HTTP 缓存

Cache-Control

http 中控制缓存的主要字段有一下三个：

重点学习 Cache-Control

缓存代理身份特殊，即是客户端也是服务端，所以还需要有一些新的“Cache-Control”属性来对它做细致的控制。

浏览器对资源的缓存位置分为：

⚠️ 内存缓存的行为，各个浏览器并没有统一规范，而且内存缓存并不关注 HTTP 语义，浏览器导航中会重用资源，即是资源带有 max-age=0 或 no-cache。
唯一可能例外的是 no-store 内存缓存在某些情况下确实会遵守该指令。

HTTP Cache 几乎遵从 HTTP 规范，但有一个例外，即是资源带有，HTML 中 prefetch 指令获取的资源会缓存在 HTTP Cache 中一定时间（5分钟）

浏览器 http-cache 策略分为两种：强缓存、协商缓存

缓存查找：查找不到直接发送请求
强制缓存：通过 Expires 和 Cache-Control 判断缓存是否有效，如果可用则直接使用，否则协商缓存
协商缓存：服务端返回资源时会带有 Last-modified、ETag信息，当协商缓存时，客户端直接发起请求并且携带 If-Modified-Since 、If-None-Match 去请求后台，服务器根据条件请求字段判断资源是否更新
- 若资源更新，返回资源和 200 状态码
- 否则，返回 304，告诉浏览器直接从缓存获取资源

以下 chrome 实现效果

💡 浏览器某些用户行为会在请求头带上“私货”以控制缓存：

HTTP 协议就定义了一系列“If”开头的“条件请求”字段，专门用来与服务器检查验证资源是否过期。当请求带有条件字段，服务器就会验证资源是否过期。

ETag 是“实体标签”（Entity Tag）的缩写，是资源的一个唯一标识，文件内容的 hash 值。比 Last-modified 做判断更精准，做验证时优先级比 Last-modified 高，因为

ETag 还有“强”“弱”之分。强 ETag 要求资源在字节级别必须完全相符，弱 ETag 在值前有个“W/”标记，只要求资源在语义上没有变化，但内部可能会有部分发生了改变（例如 HTML 里的标签顺序调整，或者多了几个空格）。

ETag 工作原理：

Last-modified 也同样类似。

Cache-Control 是个通用字段，客户端也可以发送附带 Cache-Control 缓存指令的请求（但浏览器对请求缓存控制的支持有限，比如仅支持 Cache-Control: max-age=0 或者 Cache-Control: no-cache 去做刷新）。

URL 原则上是一种网络上的资源概念，同个 URL 可以有多种资源版本形式。

比如，你可以 Accept: text/html，也可以 Accept: text/csv 改为以不同的格式获取相同的资源，这些都是服务器内容协商的结果。

vary 虽然不是 cache-control 的属性值，是内容协商的结果，带在响应头部，表示一个内容版本，可协作缓存决策依据。

大多数浏览器都支持 vary 缓存验证，但要注意的是浏览器通常不会实现为同个 URL 存储多个变体的功能，只会为唯一 URL 做单一内容版本存储；而代理服务器通常可自定义实现对同个 URL 多个 vary 缓存。

下图是代理缓存根据 vary 缓存依据流程：

原则：依据是否可 URL 版本化控制，分为永不缓存（协商），或永远缓存

可做 URL 版本化控制的文件：长期缓存 Cache-Control: public,max-age=31536000,immutable，如 webpack 模块化打包出来 js、css 等这类能够通过工具自动化打包链接的文件
切勿打包过大变动时导致缓存失效，需代码分割，进行细粒度控制缓存代码分割划分：业务代码、公共代码、第三方库
不可 URL 版本化控制的文件：协商缓存 Cache-Control: no-cache 与 etag/last-modified，如 index.html 等

其他文章

交流区

加载中...