HTTP权威指南-7
2016-10-02缓存
使用缓存的优点
- 减少冗余的数据传输,节省了你的网络费用
- 缓解了网络瓶颈的问题,不需要更多的带宽就能够更快地加载页面
- 降低了对原始服务器的要求,服务器可以更快地响应,避免过载的出现
- 降低了距离时延,因为从较远的地方加载页面会更慢一些
冗余的数据传输
服务器多次传输同一份文档,每次传输给一个客户端,相同的字节在网络中一遍遍地传输,造成冗余,缓存可以很好解决这个问题。
带宽瓶颈
缓存可以缓解网络带宽瓶颈问题。
瞬间拥塞
缓存在破坏瞬间拥塞时显得非常重要,比如突发事件,使很多人几乎同时访问一个Web文档时,就会出现瞬间拥塞,由此造成Web服务器负载过高甚至崩溃。
距离时延
即便带宽不是问题,距离也可能是问题的原因,没太网络路由器都会增加因特网流量的时延,即使没有太多路由器,光速本身也会造成显著的时延。
命中和未命中的
可以用已有副本为某些到达缓存的请求提供服务,被称为缓存命中
,亦或请求的资源在缓存服务器上不存在,而将请求转发给原始服务器被称为缓存未命中
- 再验证以保持缓存的”新鲜度”,在缓存服务器向源服务器发送请求的首部加上If-Modified-Since首部,告诉源服务器只有在缓存了对象的副本之后,又对其进行了修改的情况下,才发送此对象。
- 再验证命中(如果服务器对象未被修改,服务器想客户端发送一个小的HTTP304Not Modified响应)
- 再验证未命中(如果服务器对象与已缓存副本不同,则向客户端发送一条普通的,带有完整内容的HTTP 200 OK响应)
- 对象被删除(如果服务器对象已经被删除了,服务器回送一个404 Not Found响应,缓存也会将其副本删除)
- 命中率
- 字节命中率
- 区分命中和未命中的情况(根据Date首部,若响应日期比较早,则为缓存响应)
缓存的拓扑结构
- 私有缓存(比如浏览器缓存)
- 公有代理缓存或者称为代理缓存
- 代理缓存的层次结构
- 网状缓存、内容路由以及对等缓存
缓存的处理步骤
对一条HTTP GET报文的基本缓存处理过程包括7个步骤:
- 接收-缓存从网络中读取抵达的请求报文。
- 解析-缓存对报文进行解析,提取出URL和各种首部。
- 查询-缓存查看是否本地有副本可用,如果没有,就获取一份并缓存本地
- 新鲜度检测-缓存查看已缓存副本是否足够新鲜,如果不是,就询问源服务器是否有任何更新。
- 创建响应-缓存会用新的首部和已缓存的主体来构建一条响应报文
- 发送-缓存通过网络将响应发回给客户端
- 日志-缓存可选地创建一个日志文件条目来描述这个事务
- 文档过期设置(Cache-Control: max-age=3600
指定最大使用期限以秒为单位
; Expires: Fri, 05 Jul 2002, 05:00:00 GMT指定一个绝对的过期日期
) - 服务器再验证
- 在请求报文中添加用条件方法进行再验证
- If-Modified-Since:
- If-None-Match:
控制缓存的能力
- 服务器可以通过HTTP定义的几种方式来指定在文档过期之前可以将其缓存多长时间,按照优先级递减的顺序。服务器可以:
- 附加一个Cache-Control: no-store 首部到响应中去;
- 附加一个Cache-Control: no-cache 首部到响应中去;
- 附加一个Cache-Control: must-revalidate 首部到响应中去;
- 附加一个Cache-Control: max-age 首部到响应中去;
- 附加一个Expires 日期首部到响应中去;
- 不附加过期信息,让缓存确定自己的过期日期;
- 客户端的新鲜度限制
指令 | 目的 |
---|---|
Cache-Control: max-fresh = <s> |
至少在未来<s> 秒内文档要保持新鲜。 |
Cache-Control: max-age = <s> |
缓存无法返回缓存时间长于<s> 秒的文档 |
Cache-Control: no-cache | 除非资源进行再验证,否则这个客户端不会接受已缓存的资源 |
Cache-Control: no-store | 缓存应尽快从存储器中删除文档的所有痕迹,因为其中可能会包含敏感信息 |
Cache-Control: only-if-cached | 只有当缓存中有副本存在时,客户端才会获取一份副本 |