HTTP1.0、HTTP1.1和HTTP2.0的区别

一、HTTP的历史

早在 HTTP
建立之初，主要就是为了将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器。也是说对于前端来说，我们所写的HTML页面将要放在我们的
web 服务器上，用户端通过浏览器访问url地址来获取网页的显示内容，但是到了
WEB2.0
以来，我们的页面变得复杂，不仅仅单纯的是一些简单的文字和图片，同时我们的
HTML 页面有了 CSS，Javascript，来丰富我们的页面展示，当 ajax
的出现，我们又多了一种向服务器端获取数据的方法，这些其实都是基于 HTTP
协议的。同样到了移动互联网时代，我们页面可以跑在手机端浏览器里面，但是和
PC 相比，手机端的网络情况更加复杂，这使得我们开始了不得不对 HTTP
进行深入理解并不断优化过程中。

二、HTTP的基本优化

影响一个 HTTP 网络请求的因素主要有两个：带宽和延迟。

带宽：如果说我们还停留在拨号上网的阶段，带宽可能会成为一个比较严重影响请求的问题，但是现在网络基础建设已经使得带宽得到极大的提升，我们不再会担心由带宽而影响网速，那么就只剩下延迟了。
延迟：
- 浏览器阻塞（HOL
  blocking）：浏览器会因为一些原因阻塞请求。浏览器对于同一个域名，同时只能有
  4
  个连接（这个根据浏览器内核不同可能会有所差异），超过浏览器最大连接数限制，后续请求就会被阻塞。
- DNS 查询（DNS Lookup）：浏览器需要知道目标服务器的 IP
  才能建立连接。将域名解析为 IP 的这个系统就是
  DNS。这个通常可以利用DNS缓存结果来达到减少这个时间的目的。
- 建立连接（Initial connection）：HTTP 是基于 TCP
  协议的，浏览器最快也要在第三次握手时才能捎带 HTTP
  请求报文，达到真正的建立连接，但是这些连接无法复用会导致每次请求都经历三次握手和慢启动。三次握手在高延迟的场景下影响较明显，慢启动则对文件类大请求影响较大。

三、HTTP1.0和HTTP1.1的一些区别

HTTP1.0最早在网页中使用是在1996年，那个时候只是使用一些较为简单的网页上和网络请求上，而HTTP1.1则在1999年才开始广泛应用于现在的各大浏览器网络请求中，同时HTTP1.1也是当前使用最为广泛的HTTP协议。
主要区别主要体现在：

缓存处理，在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准，HTTP1.1则引入了更多的缓存控制策略例如Entity
tag，If-Unmodified-Since, If-Match,
If-None-Match等更多可供选择的缓存头来控制缓存策略。
带宽优化及网络连接的使用，HTTP1.0中，存在一些浪费带宽的现象，例如客户端只是需要某个对象的一部分，而服务器却将整个对象送过来了，并且不支持断点续传功能，HTTP1.1则在请求头引入了range头域，它允许只请求资源的某个部分，即返回码是206（Partial
Content），这样就方便了开发者自由的选择以便于充分利用带宽和连接。
错误通知的管理，在HTTP1.1中新增了24个错误状态响应码，如409（Conflict）表示请求的资源与资源的当前状态发生冲突；410（Gone）表示服务器上的某个资源被永久性的删除。
Host头处理，在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址，因此，请求消息中的URL并没有传递主机名（hostname）。但随着虚拟主机技术的发展，在一台物理服务器上可以存在多个虚拟主机（Multi-homed
Web
Servers），并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域，且请求消息中如果没有Host头域会报告一个错误（400
Bad Request）。
长连接，HTTP
1.1支持长连接（PersistentConnection）和请求的流水线（Pipelining）处理，在一个TCP连接上可以传送多个HTTP请求和响应，减少了建立和关闭连接的消耗和延迟，在HTTP1.1中默认开启Connection：
keep-alive，一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点。

四、HTTPS与HTTP的一些区别

HTTPS协议需要到CA申请证书，一般免费证书很少，需要交费。
HTTP协议运行在TCP之上，所有传输的内容都是明文，HTTPS运行在SSL/TLS之上，SSL/TLS运行在TCP之上，所有传输的内容都经过加密的。
HTTP和HTTPS使用的是完全不同的连接方式，用的端口也不一样，前者是80，后者是443。
HTTPS可以有效的防止运营商劫持，解决了防劫持的一个大问题。

五、SPDY：HTTP1.x的优化

2012年google如一声惊雷提出了SPDY的方案，优化了HTTP1.X的请求延迟，解决了HTTP1.X的安全性，具体如下：

降低延迟，针对HTTP高延迟的问题，SPDY优雅的采取了多路复用（multiplexing）。多路复用通过多个请求stream共享一个tcp连接的方式，解决了HOL
blocking的问题，降低了延迟同时提高了带宽的利用率。
请求优先级（request
prioritization）。多路复用带来一个新的问题是，在连接共享的基础之上有可能会导致关键请求被阻塞。SPDY允许给每个request设置优先级，这样重要的请求就会优先得到响应。比如浏览器加载首页，首页的html内容应该优先展示，之后才是各种静态资源文件，脚本文件等加载，这样可以保证用户能第一时间看到网页内容。
header压缩。前面提到HTTP1.x的header很多时候都是重复多余的。选择合适的压缩算法可以减小包的大小和数量。
基于HTTPS的加密协议传输，大大提高了传输数据的可靠性。
服务端推送（server
push），采用了SPDY的网页，例如我的网页有一个sytle.css的请求，在客户端收到sytle.css数据的同时，服务端会将sytle.js的文件推送给客户端，当客户端再次尝试获取sytle.js时就可以直接从缓存中获取到，不用再发请求了。SPDY构成图：

SPDY位于HTTP之下，TCP和SSL之上，这样可以轻松兼容老版本的HTTP协议(将HTTP1.x的内容封装成一种新的frame格式)，同时可以使用已有的SSL功能。

六、HTTP2.0性能惊人

HTTP/2: the Future of the
Internet https://link.zhihu.com/?target=https://http2.akamai.com/demo
是 Akamai 公司建立的一个官方的演示，用以说明 HTTP/2 相比于之前的
HTTP/1.1 在性能上的大幅度提升。同时请求 379 张图片，从Load time
的对比可以看出 HTTP/2 在速度上的优势。

七、HTTP2.0：SPDY的升级版

HTTP2.0可以说是SPDY的升级版（其实原本也是基于SPDY设计的），但是，HTTP2.0
跟 SPDY 仍有不同的地方，如下：

HTTP2.0和SPDY的区别：

HTTP2.0 支持明文 HTTP 传输，而 SPDY 强制使用 HTTPS
HTTP2.0
消息头的压缩算法采用 HPACK http://http2.github.io/http2-spec/compression.html，而非
SPDY 采用的 DEFLATE http://zh.wikipedia.org/wiki/DEFLATE

八、HTTP2.0和HTTP1.X相比的新特性

新的二进制格式（Binary
Format），HTTP1.x的解析是基于文本。基于文本协议的格式解析存在天然缺陷，文本的表现形式有多样性，要做到健壮性考虑的场景必然很多，二进制则不同，只认0和1的组合。基于这种考虑HTTP2.0的协议解析决定采用二进制格式，实现方便且健壮。
多路复用（MultiPlexing），即连接共享，即每一个request都是是用作连接共享机制的。一个request对应一个id，这样一个连接上可以有多个request，每个连接的request可以随机的混杂在一起，接收方可以根据request的
id将request再归属到各自不同的服务端请求里面。
header压缩，如上文中所言，对前面提到过HTTP1.x的header带有大量信息，而且每次都要重复发送，HTTP2.0使用encoder来减少需要传输的header大小，通讯双方各自cache一份header
fields表，既避免了重复header的传输，又减小了需要传输的大小。
服务端推送（server push），同SPDY一样，HTTP2.0也具有server
push功能。

九、HTTP2.0的升级改造

前文说了HTTP2.0其实可以支持非HTTPS的，但是现在主流的浏览器像chrome，firefox表示还是只支持基于
TLS 部署的HTTP2.0协议，所以要想升级成HTTP2.0还是先升级HTTPS为好。
当你的网站已经升级HTTPS之后，那么升级HTTP2.0就简单很多，如果你使用NGINX，只要在配置文件中启动相应的协议就可以了，可以参考**NGINX白皮书，NGINX配置HTTP2.0官方指南 ** https://www.nginx.com/blog/nginx-1-9-5/。
使用了HTTP2.0那么，原本的HTTP1.x怎么办，这个问题其实不用担心，HTTP2.0完全兼容HTTP1.x的语义，对于不支持HTTP2.0的浏览器，NGINX会自动向下兼容的。

十、附注

HTTP2.0的多路复用和HTTP1.X中的长连接复用有什么区别？

HTTP/1.*
一次请求-响应，建立一个连接，用完关闭；每一个请求都要建立一个连接；
HTTP/1.1
Pipeling解决方式为，若干个请求排队串行化单线程处理，后面的请求等待前面请求的返回才能获得执行机会，一旦有某请求超时等，后续请求只能被阻塞，毫无办法，也就是人们常说的线头阻塞；
HTTP/2多个请求可同时在一个连接上并行执行。某个请求任务耗时严重，不会影响到其它连接的正常执行；具体如图：

服务器推送到底是什么？服务端推送能把客户端所需要的资源伴随着index.html一起发送到客户端，省去了客户端重复请求的步骤。正因为没有发起请求，建立连接等操作，所以静态资源通过服务端推送的方式可以极大地提升速度。具体如下：

普通的客户端请求过程：

服务端推送的过程：

为什么需要头部压缩？假定一个页面有100个资源需要加载（这个数量对于今天的Web而言还是挺保守的）,
而每一次请求都有1kb的消息头（这同样也并不少见，因为Cookie和引用等东西的存在）,
则至少需要多消耗100kb来获取这些消息头。HTTP2.0可以维护一个字典，差量更新HTTP头部，大大降低因头部传输产生的流量。具体参考：HTTP/2
头部压缩技术介绍

HTTP2.0多路复用有多好？HTTP
性能优化的关键并不在于高带宽，而是低延迟。TCP
连接会随着时间进行自我「调谐」，起初会限制连接的最大速度，如果数据成功传输，会随着时间的推移提高传输的速度。这种调谐则被称为
TCP 慢启动。由于这种原因，让原本就具有突发性和短时性的 HTTP
连接变的十分低效。HTTP/2
通过让所有数据流共用同一个连接，可以更有效地使用 TCP
连接，让高带宽也能真正的服务于 HTTP 的性能提升。

HTTP/2 报文

HTTP/2 ，超文本传输协议的第二版。相对于HTTP/1.x
协议的文本传输格式，HTTP/2以二进制的格式进行数据传输。因此，具有更小的传输体积以及负载，相比于文本解析，二进制解析更加方便、高校。

HTTP/1.x与HTTP/2

报文（帧）格式

HTTP/1 的请求和响应报文，是由起始行、首部和正文组成，换行符分隔。
HTTP/2
将请求和响应数据分割为更小的帧，并对它们采用二进制编码。易于解析。

【
http2.0并没有改变http1.x的语义，只是把原来http1.x的header和body部分用frame重新封装了一层而已】

内部对比

位结构

Headers Frame: 帧头
固定的9个字节（(24+8+8+1+31)/8=9）呈现，变化的为帧的负载(Frame
Payload)，负载内容是由帧类型（Type）定义。

Length: 帧长度
无符号的自然数，24个比特表示，仅表示帧负载（Frame
Payload）所占用字节数，不包括帧头所占用的9个字节。
默认大小区间为为0~16,384(2^14)，一旦超过默认最大值2^14(16384)，发送方将不再允许发送，除非接收到接收方定义的SETTINGS_MAX_FRAME_SIZE（一般此值区间为2^14
~ 2^24）值的通知。
Type帧类型
8个比特表示，定义了帧负载的具体格式和帧的语义，HTTP/2规范定义了10个帧类型，这里不包括实验类型帧和扩展类型帧
Flags:帧的标志位
8个比特表示，服务于具体帧类型，默认值为0x0。
8个比特可以容纳8个不同的标志，比如，PADDED值为0x8，二进制表示为00001000；END_HEADERS值为0x4，二进制表示为00000100；END_STREAM值为0X1，二进制为00000001。可以同时在一个字节中传达三种标志位，二进制表示为00001101，即0x13。因此，后面的帧结构中，标志位一般会使用8个比特表示，若某位不确定，使用问号?替代，表示此处可能会被设置标志位
R:帧保留比特位
HTTP/2语境下为保留的比特位，固定值为0X0。
Stream Identifier：流标识符
无符号的31比特表示无符号自然数。0x0值表示为帧仅作用于连接，不隶属于单独的流。

关于帧长度，需要稍加关注： - 0 ~
2^14（16384）为默认约定长度，所有端点都需要遵守 - 2^14 (16,384) ~
2^24-1(16,777,215)此区间数值，需要接收方设置SETTINGS_MAX_FRAME_SIZE参数单独赋值

一端接收到的帧长度超过设定上限或帧太小，需要发送FRAME_SIZE_ERR错误 -
当帧长错误会影响到整个连接状态时，须以连接错误对待之；比如HEADERS，PUSH_PROMISE，CONTINUATION，SETTINGS，以及帧标识符不该为0的帧等，都需要如此处理
任一端都没有义务必须使用完一个帧的所有可用空间 -
大帧可能会导致延迟，针对时间敏感的帧，比如RST_STREAM, WINDOW_UPDATE,
PRIORITY，需要快速发送出去，以免延迟导致性能等问题

HTTP2 的帧类型

包含下面几种类型，对应上图的Type区域定义。

Frame Type Code

DATA 0x0

HEADERS 0x1

PRIORITY 0x2

RST_STREAM 0x3

SETTINGS 0x4

PUSH_PROMISE 0x5

PING 0x6

GOAWAY 0x7

WINDOW_UPDATE 0x8

CONTINUATION 0x9

帧的标志位（Flags）

含义如下图：
帧的标志位

案例：
假设我们要发送 0x12345678，流编号为 10
，类型为DATA，那么这个Frame的16进制表达就是：
‘000004’ + ‘00’ + ‘00’ + ‘0000000A’ + ‘12345678’

Header帧

HTTP2的 HEADER帧的格式如下：
HEADER帧格式

对应的字段列表说明如下：
** Pad
Length**：受制于PADDED标志控制是否显示，8个比特表示填充的字节数。
可选。Flags:PADDED 设置后要求有此字段
E：一个比特表示流依赖是否专用，可选项，只在流优先级PRIORITY被设置时有效
可选。Flags:PRIORITY 设置后要有此字段
Stream
Dependency：31个比特表示流依赖，只在流优先级PRIORITY被设置时有效
可选。Flags:PRIORITY 设置后要有此字段
Weight：8个比特（一个字节）表示无符号的自然数流优先级，值范围自然是(1~256)，或称之为权重。只在流优先级PRIORITY被设置时有效
这个字段是可选的，并且只在优先级标记设置的情况下才呈现。
Header Block Fragment：报头块分片
Padding：填充的字节，受制于PADDED标志控制是否显示，长度由Pad
Length字段决定
*** 注意 *** ，只有 Header Block Fragment 是必须的，其他都看
帧的标志位Flags 是否设置要有。

所需标志位：
END_STREAM (0x1): 报头块为最后一个，意味着流的结束。
END_HEADERS (0x4):
此报头帧不需分片，完整的一个帧。后续不再需要CONTINUATION帧帮忙凑齐。若没有此标志的HEADER帧，后续帧必须是以CONTINUATION帧传递在当前的流中，否则接收者需要响应PROTOCOL_ERROR类型的连接错误。
PADDED (0x8): 需要填充的标志
PRIORITY (0x20): 优先级标志位，控制独立标志位E，流依赖，和流权重。

其负载为报头块分片，若内容过大，需要借助于CONTINUATION帧继续传输。若流标识符为0x0，结束段需要返回PROTOCOL_ERROR连接异常。HEADERS帧包含优先级信息是为了避免潜在的不同流之间优先级顺序的干扰。
其实一般来讲，报文头部不大的情况下，一个HEADERS就可以完成了，特殊情况就是Cookie字段超过16KiB大小，不常见。

CONTINUATION 帧

HTTP/2的 CONTINUATION 帧的格式如下：
CONTINUATION
帧

字段列表：
Header Block
Fragment，用于协助HEADERS/PUSH_PROMISE等单帧无法包含完整的报头剩余部分数据。

注意事项：

1
一个HEADERS/PUSH_PROMISE帧后面会跟随零个或多个CONTINUATION，只要上一个帧没有设置END_HEADERS标志位，就不算一个帧完整数据的结束。
2
接收端处理此种情况，从开始的HEADERS/PUSH_PROMISE帧到最后一个包含有END_HEADERS标志位帧结束，合并的数据才算是一份完整数据拷贝
3
在HEADERS/PUSH_PROMISE（没有END_HEADERS标志位）和CONTINUATION帧中间，是不能够掺杂其它帧的，否则需要报PROTOCOL_ERROR错误
标志位： *
END_HEADERS(0X4)：表示报头块的最后一个帧，否则后面还会跟随CONTINUATION帧。

HTTP/2的 Data帧

一个或多个DATA帧作为请求、响应内容载体，较为完整的结构如下：
Data帧

字段：
Pad Length:
一个字节表示填充的字节长度。取决于PADDED标志是否被设置.
Data:
这里是应用数据，真正大小需要减去其他字段（比如填充长度和填充内容）长度。
** Padding*:
填充内容为若干个0x0字节，受PADDED标志控制是否显示。接收端处理时可忽略验证填充内容。若验证，可以对非0x0内容填充回应PROTOCOL_ERROR类型连接异常。
标志位：
END_STREAM (0x1):
标志此帧为对应标志流最后一个帧，流进入了半关闭/关闭状态。
PADDED (0x8): 负载需要填充，Padding Length + Data + Padding组成。
注意事项：

若流标识符为0x0，接收者需要响应PROTOCOL_ERROR连接错误
DATA帧只能在流处于”open” or “half closed
(remote)”状态时被发送出去，否则接收端必须响应一个STREAM_CLOSED的连接错误。若填充长度不小于负载长度，接收端必须响应一个PROTOCOL_ERROR连接错误。

参考链接：
HTTP2协议中报文头可以采用Haffman编码，我们看到的报文头信息都是二进制信息。
[HTTP2的报文格式请参考]{.ul}
[HTTP2报文头及数据帧格式解析实例分析]{.ul}
[Haffman 压缩算法请参考]{.ul}
[HTTP2
帧基础知识以及Header、CONTINUATION、DATA帧相关资料]{.ul}

网络原理

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！

DNS报文上一篇

HTTP协议下一篇