LaughingZhu's Blog
LaughingZhu
LaughingZhu
Make or miss win or lose I put my name on it

如何确保页面资源能被完整送达浏览器?

我们都知道在一个web页面打开时,会有很多个资源文件请求加载,且较大的文件也会被拆分成多个小的数据包来进行传输,那么这些资源文件是如何完整的被送达到浏览器上的呢?

我们都知道在一个web页面打开时,会有很多个资源文件请求加载,且较大的文件也会被拆分成多个小的数据包来进行传输,那么这些资源文件是如何 完整 的被送达到浏览器上的呢?

一个数据包的“旅程”

互联网实际上是一 套理念和协议组成的体系架构 。通过约定好的协议,让双方之间的通信变得没有障碍。

1.IP:把数据包送到目的主机

数据包要在互联网上进行传输,就要符合网络协议(简称IP)标准。互联网上不同的在线设备都有一个唯一的地址,地址就是一个数字即IP地址。这和我们购物的收货地址很像,购物时,你只需要填一个收货地址,物流就能把包裹送到你家。

计算机的地址统称为IP地址,访问任何网站实际上只是你的计算机(Client)向另外一台计算机(Service)请求信息。 ** 如果要想把一个数据包从主机 A 发送给主机 B,那么在传输之前,数据包上会被附加上主机 B 的 IP 地址信息,这样在传输过程中才能正确寻址。额外地,数据包上还会附加上主机 A 本身的 IP 地址,有了这些信息主机 B 才可以回复信息给主机 A。这些附加的信息会被装进一个叫 IP 头的数据结构里。IP 头是 IP 数据包开头的信息,包含 IP 版本、源 IP 地址、目标 IP 地址、生存时间等信息。

这里我们把网络简单分为三层结构,如下图: 00d9bcad0bda1fdb43ead428e89ae74d.png 简化的iP网络三层传输模型

通过上图来看一个数据包从主机A到主机B的旅程:

  • 主机A的上层将含有“极客时间”的数据包交给网络层;

  • 网络层再将IP头附加到数据包上,组成 新的IP数据包 ,并交给底层;

  • 底层通过物理网络将数据传输给主机B;

  • 数据包传输到主机B的网络层,在这里主机B拆开数据包的Ip头信息,并将拆开来的数据部分交给主机B的上层。

  • 最终,含有“极客时间”信息的数据包达到了主机B的上层。

2.UDP:把数据包送达应用程序

IP是非常底层的协议,只负责把数据包传输到对方电脑,但对方电脑并不知道把数据包交给哪个程序,是交给浏览器还是微信?因此,需要基于IP之上开发能和应用打交道的协议,最常见的是“ 用户数据包协议 (User Datagram Protocol)”,简称 UDP。 ** UDP中一个很重要的信息是端口号,端口号其实就是一个数字,每个想访问网络的程序都需要绑定一个端口号。通过端口号UDP就能把指定的数据包发送给指定的程序了,所以**IP通过IP地址信息把数据包发送给指定的电脑,而UDP通过端口号把数据包分发给正确的程序。**和IP头一样,端口号会被装进UDP头里面,UDP头再和原始数据包合并组成新的UDP数据包,UDP头中除了目的端口,还有源端口号等信息。

我们将前面的三层结构扩展成四层接口,在网络层和上层之间加了传输层来支持UDP协议: 3edb673a43f23d84253c52124ce447ea.png 简化的 UDP 网络四层传输模型

UDP协议下的数据包A -> B:

  • 主机A的上层将含有“极客时间”的数据包交给传输层;

  • 传输层会在数据包前面加上 UDP头 ,组成新的UDP数据包,再将新的 UDP数据包 交给网络层;

  • 网路层再将IP头附加到数据包上,组成新的 IP数据包 ,并交给底层;

  • 数据包被传输到主机B的网络层,在这里主机B拆开IP头信息,并将拆开来的数据部分( UDP数据包 )交给传输层;

  • 在传输层,数据包中的UDP头会被拆开,并 根据UDP中提供的端口号,把数据部门交给主机B上层的应用程序

  • 最终,还有“极客时间”信息的数据包就旅行到了主机B上层应用程序这里;

在使用UDP发送数据时,有各种因素会导致数据包出错,虽然UDP可以校验数据是否正确,但是对于错误的数据包,UDP并不提供重发机制,只是丢弃当前的包,而且UDP在发送之后也无法知道是否能达到目的地。

虽然 UDP不能保证数据可靠性,但是传输速度却非常快 ,所以UDP通常应用在一些关注速度、但不那么严格数据完整性的领域,如在线视频、游戏等。

3.TCP:把数据完整地送达应用程序

对于浏览器请求,或者邮件这类要求数据传输可靠性的应用,使用UDP来传输会存在 两个问题

  • 数据包存在传输过程中容易丢失;

  • 大文件会被拆分成很多小的数据包来传输,这些小的数据包会经过不同的路由,并在不同的时间到达接收端,而UDP协议并不知道如何组装这些数据包,从而把数据包还原成完整的文件。

基于这两个问题,我们引入了TCP。 TCP(Transmission Control Protocol,传输控制协议)是一种 面向连接的**、 可靠的 基于字节流 的传输层通信协议。**相对于UDP,TCP有下面两个特点:

  • 对于数据包丢失的情况,TCP提供重传机制;

  • TCP引入了数据包排序机制,用来保证把乱序的数据包组合成一个完整的文件。

和UDP头一样,TCP头除了包含了目标端口和本机端口号外,还提供了用于排序的序列号,以便接收端通过序号来重排数据包。如下图: 943ac29f7d5b45a8861b0cde5da99032.png 简化的 TCP 网络四层传输模型

通过上图应该了解一个数据包是如何通过TCP来传输的。TCP单个数据包的传输流程和UDP流程差不多,不同的地方在于,通过TCP头的信息保证了一块大的数据传输的完整性。

从下图可以看出,一个完整的TCP链接的生命周期包括了“ 建立连接 ”、“ 传输数据 ”、“ 断开链接 ”三个阶段。 440ee50de56edc27c6b3c992b3a25844.png一个TCP连接的生命周期

  • 首先,建立连接段 。这个阶段是通过“ 三次握手” 来建立客户端和服务器之间的连接。TCP提供面向连接的通信传输。 面向连接 是指在数据通信开始之前先做好两端之间的准备工作。所谓 三次握手 ,是指在建立一个TCP连接时,客户端和服务器总共要发送三个数据包以确认连接的建立。

  • 其次,传输数据阶段 。在该阶段, 接收端需要对每个数据包进行确认操作 。也就是接收端在接收到数据包之后,需要发送确认数据包给发送端。所以当发送端发送了一个数据包之后,在规定时间内没有接收到接收端反馈的确认消息,则判断为数据包丢失,并触发发送端的重发机制。同样,一个大的文件在传输过程中会被拆分成很多小的数据包,这些数据包到达接收端后,接收端会按照TCP头中的序号为其排序,从而确保组成完整的数据。

  • 最后,断开连接阶段 。数据传输完成之后,就要终止连接了,涉及到最后一个阶段“ 四次挥手 ”来保证双方都能断开连接。

TCP为了保证数据传输的可靠性,牺牲了数据包的传输速度,因为“三次握手”和“数据包校验机制”等把传输过程中的数据包的数量提高了一倍。

简单的总结一下:

  • 互联网中的数据是通过数据包来传输的,数据包在传输过程中容易丢失或出错。
  • IP负责把数据包送达到目主机。
  • UDP负责把数据包送达具体应用。
  • TCP保证了数据完整地传输,分为(建立连接、传输数据、断开链接)。