EduCoder 传输层协议分析
EduCoder 传输层协议分析
- 关卡1: TCP 包基础
- 了解 TCP 数据包结构及格式,以及其具体的含义。
- 关卡2: 三次握手
- 分析 TCP 的三次握手的具体过程。
- 关卡3: 拥塞控制
- 了解拥塞控制,掌握重传机制。
- 关卡4: UDP 包分析
- 能够掌握简单的 UDP 包分析。
0x01 TCP 包基础
0x0101 相关知识
为了完成本关任务,你需要掌握:
- 理解并掌握 TCP 报文段标记的具体含义;
- 在 Wireshark 抓包软件中分析 TCP 报文。
TCP 首部格式
源端口( 16 位):通信发送方使用的端口号
目标端口( 16 位):通信接收方使用的端口号
序列号( 32 位):用来确保数据可靠传输的唯一值
确认号( 32 位):接收方在响应时发送的数值
数据偏移( 4 位):标志数据包开始的位置,TCP 头部的长度
标记( 12 位/ 6 位):
SYN
:(同步)发起连接的数据包:同步SYN=1
表示这是一个连接请求或连接接受报文。ACK
:(确认)确认收到的数据包:只有当ACK=1
时,确认号字段才有效;当ACK=0
时,确认号无效。RST
:(重置)之前尝试的连接被关闭,(信号差,信号拥挤):当RST=1
时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。FIN
:(结束)连接成功,传输完毕之后,连接正在断开:用来释放一个连接,FIN=1
表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。PSH
:(推送)数据包直接发送给应用,而不是缓存起来:接收 TCP 收到PSH=1
的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付。URG
:(紧急)数据包中承载的内容应该立即由 TCP 协议栈立即进行处理:当URG=1
时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。CWR
:(拥塞窗口减小)缓存区已满或者拥挤,通信双方都应该降低传输的速率。窗口大小( 16 位):匹配缓存区的大小
校验和( 16 位):确认 TCP 数据段中的内容是否发送了变化
紧急指针( 16 位):明确显示数据之前的 16 进制序列号
其中,ACK
是可能与 SYN
,FIN
等同时使用的,比如 SYN
和 ACK
可能同时为 1 ,它表示的就是建立连接之后的响应, 如果只是单个的一个 SYN
,它表示的只是建立连接。( TCP 的几次握手就是通过这样的 ACK
表现出来的), 但 SYN
与 FIN
是不会同时为 1 的,因为前者表示的是建立连接,而后者表示的是断开连接。RST
一般是在 FIN
之后才会出现为 1 的情况,表示的是连接重置。一般地,当出现 FIN
包或 RST
包时,我们便认为客户端与服务器端断开了连接;而当出现 SYN
和 SYN+ACK
包时,我们认为客户端与服务器建立了一个连接。
0x0102 实验流程
(1)打开 Wireshark ,加载实训文件夹中的tcp-ethereal-trace-1
文件,并筛选出其中的”TCP”报文;
在过滤器中输入tcp
, 如下图所示:
(2)展开TCP
分组,查看本机使用的 IP 地址和 TCP 端口号是什么,填写到文件中;
本机所使用的IP地址和TCP端口分别如图所示:
(3)gaia.cs.umass.edu
(目标网站)的 IP 地址和 TCP 端口号是什么,填写到文件中。
先使用Terminal终端输入以下命令确认gaia.cs.umass.edu
(目标网站)的IP地址:
1 | ping gaia.cs.umass.edu |
得到其ip地址为: 128.119.245.12
和第一个(时序)TCP包的Dst IP地址一致, 所以gaia.cs.umass.edu
(目标网站)的 IP 地址和 TCP 端口号如下所示:
0x0103 最终结果
1 | 本机使用的IP地址和TCP端口号(用;隔开):192.168.1.102;1161 |
0x02 三次握手
0x0201 相关知识
为了完成本关任务,你需要掌握:
- 了解三次握手协议的内容;
- 在 Wireshark 中抓取 TCP 数据包。
三次握手建立连接
第一次握手
:客户端将标志位 SYN 置为 1 ,随机产生一个值SEQ = X
,并将该数据包发送给服务器,客户机进入 SYN_SENT 状态,等待服务器确认;第二次握手
:服务器收到数据包后由标志位SYN = 1
,知道客户端请求建立连接,服务器将标志位 SYN 和 ACK 都置为 1 ,ACK = X + 1
,随机产生一个值SEQ = Y
,并将该数据包发送给客户端以确认连接请求,服务器进入 SYN_RCVD 状态;第三次握手
:客户端收到确认后,检查 ACK 是否为X + 1
,ACK 是否为 1 ,如果正确则将标志位 ACK 置为 1 ,ACK = Y + 1
,并将该数据包发送给服务器,服务器检查 ACK 是否为K + 1
,ACK 是否为 1 ,如果正确则连接建立成功,客户端和服务器进入 ESTABLISHED 状态。
握手过程中传送的包里不包含数据,三次握手完毕后,客户端与服务器才正式开始传送数据。理想状态下,TCP 连接一旦建立,在通信双方中的任何一方主动关闭连接之前,TCP 连接都将被一直保持下去。
四次握手断开连接
第一次握手
:主动关闭方发送一个 FIN ,用来关闭主动方到被动关闭方的数据传送,也就是主动关闭方告诉被动关闭方:我已经不会再给你发数据了(当然,在 FIN 包之前发送出去的数据,如果没有收到对应的 ACK 确认报文,主动关闭方依然会重发这些数据),但此时主动关闭方还可以接受数据。第二次握手
:被动关闭方收到 FIN 包后,发送一个 ACK 给对方,确认序号为收到序号 + 1 (与 SYN 相同,一个 FIN 占用一个序号)。第三次握手
:被动关闭方发送一个 FIN ,用来关闭被动关闭方到主动关闭方的数据传送,也就是告诉主动关闭方,我的数据也发送完了,不会再给你发数据了。第四次握手
:主动关闭方收到 FIN 后,发送一个 ACK 给被动关闭方,确认序号为收到序号 + 1 ,至此,完成四次挥手。
0x0202 实验流程
(1)打开文件夹中tcp-ethereal-trace-1
文件;
(2)打开编辑 ( edit ) ->首选项 ( preferences )-> Protocols -> TCP ,取消勾选 Relative sequence numbers(相对序列号);
(3)第一次握手时, TCP SYN 区段的序列号( SEQ )是什么,填写到 txt 文件中;
如下图所示:
第一次握手TCP SYN 区段的序列号( SEQ )= 232129012 .
(4)由三次握手协议,客户端首次回复中,ACK=SEQ+1
,根据(3)中的 SEQ 号,用tcp.ack==SEQ+1
(具体数字)命令筛选出相应数据报,查看gaia.cs.umass.edu
发送给客户端计算机回复的 SYN 的序列号( SEQ )是多少,填写到 txt 文件中;
由上一步可知seq = 232129012
,
则seq + 1 = 232129013
, 在过滤器中输入 tcp.ack == 232129013 即可筛选出gaia.cs.umass.edu
发送给客户端计算机回复的TCP包, 如下所示:
可以得到回复的 SYN 的序列号( SEQ ) = 883061785.
0x0203 最终结果
1 | 第一次握手,TCP SYN区段的序列号是:232129012 |
0x03 拥塞控制
0x0301 相关知识
为了完成本关任务,你需要掌握:
- 了解拥塞控制;
- 在 Wireshark 中抓取 TCP 数据包。
什么是拥塞
拥塞现象是指到达通信子网中某一部分的分组数量过多,使得该部分网络来不及处理,以致引起这部分乃至整个网络性能下降的现象,严重时甚至会导致网络通信业务陷入停顿,即出现死锁现象。这种现象跟公路网中经常所见的交通拥挤一样,当节假日公路网中车辆大量增加时,各种走向的车流相互干扰,使每辆车到达目的地的时间都相对增加(即延迟增加),甚至有时在某段公路上车辆因堵塞而无法开动(即发生局部死锁)。
造成拥塞的原因
- 多条流入线路有分组到达,并需要同一输出线路,此时,如果路由器没有足够的内存来存放所有这些分组,那么有的分组就会丢失;
- 路由器的慢带处理器的缘故,以至于难以完成必要的处理工作,如缓冲区排队、更新路由表等。
防止拥塞的方法
- 在传输层可采用重传策略、乱序缓存策略、确认策略、流控制策略和确定超时策略;
- 在网络层可采用子网内部的虚电路与数据报策略、分组排队和服务策略、分组丢弃策略、路由算法和分组生存管理;
- 在数据链路层可采用重传策略、乱序缓存策略、确认策略和流控制策略。
0x0302 实验流程
(1)打开 Wireshark,加载实训文件夹中的tcp-ethereal-trace-1文件;
(2)使用命令ip.dst==128.119.245.12进行筛选;
如下图所示:
(3)选中一条数据报,点击统计( Statistic s)-> TCP 流图形->时间序列( Stevens ),观察图形。判断此文件中是否有重传的区段(序列号一直增大则无,反之则有),填写到 txt 文件中;
图像为一直增大,所以没有发生重传.
(4)使用 http 命令筛选数据报,查看数据传输大小以及使用时间,计算 TCP 链接的吞吐量(kb/s、结果保留整数),填写到 txt 文件中。
注:吞吐量=数据传输大小/所用时间。
首先输入http
筛选HTTP报文, 如下所示:
点开第一个http报文(第二个为响应报文, 这里用不上), 查看数据部分的数据传输大小
(Reassembled TCP length), 如下所示:
第二步就是查看所用时间
, 在TCP段中找到[Timestamps]
,如下所示:
综上所述, 得到:
- 数据传输大小 =$164090(bits)$
- 所用时间 = $5.297341000(seconds)$
- $\therefore$ 吞吐量 = $\cfrac{164090}{5.2973410\cdot1024}=30.24991984≈30$ (保留整数)
0x0303 最终结果
1 | 文件中是否有重传的区段(填写"是/否"):否 |
0x04 UDP 包分析
0x0401 相关知识
为了更好掌握本章内容,你需要了解的有:
- UDP 报文的简介;
- UDP 报文格式;
- Wireshark 软件中的 UDP 抓包分析。
UDP 简介
UDP(User Datagram Protocol),用户数据报协议,是 OSI(Open System Interconnection,开放式系统互联) 参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务。
UDP 协议与 TCP 协议一样用于处理数据包,在 OSI 模型中,两者都位于传输层,处于 IP 协议的上一层。UDP 有不提供数据包分组、组装和不能对数据包进行排序的缺点,也就是说,当报文发送之后,是无法得知其是否安全完整到达的。
许多应用只支持 UDP ,它不产生任何额外的数据,即使知道有破坏的包也不进行重发。当强调传输性能而不是传输的完整性时,如音频和多媒体应用,UDP 是最好的选择。数据传输时间很短,以至于此前的连接过程成为整个流量主体的情况下,UDP 也是一个好的选择。
UDP 报文格式
UDP 首部有 8 个字节,由 4 个字段构成,每个字段都是两个字节:
源端口
: 源端口号,需要对方回信时选用,不需要时全部置 0 ;目的端口
:目的端口号,在终点交付报文的时候需要用到;
注:端口是用来指明数据的来源(应用程序)以及数据发往的目的地(同样是应用程序)。
字段包含了 16 比特的 UDP 协议端口号,它使得多个应用程序可以多路复用同一个传输层协议及 UDP 协议,
仅通过端口号来区分不同的应用程序。
长度
:UDP 的数据报的长度(包括首部和数据)其最小值为 8(只有首部)。字段记录了该 UDP 数据包的总长度(以字节为单位),包括 8 字节的 UDP 头和其后的数据部分。最小值是 8(报文头的长度),最大值为 65535 字节;校验和
:检测 UDP 数据报在传输中是否有错,有错则丢弃。它的值是通过计算 UDP 数据报及一个伪包头而得到的。校验和的计算方法与通用的一样,都是累加求和。
UDP 校验和的计算
原理:
对发送方的 UDP 报文段的所有 16 比特字的和进行反码运算,当求和遇见溢出的时候,进行回卷(回卷的补充在下面),得到的结果放在 UDP 报文段中的校验和字段。
UDP 校验的所需信息:
(1)UDP 伪首部:源 IP + 目的 IP + Byte 0 + Byte17 + UDP 长度
,目的是让 UDP 两次检查数据是否以及正确到达目的地,只是单纯为了做校验用;
(2)UDP 首部:该长度不是报文的总长度,而是 UDP(包括 UDP 头和数据部分)的总长度;
(3)UDP 的数据部分。
计算步骤:
(1)把伪首部添加到 UDP
上;
(2)计算初始时将校验和字段添零;
(3)把所有位划分为 16 位
( 2 字节)的字;
(4)把所有 16 位的字相加,如果遇到进位,则将高于 16 字节的进位部分的值加到最低位上;
(5)将所有字相加得到的结果应该为一个 16 位的数,将该数按位取反则可以得到校验和
。
在计算校验和的时候,需要在 UDP 数据报之前增加 12 字节的伪首部,伪首部并不是 UDP 真正的首部。只是在计算校验和,临时添加在 UDP 数据报的前面,得到一个临时的 UDP 数据报。校验和就是按照这个临时的 UDP 数据报计算的。
伪首部既不向下传送也不向上递交,而仅仅是为了计算校验和。
这样的校验和,既检查了 UDP 数据报
,又对 IP 数据报的源 IP 地址
和目的 IP 地址
进行了检验。
UDP 与 TCP 对比
UDP 和 TCP 协议的主要区别是两者在如何实现信息的可靠传递方面不同。TCP 协议中包含了专门的传递保证机制,当数据接收方收到发送方传来的信息时,会自动向发送方发出确认消息。发送方只有在接收到该确认消息之后才继续传送其它信息,否则将一直等待直到收到确认信息为止。与 TCP 不同,UDP 协议并不提供数据传送的保证机制。如果在从发送方到接收方的传递过程中出现数据包的丢失,协议本身并不能做出任何检测或提示。因此,通常人们把 UDP 协议称为不可靠的传输协议。
TCP
是面向连接的传输控制协议,而UDP
提供了无连接的数据报服务,TCP
具有高可靠性,确保传输数据的正确性,不出现丢失或乱序;UDP
在传输数据前不建立连接,不对数据报进行检查与修改,无须等待对方的应答,所以会出现分组丢失、重复、乱序,应用程序需要负责传输可靠性方面的所有工作;UDP
具有较好的实时性,工作效率较TCP
协议高;UDP
段结构比TCP
的段结构简单,因此网络开销也小;TCP
协议可以保证接收端毫无差错地接收到发送端发出的字节流,为应用程序提供可靠的通信服务。对可靠性要求高的通信系统往往使用TCP
传输数据。
0x0402 实验流程
(1)打开 Wireshark,加载实训文件夹中的http-ethereal-trace-5
文件,筛选 UDP 数据包;
(2)从跟踪中选择一个 UDP 数据包。打开该数据包,查看 UDP 标头中的四个字段的名称,并将这四个字段的名称写入 txt 文件(用“;”分隔);
如图所示, UDP(User Datagram Protocal)标头的四个字段分别为:
- Source Port
源端口
- Destination Port
目的端口
- Length
长度
- Checksum
校验和
(3)UDP 标头的四个字段总共有多少字节,将信息写入 txt 文件;
根据UDP报文格式:
可以得到上述UDP标头四个字段总共有 2+2+2+2 = 8 个字节.
(4)从 IPV4(Internet Protocol Version4)中找到 UDP 的协议号是多少,将信息写入 txt 文件;
如图所示:
UDP 的协议号为: 17
0x0403 最终结果
1 | 四个字段名称(首字母大写):Source Port;Destination Port;Length;Checksum |