导读 可以毫不夸张的说现如今的互联网是基于TCP/IP构建起来的网络。弄懂协议栈的原理,无论对调试网络IO性能还是解决网络问题都是有很大帮助的。本片文章就带领大家来看看内核是如何控制网络数据流的。

TCP特点

我们都非常清楚TCP协议设计的初衷,就是保证数据传输的快速,有序,无误。所以特点总结如下:

    1、面向连接,可以用五元组来表示一条连接(远程ip,远程端口,本地ip,本地端口,传输层协议)。
    2、数据是全双工的
    3、数据是有序的,也就是接受的数据一定是按照发送时的顺序的。
    4、流量控制,发送方可以通过接收方滑动窗口大小来动态调整发送数据的大小。
    5、拥塞控制,发送方通过ACK的状态结合拥塞算法综合计算给出窗口大小。

了解完TCP特点字后,我们就来真正的看看数据发送到底是怎样的过程?

数据发送

我们首先来看张图:

上图展示的是数据流动的在硬件中的过程,下图展示的是数据在协议栈的过程:

整个过程分为三个大区域:用户区,内核区,设备。这里所说的设备就是网卡。流程如下:

    1、用户应用程序调用write系统调用
    2、确认文件描述符
    3、拷贝数据到socket buffer中
    4、创建tcp片段,计算checksum
    5、添加IP头,执行ip路由,计算checksum
    6、添加以太网协议头部,执行ARP
    7、告诉网卡芯片要发送数据了
    8、网卡从内存中获取数据发送,发送完成中断告诉CPU
数据接收

直接看硬件数据流图:

首先网卡把接收到的数据包写入到它的内存之中。然后对其进行校验,通过后发送到主机的主存之中。主存中的buffer是驱动分配好的,驱动会把分配好的buffer描述告诉网卡,如果没有足够的buffer接受网卡的数据包,网卡会将数据包丢弃。一旦数据包拷贝到主存完成,网卡会通过中断告知主机OS。

之后驱动会检查它是否能处理这个新的包。如果能处理,驱动会把数据包包装成OS认识的结构(linux sk_buffer)并推送到上层。 链路层接收到帧后检查通过的话会按照协议解帧并推送至IP层。

IP层会在解包之后根据包中包含的IP信息决定推送至上层还是转发到其他IP。如果判断需要推送至上层,则会解掉IP包头并推送至TCP层。

TCP在解报之后会根据其四元组找到对应的TCB,之后通过TCP协议处理这个报文。在接收到报文后,会把报文加到接受报文,之后根据TCP的状态发送一个ACK给对端。

当然上述过程会受到NAT等等Netfilter的作用,这里不谈了,也没深研究过。当然为了性能,大牛们方方面面也做了很多努力,比如大到RDMA、DPDK等大的软硬件技术,小到zero-copy、checksum offload等;

总结

现代的软硬件TCP/IP协议栈单链接发送速率到1~2GiB/s完全没有任何问题(经过实测)。如果你想探索更优秀的性能,你可以尝试RMDA等技术,他们通过绕过内核以减少拷贝等方式优化了性能,当然可能依赖硬件。

原文来自:

本文地址://gulass.cn/linux-tcp-ip-protocol-stack.html编辑:KSJXAXOAS,审核员:逄增宝

Linux大全:

Linux系统大全:

红帽认证RHCE考试心得: