引言

欢迎来到网络世界,《小白也能看懂的网络基础》系列文章会从零开始帮助你构建网络的基础知识。如果你完全没有接触过网络相关的内容,那我们是一样的,在学习过程中我们肯定遇到了相同的问题!写下这些文章一方面要记录自己的学习历程,另一方面也希望帮到同样想要学习网络基础的小伙伴。

文章的部分内容与素材是我从 YouTube 频道 Network Direction 发布的系列视频学习和搜集过来的,翻译不易,部分内容可能无法做到尽善尽美,甚至可能会有部分瑕疵,我会尽力让文章内容通俗易懂,覆盖全面。若各位小伙伴发现任何问题,希望能够留言或私信告诉我,在下不胜感激!当然,我也会在第一时间进行更正。

在往后的每一篇文章中,我都会把看到文章的小伙伴当成是完全没有网络经验的小白,我的目标是和零基础小白一起建立坚实的网络基础,网络大神请略过此系列文章。

让我们开始网络之旅吧!


回顾

我们已经学习并掌握了OSI和TCP/IP模型的基本原理,接下来,我们将重点介绍传输层中的两个协议,那就是「TCP」和「UDP」,我们将看一下,一个应用程序如何获取另一个应用程序的信息,同时,了解一下它们工作方式上有什么不同。

一、TCP与UDP

网络上的设备通过IP地址来实现彼此之间的信息传递,这种情况发生在第三层,也就是网络层,可能包括跨多个网络路由的数据包。

TCP & UDP

在第四层有这与第三层截然不同的操作行为,「传输层」是不在乎数据是在什么网络之间传递的,也不在乎发送与接收信息的设备是什么类型,它更关心的是应用程序之间如何实现数据交互

负责此操作的两个角色就是「TCP协议」和「UDP协议」。

1.共同点

1.1 都具有Headers头

共同点

首先,我们来看一下它们的共同点,它们都有「Headers标头」,而标头中都包含了「端口号」,通过图片,我们可以清晰的看到TCP的作用确实比UDP要多得多,由此可见,TCP支持更多功能,而UDP非常轻量。

1.2 都具有源目端口

除此之外,我们还能看到,它们都拥有「源目端口」,在之前章节的HTTP请求案例我们已经了解到,源目端口是客户端应用与服务器端应用交互的重要桥梁,我们可以把端口理解为一个应用程序的地址,每个应用都具有端口,就像每张网卡都具有MAC地址一样,最终目的都是为了准确找到对方。

源目端口

当我们打开一个应用程序,这就启动了一个会话,而这个会话一定会有一个源端口,其端口值通常都在0~65535之间,这里需要注意,一个端口只能分配给一个应用,它是具有唯一性的,若同时把一个端口分配给两个应用,则会导致某一个应用无法正常运行。

1.3 知名端口

另外,为了给某些系统服务更好的支持,0~1023范围的端口,通常都会预留给系统服务,我们通常称这类端口为「知名端口」,例如:我们使用HTTP请求时,给我们提供网络浏览的端口,通常就是80端口。

1.4 非知名端口

1024~65535这个范围的端口则成为「非知名端口」,我们可以对其进行自由支配。

2.端口特点

2.1 端口调整

如果使用知名端口,我们可以很容易的知道目前正在使用的是什么程序,并且知道它占用了哪个端口。当然,在特定情况下,我们也可以对知名端口进行调整,例如,将HTTP请求端口修改为8080或8888也是我们非常常用的修改,但这样一来,知名端口就变成非知名了,同时,若我们不知道该应用的端口,也就不知道对方提供的是什么服务了。

2.2 多路复用

使用不同的端口,可以给我们提供一个非常使用的功能,那就是「多路复用」,多路传输,即一个服务器主机可以让多个客户端应用程序同时访问,而这些客户端应用程序使用的都是同一个网卡、同一个IP地址,而实现这一切的就是因为不同的应用使用了不同的端口。

参考图示,我们可以看到,客户端这边有一个邮箱应用、有一个浏览器应用,他们的IP都是10.0.0.1,但是端口不同,邮箱是16423,浏览器是34761,因此它们两个可以同时向服务器发起请求而不会起冲突,这都是端口的功劳。

3. 套接字(Socket)

我们应该都听过这个名词,「套接字(Socket)」,它的确切定义有所不同,通常情况下,我们都会理解它是由「本地IP地址」、「本地端口号」以及「协议」三部分组成,这里的协议指的就是TCP或UDP。

有了套接字,我们就可以轻松的识别出网络中的请求属于哪个应用程序,而不会出现「串错门」的情况,每一次网络请求,我们都会检查套接字中的本地与远程的信息,从而使得我们可以准确的进行后续操作。套接字属于TCP/IP模型中的第三层和第四层。

套接字与五元组

3.1 五元组

现在,我们拥有了「本地IP地址」、「本地应用端口」、「远程IP地址」、「远程应用端口」、「协议」这五条信息,通常我们会把它们看做一个整体,称之为「五元组」,五元组中的信息都是独一无二的。

4.案例演示

我们这里使用Windows来做一下演示(Linux、MacOS操作系统原理相同),打开Windows的任务管理器,查看详细信息列表,以谷歌浏览器为例,我们会发现有好多谷歌浏览器的进程,且他们后面的「PID」也不尽相同,就是这些进程,组成了一个应用程序。

有些应用程序只有一个进程,而有些应用程序则会有多个进程,其中一些进程是用来访问网络的,这意味着它们将被分配TCP或UDP端口。

我们也可以使用「netstat」命令,并配合「-ano」选项,在DOS系统中显示所有连接信息,可以同时看到进程的详细信息,例如,通过查看左侧的协议,我们就可以知道,每一项进程采用了TCP还是UDP,他们的本地IP地址、本地端口号、远程IP地址、远程端口号、链接状态以及最右侧的PID进程号。

5.小测试

  1. 问题一
    问:查看下面两张图,哪个是TCP标头,哪个是UDP标头?
    答:标头比较多的是TCP,较少的是UDP
  2. 问题二
    问:套接字(Socket)是用来做什么的?
    答:① 套接字用于跟踪网络对话中的本地信息。
            ② 尽管套接字的确切定义有所不同,但大多数人都同意它包含协议「TCP」或「UDP」,也就是本地IP地址(第三层)和本地端口(第四层)。
            ③ 套接字对于使用它的应用程序或进程是唯一的,对于服务器端来说,可能比较头疼,服务器通常一次处理许多链接,而套接字只用于描述本地的详细信息。
            ④ 相反,我们可以使用「五元组」来跟踪对话的两端,因为它包含了本地IP,本地端口,远程IP,远程端口。

二、TCP与UDP的区别

到这里,大家可以发现,我们的内容都是围绕TCP和UDP展开的,虽然它们有很多通用的地方,但通过标头信息我们可以确定,TCP和UDP是两个完全不同的概念。

1.轻量与非轻量

UDP是轻量级的,通常都会被分配一些较轻量的任务;而TCP因其完整的内容体系,通常都会涉及许多额外的功能。

2.连接与无连接

2.1 TCP面向连接

例如TCP是面向连接的,而UDP是面向无连接的。面向连接的意思就是,TCP将在一对主机上建立并跟踪双方应用程序之间的会话连接,在准备好数据之后进行发送,之后关闭连接;但TCP的任务还没结束,相反它会启动更多的功能,例如:错误恢复、流量控制等。

2.2 UDP无连接

然而UDP则不会尝试建立连接,它只会开始准备自己的数据,而不去担心那些细节,UDP对于错误的处理方式也和TCP完全不同!对于UDP来说,数据包或数据段丢失与否,它并不关心,相反,会继续传输下一个数据。

TCP则不同了,它非常在意每一次数据传输的完整性,准确性,一旦发生丢失,它便会将丢失的部分重新传递!

3.窗口化

也正因为如此,TCP被认为是可靠的伙伴,UDP则通常被认为是不可靠的,因为TCP的这一特性,催生出了「窗口化」这个TCP的功能,窗口化的概念就是,”一台设备向另一台设备传递了某段消息,接收方必须对这段消息做出相应,若发送方没有收到响应,则会尝试重新发送该段内容“。

3.1 窗口大小

因此,对于一次可以发送多少数据,接收方必须确认这一点,该值称为「窗口大小」,如果没有丢失数据,则窗口大小可以「动态增长」;如果有数据丢失,则窗口大小可以「动态缩小」

3.2 数据切片与排序

由于较大的数据信息会被切片,对于数据段的顺序问题,TCP会使用标头中的序列号来追踪数据段的顺序信息,这对于某些应用程序可能很关键,例如:QQ中的文件分享,若中断了,下次连接需要接着上次的进行传递,也称为「断点续传」。

而对于一些应用程序,这并不重要,这也是为什么我们要使用UDP的原因,那UDP到底有什么作用呢?它看起来功能很少,而且似乎缺乏某些关键的功能,忽视顺序,忽视错误,确定能作为传输协议?

4.UDP终极奥义

话不多说,直接上案例,大家可以想象一下我们在使用语音或视频通话这类实时交互的应用,例如:微信语音,微信视频,QQ语音,QQ视频等等,若由于网络原因,导致语音、或视频卡顿,必定会造成音频流或视频流数据的丢失。

对于TCP来说,由于其严谨的态度,每次丢失的数据都要重新整理发送,这样一来,我们可能永远在和一个有延时的人进行语音或视频通话,这反而影响我们的使用体验。

相反,如果我们抱有这样一种态度,这些包丢了就丢了吧,一会网络好了再重新说一遍就好了……大家心里应该清楚了,对于语音与视频这种通讯方式通常都会使用UDP协议,它可以有效的避免一些问题的发生。

现在,我们知道了,TCP和UDP各有所长,TCP更完整,更严谨,而UDP更轻便,对于实时通话支持友好!因此,在合适的位置使用合适的协议显得尤为重要!

4.1 小测试

  1. 问题一
    问:TCP和UDP的主要区别是什么?
    答:① UDP标头比TCP标头少很多,尽管TCP功能更多,但是UDP更为轻量。
            ② TCP具有错误恢复功能,而UDP对错误一点都不关心。
            ③ TCP具有流控制,而UDP没有流控制。
            ④ TCP是面向连接的协议,而UDP是无法连接的
  2. 问题二
    问:那个协议会执行错误检测?
    答:这是一个技巧问题!
            UDP和TCP都具有有限的错误检测功能,因为它们可以使用其标头中的校验和字段来进行检测!
            但是,绝大多数错误检测都发生在第二层。例如:以太网将检测到错误并丢弃帧。当出现错误并且数据丢失的时候,TCP能够恢复,它会注意到有数据丢失,并请求重新发送,而UDP则没有此功能。
  3. 问题三
    问:如果TCP这么好,为什么还要使用UDP?
    答:UDP是轻量级的,因为它具有较小的标头,并且跳过诸如错误恢复和流控制之类的人物。因此,如果应用程序不需要这些功能(例如语音和视频流),或者这些功能在内置的应用程序中(例如DNS),则UDP要快的多。

原作者:

作者的其他文章:

  1. 小白也能看懂的网络基础 01 | 什么是网络?
  2. 小白也能看懂的网络基础 02 | 连接设备
  3. 小白也能看懂的网络基础 03 | OSI 模型是如何工作的?
  4. 小白也能看懂的网络基础 04 | IP 地址是如何工作的?
  5. 小白也能看懂的网络基础 05 | IP地址深度学习
  6. 小白也能看懂的网络安全 06 | TCP/IP 模型是如何工作的?
  7. 小白也能看懂的网络基础 07 | TCP和UDP是如何工作的?