那些年让你迷惑的阻塞、非阻塞、异步、同步

Yishto 2021-08-20 21:47:11
Categories: Tags:

1、从I/O说起

这些概念之所以容易令人迷惑,在于很多人对I/O就没有清晰准确的理解,后面的理解自然不可能正确。我想用一个具体的例子来说明一下I/O。

设想自己是一个进程,就叫小进吧。小进需要接收一个输入,我们不管这个输入是从网络套接字来,还是键盘,鼠标来,输入的来源可以千千万万。但是,都必须由内核来帮小进完成,为啥内核这么霸道?因为计算机上运行的可不只是咱小进一个进程,还有很多进程。这些进程兄弟也可能需要从这些输入设备接收输入,没有内核居中协调,岂不是乱套。

从小进的角度看,内核帮助它完成输入,其实包括三个步骤:

这三步看似挺简单,其实在具体实现时,有很多地方需要考虑:

2、阻塞式I/O模型

对上面5个问题,最简单的解决方案就是阻塞式I/O模型,它的过程是这样的:

小进:内核内核,我要接收一个键盘输入,快点帮我完成!

内核:好咧!biubiu!内核迅速将小进阻塞,可怜的小进顿时石化,就像被孙悟空点了定一样。

就这样,小进在石化中,时间一点点流逝。终于,内核收到了数据。

内核:数据终于来了,我要开干了!duang duang duang,先把数据存在自己的内核空间,然后又复制到小进的用户空间。

内核:biubiu!内核解除了小进的阻塞,小进瞬间复活,小进的记忆还是停留在让内核帮他接收输入时。

小进:哇!内核真靠谱,数据已经有了!干活去!

我们可以看到,小进发出接收输入的请求给内核开始,就处于阻塞状态,直到内核将数据复制到小进的用户空间,小进才解除阻塞。

以上过程可通过下图来解释:

3、非阻塞式I/O

小进发现,阻塞式I/O中,自己总要被阻塞好久,好不爽啊,于是小进改用了非阻塞式I/O,其过程是这样的:

小进:内核内核,我要接收一个输入,赶紧帮我看看,数据到了没有,先说好,不要阻塞我。

内核:查看了一下自己的内核空间,没有发现数据,于是迅速告诉小进,没有呢!并继续帮小进等着数据。

如此这样,小进不断地问内核,终于,过了一段时间,小进再一次询问时,内核往自己的空间中一查,呦!数据来了,不胜其烦的内核迅速告诉小进,数据好了!

小进:快给我!

内核:biu!内核干净利落地阻塞了小进,悲催的小进还是石化了!

内核赶紧将自己空间的输入数据复制到小进的用户空间,复制好后。

内核:biu!内核解除了小进的阻塞,小进立马复活

小进:哇!数据来了,啥也不说,干活!

我们看到,所谓的非阻塞I/O,其实在内核将数据从内核空间复制到小进的用户空间时,小进还是被阻塞的。

具体过程如下图所示:

4、异步I/O

上面的两种I/O解决方案中,小进都被阻塞了,只不过是阻塞时间长短不一样,第一种方案中小进被阻塞的时间长一些,在内核接收数据以及将数据复制到小进的用户空间时,都被阻塞。

第二种方案中,只在内核将数据从内核空间复制到小进的用户空间时,小进才被阻塞。

我们现在说的异步I/O,目的就是让小进绝对不被阻塞。其过程是这样的:

小进:内核内核,我要接收一个输入,弄好了告诉我。同时将一个信号和信号处理函数告诉内核,然后继续干自己的活了。

内核:得了您嘞,您先忙。

一直到内核接收到数据并将数据从内核空间复制到小进的用户空间后,内核才给小进发送信号。小进在信号处理函数中可以直接处理数据。

其过程可用下图解释:

5、IO多路复用

在上面的阻塞IO中,我们的小进都是直接阻塞在IO系统调用recvfrom上,可以说是与IO系统调用“零距离”。

这种做法有一定的弊端,就是当小进要同时等待多个输入,哪个先来就处理哪个时,小进不知道哪个先来,自然也就不知道应该被阻塞到哪一个输入的recvfrom上好。

聪明如你,可能会说,那全部用异步IO呗。但这样也不方便,就是小进要为每一个输入都在系统中注册一个信号和信号处理函数,这可是要与内核打交道的。如果要等的输入非常多,岂不是非常的麻烦。

为了方便处理这种情况,小进可以使用一个输入管家,就是select系统调用,该调用可以帮助小进管理所有的输入(通常是套接字),每当一个输入中有数据到来时,就告诉小进。这样小进实际上是阻塞在select系统调用上,而不是阻塞在真正的IO系统调用上,如下图所示:

6、那啥是同步呢?

一句话,凡是让小进阻塞(不管长短)的I/O方案都是同步I/O。也就是说,阻塞、非阻塞、信号驱动式都是同步I/O。