同步、异步、阻塞、非阻塞之间联系与区别
对于文件操作来说,不可避免会听到这几个词,但是他们之间有什么关系,没找到一个有说服力的说法。网上搜的资料、人工智能、自己的理解综合来说一下这个问题。
程序员自己开发的程序目前大部分是运行在linux上,linux区分用户态和内核态,程序运行在用户态上,通过发送系统调用,内核接收到这个命令后会调用一些硬件来执行自己想要的。
同步异步
是指运行在用户态程序调用操作系统io函数的方式
调用方式 | 调用函数 |
同步 | open()、write()、socket() |
异步 | io_uring()、aio_read() |
阻塞非阻塞
是指操作系统执行io操作的方式
其中,在 Linux 中,open() 函数用于打开或创建一个文件,其函数原型如下:
int open(const char *pathname, int flags, mode_t mode);
flags:指定文件的打开方式(如只读、只写、读写等)以及一些额外的行为标志。
其中,没有特殊指定,默认是同步调用,如果flags指定了O_NONBLOCK,则是非阻塞调用。
默认文件描述符中该参数是同步调用。
read()函数执行后,阻塞调用和非阻塞调用区别如下
阻塞调用的情况
- 如果数据尚未准备好(比如还在磁盘或网络传输中),内核会让调用线程进入等待状态(挂起),线程被移出调度队列,直到数据到达。
- 数据到达后,内核唤醒线程,将数据拷贝到用户空间,然后返回。
- 在整个过程中,用户线程是被阻塞的,无法做其他事情。
阻塞,即调用方需要一直等待io操作完成
非阻塞调用的情况
- 如果数据尚未准备好,内核不会让调用线程挂起,而是立即返回一个错误码(如 EWOULDBLOCK 或 EAGAIN),表示“现在无法完成操作”。
- 用户程序收到这个返回值后,可以选择做其他事情,稍后再尝试调用 read()。
- 用户程序需要主动地、不断地轮询内核,直到 read() 返回成功(数据已准备好)。
非阻塞,即调用方无需一直等待io操作完成,在等待的时间里去做别的事。通过事件通知或者回调函数来实现。
组合的情况
阻塞 | 非阻塞 | |
同步 | 同步阻塞(最常见) | 同步非阻塞(轮询/io多路复用技术) |
异步 | 不存在 | 异步非阻塞(真正异步io) |
同步阻塞
感觉像是全流程一个人在处理,因为全流程是阻塞的。
同步非阻塞
全流程分为了两个部分,类似领导(调用函数)和干活的(io操作方式),领导会时不时去看看干活的是否干完了。
异步非阻塞
在同步非阻塞的基础上,干活的(io操作方式)干完后会发通知领导(调用函数),领导也会通知自己的领导。
总结
同步和异步是调用完成后通知方式的区别,同步调用无人通知,需要自己返回,异步会在任务完成后通知(io_uring()、aio_read())。
阻塞和非阻塞就是操作系统执行io操作的区别,非阻塞分为调用方主动轮询和io多路复用技术两种,轮询会耗cpu资源,事件通知或者回调函数不会。
同步阻塞编程简单,同步非阻塞稍微复杂,需要处理轮询操作,异步非阻塞最复杂,需要处理事件通知或者回调函数如何处理的事。