当前位置: 首页 > news >正文

Linux中死锁问题的探讨

在 Linux 中,死锁(Deadlock) 是指多个进程或线程因为竞争资源而相互等待,导致所有相关进程或线程都无法继续执行的状态。死锁是一种严重的系统问题,会导致系统资源浪费,甚至系统崩溃。

死锁的定义

死锁是指两个或多个进程或线程在执行过程中,因为争夺资源而造成的一种互相等待的现象。如果没有外部干预,这些进程或线程将永远无法继续执行。

死锁的四个必要条件

死锁的发生需要同时满足以下四个条件(称为 Coffman 条件):

互斥条件(Mutual Exclusion)

资源一次只能被一个进程或线程占用。

例如,锁(如互斥锁)就是一种互斥资源。

占有并等待(Hold and Wait)

进程或线程持有至少一个资源,同时等待获取其他被占用的资源。

非抢占条件(No Preemption)

 已分配给进程或线程的资源不能被强制剥夺,必须由其自行释放。

循环等待条件(Circular Wait)

存在一个进程或线程的循环链,每个进程或线程都在等待下一个进程或线程所占用的资源。

只有当这四个条件同时满足时,死锁才会发生。

死锁的示例

以下是一个典型的死锁示例:

#include <pthread.h>
#include <stdio.h>pthread_mutex_t mutexA = PTHREAD_MUTEX_INITIALIZER;
pthread_mutex_t mutexB = PTHREAD_MUTEX_INITIALIZER;void* thread1_func(void* arg) {pthread_mutex_lock(&mutexA); // 线程1持有mutexAsleep(1); // 模拟一些操作pthread_mutex_lock(&mutexB); // 线程1尝试获取mutexBprintf("Thread 1 is running.\n");pthread_mutex_unlock(&mutexB);pthread_mutex_unlock(&mutexA);return NULL;
}void* thread2_func(void* arg) {pthread_mutex_lock(&mutexB); // 线程2持有mutexBsleep(1); // 模拟一些操作pthread_mutex_lock(&mutexA); // 线程2尝试获取mutexAprintf("Thread 2 is running.\n");pthread_mutex_unlock(&mutexA);pthread_mutex_unlock(&mutexB);return NULL;
}int main() {pthread_t tid1, tid2;pthread_create(&tid1, NULL, thread1_func, NULL);pthread_create(&tid2, NULL, thread2_func, NULL);pthread_join(tid1, NULL);pthread_join(tid2, NULL);return 0;
}

线程1持有 mutexA 并等待 mutexB

线程2持有 mutexB 并等待 mutexA

两个线程互相等待,导致死锁。

死锁的影响

资源浪费:死锁会导致相关进程或线程无法继续执行,占用系统资源。

系统崩溃:如果死锁涉及关键资源,可能导致整个系统无法正常运行。

难以调试:死锁通常难以复现和调试,尤其是在复杂的多线程程序中。

如何避免死锁

锁顺序:确保所有线程以相同的顺序获取锁。

超时机制:为锁操作设置超时(如 pthread_mutex_timedlock),避免无限等待。

避免嵌套锁:尽量减少锁的嵌套使用。

死锁检测:使用工具或算法检测死锁并采取措施。

资源分配策略:使用资源分配算法(如银行家算法)避免死锁。

死锁检测与恢复

检测

使用工具(如 gdbvalgrind)分析程序运行状态。

实现死锁检测算法(如图的环路检测)。

恢复

强制终止一个或多个进程或线程。

回滚操作,释放资源并重新分配。

线程阻塞

在 Linux 中,死锁阻塞是两个不同的概念,尽管它们都与资源的竞争和等待有关,但它们的表现和原因有显著区别:

阻塞(Blocking)

定义:阻塞是指一个进程或线程因为等待某个资源(如锁、I/O 操作、信号量等)而暂时无法继续执行,进入等待状态。

原因

等待获取锁(如互斥锁、读写锁)。

等待 I/O 操作完成(如读取文件、网络数据)。

等待信号量或其他同步机制。

特点

阻塞是暂时的,一旦资源可用,进程或线程会被唤醒并继续执行。

阻塞是正常的同步机制,用于协调多个进程或线程对共享资源的访问。

阻塞不会导致系统无法运行,只是当前任务暂时停止。

示例

pthread_mutex_lock(&mutex); // 如果锁被其他线程持有,当前线程会阻塞
// 临界区代码
pthread_mutex_unlock(&mutex);

区别总结

总之,阻塞是正常的同步行为,而死锁是需要避免的系统错误。

线程饥饿

一个线程持有锁一直不释放,其他线程一直在等待这个锁,这种情况不满足锁的四个必要条件,算是死锁吗?

比如如果一个线程持有锁后进入死循环,且其他线程尝试获取该锁。

具体过程:

  1. 线程 A 持有锁后进入死循环,永远不会释放锁。

  2. 线程 B 尝试获取该锁,但由于锁被线程 A 持有,线程 B 会一直阻塞等待。

  3. 如果还有其他线程也尝试获取该锁,它们同样会阻塞等待。

  4. 最终,这些线程会因为无法获取锁而永久阻塞

示例代码如下:

#include <pthread.h>
#include <stdio.h>pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;void* thread_func(void* arg) {pthread_mutex_lock(&mutex); // 线程 A 获取锁while (1) {// 死循环,永远不会释放锁}pthread_mutex_unlock(&mutex); // 这行代码永远不会执行return NULL;
}int main() {pthread_t tid;pthread_create(&tid, NULL, thread_func, NULL);pthread_mutex_lock(&mutex); // 主线程尝试获取锁,会一直阻塞printf("This will never be printed.\n");pthread_mutex_unlock(&mutex);pthread_join(tid, NULL);return 0;
}

线程 A 获取锁后进入死循环,永远不会释放锁。

主线程尝试获取锁时会被阻塞

这种情况下,虽然不满足死锁的四个必要条件,但它确实会导致类似死锁的现象,通常称为**资源饥饿(Resource Starvation)活锁(Livelock)**的一种表现。下面详细分析:

1. 这种情况的特点

一个线程持有锁后一直不释放。

其他线程因为无法获取锁而一直等待。

不满足死锁的四个必要条件(特别是循环等待条件),因为没有多个线程相互等待。

2. 为什么不是死锁?

死锁的四个必要条件之一是循环等待,即存在一个进程或线程的循环链,每个进程或线程都在等待下一个进程或线程所占用的资源。而在你的描述中:

只有一个线程持有锁,其他线程在等待这个锁。

没有形成循环等待链,因此不满足死锁的定义。

3. 这种情况的名称

这种情况通常被称为资源饥饿(Resource Starvation)

一个线程独占资源(如锁),导致其他线程无法获取资源,从而无法继续执行。

资源饥饿不一定是死锁,但它会导致系统性能下降或部分功能失效。

总结下线程饥饿和死锁的区别

比较明显的现象就是,线程饥饿时通常会有部分线程还能执行,但是死锁时,涉及到的所有线程都无法执行。

更多参考:

五、面试官:你讲一下线程死锁、饥饿和死循环的区别以及死锁的处理? 我:滔滔不绝...._死锁和循环依赖的区别-CSDN博客

常见问题

死锁、资源饥饿、CPU飙高、内存泄漏、内存溢出、栈溢出

http://www.lryc.cn/news/546813.html

相关文章:

  • 【实战 ES】实战 Elasticsearch:快速上手与深度实践-2.3.1 避免频繁更新(Update by Query的代价)
  • 【Python项目】基于Python的书籍售卖系统
  • spring boot + vue 搭建环境
  • Linux下的shell指令(一)
  • JS禁止web页面调试
  • GIt分支合并
  • Sqli-labs
  • unreal engine gameplay abiliity 获取ability的cooldown剩余时间
  • 【GenBI优化】提升text2sql准确率:建议使用推理大模型,增加重试
  • 【六祎 - Note】SQL备忘录;DDL,DML,DQL,DCL
  • 高频 SQL 50 题(基础版)_1341. 电影评分
  • JavaScript 变量命名规范
  • 解决 uView-UI和uv-ui 中 u-tabs 组件在微信小程序中出现横向滚动条的问题
  • 20250304解决在飞凌的OK3588-C的Linux R4下解决使用gstreamer保存的mp4打不开
  • build gcc
  • 【每日论文】How far can we go with ImageNet for Text-to-Image generation?
  • STM32 两个单片机之间的通信
  • Linux 下使用traceroute来进行网络诊断分析
  • 基于vue框架的游戏商城系统cq070(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • SpringBoot接入DeepSeek(硅基流动版)+ 前端页面调试(WebSocket连接模式)
  • idea实现热部署
  • 记一次误禁用USB导致键盘鼠标失灵的修复过程
  • 0x03 http协议和分层架构
  • 【leetcode hot 100 189】轮转数组
  • 医药行业哪些招聘管理系统有AI功能?
  • .net8 使用 license 证书授权案例解析
  • golang的io
  • 全向广播扬声器在油气田中的关键应用 全方位守护安全
  • 76.读取计时器运行时间 C#例子 WPF例子
  • 嵌入式开发:傅里叶变换(5):基于STM32,实现CMSIS中的DSP库