当前位置: 首页 > news >正文

线程与进程的深入解析及 Linux 线程编程

在操作系统中,进程和线程是进行并发执行的两种基本单位。理解它们的区别和各自的特点,能够帮助开发者更好地进行多任务编程,提高程序的并发性能。本文将探讨进程和线程的基础概念,及其在 Linux 系统中的实现方式,并介绍如何在 Linux 下进行线程编程。

进程与线程概念

进程

进程是程序的执行实例,是操作系统进行资源分配和调度的基本单位。每个进程都具有自己的独立内存空间、程序计数器、堆栈等资源。进程的创建过程是通过复制当前进程的数据来完成的,常见的系统调用有 fork() 和 vfork()

  1. fork():创建一个子进程,子进程是父进程的副本,拥有独立的内存空间。父进程和子进程的资源相互隔离。
  2. vfork():创建一个子进程时,父进程会被暂停,子进程共享父进程的内存空间,直到子进程调用 exec() 或 _exit() 来退出。

然而,进程的创建通常涉及大量的数据复制,影响系统的效率。这是因为每个进程都需要有独立的资源,造成一定的开销。

线程

线程是进程中的执行单位,也是操作系统调度的最小单位。与进程不同,线程不拥有独立的资源,而是与同一进程中的其他线程共享进程的资源(如内存、文件描述符等)。线程的创建和销毁比进程更加轻量级,因此线程通常用于提高并发性能。

一个线程通常由以下几个部分组成:

  • 线程ID (Thread ID):每个线程都有一个唯一的标识符。
  • 程序计数器:指向线程执行的下一条指令。
  • 寄存器:保存线程执行的中间状态。
  • :每个线程有自己的栈,用于保存局部变量和函数调用的上下文。

进程与线程的关系

  1. 线程依附于进程:每个线程都属于某个进程,不能脱离进程独立存在。
  2. 进程终止,线程随之终止:当一个进程终止时,其内部所有的线程都会被终止。
  3. 一个进程可以创建多个线程:这使得进程内可以同时执行多个任务,从而提高并发度。

进程与线程的区别

  • 资源分配

    • 进程是资源分配的单位,每个进程都有独立的资源。
    • 线程是调度执行的单位,多个线程共享同一进程的资源。
  • 创建开销

    • 进程创建时需要复制大量数据,开销较大。
    • 线程创建轻量级,开销较小。
  • 调度单位

    • 进程是操作系统调度的基本单位。
    • 线程是操作系统调度的最小单位。

Linux 下的线程编程

在 Linux 系统中,线程编程通常依赖于 NPTL(Native POSIX Thread Library),这是一种本地线程库,实现了 POSIX 标准中的线程相关接口。NPTL 库提供了线程的创建、执行、结束等功能。

创建线程

Linux 中可以通过 pthread_create 函数创建线程。该函数的原型如下:

int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine)(void *), void *arg);
  • thread:线程的标识符。
  • attr:线程属性,一般为 NULL 表示使用默认属性。
  • start_routine:线程执行的函数(即线程的入口函数)。
  • arg:传递给 start_routine 函数的参数。

线程的执行函数通常定义如下:

void *do_something(void *arg) {printf("Thread %d\n", getpid());return NULL;
}

创建线程后,主线程和新创建的线程将并发执行。

线程的结束

线程可以通过以下几种方式结束:

  1. 返回:线程执行函数返回时,线程结束,等价于调用 pthread_exit
  2. 调用 pthread_exit:主动调用 pthread_exit 结束线程。
  3. 线程被取消:通过 pthread_cancel 可以取消线程。
  4. 进程结束:如果进程结束,所有线程也会结束。
void pthread_exit(void *retval);
  • retval:线程退出时传递的返回值。

线程同步

线程共享进程的资源,这带来了数据竞争问题。为了避免多个线程同时访问共享数据导致的错误,我们通常使用互斥锁(mutex)等同步机制。

例如,可以使用 pthread_mutex_lock 和 pthread_mutex_unlock 来保护临界区:

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;void *thread_func(void *arg) {pthread_mutex_lock(&mutex);// 临界区代码pthread_mutex_unlock(&mutex);return NULL;
}

线程终止与回收

当一个线程结束时,其资源不会立即释放。如果需要主线程等待某个子线程结束并回收其资源,可以使用 pthread_join

int pthread_join(pthread_t thread, void **retval);
  • thread:要等待的线程。
  • retval:线程的返回值。

pthread_join 会阻塞当前线程,直到指定的线程结束。

示例代码

以下是一个简单的示例,展示如何在 Linux 下创建多个线程,分别打印不同的消息:

#include <pthread.h>
#include <stdio.h>
#include <unistd.h>void *thread1_func(void *arg) {printf("Thread 1: PID = %d\n", getpid());return NULL;
}void *thread2_func(void *arg) {printf("Thread 2: PID = %d\n", getpid());return NULL;
}int main() {pthread_t thread1, thread2;pthread_create(&thread1, NULL, thread1_func, NULL);pthread_create(&thread2, NULL, thread2_func, NULL);pthread_join(thread1, NULL);pthread_join(thread2, NULL);return 0;
}

查看全部

编译时,使用 -lpthread 链接线程库:

gcc -o thread_example thread_example.c -lpthread

结论

进程和线程是操作系统中的两种基本单位,它们在资源管理和调度上各有不同。进程是资源分配的单位,而线程是调度的基本单位。在 Linux 中,NPTL 库提供了高效的线程创建和管理方式,线程编程能够显著提高程序的并发性。在实际开发中,我们需要通过合适的同步机制来保证线程间的数据一致性。

希望这篇文章能帮助你更好地理解进程和线程,并掌握在 Linux 下的线程编程技巧。

http://www.lryc.cn/news/540622.html

相关文章:

  • 在ubuntu上用Python的openpyxl模块操作Excel的案例
  • 【OS安装与使用】part6-ubuntu 22.04+CUDA 12.4运行MARL算法(多智能体强化学习)
  • 【Python爬虫(35)】解锁Python多进程爬虫:高效数据抓取秘籍
  • HarmonyOS 开发套件 介绍 ——上篇
  • Linux 高级篇 日志管理、定制自己的Linux系统、备份与恢复
  • deepseek与其他大模型配合组合
  • 经验分享—WEB渗透测试中遇到加密内容的数据包该如何测试!
  • JUC并发—9.并发安全集合四
  • JSON格式,C语言自己实现,以及直接调用库函数(一)
  • MinkowskiEngine安装(CUDA11.8+torch2.0.1+RTX4070TI)
  • Spring监听器Listener
  • 【深度学习在图像配准中的应用与挑战】
  • 使用 Docker-compose 部署 MySQL
  • blender笔记2
  • 特殊符号_符号图案_特殊符号大全
  • Unity学习part4
  • 【AI绘画】大卫• 霍克尼风格——自然的魔法(一丹一世界)
  • MySQL日志undo log、redo log和binlog详解
  • C++中的指针
  • 拆解微软CEO纳德拉战略蓝图:AI、量子计算、游戏革命如何改写未来规则!
  • 智能算法如何优化数字内容体验的个性化推荐效果
  • MATLAB在数据分析和绘图中的应用:从基础到实践
  • AI客服-接入deepseek大模型到微信(本地部署deepseek集成微信自动收发消息)
  • Host文件没有配置ip解析,导致请求接口速度慢
  • excel导入Mysql中时间格式异常
  • vue 判断一个属性值,如果是null或者空字符串或者是空格没有值的情况下,赋值为--
  • JavaWeb-Tomcat服务器
  • vue语法---样式操作-行内样式
  • 封装一个echarts的组件
  • 计算机网络安全之一:网络安全概述