当前位置：首页 > news >正文

【Linux系统编程】五、进程创建 -- fork()

news 2025/9/15 17:49:19

文章目录

前言
Ⅰ. 重温fork函数
- 一、fork()的概念
- 二、如何理解fork()有两个返回值
Ⅱ.fork的常规用法
Ⅲ. fork调用失败的原因
Ⅳ. 写时拷贝
- 为什么存在写时拷贝❓❓❓

前言

现阶段我们知道进程创建有如下两种方式，其实包括在以后的学习中这两种方式也是最常见的：

命令行启动命令 (程序、指令等)
通过程序自身 fork() 后产生的子进程

Ⅰ. 重温fork函数

一、fork()的概念

在 linux 中 fork函数 是非常重要的 系统函数，它从已存在进程中创建一个新进程。新进程为子进程，而原进程为父进程。之前我们通过查 man 手册，知道了运用 fork() 函数，并且调用它需要包含 头文件 <unistd.h>。

如下是函数的声明和返回值：

#include <unistd.h> 
pid_t fork(void); // 返回值：子进程中返回0，父进程返回子进程id，出错返回-1

但是之前我们一直有个问题没有解决，那么就是**为什么一个函数一个返回两个值？**有了之前的进程概念的知识，这里我们就可以来解释一下这个现象了！

二、如何理解fork()有两个返回值

父进程 fork 时，子进程是以父进程为模板，简单地说就是子进程的大部分属性和属性值是拷贝父进程的，而小部分是指子进程的调度时间要重置、子进程的 pid、ppid 以及兄弟的要重置。其中上面的 PCB、地址空间、页表都在内核里由操作系统维护的，这也就意味着我们只需要调用操作系统提供的接口 fork，而具体工作细节由操作系统完成。

那其中 为什么 fork() 给父进程返回子进程的pid，给子进程返回 0 呢？？？因为我们知道父进程和子进程的关系就是一对多的关系，每个子进程只能有一个孩子，而每个父进程可以有多个子进程，这个 返回值的意义就是为了标识它们的关系！

我们还要知道 fork() 函数是在用户空间中被我们调用的，但是其实现是在内核空间中由操作系统实现的！

fork() 的实现思路，大致如下：

1、给子进程分配新的内存块和内核数据结构（PCB、进程地址空间、页表等，并构建对应的映射关系）；

2、将父进程的部分数据结构内容拷贝至父进程；

3、把子进程添加到系统进程列表中；

4、fork 返回，调度器开始调度。

在这里插入图片描述

从上图我们知道既然在 fork 函数 return 之前，就已经有了父子两个进程，父子两个执行流分别执行，所以会给父进程返回子进程的PID，给子进程返回0，失败则返回-1。

让我们看看下面的代码程序：

#include <stdio.h>    
#include <unistd.h>    
#include <stdlib.h>    
int main()    
{    pid_t pid;    printf("Before: pid is %d\n", getpid());    if((pid = fork()) == -1) // 判断是否返回的是失败值{perror("fork()");exit(1);}printf("After:pid is %d, fork return %d\n", getpid(), pid);    sleep(1);    return 0;    
}    调用结果：
[liren@VM-8-2-centos process]$ ./mypro 
Before: pid is 20052
After:pid is 20052, fork return 20053
After:pid is 20053, fork return 0

从上述结果可以看到原来只有父进程一个也就是 20052，但是 fork 之后又产生了子进程 20053！

🔴 注意，fork 之后，谁先执行完全由调度器决定。

调度器是CPU中央处理器的管理员，主要负责完成做两件事情：

选择某些就绪进程来执行

打断某些执行的进程让它们变为就绪状态。

利用 fork 返回值的这个特性，我们可以用变量 id 接收返回值，根据 fork 返回值不同让父子进程执行不同的代码，这个我们之前也讲过啦，简单过一下就好！

#include <stdio.h>
#include <unistd.h>
int grobal_val = 100;
int main()
{pid_t id = fork();if(id == 0){printf("子进程:pid = %d,ppid = %d | grobal_val = %d, &grobal_val = %p\n",getpid(), getppid(), grobal_val, &grobal_val);}else if(id > 0){printf("父进程:pid = %d,ppid = %d | grobal_val = %d, &grobal_val = %p\n", getpid(), getppid(), grobal_val, &grobal_val);sleep(1);}else {printf("fork error\n");return 1;}return 0;
}调用结果：
[liren@VM-8-2-centos process]$ ./mypro 
父进程:pid = 18199,ppid = 16903 | grobal_val = 100, &grobal_val = 0x60105c
子进程:pid = 18200,ppid = 18199 | grobal_val = 100, &grobal_val = 0x60105c

Ⅱ.fork的常规用法

一个父进程希望复制自己，使得 父子进程同时执行不同的代码段。例如，父进程等待客户端请求，生成子进程来处理请求。
让一个进程执行一个不同的程序。例如子进程从 fork 返回后，调用 exec 函数。（这个会在进程替换中学习）

Ⅲ. fork调用失败的原因

fork 是操作系统级别的接口，所以失败的原因一定是系统级别的原因。

系统中已经存在太多的进程了。
实际用户创建的进程超过了限制。

这段代码是测试你的用户能跑好多个进程，但是不建议跑。因为跑了之后就会影响 bash，会导致系统出错！代码如下：

#include <stdio.h>
#include <unistd.h>
int main()
{int cnt = 0;while(1){int ret = fork();if(ret < 0){printf("fork error!, cnt: %d\n", cnt);break;}else if(ret == 0){// 子进程不断循环while(1) {printf("子进程:pid = %d,ppid = %d\n",getpid(), getppid());sleep(1);}}// 父进程不断循环不断产生子进程cnt++;}return 0;
}调用结果：
子进程:pid = 1706,ppid = 27353
子进程:pid = 32351,ppid = 27353
子进程:pid = 32348,ppid = 27353
子进程:pid = 32347,ppid = 27353
子进程:pid = 32331,ppid = 27353
............
^C
[liren@VM-8-2-centos process]$