当前位置：首页 > news >正文

僵尸（Zombie）进程

news 2025/7/4 15:38:04

文章目录

1.僵尸进程
2.产生僵尸进程的原因
3.利用 wait 函数销毁僵尸进程
4.使用 waitpid 函数销毁僵尸进程

1.僵尸进程

进程完成工作后（执行完 main 函数中的程序后）应被销毁，但有时这些进程将变成僵尸进程，占用系统中的重要资源。这种状态下的进程称作“僵尸进程”，这也是给系统带来负担的原因之一。我们应该消灭这种进程。当然应掌握正确的方法，否则它会死灰复燃。

从下图可以看到，父进程的 PID 是 1166，子进程的 PID 是 1167。

在这里插入图片描述

如果我们使用 kill -9 1167 命令将子进程干掉，观察父进程会收到什么信号？

从下图可以看到，父进程收到了 SIGCHLD 信号，子进程变成了僵尸进程。

在这里插入图片描述

在 Unix 系统中，一个子进程结束了，但是他的父进程还活着，但该父进程没有调用 wait()/waitpid() 函数来进行额外的处置，那么这个子进程就会变成一个僵尸进程。

僵尸进程已经被终止，不干活了，但是依旧没有被内核丢弃掉，因为内核认为父进程可能还需要该子进程的一些信息。作为开发者，坚决不允许僵尸进程的存在。

如何干掉僵尸进程？

重启电脑。
手动地把僵尸进程的父进程干掉，僵尸进程就会自动消失。
一个进程被终止或者停止时，SIGCHLD 信号会被发送给父进程，所以，对于源码中有 fork() 行为的进程，我们应该拦截并处理 SIGCHLD 信号。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>// 信号处理函数
void sig_usr(int signo)
{int status;switch (signo){case SIGUSR1:printf("收到了SIGUSR1信号，进程id=%d!\n", getpid());    break;case SIGCHLD:printf("收到了SIGCHLD信号，进程id=%d!\n", getpid());// waitpid()函数获取子进程的终止状态，这样子进程就不会成为僵尸进程了// 第一个参数为-1，表示等待任何子进程// 第二个参数保存子进程的状态信息// 第三个参数提供额外选项，WNOHANG表示不要阻塞，让这个waitpid()立即返回pid_t pid = waitpid(-1, &status, WNOHANG);if (pid == 0) return; // 子进程没结束，会立即返回这个数字if (pid == -1) return; // 这表示这个waitpid()调用有错误，有错误也立即返回出去return; // 走到这里，表示成功，那也return吧break;}
}int main(int argc, char* const* argv)
{pid_t pid;printf("进程开始执行!\n");// 系统函数，第一个参数是个信号，第二个参数是个函数指针，代表一个针对该信号的捕捉处理函数if (signal(SIGUSR1, sig_usr) == SIG_ERR){printf("无法捕捉SIGUSR1信号!\n");exit(1);}if (signal(SIGCHLD, sig_usr) == SIG_ERR){printf("无法捕捉SIGCHLD信号!\n");exit(1);}pid = fork(); // 创建一个子进程// 要判断子进程是否创建成功if (pid < 0){printf("子进程创建失败，很遗憾!\n");exit(1);}// 现在父进程和子进程同时开始运行了 for (;;){sleep(1);printf("休息1秒，进程id=%d!\n", getpid());}printf("再见了!\n");return 0;
}

在这里插入图片描述

2.产生僵尸进程的原因

向 exit 函数传递的参数值和 main 函数的 return 语句返回的值都会传递给操作系统。而操作系统不会销毁子进程，直到把这些值传递给产生该子进程的父进程。处在这种状态下的进程就是僵尸进程。也就是说，将子进程变成僵尸进程的正是操作系统。

问：此僵尸进程何时被销毁呢？

答：应该向创建子进程的父进程传递子进程的 exit 参数值或 return 语句的返回值。

问：如何向父进程传递这些值呢？

答：操作系统不会主动把这些值传递给父进程。只有父进程主动发起请求（函数调用）时，操作系统才会传递该值。换言之，如果父进程未主动要求获得子进程的结束状态值，操作系统将一直保存，并让子进程长时间处于僵尸进程状态。也就是说，父母要负责收回自己生的孩子。

接下来的示例将创建僵尸进程。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>int main(int argc, char *argv[])
{pid_t pid = fork();if (pid == 0)    // if Child Process{puts("Hi, I am a child process");}else{// 输出子进程ID。可以通过该值查看子进程状态（是否为僵尸进程）。printf("Child Process ID: %d\n", pid);// 父进程暂停30秒。如果父进程终止，处于僵尸状态的子进程将同时销毁。因此，延缓父进程的执行以验证僵尸进程。sleep(30);    // Sleep 30 sec.}if (pid == 0)puts("End child process");elseputs("End parent process");return 0;
}

编译运行：

gcc zombie.c -o zombie
./zombie

在这里插入图片描述

程序开始运行后，将在如上所示状态暂停。跳出这种状态前（30秒内），应验证子进程是否为僵尸进程，该验证在其他控制台窗口进行。

在这里插入图片描述

可以看出，PID 为 1387 的进程状态为僵尸进程（Z+）。另外，经过 30 秒的等待时间后，PID 为 1386 的父进程和 PID 为 1387 的僵尸子进程同时销毁。

3.利用 wait 函数销毁僵尸进程

如前所述，为了销毁子进程，父进程应主动请求获取子进程的返回值。

#include <sys/wait.h>pid_t wait(int *statloc);// 成功时返回终止的子进程ID，失败时返回-1

调用此函数时如果已有子进程终止，那么子进程终止时传递的返回值（exit 函数的参数值、main 函数的 return 返回值）将保存到该函数的参数所指内存空间。但函数参数指向的单元中还包含其他信息，因此需要通过下列宏进行分离：

WIFEXITED：子进程正常终止时返回“真”（true）。
WEXITSTATUS：返回子进程的返回值。

也就是说，向 wait 函数传递变量 status 的地址时，调用 wait 函数后应编写如下代码：

if (WIFEXITED(status))    // 是正常终止的吗？
{puts("Normal termination!");printf("Child pass num: %d", WEXITSTATUS(status));    // 那么返回值是多少？
}

根据上述内容编写如下示例，在下面示例中，不会再让子进程变成僵尸进程。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>int main(int argc, char *argv[])
{int status;// 第11行创建的子进程将在第15行通过main函数中的return语句终止。pid_t pid = fork();if (pid == 0){return 3;}else{printf("Child PID: %d\n", pid);// 第22行中创建的子进程将在第26行通过调用exit函数终止。pid = fork();if (pid == 0){exit(7);}else{printf("Child PID: %d\n", pid);// 调用wait函数。之前终止的子进程相关信息将保存到status变量，同时相关子进程被完全销毁。wait(&status);// 第36行中通过WIFEXITED宏验证子进程是否正常终止。如果正常退出，则调用WEXITSTATUS宏输出子进程的返回值。if (WIFEXITED(status))printf("Child send one: %d\n", WEXITSTATUS(status));// 因为之前创建了2个进程，所以再次调用wait函数和宏。wait(&status);if (WIFEXITED(status))printf("Child send two: %d\n", WEXITSTATUS(status));// 为暂停父进程终止而插入的代码。此时可以查看子进程的状态。sleep(30); // Sleep 30 sec.}}return 0;
}

编译运行：

gcc wait.c -o wait
./wait

输出结果：

在这里插入图片描述

可以看出，此时系统中并没有 PID 为 1497 和 1498 的进程，这是因为调用了 wait 函数，完全销毁了该子进程。另外，两个子进程终止时返回的 $3$ 和 $7$ 传递到了父进程。

这就是通过调用 wait 函数消灭僵尸进程的方法。调用 wait 函数时，如果没有已终止的子进程，那么程序将阻塞（Blocking）直到有子进程终止，因此要谨慎调用该函数。

4.使用 waitpid 函数销毁僵尸进程

wait 函数会引起程序阻塞，还可以考虑调用 waitpid 函数。这是防止僵尸进程的第二种方法，也是防止阻塞的方法。

#include <sys/wait.h>pid_t waitpid(pid_t pid, int *statloc, int options);// 成功时返回终止的子进程ID（或0），失败时返回-1
// pid：等待终止的目标子进程的ID，若传递-1，则与wait函数相同，可以等待任意子进程终止
// statloc：与wait函数的statloc参数具有相同含义
// options：传递头文件sys/wait.h中声明的常量WNOHANG，即使没有终止的子进程也不会进入阻塞状态，而是返回0并退出函数

下面介绍调用 waitpid 函数的示例。调用 waitpid 函数时，程序不会阻塞。

#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>int main(int argc, char *argv[])
{int status;pid_t pid = fork();if (pid == 0){// 调用sleep函数推迟子进程的执行。这会导致程序延迟15秒。sleep(15);return 24;}else{// while循环中调用waitpid函数。向第三个参数传递WNOHANG，因此，若之前没有终止的子进程将返回0。while (!waitpid(-1, &status, WNOHANG)){sleep(3);puts("sleep 3sec.");}if (WIFEXITED(status))printf("Child send %d\n", WEXITSTATUS(status));}return 0;
}