【Linux取经路】进程控制——进程等待

本文介绍: 本篇文章介绍了进程结束的三种状态，以此引出进程等待的话题，为什么要进行进程等待，进程等待是如何做到的、以及实现进程等待的两个系统调用、阻塞等待和非阻塞轮询等待的介绍。

在这里插入图片描述

在 Linux 中，fork 函数用于从已存在进程中创建一个新进程。新进程为子进程，而原进程为父进程。

#include <unistd.h>
pid_t fork(void); // fork 函数声明
返回值：子进程中返回0；父进程中返回子进程的 pid，出错返回-1。

一个进程调用 fork 函数后，当控制转移到内核中的 fork 代码后（执行 fork 函数的代码），内核做了如下一些工作：

小Tips：其实做完前两步，子进程就已经被创建出来了。

在这里插入图片描述
当一个进程调用 fork 之后，就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以开始它们自己的旅程。说的再多还是需要通过代码来演示证明。

#include <stdio.h>    
#include <unistd.h>    
    
int main()    
{    
    printf("befor pid：%dn", getpid());    
    
    fork();    
    
    printf("after pid：%dn", getpid());                                                                                                                                                                          
    return 0;    
}

#include <stdio.h>      
#include <unistd.h>      
#include <stdlib.h>      
    
#define N 5                                                                                            
                      
void func()           
{                      
    int cnt = 10;      
    while(cnt)        
    {                                                                       
        printf("I am chid, pid：%d, ppid：%dn", getpid(), getppid());      
        cnt--;                                                            
        sleep(1);                                                         
    }                 
    return;           
}                     
                      
int main()            
{                     
    int i = 0;                  
    for(i = 0; i < N; i++)      
    {                           
        pid_t id = fork();                  
        if(id == 0)// 只有子进程会进去      
        {                                 
            func();                                
            exit(0);// 子进程走到这里就退出了      
        }                                        
    }                                            
    sleep(1000);      
    return 0;       
}

一般代码运行完毕，结果正确，我们是不会关心代码为什么跑对了。但是当代码运行完毕，结果不正确，我们作为程序员是需要知道为什么结果不正确，因此进程需要将运行结果以及不正确的原因告诉程序员。这就是 main 函数里常写的 return 0 的作用。return 后面跟的数字叫做进程的退出码，表征进程的运行结果是否正确，不同的返回数字表征不同的出错原因，0表示 success。main 函数 return 的这个0，最终会被父进程，即 bash 拿到。可以在 bash 中输出 echo $? 指令查看上一个子进程的退出码。$? 表示命令行当中最近一个进程运行的退出码。

int main()    
{    
    printf("模拟一段逻辑！n");    
    return 0;                                                                                          
}

int main()      
{      
    int i = 0;      
    for(; i < 200; i++)      
    {      
        printf("%d, %sn", i, strerror(i));                                                            
    }                              
    return 0;                      
}

#include <stdio.h>    
#include <unistd.h>    
#include <stdlib.h>    
#include <string.h>    
#include <errno.h>                                                                                   
    
int main()    
{    
    int ret = 0;    
    char* str = (char*)malloc(1000*1000*1000*4);    
    if(str == NULL)    
    {    
        printf("malloc error：%d, %sn", errno, strerror(errno));    
        ret = errno;    
    }    
    else    
    {    
        printf("malloc success!n");    
    }    
    return ret;    
}

int main()    
{    
    char* pc = NULL;    
    *pc = 'a'; // 解引用空指针，会发生段错误
    return 0;
}

#include <unistd.h>
void exit(int status);

在代码中的任何地方调用 exit 函数，都表示调用进程直接退出。退出码就是 exit 函数的参数 status。说这个主要是为了区分 return 和 exit，return 只有在主函数（main）中出现才表示进程退出，在普通的函数中使用 return 仅表示函数返回，而在函数中使用 exit，也会让进程直接退出。

在这里插入图片描述
上面的现象我们是可以理解的，printf 函数后面没有加 n，因此要打印的内容先被保存在了缓冲区中，等休眠两秒后，程序执行 exit 退出，程序退出会刷新缓冲区，所以程序运行我们看到的效果是前两秒什么也没打印，在程序退出前才执行了打印。下面我们把 exit 换成 _exit 再看看效果。

结论：_exit 是系统调用，exit 是库函数。exit 最后会调用 _exit，但是在调用 _exit 之前，还做了下面几个工作。

进程等待就是在父进程的代码中，通过系统调用 wait/waitpid，来进行对子进程进行状态检测与回收的功能。

#include <sys/types.h>
#include <sys/wait.h>

pid_t wait(int* status);

#include <sys/types.h>
#include <sys/wait.h>

pid_t waitpid(pid_t pid, int* status, int options);

#include <stdio.h>    
#include <unistd.h>    
#include <stdlib.h>    
#include <sys/types.h>    
#include <sys/wait.h>    
    
int main()    
{    
    pid_t id = fork();    
    if(id < 0)    
    {    
        perror("fork");    
        return 1;    
    }    
    else if(id == 0)    
    {    
        // child    
        int cnt = 5;    
        while(cnt)    
        {    
            printf("I am child, pid：%d, ppid：%d, cnt：%dn", getpid(), getppid(), cnt--);    
            sleep(1);    
        }    
        exit(0);    
    }    
    else    
    {    
        int cnt = 10;    
        // parent    
        while(cnt)    
        {    
            printf("I am parent, pid：%d, ppid：%d, cnt：%dn", getpid(), getppid(), cnt--);    
            sleep(1);    
        }    
    
        int ret = wait(NULL);    
        if(ret == id)    
        {    
            printf("wait success!n");    
        }    
        sleep(5);                                                                                                                                               
    }    
    
    return 0;    
}

一个 wait 只能等待任意一个子进程，因此父进程如果要等待多个子进程可以通过循环来多次调用 wait 实现等待多个子进程。

#include <stdio.h>    
#include <unistd.h>    
#include <stdlib.h>    
#include <sys/types.h>    
#include <sys/wait.h>    
    
#define N 5    
// 父进程等待多个子进程    
void RunChild()    
{    
    int cnt = 5;    
    while(cnt--)    
    {    
        printf("I am child, pid：%d, ppid：%dn", getpid(), getppid());    
        sleep(1);    
    }    
    return;    
}    
int main()    
{    
    for(int i = 0; i < N; i++)    
    {    
        pid_t id = fork();// 创建一批子进程    
        if(id == 0)    
        {    
            // 子进程    
            RunChild();    
            exit(0);    
        }    
        // 父进程    
        printf("Creat process sucess：%dn", id);    
    }    
    
    sleep(10);    
    
    for(int i = 0; i < N; i++)    
    {    
        pid_t id = wait(NULL);                                                                                
        if(id > 0)    
        {    
            printf("Wait process：%d, success!n", id);    
        }    
    }    
    
    sleep(5);    
    return 0;    
}

在这里插入图片描述
小Tips：如果子进程不退出，父进程在执行 wait 系统调用的时候也不返回（默认情况），默认叫做阻塞状态。由此可以看出，一个进程不仅可以等待硬件资源，也可以等待软件资源，这里的子进程就是软件。

在 2.1 小结提到过，进程有三种退出场景。正是因为有这三种退出场景，父进程等待希望获得子进程退出的以下信息：子进程代码是否异常；没有异常，结果对嘛？不对是因为什么呢？子进程这些所有的退出信息都被保存在 status 参数里面。

int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
        return 1;
    }
    else if(id == 0)
    {
        // child
        int cnt = 5, a = 10;
        while(cnt)
        {
            printf("I am child, pid：%d, ppid：%d, cnt：%dn", getpid(), getppid(), cnt--);
            sleep(1);
            a /= 0; // 故意制造一个异常
        }
        exit(11); // 将退出码故意设置成11
    }
    else 
    {
        // parent
        int cnt = 10;
        while(cnt)
        {
            printf("I am parent, pid：%d, ppid：%d, cnt：%dn", getpid(), getppid(), cnt--);
            sleep(1); 
        }

        // 目前为止，进程等待是必须的！
        //int ret = wait(NULL);
        int status = 0;
        int ret = waitpid(id, &status, 0);
        if(ret == id)
        {
        	// 获取子进程退出状态信息的关键代码
            // 0111 1111:0x7F,1111 1111 0000 0000:0xFF00
            printf("wait success! exit signal：%d, exit code：%d!n", status&0X7F, (status >> 8)&0XFF); 
        }
        sleep(5);
    }
    return 0;
}

// 常规的进程等待代码
int status = 0;
int ret = waitpid(id, &status, 0);
if(ret == id)
{
    // 0111 1111:0x7F,1111 1111 0000 0000:0xFF00
    //printf("wait success! exit signal：%d, exit code：%d!n", status&0X7F, (status >> 8)&0XFF);
    if(WIFEXITED(status))
    {
        printf("子进程正常退出，退出码是：%dn", WEXITSTATUS(status));
    }
    else 
    {
        printf("子进程被异常终止！n");
    }
}

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>

// 父进程只等待一个子进程(非阻塞轮询等待)
int main()
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
        return 1;
    }
    else if(id == 0)
    {
        // child
        int cnt = 5;
        while(cnt)
        {
            printf("I am child, pid：%d, ppid：%d, cnt：%dn", getpid(), getppid(), cnt--);
            sleep(1);
            //a /= 0;
        }
        exit(11);
    }
    else 
    {
        // parent 
        // 目前为止，进程等待是必须的！
        //int ret = wait(NULL);
        while(1)
        {
            int status = 0;
            int ret = waitpid(id, &status, WNOHANG);
            if(ret > 0)
            {
                // 0111 1111:0x7F,1111 1111 0000 0000:0xFF00
                //printf("wait success! exit signal：%d, exit code：%d!n", status&0X7F, (status >> 8)&0XFF);
                if(WIFEXITED(status))
                {
                    printf("子进程正常退出，退出码是：%dn", WEXITSTATUS(status));
                }
                else 
                {
                    printf("子进程被异常终止！n");
                }
                break;
            }
            else if(ret == 0)
            {
            	// 父进程的任务可以写在这里
                printf("child process is running...n");
            }
            else
            {
                printf("等待出错！n");
            }
            sleep(1);
        }
        sleep(2);
    }

    return 0;
}