【Linux】探索进程的父与子

本文介绍: 探索Linux下的父子进程，以及fork函数理解

最近，我发现了一个超级强大的人工智能学习网站。它以通俗易懂的方式呈现复杂的概念，而且内容风趣幽默。我觉得它对大家可能会有所帮助，所以我在此分享。点击这段文字跳转到网站。

在这里插入图片描述

一个进程想要获取自己的PID可以通过调用系统调用接口getpid()，它会返回调用这个函数进程的PID，返回值是pid_t类型。
在这里插入图片描述
我们来写代码使用一下这个函数：

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main()
{

    pid_t id=getpid();
    while(1)
    {
        printf("我是一个进程，我的pid是%d",id);
        sleep(1);
    }

    return 0;
}

我们在编译前可以写一个监控脚本：

while :; do ps axj | head -1 ; ps axj | grep proc | grep -v grep; sleep 1; done

这条命令的作用是每隔一秒检查并显示与 “proc” 相关的进程信息。下面是对这条命令的详细解释：

我们下来编译运行一下看结果>
在这里插入图片描述
可以看到我们用ps命令查询出来的进程pid和进程自己打印出来的pid相同。

当然进程除了pid之外呢，进程还有所谓的叫做父进程pid，那么当然我们查的时候呢，我们看到这儿有一个pid，那么这还有一个ppid，这个ppid什么意思呢，就第1个p呢，就相当于叫做parent啊，父母的意思，然后第2个p呢就是process ID ，所以PPID呢就是的父进程id号，所以呢，我们一般在进行我们进程所对应的一个操作的时候呢，除了能获得自己的id也能获得父进程的id值。
获取父进程pid的函数接口是getppid()返回值类型参数跟getpid()相同。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main()
{
    while(1)
    {
        printf("我是一个进程，我的pid是%d，我的父进程ppid是%dn",getpid(),getppid());
        sleep(1);
    }

    return 0;
}

ps axj | head -1 ; ps axj | grep 7361

我们一直在讨论如何创建进程以及维护进程之间的父子关系。现在我们来谈一下实际创建进程的方法和如何维护这些关系。如果我想创建进程，我应该采取哪些方法呢？今天我们已经了解了其中一种创建进程的方法，那就是通过直接执行命令行来创建并运行一个进程。执行./proc命令就可以创建一个新的进程并在其上运行。但是，如果我想手动创建一个进程呢？为了满足这个需求，我们可以使用Linux系统中的fork函数来手动创建进程。这个函数允许我们创建一个新的进程，并在其中运行我们想要的代码。
在这里插入图片描述
fork()函数通过复制调用它的进程（我们称之为父进程）来创建一个新的进程（我们称之为子进程）
我先给大家写一个demo代码,来演示一下效果:

int main()
{
    printf("before:only one linen");
    fork();
    printf("after:onlu one linen");
    sleep(1);
    return 0;
}

在这里插入图片描述
这里我们看到fork之前的代码被执行了一次，但是fork之后的代码被执行了两次,这是因为我们在创建用fork创建进程的时候，fork之前只有一个执行流，fork之后就会变成两个进程.
那么怎么证明呢，我们再来使用man手册来查看fork函数:
在这里插入图片描述
当fork()成功执行时，它会在父进程中返回子进程的进程ID (PID)，而在子进程中返回0。这种方式使得父进程可以得知子进程的PID,如果fork()执行失败，它会在父进程中返回-1，并且不会创建子进程。同时，全局变量errno会被设置为一个表示错误原因的值。
我们再来写一段代码演示一下：

int main()
{
    printf("begin:我是一个进程，pid:%d,ppid:%d",getpid(),getppid());
    pid_t id = fork();
    if(id == 0)
    {
        //子进程
        while (1)
        {
            printf("我是子进程，pid:%d,ppid:%d",getpid(),getppid());
            sleep(1);
        }
    }
    else if(id>0)
    {
        //父进程
        while(1)
        {
            printf("我是父进程：pid：%d,ppid:%d",getpid(),getppid());
            sleep(1);
        }
    }
    else
    {
        //error
    }

    return 0;
}

返回不同的返回值，是为了区分让不同的执行流，执行不同的代码块！
一般而言啊，fork之后的代码父子共享啊,也就是说呢，其实当我们fork之后，后续的所有代码父子进父子进程他都能看到啊，只不过呢，我们是需要通过一定程度去区分，我们可以让父进程和子进程执行不同的代码块，那么当然应该这样，要不然我为什么创建子进程呢，我不就是想让你的子进程过来帮我忙嘛，把你创建出来，让你和我做不同的事情，所以我们的返回值一定是需要不同的，即便是返回值未来，如果假设系统设计者把它设成相同的了，未来我们一定也要有方法区分父子进程，这是这个，当然这不是这个问题的答案，问题是为什么要给子进程反回0给父进程反回pid，上面回答的是为什么父子进程反回值不同，我们现在知道了，因为父子进程，那么后续的代码是共享的，而我们可以通过不同的返回值来区分不同的执行流，让父子执行不同的代码块好也没有毛病，具体他执行的代码块要干啥我们后面来介绍啊现在的问题是为什么要给子进程返回0给父进程返回pid。

给大家举一个生活当中的例子啊：
在现实生活中，一个父亲可以有多个子女，而每个子女只有一个父亲，这是容易理解的。在进程的世界中，一个父进程也可能有多个子进程。但有时，我们可能需要对特定的子进程进行控制。想象一下，如果一个家庭有10个孩子，当父亲喊“儿子，你过来”时，所有10个孩子都过来了，那么父亲到底是想叫哪个孩子呢？
因此，对于父进程来说，它必须有一种方法来区分每一个子进程。这就是为什么fork()在父进程中返回子进程的PID。这样，父进程就可以使用这个PID来标定和识别每一个子进程的唯一性。而对于子进程来说，情况就简单了。它只需要调用getppid()函数就可以直接获取其父进程的PID。所以，子进程要找到父进程并不需要花费太多成本，它只需要通过返回0来表示成功就可以了。这就是为什么我们在父进程中返回子进程的PID的原因，因为未来我们可能想通过父进程使用PID来明确控制我们要访问的是哪一个子进程。

理解一个函数如何被返回两次，尤其是fork()，首先需要深入了解fork()的工作原理。在没有调用fork()之前，系统中只有一个进程。进程由内核数据结构和与之关联的代码和数据组成。当创建一个新进程时，需要为它创建相应的进程控制块（PCB）以及与之关联的代码和数据。CPU随后会调度这个新进程，执行它的代码和数据。

调用fork()后，会创建一个新的子进程。创建子进程的本质是系统中多了一个新进程。由于进程由内核数据结构和代码及数据组成，因此新创建的子进程首先需要创建自己的task_struct（Linux内核中的进程描述符）。这个子进程的大部分属性是基于父进程的属性创建的，相当于复制了父进程的对象并对部分属性进行了修改。例如，子进程会有自己的PID，而其父进程ID（PPID）则设置为父进程的PID。这样，父子进程就有了自己的ID关系。

然而，子进程在刚创建时并没有自己的代码和数据，因此它只能访问父进程的代码和数据。这就是为什么fork()之后父子进程的代码是共享的。当CPU调度并运行父进程的代码时，它执行的是父进程的代码；当调度并运行子进程的代码时，它执行的仍然是父进程的代码。
在这里插入图片描述

我们来看看fork函数具体做了哪些事情：
在这里插入图片描述
所以我们最终的结果也就来了：当我们准备在fork()之后进行return时，实际上子进程的创建工作已经完成。一旦fork()创建完毕，系统中就存在了子进程，于是CPU可以分别调度父进程和子进程来运行。需要注意的是，在创建子进程之后，父子进程的代码是共享的。由于return语句也是代码的一部分，当执行到这里时，父进程和子进程都已经存在。因为return语句是父子进程共享的，所以当父进程调度并执行这个函数时，它会返回一次；同样地，当子进程调度并执行时，它也会返回一次。这就是为什么fork()函数最终会被返回两次的原因。

当使用fork()创建子进程时，系统中确实多了一个进程，这也意味着操作系统内必须为这个新进程创建一个对应的PCB（进程控制块）。这个子进程的PCB同样可以被CPU调度运行。与父进程不同，子进程在创建之初并没有自己的代码和数据。

总结来说，fork()创建的子进程具有独立的PCB，可以被CPU调度运行。虽然父子进程的代码是共享的，但数据不一定是共享的。操作系统通过写时拷贝技术确保父子进程在数据层面的独立性，同时也避免了数据冗余。
在这里插入图片描述

今天我们学习了"【Linux】探索进程的父与子"相信大家看完有一定的收获。种一棵树的最好时间是十年前，其次是现在！ 把握好当下，合理利用时间努力奋斗，相信大家一定会实现自己的目标！加油！创作不易，辛苦各位小伙伴们动动小手，三连一波💕💕~~~，本文中也有不足之处，欢迎各位随时私信点评指正！
在这里插入图片描述