通常我们使用wait()/waitpid()/waitid()来回收子进程,但是这个方法,需要我们去轮询。没有事件监听机制。本文研究了相关的技术,可以实现poll监听子进程退出。
    linux 有 signalfd,timerfd,eventfd。后续最新的5.4内核还添加了pidfd。参考文档3,2008年提交了waitfd的patch给内核,但是似乎没有被内核采纳。
signalfd可以打开一个文件描述符来接收信号,signalfd不阻碍原来的信号行为,但是既然我们通过signalfd来监听信号,通常我们将信号设置为block状态。
通过将SIGCHILD添加到signalfd,我们就可以监听到SIGCHILD信号。子进程退出时,会给父进程发送SIGCHILD信号。
signalfd支持的内核非常早,在2.6.26内核就已经支持了。signalfd可以使用read来读取收到的信号信息。poll到信号后,必须read,否则poll一直返回。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69  | #include <signal.h>#include <stdio.h>#include <stddef.h>#include <poll.h>#include <sys/signalfd.h>#include <unistd.h>#include <sys/wait.h>int main(int argc, char **argv){    sigset_t sigmask;    int sigfd;    struct pollfd pollfd;    int ret;    struct signalfd_siginfo fdsi;    sigemptyset(&sigmask);    sigaddset(&sigmask, SIGCHLD);    sigprocmask(SIG_BLOCK, &sigmask, NULL);    sigfd = signalfd(-1, &sigmask, SFD_NONBLOCK);    if (sigfd < 0) {        perror("signalfd failed");        return 1;    }    ret = fork();    if (ret < 0) {        perror("fork failed");        return 1;    }    else if (ret == 0) {        sleep(2);        return 0;    }    printf("fork child pid: %d\n", ret);    pollfd.fd = sigfd;    pollfd.events = POLL_IN;    pollfd.revents = 0;    while (1) {        ret = poll(&pollfd, 1, -1);        if (ret < 0) {            perror("poll failed\n");            return 1;        }        printf("poll returned %d\n", ret);        ret = read(sigfd, &fdsi, sizeof(fdsi));        if (ret < 0) {            perror("read failed");            return 1;        }        printf("read return %d\n", ret);        if (fdsi.ssi_signo == SIGCHLD) {            printf("Got SIGCHLD\n");            ret = wait(NULL);            printf("wait return %d\n", ret);        } else {            printf("Read unexpected signal\n");        }    }    return 0;} | 
执行
$ cc signalfd_child.c 
$ ./a.out 
fork child pid: 20625
poll returned 1
read return 128
Got SIGCHLD
wait return 2062
2015年提交了patch,但是未被内核采纳。
在waitfd和CLONE_FD均没有被内核采纳的情况下,2019年的pidfd被内核采纳了,合入到5.4内核中,它可以直接打开一个进程描述符,根据参考文档4中的描述,主要是解决进程id回绕带来的安全问题。
使用 int pidfd_open(pid_t pid, unsigned int flags); 可以打开一个pidof,注意这里可以打开任意进程,不仅仅是自己的子进程。
打开后,可以使用poll来监听,当进程结束后(注意不是状态变化),poll将返回readable。此时可以回收进程。在回收子前不能继续poll,否则立即返回。
示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58  | #define _GNU_SOURCE#include <sys/types.h>#include <sys/syscall.h>#include <unistd.h>#include <poll.h>#include <stdlib.h>#include <stdio.h>#ifndef __NR_pidfd_open#define __NR_pidfd_open 434   /* System call # on most architectures */#endifstatic intpidfd_open(pid_t pid, unsigned int flags){    return syscall(__NR_pidfd_open, pid, flags);}intmain(int argc, char *argv[]){    struct pollfd pollfd;    int pidfd, ready;    int pid;    pid = fork();    if (pid < 0) {        perror("fork");        return 1;    }    else if (pid == 0) {        sleep(2);        return 0;    }    printf("fork child pid %d\n", pid);    pidfd = pidfd_open(pid, 0);    if (pidfd == -1) {        perror("pidfd_open");        exit(EXIT_FAILURE);    }    pollfd.fd = pidfd;    pollfd.events = POLLIN;    ready = poll(&pollfd, 1, -1);    if (ready == -1) {        perror("poll");        exit(EXIT_FAILURE);    }    printf("Events (%#x): POLLIN is %sset\n", pollfd.revents,            (pollfd.revents & POLLIN) ? "" : "not ");    close(pidfd);    exit(EXIT_SUCCESS);} | 
[1] https://man7.org/linux/man-pages/man2/signalfd.2.html
[2] CLONE_FD: Task exit notification via file descriptor. https://lwn.net/Articles/636646/
[3] waitfd: file descriptor to wait on child processes. https://lwn.net/Articles/310375/
[4] Adding the pidfd abstraction to the kernel. https://lwn.net/Articles/801319/
[5] https://man7.org/linux/man-pages/man2/pidfd_open.2.html