一. 进程创建
1.fork的概念与使用
在 Linux 中 fork 可以在一个进程中创建一个新的进程。这个新进程称为子进程,原进程为父进程。使用前需要包含头文件 #include <unistd.h> 。在调用 fork 函数时,子进程与父进程会共享数据和代码,此时它们共用同一块物理地址空间。但当子进程或父进程运行时,对数据进行了修改进行了写入,此时系统将进行写时拷贝,重新给子进程或者父进程申请物理地址。
fork 函数调用时父进程会返回子进程 pid (大于0),子进程会返回0。
二. 进程终止
进程的退出场景分为三类,第一是代码运行完毕并且结果正确,第二是代码运行完毕但结果不正确,第三是代码运行时异常终止。
在第一种和第二种情况下,我们可以通过退出码来分辨,退出码为0就是结果正确,不为0结果不正确。不同的退出码代表不同的退出状态。
当我们想查看进程最近一次的退出码时,输入指令 echo $? 可以查看到退出码。
我们通常退出程序时以return exit 或 _exit 结尾终止进程。那么它们直接有什么区别呢?
return 返回通常为函数终止,但不一定代表结束,若在函数中return 返回后程序还会继续运行。而exit 退出则代表程序结束了,此时 exit 会自动执行全局清理。_exit 与 exit 的区别在于 _exit 可以在任意位置结束程序,并且不会对全局进行清理。
int main() { printf("hello"); exit(0); } 运⾏结果: [root@localhost linux]# ./a.out hello[root@localhost linux]# int main() { printf("hello"); _exit(0); } 运⾏结果: [root@localhost linux]# ./a.out [root@localhost linux]#
三. 进程等待
在进程中,子进程退出若父进程不进行管理,会导致子进程变成“僵尸进程”,造成内存泄漏。在进程等待中,我们用 wait 和 waitpid 这两个函数。
3.1 wait与waitpid
我们在使用这两个函数前要包含两个头文件。
#include<sys/types.h> #include<sys/wait.h>
pid_t wait(int* status)
其中status用于储存 wait 中子进程的退出状态,status需要是一个int类型,我们需要将他视作位图,里面会存储进程的退出码,我们也可以传递NULL进去表示不关心退出状态。若子进程成功退出,wait会返回子进程pid,若失败则返回-1。
pid_t waitpid(pid_t pid,int *status,int options)
waitpid 内包含了三个参数,pid,status和options,这里的pid调用的是等待进程的pid,而status与上文一致,options分为阻塞等待和非阻塞等待(下文讲解)。
3.2 阻塞与非阻塞等待
阻塞等待阻塞的是父进程,当父进程处于阻塞状态时,不能进行其他的代码操作,需要一直等待子进程完成任务后得到退出码才能执行自己的代码。而非阻塞等待的父进程可以在等待子进程时,运行父进程的代码,我们可以通过循环的方式,限制多长时间对子进程进行访问是否返回。
通过一个简单的例子说明,我们在等待女友化妆,阻塞等待就是单纯的等女友化完妆,而非阻塞等待意味着,我们可以在女友化妆时做一些其他的事情。
下面是进程阻塞方式的代码:
此时options的参数为0.
int main()
{
pid_t pid;
pid = fork();
if (pid < 0)
{
printf("%s fork error\n", __FUNCTION__);
return 1;
}
else if (pid == 0)
{ //child
printf("child is run, pid is : %d\n", getpid());
sleep(5);
exit(257);
}
else
{
int status = 0;
pid_t ret = waitpid(-1, &status, 0);//阻塞式等待,等待5S
printf("this is test for wait\n");
if (WIFEXITED(status) && ret == pid)
{
printf("wait child 5s success, child return code is:%d.\n",WEXITSTATUS(status));
}
else
{
printf("wait child failed, return.\n");
return 1;
}
}
return 0;
}
运⾏结果:
[root@localhost linux]# ./a.out
child is run, pid is : 45110
this is test for wait
wait child 5s success, child return code is :1.
pid 返回了子进程的pid,并且等待了5秒。
四. 进程程序替换
4.1 替换原理
程序在 fork() 之后,父进程和子进程共用同一份代码(可能执行不同的分支),若我们当前想让子进程独立执行一个全新的程序该如何操作呢?
这里我们会调用一种exec开头的函数,他会将我们子进程的代码进行替换,将需要更换的程序从磁盘里面拷贝下来。他不会产生新的进程,所以子进程的 pid 仍然保持不变,exec 只是对代码段数据段进行了替换。
4.2 替换函数
一共有六中以 exec 开头的函数:
#include <unistd.h> int execl(const char *path, const char *arg, ...); int execlp(const char *file, const char *arg, ...); int execle(const char *path, const char *arg, ...,char *const envp[]); int execv(const char *path, char *const argv[]); int execvp(const char *file, char *const argv[]); int execve(const char *path, char *const argv[], char *const envp[]);
4.2.1 execl
execl 参数有 path 和 arg,path 代表要替换程序在磁盘中的文件地址,arg 代表需要替换的功能。
execl("/bin/ls", "ls", "-l", NULL);
在文件 /bin/ls 下 ,调用 ls -l 这一功能,其中要在末尾添加上NULL,代表结束。
4.2.2 execlp
execlp 参数有 file 和 arg,file 可以根据命令查找到对应的文件,例如我们可以将 /bin/ls 文件改为 ls 也能实现同样的功能。后面的 arg 代表要实现的功能。
execlp("ls", "ls", "-l", NULL);
4.2.3 execle
execle 与 execlp 的不同之处在于,它的代表着环境变量 env ,我们在调用时需要自己组装环境变量,当然也可以使用系统环境变量。
我们可以对第三个参数 envp【】自行添加环境变量,例如 { "KEY1=VALUE1","KEY2=VALUE2"};
execle("ls", "ls", "-l", NULL, envp);
4.2.4 execv
我们将 execv 与 execl 进行对比,它们区别在于 “v” 传递的参数为数组,而 “l” 传递的参数为指针。
char *const argv[] = {"ls", "-l", NULL};
execv("/bin/ps", argv);
同样的,在数组最后也要加上NULL表示终止。
4.2.5 execvp
结合上述对函数的解析,这个函数我们不难进行理解,“v” 代表传递的是数组(里面包含相应调用的功能),“p” 代表根据功能找到对应的文件地址。
char *const argv[] = {"ls", "-l", NULL};
execvp("ls", argv);
4.2.6 execve
与 exec 相比多了 “e”和 “v” ,也就是需要添加数组和环境变量数组。
char *const argv[] = {"ls", "-l", NULL};
char *const envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL};
execve("/bin/ls", argv, envp);
总结:事实上,在操作系统中真正被调用的只有 execve 这个函数,其他函数都是对其进了封装。因为在 man 手册第二节存在execve ,而其他函数都在man 手册第三节。本质是将 “l” 转化为 “v” 将可变参数报错带数组中,将 “p” 转化为 “e” 将环境变量转化为数组。