命令行
命令行就是终端上输入的字符串,如 ls -l
命令行参数
命令行参数是命令行字符串按空格分割的子字符串
环境变量
环境变量是一个格式为''Val=value''的字符串
命令行解释器
命令行解释器又称shell,是用来解析和执行命令行的进程,比如 linux的bash进程
main函数的三个参数
int main(int argc, char **argv, char **envp)
argc
:命令行参数的个数(包括程序名本身)。argv
:指向一个字符指针数组,每个字符指针指向一个命令行参数字符串argv[0]
指向程序名。argv[1]
到argv[argc-1]
指向的是用户输入的参数。argv[argc]
是NULL,也就是数组最后一个char*为NULL
。
envp:
envp也是指向一个char*数组,每一个char*指向一个环境变量字符串。- envp指向的指针数组的最后一个char*为NULL。
命令行参数和环境变量的存放
1.命令行参数和环境变量存放在虚拟地址空间里栈的栈顶
高地址
+-------------------+
| "PATH=/usr/bin" | <-- envp[0] 指向的字符串
| "USER=root" | <-- envp[1] 指向的字符串
| "ls" | <-- argv[0] 指向的字符串
| "-l" | <-- argv[1] 指向的字符串
+-------------------+
| envp[0] | → 指向环境变量字符串
| envp[1] | → ...
| NULL |
| argv[0] | → 指向命令行参数字符串
| argv[1] | → ...
| NULL |
+-------------------+
| argc (2) |
+-------------------+
| 返回地址 | → _start
低地址
2.elf文件中没有保存命令行参数和环境变量
3.clib会用一个char** environ的全局变量来指向栈里面的envp,假如进程要修改环境变量,那栈里面的envp字符串和指针数组作废,会去堆上开字符数组保存字符串,开字符指针数组并用environ指向
fork()
fork系统调用会先创建子进程pcb,mm_struct 、files_struct 和父进程一样,也就是浅拷贝,于是代码、数据、环境变量子进程与父进程共享,并将子进程pcb加入运行队列。子进程重新调度,会从fork已经执行结束的位置开始运行。内核会将父进程中保存返回值的寄存器设为子进程pid,而子进程的设为0,然后才返回用户态。接下来父子进程共享代码,但却会因为返回值不同而执行流不同
命令行解释器运行流程
往终端里写入命令行,bash进程会解析命令行,将命令行参数字符串和指针数组存放在堆上,我假设是用一个char** argv指向指针数组,指针数组最后一个元素是NULL。然后接下来bash进程调用fork创建子进程,此时子进程共享父进程的environ全局变量,从而共享其环境变量,也就是说子进程根本不关心父进程此时environ指向栈还是堆。然后子进程调用execve,传入argv和environ,系统调用execve陷入内核,然后将堆上的环境变量和命令行参数字符串拷进内核缓冲区,用新程序的代码段和数据段替换原来的代码段和数据段,并重建堆栈,将缓冲区中的字符串存到新栈的栈顶,还要存进对应的字符指针数组和命令行参数个数,后面靠_start函数解析新栈来获取main函数的参数