本文已参与「新人创作礼」活动，一起开启掘金创作之路。

一、前言

shell是命令行解释器，作用是将命令交给bash去执行，而bash将任务交给子进程来完成，这样即使这个任务出现问题，bash也不会受到影响。

而子进程也不是直接去执行任务，而是通过程序替换来完成，所以shell的模拟最重要的两个部分就是创建子进程和程序替换。

创建子进程在进程概念中已经提到过，下面先重点介绍进程替换，再模拟实现shell。

二、进程程序替换

1.替换原理

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。

2.替换函数

函数都以exec开头，后面的字母可以采用如下的理解来记忆 l(list) : 表示采用参数列表 v(vector) : 表示参数用数组 p(path) : 表示在环境变量中搜索程序的路径 e(env) : 表示参数中自定义环境变量

由上可以看出，这6个函数使用时差别不是很大，以execl为例详细讲解。

int execl(const char *path, const char *arg, …);

path是程序的路径，arg是如何执行，“…”是可变参数，必须以NULL结尾。下面举一个例子。

先查看到 ls 的路径。

#include <stdio.h>
#include <unistd.h>

int main()
{
	printf("I am a process!\n");
	sleep(3);
	// 路径 ls 命令行参数 以NULL结尾
	execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
	return 0;
}

最后程序的结果显然与动图中上面运行ls -a -i -l的结果相同。

这样在我写的myproc进程内就可以调用其他的程序（比如ls）。

进程替换不会创建新的进程，直接用新的代码和数据替换原来的代码和数据，所以进程替换后的代码不会执行，直接被替换了。

#include <stdio.h>
#include <unistd.h>

int main()
{
	printf("I am a process!\n");
	sleep(3);
	execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
	printf("you can't see me!\n");//看看这句代码是否被执行
	return 0;
}

结果没有打印you can’t see me!，所以可验证上面的结论。

程序替换也是可能失败的，下面以路径错误为例看结果。

#include <stdio.h>
#include <unistd.h>

int main()
{
	printf("I am a process!\n");
	sleep(3);
	//正确路径这里是usr/bin/ls
	execl("/us/bin/ls", "ls", "-a", "-i", "-l", NULL);
	printf("you can't see me!\n");//看看这句代码是否被执行
	return 0;
}

因为进程替换失败，所以后面的代码和数据都不会被替换，继续跑下面的代码。

所以说，exec系列的函数从使用上来说不需要判断返回值，只要返回就是失败。

一般调用exec系列的函数，多是创建子进程，然后将子进程的代码和数据替换掉，执行其他的程序。与上面的代码功能相同，新的代码如下。

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>

int main()
{
	pid_t id = fork();
	if (id == 0)
	{
		printf("I am a process!\n");
		sleep(3);
		execl("/usr/bin/ls", "ls", "-a", "-i", "-l", NULL);
		exit(10);
	}
	int status = 0;
	pid_t ret = waitpid(id, &status, 0);
	if (ret > 0 && WIFEXITED(status))
	{
		printf("signal:%d\n", WIFEXITED(status));
		printf("exit code:%d\n", WEXITSTATUS(status));
	}
	return 0;
}

下面是几个不需要环境变量的函数的等价写法。

三、模拟简易的shell

先以ls为例说明一下shell的大概流程。

用下图的时间轴来表示事件的发生次序。其中时间从左向右。shell由标识为sh的方块代表，它随着时间的流逝从左向右移动。

shell从用户读入字符”ls”，然后建立一个新的子进程，接着在新创建的进程中运行ls程序并等待那个进程结束。

然后shell读取新的一行输入，建立一个新的进程，在这个进程中运行程序并等待这个进程结束。

所以要写一个shell，需要循环以下过程:

获取命令行
解析命令行
建立一个子进程（fork）
替换子进程（exec）
父进程等待子进程退出（wait）

1.gethostname

首先命令行前有如下的提示符：这些内容可以通过gethostname来获取。

用如下代码获取主机名：

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>

int main()
{
	char name[100];
	while (1)
	{
		gethostname(name, sizeof(name));
		printf("%s\n", name);
	}
	return 0;
}

在下面的代码中，直接用我自己虚构的主机名带代表模拟的shell。

2.模拟实现

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdlib.h>
#include <string.h>

#define LEN 1024//读入的字符个数最多1024个
#define NUM 32//命令+命令行参数最多32个

int main()
{
	char cmd[LEN];
	while (1)
	{
		//打印提示符
		printf("[yh@my_centos dir]& ");

		//获得用户输入(其实就是一个字符串)
		fgets(cmd, LEN, stdin);//从标准输入(一般是键盘)读入用户输入的字符串
		cmd[strlen(cmd) - 1] = '\0';//最后一个位置本来是'\n'

		//解析字符串
		char* myArg[NUM];
		//输入的字符串至少有第一个命令
		myArg[0] = strtok(cmd, " ");//以空格为分割符先分割出命令
		int i = 1;
		//拿到之后的命令行参数
		while (myArg[i] = strtok(NULL, " "))//默认从上一次的子串中提取，所以传NULL
		{
			i++;
		}

		//让子进程执行命令
		pid_t id = fork();
		if (id == 0)
		{
			//child
			execvp(myArg[0], myArg);
			exit(11);
		}

		int status = 0;
		pid_t ret = waitpid(id, &status, 0);
		if (ret > 0 && WIFEXITED(status))
		{
			printf("signal:%d,", WIFEXITED(status));
			printf("exit code:%d\n", WEXITSTATUS(status));
		}
	}
	return 0;
}

但也有一些命令不能实现，比如用’;’隔开的两个命令、使用’|’管道时、cd等命令等等，有些是因为程序中处理字符串时没有考虑、有些是因为命令本身不是由fork完成的。

这里模拟实现shell只是为了将fork和进程替换用起来，所以难免会有缺陷。

感谢阅读，如有错误请批评指正

今天的文章【Linux小练习】模拟简易的shell分享到此就结束了，感谢您的阅读。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
如需转载请保留出处：https://bianchenghao.cn/13569.html

【Linux小练习】模拟简易的shell