C语言之常用字符串函数总结、使用和模拟实现

发布于:2024-06-17 ⋅ 阅读:(21) ⋅ 点赞:(0)


文章目录

目录

一、strlen 的使用和模拟实现

二、strcpy 的使用及模拟实现

三、strcat 的使用和模拟实现

四、strcmp 的使用和模拟实现

五、strncpy 的使用和模拟实现

六、strncat 的使用和模拟实现

七、strncmp 的使用和模拟实现

八、strstr 的使用和模拟实现

九、strtok函数的使用

十、strerror 函数的使用

2.补充:perror 函数的使用



前言

        本文介绍和模拟实现的字符串函数有:strlen、strcpy、strcat、strcmp、strncpy、strncat、strncmp、strstr。另外详细介绍了 strtok 、strerror、perror函数的使用。基本囊括了所有常用的字符串函数。模拟实现有助于我们理解和记忆这些库函数,我们都能够自己实现这些库函数,使用时需要注意的细节我们肯定也更加清楚和深刻。最后,希望本文的内容能够帮助到大家更好的理解这些库函数


注意:字符串函数包含的头文件都为 <string.h>

一、strlen 的使用和模拟实现

1.使用:

功能:strlen 函数,其功能相信大家很熟悉了,就是计算字符串的长度

      

函数声明:size_t strlen ( const char * str );

      

用法:传入字符串首字符的地址,计算出的结果将以 size_t 类型返回

(size_t 是一种无符号整形,是为了代码的可移植性而定义的一种自定义类型,使用 %zd 打印)

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char ch1[] = { "abcdefg" };
	char* ch2 = "qwertyuiop";

	printf("%zd\n", strlen(ch1));
	printf("%zd\n", strlen(ch2));

	return 0;
}

运行结果:

解疑:上述ch1是数组名,表示数组首元素地址,ch2是字符指针,指向的是一个字符串字面量的首字符地址


2.模拟实现:

想要模拟实现 strlen ,我们就应该了解其机制,strlen 就是通过寻找字符串结尾处的 '\0' 字符来计算字符串的长度的,像我们平时写在双引号中的字符串,其末尾自动包含了一个'\0',我们也可以在定义字符数组的时候在其末尾手动添加 '\0',只有包含了 '\0'的字符串才能被strlen正确的计算长度

以下演示三种 strlen 的模拟实现

(以下所以代码中包含了 assert 函数,其为断言,用来检查指针是否为空,详细请移步主页指针基础知识,其中有详细讲解)

1:边寻找 '\0' 边统计字符

#include <stdio.h>
#include <assert.h>

size_t my_strlen(const char* str)
{
	assert(str != NULL);
 
	size_t count = 0;

	while (*str)
	{
		str++;
		count++;
	}

	return count;
}

2:通过指针相减算出元素个数

#include <stdio.h>
#include <assert.h>

size_t my_strlen(const char* str)
{
	const char* str1 = str;

	assert(str != NULL);

	while (*str1)
	{
		str1++;
	}

	return str1 - str;
}

3:使用递归实现

size_t my_strlen(const char* str)
{
	assert(str != NULL);

	if (*str == '\0')
	{
		return 0;
	}
	else
	{
		return 1 + my_strlen(str + 1);
	}
}


二、strcpy 的使用及模拟实现

1.使用:

功能:将源字符串拷贝到目标字符串之中,返回目标字符串首地址

    

函数声明:char * strcpy ( char * destination, const char * source );

    

用法:按顺序先传入目标字符串,再传入源字符串,最后 strcpy 返回的目标字符串首地址,另外,函数有以下几个要求和细节:

  • 源字符串必须以 '\0' 结束。
  • 会将源字符串中的 '\0' 拷贝到目标空间。
  • 目标空间必须足够⼤,以确保能存放源字符串。
  • 目标空间必须可修改。因此目标字符串参数没有使用const修饰

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char ch1[20] = { "xxxxxxxxxxxxx" };
	char* ch2 = "abcdefg";

	char* ret = strcpy(ch1, ch2);

	printf("%s\n", ch1);
	printf("%s\n", ret);

	return 0;
}

运行结果

解疑:值得注意的是,ch2中的'\0'也会被拷贝到ch1中我们可以通过调试观察到

另外,目标字符串小于原字符串将导致报错


2.模拟实现:

#include <stdio.h>
#include <assert.h>

char* my_strcpy(char* dest, const char* src)
{
	assert(dest && src);

	char* ret = dest;

	while (*dest++ = *src++)
	{
		;
	}

	return ret;
}

解疑:这里面比较难理解的估计就是这个while循环,*dest++ = *src++,首先 ++ 的优先级高于 *,因此先执行++,但因为是后置++,先使用后++,因此会先解引用,将src的值赋给dest,然后++,两字符串地址向后走一个字节长度,来到下一个字符的地址,依次循环下去,最后 src 解引用遇到'\0'赋值给dest后,整个表达式值为0,循环停止,注意循环体为空语句。最后包括'\0'在内的所有字符都从src中拷贝到了dest中,最后的最后返回目标字符串首地址


三、strcat 的使用和模拟实现

1.使用:

功能:将源字符串追加到目标字符串的末尾

    

函数声明:char * strcat ( char * destination, const char * source );

    

用法:先传入目标字符串首地址,再传入源字符串首地址,追加后返回目标字符串首地址

有以下需要注意的细节和要求:

  • 源字符串必须以 '\0' 结束。
  • 目标字符串中也得有 '\0' ,否则没办法知道追加从哪里开始。
  • 目标空间必须有足够的大,能容纳下源字符串的内容。
  • 目标空间必须可修改。

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char ch1[20] = { "abcdef" };
	char ch2[] = { "qwerty" };

	char* ret = strcat(ch1, ch2);

	printf("%s\n", ch1);
	printf("%s\n", ret);

	return 0;
}

2.模拟实现:


2.模拟实现:

#include <stdio.h>
#include <assert.h>

char* my_strcat(char* dest, const char* src)
{
	assert(dest && src);

	char* ret = dest;

	while (*dest)
	{
		dest++;
	}

	while (*dest++ = *src++)
	{
		;
	}
	
	return ret;
}

解疑:第一个while循环用来定位 dest 中'\0'位置,也就是dest中第一次出现'\0'的位置,第二个循环与前面 strcpy 一样,将源字符串src内容拷贝到目标字符串dest中,只不过是接在dest第一个'\0'的位置处,最后返回目标字符串首地址


另外考虑一个问题,问:strcat 能不能给自己追加自己?

我们使用自己模拟的strcat试一试:

结果是不可以,因为 src 追加后,使得自己变长,永远到不了'\0',结果就会导致死循环

官方的库函数却可以,但其返回值也不可以,底层逻辑的实现不同,这里不再深究


四、strcmp 的使用和模拟实现

1.使用:

功能:比较两字符串大小,不是比较长度,而是按顺序比较每一位对应字符的ASCII码值

    

函数声明:int strcmp ( const char * str1, const char * str2 );

    

用法:分别传入需要比较的字符串首地址,strcmp 会比较两字符串的对应位字符的ASCII码值,其返回值分为三种:

  1. 返回值 >0,表示 str1 中某一位字符大于 str2 对应位的字符
  2. 返回值 <0,表示 str1 中某一位字符小于 str2 对应位的字符
  3. 返回值 == 0,表示 str1 与 str 2完全相同

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char* ch1 = "abcdefg";
	char* ch2 = "abcz";

	int ret = strcmp(ch1, ch2);

	printf("%d\n", ret);

	return 0;
}

运行结果:

解疑:在vs中,strcmp三种返回值为1,0,-1,对应的三种情况,但C语言标准中是按照大于0小于0等于0分的。上图结果为-1,因为ch2中的第四个字符为 'z',大于ch1中第四个字符 'd',因此判定ch1小于ch2,返回-1。也就是返回<0的值


2.模拟实现:

#include <stdio.h>
#include <assert.h>

int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);

	while (*str1 == *str2)
	{
		if (*str1 == '\0')
		{
			return 0;
		}
		str1++;
		str2++;
	}

	return *str1 - *str2;

    /*if (*str1 > *str2)
    {
	    return 1;
    }
    else
    {
	    return -1;
    }*/
}

解疑:首先while循环,判断两字符串对应位置字符是否相同,相同就进入循环,在进行判断,如果其中有一个字符为'\0',表示这两个字符走到头了,并且完全相等,返回0,如果没有就使两字符串地址向后走一位,再进行循环判断,如果两字符串对应位字符不相等,就跳出循环,直接令这两个字符串对应位置的字符相减,其返回值就能判断两字符串的大小,也可以使用分支判断两字符串,使其返回1或-1,如代码中注释的部分


五、strncpy 的使用和模拟实现

1.使用:

功能:拷贝指定个数的字符从源字符串到目标字符串上

    

函数声明:char * strncpy ( char * destination, const char * source, size_t num );

    

用法:和 strcpy 相比多了一个参数 num,用来指定复制多少个字符,有以下几点需要注意:

  • 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
  • 如果原字符串的长度大于num,则只拷贝num个字符到目标文件中,目标文件中如果有数据将会被覆盖,并且不会追加'\0'。
  • 目标字符串的容量必须足够大,能存放下拷贝的字符

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char ch1[10] = { "xxxxxxxxx" };
	char ch2[] = { "abcdef" };

	char* ret = strncpy(ch1, ch2, 9);

	printf("%s\n", ch1);
	printf("%s\n", ret);

	return 0;
}

运行结果:

监视窗口:

解疑:上述代码符号第一种情况,即如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。


2.模拟实现:

#include <stdio.h>
#include <string.h>
#include <assert.h>

char* my_strncpy(char* dest, char* src, size_t num)
{
	assert(dest && src);
	char* ret = dest;
	size_t len = strlen(src);
	int count = (int)num - (int)len;

	while (num && *src)
	{
		*dest = *src;
		dest++;
		src++;
		num--;
	}

	while (count > 0)
	{
		*dest = 0;
		dest++;
		count--;
	}

	return ret;
}

解疑:以上的实现是我个人的想法,不是最优解。首先除了保存目标字符串首地址,计算了源字符串大小,并保存了num与源字符串长度的差值,第一个while循环,在保证拷贝没有超过 num 个字符和原字符串没有走到结尾的情况下,拷贝了能拷贝的字符。然后下面一个while循环用来判断 num是否大于源字符串长度,如果大于,则在目标字符串末尾补0。直至刚好拷贝完num个字符,最后返回目标字符串首地址。


六、strncat 的使用和模拟实现

1.使用:

功能:将源字符串的前num个字符追加到目标字符串指向的字符串末尾,再追加⼀个'\0'字符

    

函数声明:char * strncat ( char * destination, const char * source, size_t num );

    

用法:前两个参数与strcat一致,也是后面多了一个num,用来指定追加多少个字符。这里需要注意的有以下几条:

  • 如果 source 指向的字符串的长度小于num的时候,只会将字符串中到 '\0' 的内容追加到destination指向的字符串末尾。大于num的话,就是源字符串的前num个字符追加到目标字符串指向的字符串末尾,再追加⼀个'\0'字符
  • 目标字符串的容量得足够大,能容下追加的字符

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char ch1[20] = { "abcd\0xxxxxxxx" };
	char* ch2 = "qwerty";

	char* ret = strncat(ch1, ch2, 8);

	printf("%s\n", ch1);
	printf("%s\n", ret);

	return 0;
}

运行结果:

监视窗口:

解疑:以上代码就符合num大于源字符串长度的情况,即 source 指向的字符串的长度小于num的时候,只会将字符串中到 '\0' 的内容追加到destination指向的字符串末尾。为了方便观察,我在ch1中插入了'\0'和xxxxxxxx,最后发现末尾确实追加了一个'\0'字符。


2.模拟实现:

#include <stdio.h>
#include <assert.h>

char* my_strncat(char* dest, const char* src, size_t num)
{
	assert(dest && src);
	char* ret = dest;

	while (*dest)
	{
		dest++;
	}

	while (num && *src)
	{
		*dest = *src;
		dest++;
		src++;
		num--;
	}
	
	*dest = '\0';

	return ret;
}

解疑:前面步骤与strcat一致,到了第二个while循环,也是在保证没有追加超过num个字符和源字符串地址没有走到字符串末尾的情况下,追加所有能追加的字符,然后无论 num 大于或者小于 源字符串长度,只需要追加一个'\0'即可。最后返回目标字符串首地址。


七、strncmp 的使用和模拟实现

1.使用:

函数声明:int strncmp ( const char * str1, const char * str2, size_t num );

    

功能及用法:比较str1和str2的前num个字符,如果相等就继续往后比较,最多比较num个字母,如果提前发现不一样,就提前结束,大的字符所在的字符串大于另外⼀个。如果num个字符都相等,就是相等返回0。返回值情况与strcmp一致

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char* ch1 = "abcde";
	char* ch2 = "abcqwer";

	int ret1 = strncmp(ch1, ch2, 3);
	int ret2 = strncmp(ch1, ch2, 5);
	
	printf("%d\n", ret1);
	printf("%d\n", ret2);

	return 0;
}

运行结果:

解疑:基本和strcmp一样,只是多了指定比较的个数


2.模拟实现:

#include <stdio.h>
#include <assert.h>

int my_strncmp(const char* str1, const char* str2, size_t num)
{
	assert(str1 && str2);

	while ((*str1 == *str2) && num)
	{
		if (*str1 == '\0')
		{
			return 0;
		}
		str1++;
		str2++;
		num--;
	}

	if (*str1 == *str2)
	{
		return 0;
	}
	else if (*str1 > *str2)
	{
		return 1;
	}
	else
	{
		return -1;
	}
}

解疑:模拟过程与strcmp相比,while循环多了一个num的判断,最后的条件判断也多了一条判断相等的情况,因为while循环的终止可能是由于num等于0的情况,此时需要再对字符串进行一次比较。


八、strstr 的使用和模拟实现

1.使用:

功能:在一个字符串中寻找与另一个字符串完全相同的片段

    

函数声明:char * strstr ( const char * str1, const char * str2 );

    

用法:传入两个字符串的首地址,函数返回字符串str2在字符串str1中第一次出现的位置的地址,如果找不到,就返回空指针(NULL)。

使用演示

#include <stdio.h>
#include <string.h>

int main()
{
	char ch1[] = "This is a simple string";
	char ch2[] = "simple";

	char* ret = strstr(ch1, ch2);

	printf("%s\n", ret);

	return 0;
}

运行结果:

解疑:因为函数返回的是str2字符串内容在str1中第一次出现时的地址,所以我们以%s打印时,会从这个地址一直打印到str1字符串末尾遇到'\0'停止


2.模拟实现:

#include <stdio.h>
#include <assert.h>
#include <string.h>

char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);

	const char* s1 = NULL;
	const char* s2 = NULL;
	const char* cur = str1;

	if (*str2 == '\0')
	{
		return (char*)str1;
	}

	while (*cur)
	{
		s1 = cur;
		s2 = str2;

		while (*s1 && *s2 && *s1 == *s2)
		{
			s1++;
			s2++;
		}

		if (*s2 == '\0')
		{
			return (char*)cur;
		}

		if (strlen(cur+1) < strlen(str2))
		{
			return NULL;
		}

		cur++;
	}

	return NULL;
}

解疑:

  1. 首先创建了三个指针变量,s1,s1分别用来记录str1和str2比较过程中的地址,cur记录的是str1当前位置的地址,因为途中的比较过程会打乱str1指针的指向,因此需要cur来记录str1当前位置的地址,以便s1在比较过程中没有找到相同字符串时,可以通过cur找回起始位置。而str2本身指向是不会变的,因此不需要另外的指针进行记录当前位置。
  2.  if (*str2 == '\0') ,这个意思是如果str2是个空字符串的话,直接返回str1的地址,这是C语言标准中strstr的规定。并且空字符串本身也不需要寻找,任何字符串都包含空字符串
  3. while (*cur) ,这个循环条件就是cur没有指向字符串末尾。然后给s1赋值为cur,s2赋值为str2,。s1,s2就是用来比较判断两字符串是否有相同的指针。
  4. while (*s1 && *s2 && *s1 == *s2),这个循环意思是,只要s1,s2没有指向字符串末尾并且它两指向的字符相等,就让s1,s2一直往后走,只要有其中一个条件不满足时,循环就终止
  5. 循环终止后就进行一个判断,if (*s2 == '\0'),该判断的意思是,如果s2等于'\0',表示前一个循环是因为s2走到字符串末尾而终止的,s2能走到末尾,就表示s2前面的字符与s1都相同,这就表明能在str1中找到str1,此时只需要终止函数,返回cur,也就是str1当前的地址就行
  6. 而如果s1指向的字符不为'\0',就表示前一个循环的终止是因为s1,s2指向的字符不相同导致的,就再进行一个判断,if (strlen(cur+1) < strlen(str2)),这个判断表示,当前str1指向的下一个位置到字符串末尾的长度,如果小于str2的长度,就表明str1后面一定找不到str2了,为了提高效率,直接返回空指针。
  7. 如果两个判断都不满足,就让str1当前的位置往后走一步,也就是cur++,再进行循环判断。
  8. 如果直到最后cur都指向'\0'了,就直接返回空指针。


九、strtok函数的使用

功能:将一个字符串以指定字符的格式分隔

    

函数声明:char * strtok ( char * str, const char * sep );

    

用法:第一个参数指向了一个字符串,第二个参数指向了需要分隔的字符的集合,并且有以下要求和细节:

  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。简单来说就是str中可能有sep包含的字符
  • sep参数指向一个字符串,定义了用作分隔符的字符集合
  • strtok函数找到str中的下一个标记字符(sep),并将其用 '\0' 结尾,返回一个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以被strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • 第一次调用,strtok函数的第⼀个参数不为 NULL ,函数将找到str中第一个标记字符,strtok函数将保存它在字符串中的位置
  • 下一次调用,strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记
  • 简单来说就是 strtok 具有保存记忆的功能,如果第一个参数传入NULL,strtok能记起同一个字符串上一次被分隔的位置
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	char ch1[] = "abcd.bbc/123@xp";
	char ch2[] = "./@";

	printf("第一次分割:\n");
	char* ret = strtok(ch1, ch2);
	printf("%s\n", ret);
	printf("%s\n", ch1);

	printf("第二次分割:\n");
	ret = strtok(NULL, ch2);
	printf("%s\n", ret);
	printf("%s\n", ch1);

	printf("第三次分割:\n");
	ret = strtok(NULL, ch2);
	printf("%s\n", ret);
	printf("%s\n", ch1);

	printf("第四次分割:\n");
	ret = strtok(NULL, ch2);
	printf("%s\n", ret);
	printf("%s\n", ch1);

	printf("第五次分割:\n");
	ret = strtok(NULL, ch2);
	printf("%s\n", ret);
	printf("%s\n", ch1);

	return 0;
}

运行结果:

解疑:第一次分割将字符'.'修改为'\0',返回了起始地址,也就是字符'a'的地址,因为改变了源字符串的数据,所以此后以%s打印ch1只能打印abcd。第二次分割将字符'/'修改为'\0',然后返回了第二段起始地址,也就是字符'b'的地址。后面的结果依次类推就行。直到最后没有可分割字符返回空指针

是不是发现上面有大量重复的代码,其实我们可以使用循环来进行打印:

#include <stdio.h>
#include <string.h>

int main()
{
	char str[] = "123.4545.446.xpashisdid@qq.com";
	char* sep = ".@";

	for (char* ret = strtok(str, sep); ret != NULL; ret = strtok(NULL, sep))
	{
		printf("%s\n", ret);
	}

	return 0;
}

运行结果:

解疑:以上for循环使用地非常巧妙,首先初始化部分调用一次strtok,传入需分割的字符串和分割字符。创建一个ret接收strtok的返回值,因为for循环初始化部分只会进行一次。所以该部分不会重复进行,然后判断部分写 ret != NULL,只要返回值不为空指针,循环就不终止。for调整部分写再一次调用strtok,传入空指针即可。strtok具有记忆保存的属性。如此一来就实现了循环分割打印的效果


十、strerror 函数的使用

1.使用:

功能:接收并记录程序运行时的错误码,返回错误码对应的错误信息的字符串地址

    

函数声明:char * strerror ( int errnum );

    

功能介绍:在不同的系统和C语言标准库的实现中都规定了一些错误码,一般是放在 errno.h 这个头文件中说明的,C语言程序启动的时候就会使用一个全局的变量errno来记录程序的当前错误码,只不过程序启动的时候errno是0,表示没有错误,当我们在使用标准库中的函数的时候发生了某种错误,就会将对应的错误码,存放在errno中,而一个错误码的数字是整数很难理解是什么意思,所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。

打印0~10错误码对应的信息:

#include <stdio.h>
#include <string.h>
#include <errno.h>

int main()
{
	int i = 0;

	for (i = 0; i <= 10; i++)
	{
		printf("%s\n", strerror(i));
	}

	return 0;
}

运行结果:

(注:不包含 errno.h 头文件也可以打印)

使用演示:

#include <stdio.h>
#include <string.h>

int main()
{
	FILE* pf = fopen("xxx.txt", "r");

	if (pf == NULL)
	{
		printf("%s\n", strerror(errno));
	}

	return 0;
}

运行结果:

解疑:定义一个文件指针,以只读的形式打开一个不存在的文件,pf会接收到一个空指针,此时这个文件打开错误会被记录,使用if判断然后打印出这个错误信息,这在我们日常写代码中非常实用。另外记住使用strerror时要传参errno


2.补充:perror 函数的使用
 

函数声明:void perror ( const char * str );

    

功能介绍:perror与strerror类似,都是记录错误信息,但是不同的是:

  • perror使用时会直接打印出错误信息,不需要向strerror那样使用printf进行打印。
  • perror的参数,指我们可以自己添加一个需要打印的字符串信息在错误信息的前面
  • perror函数包含在 <stdio.h> 头文件中

使用演示:

#include <stdio.h>

int main()
{
	FILE* pf = fopen("xxx.txt", "r");

	if (pf == NULL)
	{
		perror("fopen");
	}

	return 0;
}

运行结果:

解疑:如图所示,我们传入perror的字符串参数最终会加上':'打印在屏幕上,我们传入的字符串可以提醒我们哪里或者哪个函数出的问题。更加的方便和实用

关于strerror与perror函数的选择,是根据自己的情况而定,只记录不打印选择strerror,只打印选择perror即可


总结

        以上就是本文的全部内容了,希望对大家有所帮助,感谢支持