字符串的拷贝
每个中文字符在系统中是占用 3 个字节的存储空间,并且都是负数。思路是:检测到ch为\0结束程序,检测到ch<0,复制三个字节,大于0复制一个字节但是结果乱码,能不能帮我看下代码哪有问题,谢谢代码没多长
#include <stdio.h>
#define MAX 1024
int main()
{
char str1,str2;
char *target1,*target2;
char ch;
target1 = str1;
target2 = str2;
printf("请输入一串字符串,可以包含中文!");
fgets(str1,MAX,stdin);
while(1)
{
ch = *target1++;
if(ch =='\0')
{
break;
}
if((int)ch<0)
{
*target2++ = *target1++;
*target2++ = *target1++;
*target2++ = *target1++;
}
else
{
*target2++ = *target1++;
}
}
printf("%s",str2);
return 0;
}
*target1++ 是线target1++再*target1。所以会乱码。
换成两行语句
*target1;
target1++;
就不会了 本帖最后由 jackz007 于 2019-4-6 20:16 编辑
字符串拷贝用系统函数 strcpy() 难道不行吗?楼主这个自编函数的功能实际上与 strcpy() 无异,完全没有必要自编。
只有采用 utf8 编码的中文字符才会占用 3 个字节,而 Windows 系统采用的 ANSI 编码和 unicode 编码都是 2 个字节。 百里狂生 发表于 2019-4-6 18:33
*target1++ 是线target1++再*target1。所以会乱码。
换成两行语句
*target1;
你们可能对 *target++ != '\0' 这一行代码有疑问,这里我给大家解释下。首先在“运算符的优先级和结合性”(http://bbs.fishc.com/thread-67664-1-1.html)可以查到自增运算符(++)的优先级比取值运算符(*)要高,所以 *target++ 相当于 *(target++),先执行自增运算符,再取值。但由于这是一个后缀的自增运算符,所以自增的效果要在下一条语句才会生效,因此这里取出来的依然是 target 地址自增前指向的数组元素的值。
这是小甲鱼课后作业里面写的可以这么写 jackz007 发表于 2019-4-6 19:26
字符串拷贝用系统函数 strcpy() 难道不行吗?楼主这个自编函数的功能实际上与 strcpy() 无异,完全没 ...
我目的就是自己把拷贝函数写出来
我在我的编译器里面试过了 就是三个字节 本帖最后由 jackz007 于 2019-4-7 19:34 编辑
saberAMD 发表于 2019-4-7 18:52
我目的就是自己把拷贝函数写出来
我在我的编译器里面试过了 就是三个字节
拷贝字符串而已,何须如此复杂,下面 2 行代码足矣:
while (* target1) * target2 ++ = * target1 ++ ;
* target2 = '\0' ;
C / C++ 语言的字符串,只要不是 unicode 的编码,根据字符串结尾标志 '\0' 拷贝字符串就永远不会出错!不管每个汉字是几个字节都是如此!
楼主汉字乱码的原因应该与字符串拷贝函数没有任何关系,问题应该出在汉字的 utf-8 编码上,如果操作系统是Windows ,那么,这个操作系统只能支持 ANSI 和 unicode 编码的汉字,也就是每个汉字 2 个字节的编码方式,utf-8编码每个汉字是 3 个字节,这种编码是不被支持的。除非是在 Linux 系统上,在这个系统上汉字必须是 utf-8 编码。
如果是在 Windows 操作系统环境下,避免汉字出现乱码的方法是把 C 源程序文本文件的编码置为 ANSI,绝对不能置为 utf-8! 同意jackz007的说法。
不过乱码的原因在这儿ch = *target1++;
这儿应该把后置++去掉,不然你每循环一次就漏一个字节 Croper 发表于 2019-4-7 19:49
同意jackz007的说法。
不过乱码的原因在这儿
这儿应该把后置++去掉,不然你每循环一次就漏一个字节
那个 我能再问个问题吗
就是target不自加那ch永远就是数组str1的第一个元素的哇 怎么可以判断后面的元素:if(ch =='\0'),if((int)ch<0) 你后面不有自加么 if((int)ch<0)
{
*target2++ = *target1++;
*target2++ = *target1++;
*target2++ = *target1++;
}
else
{
*target2++ = *target1++;
} jackz007 发表于 2019-4-7 19:32
拷贝字符串而已,何须如此复杂,下面 2 行代码足矣:
C / C++ 语言的字符串,只要不是 u ...
学到了因为代码写出来有错误想要明白错误在哪非常感谢 Croper 发表于 2019-4-7 21:09
你后面不有自加么
对对对 顿悟了 万分感谢
页:
[1]