字符串的拷贝,C\C++交流,编程语言专区,鱼C论坛

saberAMD 发表于 2019-4-6 17:51:39

字符串的拷贝

每个中文字符在系统中是占用 3 个字节的存储空间，并且都是负数。思路是：检测到ch为\0结束程序，检测到ch<0,复制三个字节，大于0复制一个字节
但是结果乱码，能不能帮我看下代码哪有问题，谢谢代码没多长
#include <stdio.h>
#define MAX 1024

int main()
{
char str1,str2;
char *target1,*target2;
char ch;
target1 = str1;
target2 = str2;
printf("请输入一串字符串，可以包含中文！");
fgets(str1,MAX,stdin);
while(1)
{
ch = *target1++;
if(ch =='\0')
{
break;
}
if((int)ch<0)
{
*target2++ = *target1++;
*target2++ = *target1++;
*target2++ = *target1++;
}
else
{
*target2++ = *target1++;
}
}
printf("%s",str2);

return 0;
}

百里狂生 发表于 2019-4-6 18:33:52

*target1++ 是线target1++再*target1。所以会乱码。
换成两行语句
*target1；
target1++；
就不会了

jackz007 发表于 2019-4-6 19:26:57

本帖最后由 jackz007 于 2019-4-6 20:16 编辑

字符串拷贝用系统函数 strcpy() 难道不行吗？楼主这个自编函数的功能实际上与 strcpy() 无异，完全没有必要自编。

只有采用 utf8 编码的中文字符才会占用 3 个字节，而 Windows 系统采用的 ANSI 编码和 unicode 编码都是 2 个字节。

saberAMD 发表于 2019-4-7 18:50:58

百里狂生发表于 2019-4-6 18:33
*target1++ 是线target1++再*target1。所以会乱码。
换成两行语句
*target1；

你们可能对 *target++ != '\0' 这一行代码有疑问，这里我给大家解释下。首先在“运算符的优先级和结合性”（http://bbs.fishc.com/thread-67664-1-1.html）可以查到自增运算符（++）的优先级比取值运算符（*）要高，所以 *target++ 相当于 *(target++)，先执行自增运算符，再取值。但由于这是一个后缀的自增运算符，所以自增的效果要在下一条语句才会生效，因此这里取出来的依然是 target 地址自增前指向的数组元素的值。

这是小甲鱼课后作业里面写的可以这么写

saberAMD 发表于 2019-4-7 18:52:47

jackz007 发表于 2019-4-6 19:26
字符串拷贝用系统函数 strcpy() 难道不行吗？楼主这个自编函数的功能实际上与 strcpy() 无异，完全没 ...

我目的就是自己把拷贝函数写出来
我在我的编译器里面试过了就是三个字节

jackz007 发表于 2019-4-7 19:32:13

本帖最后由 jackz007 于 2019-4-7 19:34 编辑

saberAMD 发表于 2019-4-7 18:52
我目的就是自己把拷贝函数写出来
我在我的编译器里面试过了就是三个字节

拷贝字符串而已，何须如此复杂，下面 2 行代码足矣：
                     while (* target1) * target2 ++ = * target1 ++ ;
                     * target2 = '\0'                            ;
   C / C++ 语言的字符串，只要不是 unicode 的编码，根据字符串结尾标志 '\0' 拷贝字符串就永远不会出错！不管每个汉字是几个字节都是如此！

   楼主汉字乱码的原因应该与字符串拷贝函数没有任何关系，问题应该出在汉字的 utf-8 编码上，如果操作系统是Windows ，那么，这个操作系统只能支持 ANSI 和 unicode 编码的汉字，也就是每个汉字 2 个字节的编码方式，utf-8编码每个汉字是 3 个字节，这种编码是不被支持的。除非是在 Linux 系统上，在这个系统上汉字必须是 utf-8 编码。

   如果是在 Windows 操作系统环境下，避免汉字出现乱码的方法是把 C 源程序文本文件的编码置为 ANSI，绝对不能置为 utf-8!

Croper 发表于 2019-4-7 19:49:01

同意jackz007的说法。
不过乱码的原因在这儿ch = *target1++;
这儿应该把后置++去掉，不然你每循环一次就漏一个字节

saberAMD 发表于 2019-4-7 21:07:06

Croper 发表于 2019-4-7 19:49
同意jackz007的说法。
不过乱码的原因在这儿
这儿应该把后置++去掉，不然你每循环一次就漏一个字节

那个我能再问个问题吗
就是target不自加那ch永远就是数组str1的第一个元素的哇怎么可以判断后面的元素：if(ch =='\0'），if((int)ch<0)

Croper 发表于 2019-4-7 21:09:29

你后面不有自加么             if((int)ch<0)
            {
                     *target2++ = *target1++;
                     *target2++ = *target1++;
                     *target2++ = *target1++;
            }
            else
            {
                     *target2++ = *target1++;
            }

saberAMD 发表于 2019-4-7 21:10:39

jackz007 发表于 2019-4-7 19:32
拷贝字符串而已，何须如此复杂，下面 2 行代码足矣：

C / C++ 语言的字符串，只要不是 u ...

学到了因为代码写出来有错误想要明白错误在哪非常感谢

saberAMD 发表于 2019-4-7 21:14:24

Croper 发表于 2019-4-7 21:09
你后面不有自加么

对对对顿悟了万分感谢

页: [1]

鱼C论坛's Archiver

字符串的拷贝