saberAMD 发表于 2019-4-6 17:51:39

字符串的拷贝

每个中文字符在系统中是占用 3 个字节的存储空间,并且都是负数。思路是:检测到ch为\0结束程序,检测到ch<0,复制三个字节,大于0复制一个字节
但是结果乱码,能不能帮我看下代码哪有问题,谢谢代码没多长
#include <stdio.h>
#define MAX 1024

int main()
{
        char str1,str2;
        char *target1,*target2;
        char ch;
        target1 = str1;
        target2 = str2;
        printf("请输入一串字符串,可以包含中文!");
        fgets(str1,MAX,stdin);
        while(1)
        {
                ch = *target1++;
                if(ch =='\0')
                {
                        break;
                }
                if((int)ch<0)
                {
                        *target2++ = *target1++;
                        *target2++ = *target1++;
                        *target2++ = *target1++;
                }
                else
                {
                        *target2++ = *target1++;
                }
        }
        printf("%s",str2);
       
        return 0;
}

百里狂生 发表于 2019-4-6 18:33:52

*target1++ 是线target1++再*target1。所以会乱码。
换成两行语句
*target1;
target1++;
就不会了

jackz007 发表于 2019-4-6 19:26:57

本帖最后由 jackz007 于 2019-4-6 20:16 编辑

      字符串拷贝用系统函数 strcpy() 难道不行吗?楼主这个自编函数的功能实际上与 strcpy() 无异,完全没有必要自编。

      只有采用 utf8 编码的中文字符才会占用 3 个字节,而 Windows 系统采用的 ANSI 编码和 unicode 编码都是 2 个字节。

saberAMD 发表于 2019-4-7 18:50:58

百里狂生 发表于 2019-4-6 18:33
*target1++ 是线target1++再*target1。所以会乱码。
换成两行语句
*target1;


你们可能对 *target++ != '\0' 这一行代码有疑问,这里我给大家解释下。首先在“运算符的优先级和结合性”(http://bbs.fishc.com/thread-67664-1-1.html)可以查到自增运算符(++)的优先级比取值运算符(*)要高,所以 *target++ 相当于 *(target++),先执行自增运算符,再取值。但由于这是一个后缀的自增运算符,所以自增的效果要在下一条语句才会生效,因此这里取出来的依然是 target 地址自增前指向的数组元素的值。

这是小甲鱼课后作业里面写的可以这么写

saberAMD 发表于 2019-4-7 18:52:47

jackz007 发表于 2019-4-6 19:26
字符串拷贝用系统函数 strcpy() 难道不行吗?楼主这个自编函数的功能实际上与 strcpy() 无异,完全没 ...

我目的就是自己把拷贝函数写出来
我在我的编译器里面试过了 就是三个字节

jackz007 发表于 2019-4-7 19:32:13

本帖最后由 jackz007 于 2019-4-7 19:34 编辑

saberAMD 发表于 2019-4-7 18:52
我目的就是自己把拷贝函数写出来
我在我的编译器里面试过了 就是三个字节

    拷贝字符串而已,何须如此复杂,下面 2 行代码足矣:
                        while (* target1) * target2 ++ = * target1 ++ ;
                        * target2 = '\0'                              ;
       C / C++ 语言的字符串,只要不是 unicode 的编码,根据字符串结尾标志 '\0' 拷贝字符串就永远不会出错!不管每个汉字是几个字节都是如此!

      楼主汉字乱码的原因应该与字符串拷贝函数没有任何关系,问题应该出在汉字的 utf-8 编码上,如果操作系统是Windows ,那么,这个操作系统只能支持 ANSI 和 unicode 编码的汉字,也就是每个汉字 2 个字节的编码方式,utf-8编码每个汉字是 3 个字节,这种编码是不被支持的。除非是在 Linux 系统上,在这个系统上汉字必须是 utf-8 编码。

      如果是在 Windows 操作系统环境下,避免汉字出现乱码的方法是把 C 源程序文本文件的编码置为 ANSI,绝对不能置为 utf-8!

Croper 发表于 2019-4-7 19:49:01

同意jackz007的说法。
不过乱码的原因在这儿ch = *target1++;
这儿应该把后置++去掉,不然你每循环一次就漏一个字节

saberAMD 发表于 2019-4-7 21:07:06

Croper 发表于 2019-4-7 19:49
同意jackz007的说法。
不过乱码的原因在这儿
这儿应该把后置++去掉,不然你每循环一次就漏一个字节

那个 我能再问个问题吗
就是target不自加那ch永远就是数组str1的第一个元素的哇 怎么可以判断后面的元素:if(ch =='\0'),if((int)ch<0)

Croper 发表于 2019-4-7 21:09:29

你后面不有自加么                if((int)ch<0)
                {
                        *target2++ = *target1++;
                        *target2++ = *target1++;
                        *target2++ = *target1++;
                }
                else
                {
                        *target2++ = *target1++;
                }

saberAMD 发表于 2019-4-7 21:10:39

jackz007 发表于 2019-4-7 19:32
拷贝字符串而已,何须如此复杂,下面 2 行代码足矣:

       C / C++ 语言的字符串,只要不是 u ...

学到了因为代码写出来有错误想要明白错误在哪非常感谢

saberAMD 发表于 2019-4-7 21:14:24

Croper 发表于 2019-4-7 21:09
你后面不有自加么

对对对 顿悟了   万分感谢      
页: [1]
查看完整版本: 字符串的拷贝