鱼C论坛

 找回密码
 立即注册
查看: 2537|回复: 17

S1E22中关于C语言字符数组中文字符所占字节的问题

[复制链接]
发表于 2021-9-28 08:30:25 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 junran 于 2021-9-28 08:30 编辑



做作业时发现,关于中文字符的题目一道也做不出来
后来发现复制小甲鱼的代码也时对时不对

经过本人夜以继日的测试,发现中文字符的ascii码在我的电脑上是随机的

                               
登录/注册后可看大图

可能为正,也可能为负

                               
登录/注册后可看大图

而且在字符数组中所占位置为1字节而不是小甲鱼所说的3字节
这究竟是为什么呢?

更有意思的是,只要我初始化字符数组给定中文字符串,那么中文就占3字节

                               
登录/注册后可看大图


将字符数组变成输入赋值后就变成了1字节了

                               
登录/注册后可看大图



百思不得其解,求助各位大大了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-9-28 08:38:37 | 显示全部楼层
试试这个代码输出的内容和你在调试器中看到的是不是一样
#include <stdio.h>

int main(void) {
    const char *str = "你好 - hello";
    for(size_t i = 0; str[i]; ++i) printf("%d ", str[i]);
    printf("\n");
    return 0;
}

我这边的输出
$ ./main
-28 -67 -96 -27 -91 -67 32 45 32 104 101 108 108 111
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-28 08:40:06 | 显示全部楼层
人造人 发表于 2021-9-28 08:38
试试这个代码输出的内容和你在调试器中看到的是不是一样

是一样的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-28 08:41:38 | 显示全部楼层
人造人 发表于 2021-9-28 08:38
试试这个代码输出的内容和你在调试器中看到的是不是一样

试试手动输入的?我这边也是,只要初始化中赋值了就没毛病,但是fgets输入就有问题
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 08:45:46 | 显示全部楼层
我估计 你夜以继日的测试,最终得到的结果是 vscode 的问题,^_^
测试的时候,顺便把数组的内容输出出来,像我上面那样,用 printf 输出出来,看看是不是和 vscode 调试器中的内容一样
printf 输出出来的内容是没问题的,就是内存中的数字
vscode 调试器中输出的就不一定了

这样加上索引也许更好,更方便你调试
#include <stdio.h>

int main(void) {
    const char *str = "你好 - hello";
    for(size_t i = 0; str[i]; ++i) printf("[%lu] = %d\n", i, str[i]);
    return 0;
}
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 08:46:41 | 显示全部楼层
$ ./main
[0] = -28
[1] = -67
[2] = -96
[3] = -27
[4] = -91
[5] = -67
[6] = 32
[7] = 45
[8] = 32
[9] = 104
[10] = 101
[11] = 108
[12] = 108
[13] = 111
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 08:49:02 | 显示全部楼层
junran 发表于 2021-9-28 08:41
试试手动输入的?我这边也是,只要初始化中赋值了就没毛病,但是fgets输入就有问题

没关系呀,你手动输入好了,然后再输出出来,关键是要看内存中保存的是什么
#include <stdio.h>

int main(void) {
    char str[1024];
    fgets(str, 1024, stdin);
    for(size_t i = 0; str[i]; ++i) printf("[%lu] = %d\n", i, str[i]);
    return 0;
}
$ ./main
你好 - hello
[0] = -28
[1] = -67
[2] = -96
[3] = -27
[4] = -91
[5] = -67
[6] = 32
[7] = 45
[8] = 32
[9] = 104
[10] = 101
[11] = 108
[12] = 108
[13] = 111
[14] = 10
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-28 08:53:33 | 显示全部楼层
人造人 发表于 2021-9-28 08:49
没关系呀,你手动输入好了,然后再输出出来,关键是要看内存中保存的是什么


                               
登录/注册后可看大图

所以是我的电脑有问题吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 08:54:56 | 显示全部楼层
junran 发表于 2021-9-28 08:53
所以是我的电脑有问题吗

在 202 行下断点
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 08:55:37 | 显示全部楼层
junran 发表于 2021-9-28 08:53
所以是我的电脑有问题吗


就是执行到 202 行的时候停下来,看调试器中输出的是不是和 printf 输出的一样
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 08:59:00 | 显示全部楼层
junran 发表于 2021-9-28 08:53
所以是我的电脑有问题吗

这样
#include <stdio.h>

int main(void) {
    char str[1024];
    fgets(str, 1024, stdin);
    printf("%s", str);
    for(size_t i = 0; str[i]; ++i) printf("[%lu] = %d\n", i, str[i]);
    return 0;
}
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-28 09:04:21 | 显示全部楼层


                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-28 09:05:44 | 显示全部楼层

然而这个负数只是偶然

                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 09:07:58 | 显示全部楼层

很明显了,vscode 的问题,'你好' 这两个中文字符没有输入到内存中,也可以说成是 输入到内存中的 '你好' 这两个中文字符是错误的
因为 fgets 下面的 printf 按 %s 输出输入的字符串,结果显示输出的内容不对,说明保存到内存中的字符串不是
'你好 - hello'
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-28 09:11:56 | 显示全部楼层
人造人 发表于 2021-9-28 09:07
很明显了,vscode 的问题,'你好' 这两个中文字符没有输入到内存中,也可以说成是 输入到内存中的 '你好' ...

就是说如果我用支持中文字符的编译器的话,他就一定会是3个字节而且都为负数对吧?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 09:14:10 | 显示全部楼层
junran 发表于 2021-9-28 09:11
就是说如果我用支持中文字符的编译器的话,他就一定会是3个字节而且都为负数对吧?

不一定,这还要看你文件的编码
你换一个 dev-c++ 试一试就知道了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-28 09:15:20 | 显示全部楼层
人造人 发表于 2021-9-28 09:14
不一定,这还要看你文件的编码
你换一个 dev-c++ 试一试就知道了

好的,了解了,谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-28 09:27:10 | 显示全部楼层
junran 发表于 2021-9-28 09:15
好的,了解了,谢谢

1.png
$ ./main
你好 - hello
你好 - hello
[0] = -60
[1] = -29
[2] = -70
[3] = -61
[4] = 32
[5] = 45
[6] = 32
[7] = 104
[8] = 101
[9] = 108
[10] = 108
[11] = 111
[12] = 10
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-22 12:34

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表