18295982292 发表于 2021-7-28 17:12:54

sle22,汉字,为什么指针要移两个字节

不难发现,每个中文字符在我们的系统中是占用 4 个字节的存储空间,并且都是负数。以此规律,我们只要检测一个字符对应的整型值是否为负数,如果是(中文字符),则将指针往后移动两个字节。
不理解的是如果汉字是4个字节,那么指针不应该也移四个吗

大马强 发表于 2021-7-28 18:39:53

要这么说的话,我感觉应该是对的,不同的编码下的汉字占的字节是不一样的
我查了下
1,ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。
2,UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节
3,Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点占两个字节

万千只cnm 发表于 2021-7-28 21:17:30

不一定四个呀

18295982292 发表于 2021-7-29 08:28:15

大马强 发表于 2021-7-28 18:39
要这么说的话,我感觉应该是对的,不同的编码下的汉字占的字节是不一样的
我查了下
1,ASCII码:一个英文 ...

但是按他的例子测试,我确实测出来汉字是四个字节

大马强 发表于 2021-7-29 08:43:28

你应该学到有关文件编码类的知识了吧?
页: [1]
查看完整版本: sle22,汉字,为什么指针要移两个字节