[课后作业] S1E22:指针和数组 第一题
汉字存放在内存里需要占用四个字节 但是这个里面target 在赋值给ch的时候地址指向了第一个字节 在将ch转化为整形小于零的时候加了两个字节 这么算下来一共才三个 跟所说的四个字节对不上 想了很久不知道哪里出现了问题 大婶们救救我!!!@ 大婶? 因为还有第二轮循环第一轮循环
target++
target+=2
第二轮循环
target++,然后因为ch =='\0' 而break了
这不就四个 翼是孤独 发表于 2022-1-29 23:38
因为还有第二轮循环
第一轮循环
break结束循环后 那岂不是输入一个汉字之后就彻底结束了 存放在str数组里的数据也不会再计数了啊 本帖最后由 翼是孤独 于 2022-1-30 00:27 编辑
youxixingzhet 发表于 2022-1-29 23:54
break结束循环后 那岂不是输入一个汉字之后就彻底结束了 存放在str数组里的数据也不会再计数了啊
因为 汉字 UTF-8通常是占三个字节,有的是四个 人造人 发表于 2022-1-29 23:32
大婶?
咋了嘛 咋了嘛 翼是孤独 发表于 2022-1-30 00:25
因为 汉字 UTF-8通常是占三个字节,有的是四个
那是不是这个代码不太对啊? str = 0经过 if ( ch == '\0')直接就退出循环了length也就不增加了诶 youxixingzhet 发表于 2022-1-30 19:17
咋了嘛 咋了嘛
https://github.com/ruby-china/How-To-Ask-Questions-The-Smart-Way/blob/master/README-zh_CN.md youxixingzhet 发表于 2022-1-30 19:19
那是不是这个代码不太对啊? str = 0经过 if ( ch == '\0')直接就退出循环了length也就不增加了诶
对的啊,str = ‘\0’退出,前面不是有str str str 吗,一共3个,说明这个汉字长度是3字节
汉字的UTF-8长度最长是4字节,又不是全是4字节 翼是孤独 发表于 2022-1-30 19:45
对的啊,str = ‘\0’退出,前面不是有str str str 吗,一共3个,说明这个汉字长度是3字节
...
懂了 谢谢 翼是孤独 发表于 2022-1-30 00:25
因为 汉字 UTF-8通常是占三个字节,有的是四个
UTF-8编码规则:如果只有一个字节则取值为0x00-0x7F。其余字节按长度进行以下拓展:
UTF-8由4种编码方式实现,即UTF8-1 / UTF8-2 / UTF8-3 / UTF8-4 。其中:
UTF8, 16进制编码表
UTF8-1
0x00-0x7F
UTF8-2
0xC2-0xDF 0x80-0xBF
UTF8-3
0xE0 0xA0-0xBF 0x80-0xBF
0xE1-0xEC 0x80-0xBF 0x80-0xBF
0xED 0x80-0x9F 0x80-0xBF
0xEE-0xEF 0x80-0xBF 0x80-0xBF
UTF8-4
0xF0 0x90-0xBF 0x80-0xBF 0x80-0xBF
0xF1-0xF3 0x80-0xBF 0x80-0xBF 0x80-0xBF
0xF4 0x80-0x8F 0x80-0xBF 0x80-0xBF
页:
[1]