zmq 发表于 2020-8-26 12:35:55

第28讲中的例子

视频中的那个演示文件(record.txt),请问为何f.seek(45, 0)答应出来的是‘小甲鱼:咦?’
按照中文占2个字节,数到小不是45呀,应该是42吧?

昨非 发表于 2020-8-26 12:38:06

那如果:算一个字节呢

qiuyouzhi 发表于 2020-8-26 12:42:01

昨非 发表于 2020-8-26 12:38
那如果:算一个字节呢

中文字符通常都是2-3个字节的

昨非 发表于 2020-8-26 12:44:10

qiuyouzhi 发表于 2020-8-26 12:42
中文字符通常都是2-3个字节的

好像没有注意过中文特殊字符占的大小{:10_277:}

qiuyouzhi 发表于 2020-8-26 12:45:30

昨非 发表于 2020-8-26 12:44
好像没有注意过中文特殊字符占的大小

蛤?
只要是中文字符,不都应该是2-3个字节滴吗?

昨非 发表于 2020-8-26 12:46:46

qiuyouzhi 发表于 2020-8-26 12:45
蛤?
只要是中文字符,不都应该是2-3个字节滴吗?

我印象里中文汉字都是2字节吧{:10_245:}
哥哥别吓我(我菜)

qiuyouzhi 发表于 2020-8-26 12:47:55

昨非 发表于 2020-8-26 12:46
我印象里中文汉字都是2字节吧
哥哥别吓我(我菜)

在某些编码里面,中文字符是3个字节

昨非 发表于 2020-8-26 12:50:17

本帖最后由 昨非 于 2020-8-26 12:57 编辑

我刚刚看了一下,utf-8汉字三个字节,gbk汉字2个字节
https://s1.ax1x.com/2020/08/26/dR3xqH.png

Twilight6 发表于 2020-8-26 12:56:45

qiuyouzhi 发表于 2020-8-26 12:45
蛤?
只要是中文字符,不都应该是2-3个字节滴吗?

我记得好像一些生僻字,字节更长

heidern0612 发表于 2020-8-26 13:08:11

Twilight6 发表于 2020-8-26 12:56
我记得好像一些生僻字,字节更长

是的。超过5万多了之后,大部分字节都是四字节。
页: [1]
查看完整版本: 第28讲中的例子