[已解决]小白求助第28讲第8题

HMartin · 发表于 2020-2-23 11:11:33

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

8. 还是视频中的那个演示文件（record.txt），请问为何f.seek(45, 0)不会出错，但f.seek(46)就出错了呢？

>>> f.seek(46)
46
>>> f.readline()
Traceback (most recent call last):
File "<pyshell#18>", line 1, in <module>
f.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xe3 in position 4: illegal multibyte sequence

答：因为使用f.seek()定位的文件指针是按字节为单位进行计算的，演示文件（record.txt）是以GBK进行编码的，按照规则，一个汉字需要占用两个字节，f.seek(45)的位置位于字符“小”的开始位置，因此可以正常打印，而f.seek(46)的位置刚好位于字符“小”的中间位置，因此按照GBK编码的形式无法将其解码！

https://www.bilibili.com/video/av27789609?p=29 这是原视频网址，问题在12:18处。
我数了一下共有19个汉字，1个: 1个, 1个? 1个\n 这最多就43个字节那么f.seek(44,0)不就可以开始从 '小' 打印了吗，45便位于 '小' 的结束位置, 为什么说45的位置位于 '小' 的开始位置？

最佳答案

月排行榜 / 总排行榜

shuofxz

2020-2-24 16:26:55

HMartin 发表于 2020-2-24 09:30
这么说那一个小矩形就算一个字节了？

对，每个矩形是一个字节

跳转到最佳答案楼层

shuofxz · 发表于 2020-2-23 11:48:17

首先下标从0开始数，所以f.seek(45)，其实是第46个位置（如果从1开始数的话）

前面：，？都是中文字符，都是占2个字符的，所以前面一共有（19个汉字+3个中文符号 = 22个中文符号，1个\n是一个英文字符），即 22*2 + 1 = 45，下标从零开始数，“小”前面那个字符的结束位置是44，所以45是小的起始位置

HMartin · 发表于 2020-2-23 12:41:29

shuofxz 发表于 2020-2-23 11:48
首先下标从0开始数，所以f.seek(45)，其实是第46个位置（如果从1开始数的话）

前面：，？都是中文字符， ...

45是小的起始位置，那么从45开始数，一个汉字俩字节，那么46不就数完了吗，为什么说46是中间位置呢，45，46，47那就是三个字节了

shuofxz · 发表于 2020-2-23 18:41:02

HMartin 发表于 2020-2-23 12:41
45是小的起始位置，那么从45开始数，一个汉字俩字节，那么46不就数完了吗，为什么说46是中间位置呢，45， ...

这样画能明白不

HMartin · 发表于 2020-2-24 09:30:00

shuofxz 发表于 2020-2-23 18:41
这样画能明白不

这么说那一个小矩形就算一个字节了？

shuofxz · 发表于 2020-2-24 16:26:55

这个最佳答案由 shuofxz 给出，感谢 shuofxz 的回答。

单击隐藏图章

HMartin 发表于 2020-2-24 09:30
这么说那一个小矩形就算一个字节了？

对，每个矩形是一个字节

账号		自动登录	找回密码
密码			立即注册