买了个表 发表于 2018-10-24 18:06:21

关于文档的读取问题

我在桌面创建了一个txt文档,输入了 我爱河海大学,祝河海大学103岁生日快乐!
在python 的shell中
>>> f=open('C:\\Users\\LambertZheng\\Desktop\\test.txt')
          
>>> f.read()
          
'我爱河海大学,祝河海大学103岁生日快乐!'

>>> f.tell()
          
39

>>> f.seek(3,0)
          
3
>>> f.read()
          
Traceback (most recent call last):
File "<pyshell#42>", line 1, in <module>
    f.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 0: illegal multibyte sequence

>>> f.seek(39,0)
          
39
>>> f.read()
          
' '
就很奇怪,为什么
>>> f.seek(3,0)
          
3
>>> f.read()
这个部分会报错,而f.seek(39,0)就可以执行

塔利班 发表于 2018-10-24 18:12:51

中英文长度不一样,你可能正好卡在中文一半的位置去读

买了个表 发表于 2018-10-25 10:24:35

今天按照小甲鱼的视频一步一步来,已经没有再出现这个问题了

买了个表 发表于 2018-10-25 10:28:24

塔利班 发表于 2018-10-24 18:12
中英文长度不一样,你可能正好卡在中文一半的位置去读

你的回答让我醍醐灌顶,谢谢你
read是按照字符来的,而seek是将指针按照字节来的,一个中文字符=2个字节,所以我输入seek(3,0)正好卡在中文字符所占的中间位置的字节开始读,就没有办法将该中文字符完整读取,所以报错
页: [1]
查看完整版本: 关于文档的读取问题