关于文档的读取问题
我在桌面创建了一个txt文档,输入了 我爱河海大学,祝河海大学103岁生日快乐!在python 的shell中
>>> f=open('C:\\Users\\LambertZheng\\Desktop\\test.txt')
>>> f.read()
'我爱河海大学,祝河海大学103岁生日快乐!'
>>> f.tell()
39
>>> f.seek(3,0)
3
>>> f.read()
Traceback (most recent call last):
File "<pyshell#42>", line 1, in <module>
f.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 0: illegal multibyte sequence
>>> f.seek(39,0)
39
>>> f.read()
' '
就很奇怪,为什么
>>> f.seek(3,0)
3
>>> f.read()
这个部分会报错,而f.seek(39,0)就可以执行 中英文长度不一样,你可能正好卡在中文一半的位置去读 今天按照小甲鱼的视频一步一步来,已经没有再出现这个问题了 塔利班 发表于 2018-10-24 18:12
中英文长度不一样,你可能正好卡在中文一半的位置去读
你的回答让我醍醐灌顶,谢谢你
read是按照字符来的,而seek是将指针按照字节来的,一个中文字符=2个字节,所以我输入seek(3,0)正好卡在中文字符所占的中间位置的字节开始读,就没有办法将该中文字符完整读取,所以报错
页:
[1]