python 打开文件后不能识别中文内容
使用python打开 TXT 文件,打开正常,光标移动正常如果使用 .read()和 .readline() 都会提示编译错误
如果将TXT 内容改为 英文,一切正常
还有如果 使用 “rb”改为二进制方式打开,.read()正常
求大神告知原因 代码和txt文件呢??? 本帖最后由 飞天大猫 于 2020-2-23 15:35 编辑
qiuyouzhi 发表于 2020-2-23 15:22
代码和txt文件呢???
文件已经删了啊,等下我重新写个传上来
>>> a = open("C:\\Users\\test\\Desktop\\Python\\test1.txt")
>>> a
<_io.TextIOWrapper name='C:\\Users\\test\\Desktop\\Python\\test1.txt' mode='r' encoding='cp936'>
>>> a.read()
Traceback (most recent call last):
File "<pyshell#106>", line 1, in <module>
a.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 10: illegal multibyte sequence
>>> a.seek(0)
0
>>> a.readline()
Traceback (most recent call last):
File "<pyshell#108>", line 1, in <module>
a.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 10: illegal multibyte sequence
>>> 本帖最后由 飞天大猫 于 2020-2-23 15:36 编辑
飞天大猫 发表于 2020-2-23 15:23
文件已经删了啊,等下我重新写个传上来
没找到哪里添加附件啊
难道是因为我不是VIP? 一个账号 发表于 2020-2-23 15:41
等到你 100 积分的时候就可以传了。
把内容发上来吧
爸爸:“呵呵呵,朱迪。知道为什么我和你妈妈过得这么幸福吗?”
小朱迪:“不知道。”
爸爸:“因为我们放弃梦想,选择安定,对吗?”
妈妈:“哦,说的没错,我们可安定了。”
爸爸:“你看,这就是知足常乐的好处,如果你不做新的尝试就不会犯错。”
小朱迪:“可我就喜欢尝试。”
妈妈:“你爸爸的意思是,当警察挺难的,甚至不可能,尤其是对于你来说”
爸爸:“没错,兔子从来不当警察”妈妈:“对!”爸爸:“也当不了警察。”妈妈:“当不了。”
爸爸:“当不了。”
小朱迪:“哦!那我就会是第一个啦!因为我想,要让这个世界变得更美好!”
爸爸:“啊,呵呵,哦,你看这,让世界变得美好还有别的方法,比如当一个种胡萝卜的农民。”
妈妈:“没错,你爸爸和我还有你275个兄弟姐妹,我们都在改变世界。”爸爸:“对!”妈妈:“用胡萝卜改变。”
爸爸:“感谢上帝,种胡萝卜可是高尚的职业。”
妈妈:“嗯,只要把种子放进土壤。”
爸爸:“啊,只要和土壤融为一体,再用泥土盖起来。”
妈妈:“对啊,梦想确实美好。”
爸爸:“是啊,只要梦想别太离谱就好。额,他跑哪儿去了?” 这是我从网上复制的,亲测手动打上去和网上复制都不行,英文没一点问题 飞天大猫 发表于 2020-2-23 15:43
这是我从网上复制的,亲测手动打上去和网上复制都不行,英文没一点问题
编码问题,你文件使用什么编码的?如果是 "utf-8",改成这样:
a = open("C:\\Users\\test\\Desktop\\Python\\test1.txt", encoding="utf-8") 本帖最后由 飞天大猫 于 2020-2-23 15:47 编辑
一个账号 发表于 2020-2-23 15:42
改成这样:
为什么改成这个就好了啊?
本帖最后由 一个账号 于 2020-2-23 15:49 编辑
飞天大猫 发表于 2020-2-23 15:46
为什么改成这个就好了啊?
encoding="utf-8" 的意思是指定文件编码为 "utf-8",Python 默认是 GBK。
页:
[1]