[已解决]关于python中TXT格式识别问题

野渡1 · 发表于 2018-10-7 11:11:11

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

代码 txt = open('D:/Users/python/三国演义.txt','r',encoding='utf-8').read()

错误提示 File "D:\python\lib\codecs.py", line 322, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte

txt文本文件怎么转换成python 能识别的格式呢，utf-8 和gbk不能正常识别，是需要首先对TXT转码之后才能识别吗

最佳答案

月排行榜 / 总排行榜

RIXO

2018-10-7 15:12:04

呃，这个问题，因为windows自己使用的编码可能不是utf-8，所以你的encoding = ‘utf-8’ 报错了建议用gbk 试试，或者chardet模块判断字符编码

跳转到最佳答案楼层

1005204767 · 发表于 2018-10-7 12:25:21

txt = open('D:/Users/python/三国演义.txt','r',encoding='utf-8'，errors = 'ignore').read()
你可以先加个ignore 跳过错误看看，如果打印出来的文本太多乱码说明编码方式不对。

RIXO · 发表于 2018-10-7 15:12:04

呃，这个问题，因为windows自己使用的编码可能不是utf-8，所以你的encoding = ‘utf-8’ 报错了建议用gbk 试试，或者chardet模块判断字符编码

野渡1 · 发表于 2018-10-7 16:46:48

1005204767 发表于 2018-10-7 12:25
txt = open('D:/Users/python/三国演义.txt','r',encoding='utf-8'，errors = 'ignore').read()
你可以先 ...

谢谢啦，已经解决了，文本太大了，用的gb18030

野渡1 · 发表于 2018-10-7 16:48:10

RIXO 发表于 2018-10-7 15:12
呃，这个问题，因为windows自己使用的编码可能不是utf-8，所以你的encoding = ‘utf-8’ 报错了建议 ...

嗯嗯，刚开始用的gbk，不行才换的这个，用gb18030就好了，文档太大，gbk小了

账号		自动登录	找回密码
密码			立即注册

[已解决]关于python中TXT格式识别问题

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块