贾雨村 发表于 2020-10-30 14:34:27

文件

请问大家
我用list.read()去输出打开文档时弹出了这个错误类型
UnicodeDecodeError: 'gbk' codec can't decode byte 0xa2 in position 50: illegal multibyte sequence
请问这是什么原因导致的呢?
谢谢大佬们了

小甲鱼的铁粉 发表于 2020-10-30 14:39:07

打开txt文件,点击文件,选择另存为,选择右下角的编码格式,选择utf-8,点击保存

sunrise085 发表于 2020-10-30 14:54:57

文件的编码格式问题。txt常见的编码有两种,一种是utf-8,一种是GBK

解决问题的方法有两种:
一、修改txt文件的编码格式,就像二楼那说的那样,文件另存为的时候,右下角有个编码格式,可以选择
二、 修改程序,open函数有个参数encoding就是设置文件编码格式的,默认值是'gbk',你可以修改这个参数。list.read(encoding='utf-8'),不过这这方法只能在你知道文件编码格式的时候使用,若不知道文件编码格式,那这种方法就不好使了。有可以检测文件编码格式的模块chardet,需要自己先安装模块,然后就可以在打开文件之前检测一下文件的编码格式,那样就可以正常打开了
页: [1]
查看完整版本: 文件