第30讲第4题,关于文本格式
从学了文件开始我就发现了这个问题,有些txt需要用encoding='UTF-8',有些不需要,之前的几道题都是需要就加上,不需要就不加,而当我遇到这道要打开多个txt文件的题的时候就难住我了,自己编了好久,最后又拿甲鱼哥的代码去试,发现还是有这个问题,不加encoding='UTF-8'会出现UnicodeDecodeError: 'gbk' codec can't decode byte 0xbc in position 8: illegal multibyte sequence
加了就会出现
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 26: invalid continuation byte
实在是搞晕我了,有没有大佬解释一下这些格式都是咋要求的呜呜呜 这个问题是因为你的这多个txt文件,有的是utf8编码,有的不是utf8编码。所以你在open中将encoding设置成哪种都会报错。
解决方法有两种:
第一种,比较笨,治标不治本,去修改txt的编码,将之统一成一种编码。具体操作:打开txt,将文件另存为,在另存为窗口下方有个编码格式设置,各个文件统一编码即可
第二种,下载一个模块charset,这个模块可以识别文件编码,每次打开文件之前,先获取文件编码,再用正确的编码格式打开。 py有俩个三方模块,可以获取文本文件的编码方式,自己百度一下,我忘了叫啥来着 sunrise085 发表于 2020-12-7 23:17
这个问题是因为你的这多个txt文件,有的是utf8编码,有的不是utf8编码。所以你在open中将encoding设置成哪 ...
请问已经下载并解压了这个模块,需要如何安装呢,我点set up发现在pycharm里出现了一个py文件 1Z啊 发表于 2020-12-8 20:56
请问已经下载并解压了这个模块,需要如何安装呢,我点set up发现在pycharm里出现了一个py文件
哦,我会了,搜到了 1Z啊 发表于 2020-12-8 20:56
请问已经下载并解压了这个模块,需要如何安装呢,我点set up发现在pycharm里出现了一个py文件
我使用的不是pycharm,所以也不太清楚pycharm安装模块的方法
你网上搜一下吧。
我刚刚看了一下,好像是打开pycharm界面,然后file->setting进行安装。具体步骤自己搜一下吧。我没用过,不是很清楚那个帖子的方法能使用,就不给你贴链接了 sunrise085 发表于 2020-12-8 21:28
我使用的不是pycharm,所以也不太清楚pycharm安装模块的方法
你网上搜一下吧。
我刚刚看了一下,好像 ...
嗯,已经安装上了,但是不太会用,想问一下用什么chardet方法检测文件的编码 1Z啊 发表于 2020-12-8 21:59
嗯,已经安装上了,但是不太会用,想问一下用什么chardet方法检测文件的编码
百度是个好东西 sunrise085 发表于 2020-12-8 23:01
百度是个好东西
我查了,还是想确认一下,是需要把文本open然后readline,再加encode转utf-8,才能用吗,0, 0
页:
[1]