鱼C论坛

 找回密码
 立即注册
查看: 2107|回复: 8

[已解决]第30讲第4题,关于文本格式

[复制链接]
发表于 2020-12-7 23:17:22 | 显示全部楼层 |阅读模式
30鱼币
从学了文件开始我就发现了这个问题,有些txt需要用encoding='UTF-8',有些不需要,之前的几道题都是需要就加上,不需要就不加,而当我遇到这道要打开多个txt文件的题的时候就难住我了,自己编了好久,最后又拿甲鱼哥的代码去试,发现还是有这个问题,不加encoding='UTF-8'会出现
UnicodeDecodeError: 'gbk' codec can't decode byte 0xbc in position 8: illegal multibyte sequence
加了就会出现
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 26: invalid continuation byte
实在是搞晕我了,有没有大佬解释一下这些格式都是咋要求的呜呜呜
最佳答案
2020-12-7 23:17:23
这个问题是因为你的这多个txt文件,有的是utf8编码,有的不是utf8编码。所以你在open中将encoding设置成哪种都会报错。
解决方法有两种:
第一种,比较笨,治标不治本,去修改txt的编码,将之统一成一种编码。具体操作:打开txt,将文件另存为,在另存为窗口下方有个编码格式设置,各个文件统一编码即可
第二种,下载一个模块charset,这个模块可以识别文件编码,每次打开文件之前,先获取文件编码,再用正确的编码格式打开。

最佳答案

查看完整内容

这个问题是因为你的这多个txt文件,有的是utf8编码,有的不是utf8编码。所以你在open中将encoding设置成哪种都会报错。 解决方法有两种: 第一种,比较笨,治标不治本,去修改txt的编码,将之统一成一种编码。具体操作:打开txt,将文件另存为,在另存为窗口下方有个编码格式设置,各个文件统一编码即可 第二种,下载一个模块charset,这个模块可以识别文件编码,每次打开文件之前,先获取文件编码,再用正确的编码格式打开。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-12-7 23:17:23 | 显示全部楼层    本楼为最佳答案   
这个问题是因为你的这多个txt文件,有的是utf8编码,有的不是utf8编码。所以你在open中将encoding设置成哪种都会报错。
解决方法有两种:
第一种,比较笨,治标不治本,去修改txt的编码,将之统一成一种编码。具体操作:打开txt,将文件另存为,在另存为窗口下方有个编码格式设置,各个文件统一编码即可
第二种,下载一个模块charset,这个模块可以识别文件编码,每次打开文件之前,先获取文件编码,再用正确的编码格式打开。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-12-8 07:23:02 From FishC Mobile | 显示全部楼层
py有俩个三方模块,可以获取文本文件的编码方式,自己百度一下,我忘了叫啥来着
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-12-8 20:56:26 | 显示全部楼层
sunrise085 发表于 2020-12-7 23:17
这个问题是因为你的这多个txt文件,有的是utf8编码,有的不是utf8编码。所以你在open中将encoding设置成哪 ...

请问已经下载并解压了这个模块,需要如何安装呢,我点set up发现在pycharm里出现了一个py文件
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-12-8 21:26:44 | 显示全部楼层
1Z啊 发表于 2020-12-8 20:56
请问已经下载并解压了这个模块,需要如何安装呢,我点set up发现在pycharm里出现了一个py文件

哦,我会了,搜到了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-12-8 21:28:55 | 显示全部楼层
1Z啊 发表于 2020-12-8 20:56
请问已经下载并解压了这个模块,需要如何安装呢,我点set up发现在pycharm里出现了一个py文件


我使用的不是pycharm,所以也不太清楚pycharm安装模块的方法
你网上搜一下吧。
我刚刚看了一下,好像是打开pycharm界面,然后file->setting进行安装。具体步骤自己搜一下吧。我没用过,不是很清楚那个帖子的方法能使用,就不给你贴链接了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-12-8 21:59:39 | 显示全部楼层
sunrise085 发表于 2020-12-8 21:28
我使用的不是pycharm,所以也不太清楚pycharm安装模块的方法
你网上搜一下吧。
我刚刚看了一下,好像 ...

嗯,已经安装上了,但是不太会用,想问一下用什么chardet方法检测文件的编码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-12-8 23:01:04 | 显示全部楼层
1Z啊 发表于 2020-12-8 21:59
嗯,已经安装上了,但是不太会用,想问一下用什么chardet方法检测文件的编码

百度是个好东西
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-12-8 23:08:24 | 显示全部楼层

我查了,还是想确认一下,是需要把文本open然后readline,再加encode转utf-8,才能用吗,0, 0
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 17:38

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表