Jerry~Mouse 发表于 2022-3-15 15:34:28

文件读取的问题

>>> f.readlines()
Traceback (most recent call last):
File "<pyshell#20>", line 1, in <module>
    f.readlines()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence

请问这个是什么错误呢 有什么方法可以解决吗

文件内容如下:(有省略)

小客服:小甲鱼,今天有客户问你有没有女朋友?
小甲鱼:咦??
小客服:我跟她说你有女朋友了!
小甲鱼:。。。 o o 。
小客服:她让你分手后考虑下她!然后我说:"您要买个优盘,我就帮您留意下~"
小甲鱼:然后呢?
小客服:她买了两个,说发一个货就好~
小甲鱼:呃。。 。。。。你真牛!
小客服:那是,谁让我是鱼C最可爱小客服嘛~
小甲鱼:下次有人想调戏你我不阻止~
小客服:滚!!!
............

wp231957 发表于 2022-3-15 15:35:21

打开文件时要使用正确的编码

python爱好者. 发表于 2022-3-15 15:36:13

f = open("东西",encoding = "utf8")

isdkz 发表于 2022-3-15 15:37:16

楼上大佬正解

ba21 发表于 2022-3-15 15:38:27

文本文件读写编码是一个麻烦问题 。
如果你只是学习测试,你用记事本打开文件,然后另存为 编码选为 ANSI

Jerry~Mouse 发表于 2022-3-15 15:59:24

python爱好者. 发表于 2022-3-15 15:36
f = open("东西",encoding = "utf8")

这里utf8是什么意思呢 全英文和数字的文件不需要这个也可以打开 哪些文件打开需要这个呢 小甲鱼在视频里打开中文字符的文件没加utf8就打开了 是有什么奥秘吗

Jerry~Mouse 发表于 2022-3-15 16:00:22

ba21 发表于 2022-3-15 15:38
文本文件读写编码是一个麻烦问题 。
如果你只是学习测试,你用记事本打开文件,然后另存为 编码选为 ANSI

具体应该如何操作呢

ba21 发表于 2022-3-15 16:05:56

Jerry~Mouse 发表于 2022-3-15 16:00
具体应该如何操作呢

直接打开你的文件,另存为

isdkz 发表于 2022-3-15 16:06:53

Jerry~Mouse 发表于 2022-3-15 15:59
这里utf8是什么意思呢 全英文和数字的文件不需要这个也可以打开 哪些文件打开需要这个呢 小甲鱼在视频里 ...

你可以看一下这个:
https://fishc.com.cn/forum.php?mod=redirect&goto=findpost&ptid=209823&pid=5758004

Jerry~Mouse 发表于 2022-3-15 22:50:54

isdkz 发表于 2022-3-15 16:06
你可以看一下这个:
https://fishc.com.cn/forum.php?mod=redirect&goto=findpost&ptid=209823&pid=5758 ...

这个解答挺清晰的 搞明白了 谢谢!!

Jerry~Mouse 发表于 2022-3-15 22:53:36

isdkz 发表于 2022-3-15 16:06
你可以看一下这个:
https://fishc.com.cn/forum.php?mod=redirect&goto=findpost&ptid=209823&pid=5758 ...

但是我还是觉得有一点奇怪 为什么小甲鱼讲课的时候不使用utf-8打开中文字符的文件也可以呢

isdkz 发表于 2022-3-15 23:00:15

Jerry~Mouse 发表于 2022-3-15 22:53
但是我还是觉得有一点奇怪 为什么小甲鱼讲课的时候不使用utf-8打开中文字符的文件也可以呢

因为他的文件本来就是以 gbk 编码保存的,

你不加编码方式默认根据你的当前语言环境的编码来 解码,

以什么编码格式来 编码 就要以什么编码格式 解码,或者他也是以 utf-8 保存,

但是他的语言环境默认使用 utf-8 解码,你可以通过以下命令改变默认编码方式(在 cmd 下执行):

setx PYTHONUTF8 1

这样你如果文件的编码是 utf-8 的,也就不用手动指定了,但是你的文件编码换成是 gbk 的就得手动指定了。

Jerry~Mouse 发表于 2022-3-15 23:22:24

isdkz 发表于 2022-3-15 23:00
因为他的文件本来就是以 gbk 编码保存的,

你不加编码方式默认根据你的当前语言环境的编码来 解码,


原来如此 明白了 谢谢解答
页: [1]
查看完整版本: 文件读取的问题