文件读取的问题
>>> f.readlines()Traceback (most recent call last):
File "<pyshell#20>", line 1, in <module>
f.readlines()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence
请问这个是什么错误呢 有什么方法可以解决吗
文件内容如下:(有省略)
小客服:小甲鱼,今天有客户问你有没有女朋友?
小甲鱼:咦??
小客服:我跟她说你有女朋友了!
小甲鱼:。。。 o o 。
小客服:她让你分手后考虑下她!然后我说:"您要买个优盘,我就帮您留意下~"
小甲鱼:然后呢?
小客服:她买了两个,说发一个货就好~
小甲鱼:呃。。 。。。。你真牛!
小客服:那是,谁让我是鱼C最可爱小客服嘛~
小甲鱼:下次有人想调戏你我不阻止~
小客服:滚!!!
............
打开文件时要使用正确的编码 f = open("东西",encoding = "utf8") 楼上大佬正解 文本文件读写编码是一个麻烦问题 。
如果你只是学习测试,你用记事本打开文件,然后另存为 编码选为 ANSI python爱好者. 发表于 2022-3-15 15:36
f = open("东西",encoding = "utf8")
这里utf8是什么意思呢 全英文和数字的文件不需要这个也可以打开 哪些文件打开需要这个呢 小甲鱼在视频里打开中文字符的文件没加utf8就打开了 是有什么奥秘吗 ba21 发表于 2022-3-15 15:38
文本文件读写编码是一个麻烦问题 。
如果你只是学习测试,你用记事本打开文件,然后另存为 编码选为 ANSI
具体应该如何操作呢 Jerry~Mouse 发表于 2022-3-15 16:00
具体应该如何操作呢
直接打开你的文件,另存为 Jerry~Mouse 发表于 2022-3-15 15:59
这里utf8是什么意思呢 全英文和数字的文件不需要这个也可以打开 哪些文件打开需要这个呢 小甲鱼在视频里 ...
你可以看一下这个:
https://fishc.com.cn/forum.php?mod=redirect&goto=findpost&ptid=209823&pid=5758004 isdkz 发表于 2022-3-15 16:06
你可以看一下这个:
https://fishc.com.cn/forum.php?mod=redirect&goto=findpost&ptid=209823&pid=5758 ...
这个解答挺清晰的 搞明白了 谢谢!! isdkz 发表于 2022-3-15 16:06
你可以看一下这个:
https://fishc.com.cn/forum.php?mod=redirect&goto=findpost&ptid=209823&pid=5758 ...
但是我还是觉得有一点奇怪 为什么小甲鱼讲课的时候不使用utf-8打开中文字符的文件也可以呢 Jerry~Mouse 发表于 2022-3-15 22:53
但是我还是觉得有一点奇怪 为什么小甲鱼讲课的时候不使用utf-8打开中文字符的文件也可以呢
因为他的文件本来就是以 gbk 编码保存的,
你不加编码方式默认根据你的当前语言环境的编码来 解码,
以什么编码格式来 编码 就要以什么编码格式 解码,或者他也是以 utf-8 保存,
但是他的语言环境默认使用 utf-8 解码,你可以通过以下命令改变默认编码方式(在 cmd 下执行):
setx PYTHONUTF8 1
这样你如果文件的编码是 utf-8 的,也就不用手动指定了,但是你的文件编码换成是 gbk 的就得手动指定了。
isdkz 发表于 2022-3-15 23:00
因为他的文件本来就是以 gbk 编码保存的,
你不加编码方式默认根据你的当前语言环境的编码来 解码,
原来如此 明白了 谢谢解答
页:
[1]