斐波纳税 发表于 2020-4-10 18:50:49

[请教]关于open()函数的一个问题

第一次发帖,有些没注意到的请谅解{:5_92:}

问题描述如下:
使用open()函数对变量f1赋值‘乱打.txt’后,list(f1)能够将'乱打.txt'中内容正常返回。

但给f2赋值'电影资源网站.txt',list(f2)就会报错。
用的都是同样的方法,为什么会这样...

具体代码以及报错等内容如附图所示。

老八秘制 发表于 2020-4-10 19:27:28

解码改成GBK试试

_荟桐_ 发表于 2020-4-10 19:27:49

试试'rb'模式打开???
我也老是遇到编码问题{:10_284:}

斐波纳税 发表于 2020-4-10 20:42:51

老八秘制 发表于 2020-4-10 19:27
解码改成GBK试试

什么意思。是这个编码声明吗# -*- coding=utf-8 -*-

txxcat 发表于 2020-4-10 20:43:42

参考一下这个帖子:避免打开文本文件出现编码错误的一个小技巧

老八秘制 发表于 2020-4-10 20:57:33

斐波纳税 发表于 2020-4-10 20:42
什么意思。是这个编码声明吗# -*- coding=utf-8 -*-

open("文件名", encoding='GBK')

斐波纳税 发表于 2020-4-10 21:20:10

_荟桐_ 发表于 2020-4-10 19:27
试试'rb'模式打开???
我也老是遇到编码问题

试过了'rb'可以打开,不会报错

斐波纳税 发表于 2020-4-10 21:20:54

老八秘制 发表于 2020-4-10 20:57
open("文件名", encoding='GBK')

list(f2)成功返回了,大佬能否解释其原理?

_荟桐_ 发表于 2020-4-10 22:55:28

斐波纳税 发表于 2020-4-10 21:20
list(f2)成功返回了,大佬能否解释其原理?

'rb'以只读二进制打开文件
可能‘电影资源网.txt’是以二进制的方式储存的
所以不用二进制模式打开就会报错
你可以打开看看是不是乱码
如果是乱码(或者是这样的:b'\xe4\xba\xba\xe7')就是二进制
我也对这个编码问题很懵,所以我也不太确定是不是这样的。。{:10_264:}

斐波纳税 发表于 2020-4-11 00:01:22

本帖最后由 斐波纳税 于 2020-4-11 00:03 编辑

_荟桐_ 发表于 2020-4-10 22:55
'rb'以只读二进制打开文件
可能‘电影资源网.txt’是以二进制的方式储存的
所以不用二进制模式打开 ...

如果是rb,返回结果如图所示。

另外,这个文件是我随便找来(当然,不是我自己打的)。如果用别打文本浏览器打开的话是可以正常显示的...

我用了前面那位大佬说的open()后面加上encoding = 'GBK'可以正常返回的。可能真的是因为编码的缘故...?

_荟桐_ 发表于 2020-4-11 07:18:36

本帖最后由 _荟桐_ 于 2020-4-11 07:19 编辑

斐波纳税 发表于 2020-4-11 00:01
如果是rb,返回结果如图所示。

另外,这个文件是我随便找来(当然,不是我自己打的)。如果用别打文 ...

b"\jdkdn\dhdu"这样的是字节类型(bytes),也算一种二进制,加了gbg就是把他转换gbk的编码读取。
肯定是编码的缘故

老八秘制 发表于 2020-4-11 08:27:42

斐波纳税 发表于 2020-4-10 21:20
list(f2)成功返回了,大佬能否解释其原理?

txt文档的默认解码方式是GBK
页: [1]
查看完整版本: [请教]关于open()函数的一个问题