[已解决]文件读取问题

小猎人 · 发表于 2020-2-25 17:15:00

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

>>> f = open(r'C:\Users\DELL\Desktop\python\homework\something.txt')
>>> f.read()
'从明天起，做一个幸福的人\n喂马、劈柴，周游世界\n从明天起，关心粮食和蔬菜\n我有一所房子，面朝大海，春暖花开\n\n从明天起，和每一个亲人通信\n告诉他们我的幸福\n那幸福的闪电告诉我的\n我将告诉每一个人\n\n给每一条河每一座山取一个温暖的名字\n陌生人，我也为你祝福\n愿你有一个灿烂的前程\n愿你有情人终成眷属\n愿你在尘世获得幸福\n我只愿面朝大海，春暖花开\n\n\n'
>>> f.close()
>>> f = open(r'C:\Users\DELL\Desktop\python\homework\something - 副本.txt')
>>> f.read()
'从明天起，做一个幸福的人\n喂马、劈柴，周游世界\n从明天起，关心粮食和蔬菜\n我有一所房子，面朝大海，春暖花开\n\n从明天起，和每一个亲人通信\n告诉他们我的幸福\n那幸福的闪电告诉我的\n我将告诉每一个人\n\n给每一条河每一座山取一个温暖的名字\n陌生人，我也为你祝福\n愿你有一个灿烂的前程\n愿你有情人终成眷属\n愿你在尘世获得幸福\n我只愿面朝大海，春暖花开\n\n\n'
>>> f = open(r'C:\Users\DELL\Desktop\python\homework\something - copy.txt')
>>> f.read()
Traceback (most recent call last):
File "<pyshell#11>", line 1, in <module>
f.read()
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 20: illegal multibyte sequence

复制代码

something是最初用python写入的文本
something - 副本是直接复制了文本文件得到的
something - copy是复制了文本内容，再新建了一个文本后，将内容粘贴进去的，当f.read()时却显示没法解码
而且对于其它我自己键入的文本，也没法进行f.read()操作

希望能有大神解答一下，小弟在此先谢过了

最佳答案

月排行榜 / 总排行榜

qiuyouzhi

2020-2-25 20:22:54

小猎人发表于 2020-2-25 20:12
谢谢你的答案，可以成功打开了。不过我还有一些别的疑问，遇到解码错误问题时，应该怎么查找编码类型呢？ ...

import chardet
# 获取文件编码类型
def get_encoding(file):
# 二进制方式读取，获取字节数据，检测类型
with open(file, 'rb') as f:
return chardet.detect(f.read())['encoding']
file_name = 'my.ini'
encoding = get_encoding(file_name)
print(encoding)

复制代码

跳转到最佳答案楼层

qiuyouzhi · 发表于 2020-2-25 17:26:37

f = open(r'C:\Users\DELL\Desktop\python\homework\something - copy.txt', encoding='utf-8')

复制代码

试试

小猎人 · 发表于 2020-2-25 20:12:05

qiuyouzhi 发表于 2020-2-25 17:26
试试

谢谢你的答案，可以成功打开了。不过我还有一些别的疑问，遇到解码错误问题时，应该怎么查找编码类型呢？在python课后作业里，老师要求寻找所有文件的某一字符串，如果不同文件编码方式不同的话，那执行相同操作时，Python还是会报解码错误，这种情形感觉还是不知道怎么办，想请教一下，谢谢你！

qiuyouzhi · 发表于 2020-2-25 20:22:54

这个最佳答案由 qiuyouzhi 给出，感谢 qiuyouzhi 的回答。

单击隐藏图章

小猎人发表于 2020-2-25 20:12
谢谢你的答案，可以成功打开了。不过我还有一些别的疑问，遇到解码错误问题时，应该怎么查找编码类型呢？ ...

import chardet
# 获取文件编码类型
def get_encoding(file):
# 二进制方式读取，获取字节数据，检测类型
with open(file, 'rb') as f:
return chardet.detect(f.read())['encoding']
file_name = 'my.ini'
encoding = get_encoding(file_name)
print(encoding)

复制代码

luoyunjian · 发表于 2020-2-26 00:03:16

qiuyouzhi 发表于 2020-2-25 20:22

厉害啊，学习了

qiuyouzhi · 发表于 2020-2-26 08:38:30

luoyunjian 发表于 2020-2-26 00:03
厉害啊，学习了

如果有帮助，请设最佳答案

小猎人 · 发表于 2020-2-26 11:47:05

感谢大神啦

账号		自动登录	找回密码
密码			立即注册

[已解决]文件读取问题

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块