python读取.txt文件的中文编码问题

龟龟仙人 · 发表于 2019-2-3 12:23:44

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

学习小甲鱼的课后题，查找文件夹内所有包含关键字的.txt文件，并且输出相应位置
问题代码：
def search_in_file(file_name,key):
f = open(file_name)
count = 0
key_dict = dict()
for each_line in f:
      count += 1
      if key in each_line:
         pos = pso_in_line(each_line,key)
         key_dict[count] = pos

f.close()
return key_dict

问题：
for each_line in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x99 in position 6840: illegal multibyte sequence

在百度上找的的修改：
f = open(file_name,encoding='UTF-8')
错误又变成：
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa6 in position 0: invalid start byte

这‘gbk’ 和 ‘uff-8’算是分不清了。
求大佬给个解决方案。

ABC23 · 发表于 2019-2-3 12:52:55

用什么编辑器，不是记事本吧，它会自动在前面加上一段xxx的东西。

账号		自动登录	找回密码
密码			立即注册

python读取.txt文件的中文编码问题

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块