[已解决]编解码器无法解码位置2中的字节0xbf：起始字节无效

wujiale · 发表于 2020-12-15 18:06:02

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

这是程序崩溃出现的字：

Traceback (most recent call last):
  File "C:/Users/84702/Desktop/OSSS.py", line 61, in <module>
search_files(key,detail)
  File "C:/Users/84702/Desktop/OSSS.py", line 50, in search_files
key_dict = search_in_file(each_txt_file,key)
  File "C:/Users/84702/Desktop/OSSS.py", line 28, in search_in_file
for each_line in f:
  File "D:\python\lib\codecs.py", line 322, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbf in position 2: invalid start byte

这是原程序，小甲鱼第30讲最后一题：

import os

def print_pos(key_dict):
keys = key_dict.keys()
keys = sorted(keys) #由于字典是无序的，我们这里对行数进行排序
for each_key in keys:
      print("关键字出现在第 %s 行，第 %s 个位置。" % (each_key,str(key_dict[each_key])))

def pos_in_line(line,key):
pos = []
begin = line.find(key)
while begin != -1 :
      pos.append(begin + 1) #用户的角度是从1开始数
      begin = line.find(key,begin+1) # 从下一个位置继续查找

return pos

def search_in_file(file_name,key):
f = open(file_name,encoding="utf-8")
count = 0 #记录行数
key_dict = dict()# 字典，用户存放key所在具体行数对应具体位置

for each_line in f:
      count += 1
      if key in each_line:
         pos = pos_in_line(each_line,key) # key在每行对应的位置
         key_dict[count] = pos

f.close()
return key_dict

def search_files(key,detail):
all_files = os.walk(os.getcwd())
txt_files = []

for i in all_files:
      for each_file in i[2]:
         if os.path.splitext(each_file)[1] == ".txt": # 根据后缀判断是否文本文件
            each_file = os.path.join(i[0],each_file)
            txt_files.append(each_file)

for each_txt_file in txt_files:
      key_dict = search_in_file(each_txt_file,key)
      if key_dict:
         print("=======================================================")
         print("在文件【%s】中找到关键字【%s】"% (each_txt_file,key))
         if detail in ["YES","Yes","yes"]:
            print_pos(key_dict)

key = input("请将该脚本防御待查找的文件夹内，请输入关键字：")
detail = input("请问是否需要打印关键字【%s】在文件中的具体位置（YES/NO）:" % key)
search_files(key,detail)

最佳答案

月排行榜 / 总排行榜

hrp

2020-12-15 18:38:06

不能所有的文件都用utf-8编码去打开呀，毕竟不是所有的文件都是用utf8保存的，你可以了解一下chardet模块，猜测文件编码用的

跳转到最佳答案楼层

hrp · 发表于 2020-12-15 18:38:06

不能所有的文件都用utf-8编码去打开呀，毕竟不是所有的文件都是用utf8保存的，你可以了解一下chardet模块，猜测文件编码用的

账号		自动登录	找回密码
密码			立即注册