lingedu 发表于 2020-6-15 17:21:23

关于python编码的问题,第30讲课后习题

我代码能正常显示出结果,但是之后会 出现一行错误代码:
Traceback (most recent call last):
File "D:/教程/python教程/python练习/030课后第四题检索.py", line 52, in <module>
    search_file(key,detail)
File "D:/教程/python教程/python练习/030课后第四题检索.py", line 17, in search_file
    key_dict = search_in_file(each_txt,key)
File "D:/教程/python教程/python练习/030课后第四题检索.py", line 35, in search_in_file
    for each_line in f:
File "F:\Program Files\python\lib\codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 31: invalid start byte


我已经把打开文件改成utf-8 了为啥还会报错啊?功能都能正常显示,就是之后会报错,为什吗啊?
附源代码:
#编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,
#则进入文件夹继续搜索)所有含有该关键字的文本文件(.txt后缀),
#要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符)
import os

#查找关键字是否在文件
def search_file(key,detail):
    all_files = os.walk(os.getcwd())    #获得当前路径所有文件路径(三元组)(路径,包含目录,包含文件)
    txt_file = []    #全部的txt文件用列表存储
    for i in all_files:
      for each in i:         #(路径,包含目录,包含文件)i为包含文件
            if os.path.splitext(each) == '.txt':
                each = os.path.join(i,each)#组合成一个路径
                txt_file.append(each)   #完整路径添加到列表
    for each_txt in txt_file:
      #查找指定关键字是否在文件里
      key_dict = search_in_file(each_txt,key)
      if key_dict:
            print('在文件【%s】中找到关键字【%s】' % (each_txt, key))
            if detail =='YES':
                  print_pos(key_dict)

def print_pos(key_dict):
    keys = key_dict.keys()#返回的是可迭代对象
    keys = sorted(keys)
    for each_key in keys:
      print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict)))
      
               
   
def search_in_file(file_name,key):
    f = open(file_name,encoding='UTF-8')
    count = 0       #记录行数
    key_dict = {}
    for each_line in f:
      count += 1
      if key in each_line:
            pos = pos_in_line(each_line,key)#每行的位置
            key_dict = pos
    f.close()
    return key_dict
def pos_in_line(each_line,key):
    pos = []      #储存位置
    begin = each_line.find(key)
    while begin !=-1:
      pos.append(begin+1)         #程序默认从零数起,人默认从一数起啊
      begin = each_line.find(key,begin+1)
    return pos      #返回位置
key = input('请输入关键字:')
detail = input('是否需要打印关键字【%s】在文件中的位置:'%key)
os.chdir(r'C:\Users\Administrator\Desktop\测试文件夹')
search_file(key,detail)

Twilight6 发表于 2020-6-15 17:22:40

本帖最后由 Twilight6 于 2020-6-15 17:24 编辑




因为你可能 txt 文本的编码不统一

有可能 这个 txt 保存的时候是 utf-8另一个是 gbk导致报错了


建议你自己重新建个文件夹 统一下txt文件编码

第一步:

https://xxx.ilovefishc.com/forum/202005/25/072650zqq1fqqmng421bqz.jpg

第二步:

https://xxx.ilovefishc.com/forum/202005/25/072647nvzjv2zemvgxet5g.jpg

昨天也有人出现类似问题:

[已解决]关于python课后30最后一题
https://fishc.com.cn/thread-172137-1-1.html
(出处: 鱼C论坛)


页: [1]
查看完整版本: 关于python编码的问题,第30讲课后习题