鱼C论坛

 找回密码
 立即注册
查看: 1082|回复: 1

[已解决]关于python编码的问题,第30讲课后习题

[复制链接]
发表于 2020-6-15 17:21:23 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我代码能正常显示出结果,但是之后会 出现一行错误代码:
Traceback (most recent call last):
  File "D:/教程/python教程/python练习/030课后第四题检索.py", line 52, in <module>
    search_file(key,detail)
  File "D:/教程/python教程/python练习/030课后第四题检索.py", line 17, in search_file
    key_dict = search_in_file(each_txt,key)
  File "D:/教程/python教程/python练习/030课后第四题检索.py", line 35, in search_in_file
    for each_line in f:
  File "F:\Program Files\python\lib\codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 31: invalid start byte


我已经把打开文件改成utf-8 了为啥还会报错啊?功能都能正常显示,就是之后会报错,为什吗啊?
附源代码:
  1. #编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,
  2. #则进入文件夹继续搜索)所有含有该关键字的文本文件(.txt后缀),
  3. #要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符)
  4. import os

  5. #查找关键字是否在文件
  6. def search_file(key,detail):
  7.     all_files = os.walk(os.getcwd())    #获得当前路径所有文件路径(三元组)(路径,包含目录,包含文件)
  8.     txt_file = []    #全部的txt文件用列表存储
  9.     for i in all_files:
  10.         for each in i[2]:           #(路径,包含目录,包含文件)i[2]为包含文件
  11.             if os.path.splitext(each)[1] == '.txt':
  12.                 each = os.path.join(i[0],each)  #组合成一个路径
  13.                 txt_file.append(each)   #完整路径添加到列表
  14.     for each_txt in txt_file:
  15.         #查找指定关键字是否在文件里
  16.         key_dict = search_in_file(each_txt,key)
  17.         if key_dict:
  18.             print('在文件【%s】中找到关键字【%s】' % (each_txt, key))
  19.             if detail =='YES':
  20.                   print_pos(key_dict)

  21. def print_pos(key_dict):
  22.     keys = key_dict.keys()  #返回的是可迭代对象
  23.     keys = sorted(keys)
  24.     for each_key in keys:
  25.         print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))
  26.         
  27.                
  28.    
  29. def search_in_file(file_name,key):
  30.     f = open(file_name,encoding='UTF-8')
  31.     count = 0       #记录行数
  32.     key_dict = {}
  33.     for each_line in f:
  34.         count += 1
  35.         if key in each_line:
  36.             pos = pos_in_line(each_line,key)#每行的位置
  37.             key_dict[count] = pos
  38.     f.close()
  39.     return key_dict
  40. def pos_in_line(each_line,key):
  41.     pos = []        #储存位置
  42.     begin = each_line.find(key)
  43.     while begin !=-1:
  44.         pos.append(begin+1)         #程序默认从零数起,人默认从一数起啊
  45.         begin = each_line.find(key,begin+1)
  46.     return pos      #返回位置
  47. key = input('请输入关键字:')
  48. detail = input('是否需要打印关键字【%s】在文件中的位置[YES/NO]:'%key)
  49. os.chdir(r'C:\Users\Administrator\Desktop\测试文件夹')
  50. search_file(key,detail)
复制代码
最佳答案
2020-6-15 17:22:40
本帖最后由 Twilight6 于 2020-6-15 17:24 编辑




因为你可能 txt 文本的编码不统一

有可能 这个 txt 保存的时候是 utf-8  另一个是 gbk  导致报错了


建议你自己重新建个文件夹 统一下txt文件编码

第一步:


                               
登录/注册后可看大图


第二步:


                               
登录/注册后可看大图


昨天也有人出现类似问题:

[已解决]关于python课后30最后一题
https://fishc.com.cn/thread-172137-1-1.html
(出处: 鱼C论坛)


小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-6-15 17:22:40 | 显示全部楼层    本楼为最佳答案   
本帖最后由 Twilight6 于 2020-6-15 17:24 编辑




因为你可能 txt 文本的编码不统一

有可能 这个 txt 保存的时候是 utf-8  另一个是 gbk  导致报错了


建议你自己重新建个文件夹 统一下txt文件编码

第一步:


                               
登录/注册后可看大图


第二步:


                               
登录/注册后可看大图


昨天也有人出现类似问题:

[已解决]关于python课后30最后一题
https://fishc.com.cn/thread-172137-1-1.html
(出处: 鱼C论坛)


小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-21 22:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表