关于python编码的问题,第30讲课后习题
我代码能正常显示出结果,但是之后会 出现一行错误代码:Traceback (most recent call last):
File "D:/教程/python教程/python练习/030课后第四题检索.py", line 52, in <module>
search_file(key,detail)
File "D:/教程/python教程/python练习/030课后第四题检索.py", line 17, in search_file
key_dict = search_in_file(each_txt,key)
File "D:/教程/python教程/python练习/030课后第四题检索.py", line 35, in search_in_file
for each_line in f:
File "F:\Program Files\python\lib\codecs.py", line 322, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 31: invalid start byte
我已经把打开文件改成utf-8 了为啥还会报错啊?功能都能正常显示,就是之后会报错,为什吗啊?
附源代码:
#编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,
#则进入文件夹继续搜索)所有含有该关键字的文本文件(.txt后缀),
#要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符)
import os
#查找关键字是否在文件
def search_file(key,detail):
all_files = os.walk(os.getcwd()) #获得当前路径所有文件路径(三元组)(路径,包含目录,包含文件)
txt_file = [] #全部的txt文件用列表存储
for i in all_files:
for each in i: #(路径,包含目录,包含文件)i为包含文件
if os.path.splitext(each) == '.txt':
each = os.path.join(i,each)#组合成一个路径
txt_file.append(each) #完整路径添加到列表
for each_txt in txt_file:
#查找指定关键字是否在文件里
key_dict = search_in_file(each_txt,key)
if key_dict:
print('在文件【%s】中找到关键字【%s】' % (each_txt, key))
if detail =='YES':
print_pos(key_dict)
def print_pos(key_dict):
keys = key_dict.keys()#返回的是可迭代对象
keys = sorted(keys)
for each_key in keys:
print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict)))
def search_in_file(file_name,key):
f = open(file_name,encoding='UTF-8')
count = 0 #记录行数
key_dict = {}
for each_line in f:
count += 1
if key in each_line:
pos = pos_in_line(each_line,key)#每行的位置
key_dict = pos
f.close()
return key_dict
def pos_in_line(each_line,key):
pos = [] #储存位置
begin = each_line.find(key)
while begin !=-1:
pos.append(begin+1) #程序默认从零数起,人默认从一数起啊
begin = each_line.find(key,begin+1)
return pos #返回位置
key = input('请输入关键字:')
detail = input('是否需要打印关键字【%s】在文件中的位置:'%key)
os.chdir(r'C:\Users\Administrator\Desktop\测试文件夹')
search_file(key,detail)
本帖最后由 Twilight6 于 2020-6-15 17:24 编辑
因为你可能 txt 文本的编码不统一
有可能 这个 txt 保存的时候是 utf-8另一个是 gbk导致报错了
建议你自己重新建个文件夹 统一下txt文件编码
第一步:
https://xxx.ilovefishc.com/forum/202005/25/072650zqq1fqqmng421bqz.jpg
第二步:
https://xxx.ilovefishc.com/forum/202005/25/072647nvzjv2zemvgxet5g.jpg
昨天也有人出现类似问题:
[已解决]关于python课后30最后一题
https://fishc.com.cn/thread-172137-1-1.html
(出处: 鱼C论坛)
页:
[1]