“gbk”编解码器无法解码的问题,希望能有前辈解惑!!
首先已经百度了,然后还是会出现这个问题,以前可能写的脚本太简单,这次多一点,出现了错误。 希望能有前辈解惑,万分感谢!!!!代码如下:
import os
key=input('请将该脚本放入需要查找的文件夹内,请输入关键字:')
date=input('请问是否打印关键字【%s】在文件中的位置【yes/no】:' % key)
def searchfile(key,date):
all=os.walk(os.getcwd()) #当前工作环境,所有路径+目录+文件
txtf=[]
for ii in all:
for cc in ii: #ii=所有文件名
if os.path.splitext(cc) == '.txt': #文件名为txt
bb=os.path.join(ii,cc) #路径+文件名为txt
txtf.append(cc)
#txtf有所有文件名为txt的路径
for dd in txtf:
dict1=searchin(dd,key) #调用
if dict1:
print('=============================')
print('在文件【%s】中找到关键字【%s】' % (dd,key))
if date in 'yes':
p(dict1) #调用
def searchin(name,key):
f=open(name)#打开所有的txt文件
c=0 #记录行数
dict1=dict() #字典,存放关键字所在具体位置对应具体位置
for bb in f:
c +=1
if key in bb:
pos=inline(bb,key) #调用,关键字在每行对应的位置(所有关键字索引)
dict1=pos
f.close()
return dict1
def inline(line,key):
pos=[]
begin=line.find(key) #返回关键字的索引(第一次出现)
while begin != -1:#全部索引都过一遍之后,会返回 -1
pos.append(begin+1) #用户是从1开始,pos里加入一个索引
begin =line.find(key,begin+1) #从下一个位置继续查找,begin+1
return pos
def p(dict1):
keys=dict1.keys() #显示出dict1里的key(前面的)
keys=sorted(keys) #从小到大进行key排序(字典是无序的)
for aa in keys:
print('关键字出现在第%s行,第%s个位置。'% (aa,str(dict1)))
searchfile(key,date)
运行之后能运行,但是有报错!如下:
请将该脚本放入需要查找的文件夹内,请输入关键字:g
请问是否打印关键字【g】在文件中的位置【yes/no】:e
=============================
在文件【b1.txt】中找到关键字【g】
关键字出现在第10行,第个位置。
=============================
在文件【b2.txt】中找到关键字【g】
关键字出现在第9行,第个位置。
Traceback (most recent call last):
File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 62, in <module>
searchfile(key,date)
File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 19, in searchfile
dict1=searchin(dd,key) #调用
File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 33, in searchin
for bb in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 45: illegal multibyte sequence 有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文件-另存为,编码选择 utf-8 。
然后这样打开文件:
f = open('文件路径', encoding='utf-8') 112024 发表于 2020-2-9 17:22
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文 ...
最大的可能就是你的路径里啥文件编码格式都有
所以open文件之前,需要先判断该文件的编码类型,如何获取文件的编码格式呢,请百度 112024 发表于 2020-2-9 17:22
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文 ...
刚遇到同样的问题,感谢分享~
页:
[1]