“gbk”编解码器无法解码的问题，希望能有前辈解惑！！

112024 · 发表于 2020-2-9 17:09:43

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

首先已经百度了，然后还是会出现这个问题，以前可能写的脚本太简单，这次多一点，出现了错误。希望能有前辈解惑，万分感谢！！！！
代码如下：

import os
key=input('请将该脚本放入需要查找的文件夹内，请输入关键字：')
date=input('请问是否打印关键字【%s】在文件中的位置【yes/no】：' % key)
def searchfile(key,date):
all=os.walk(os.getcwd()) #当前工作环境，所有路径+目录+文件
txtf=[]
for ii in all:
for cc in ii[2]: #ii[2]=所有文件名
if os.path.splitext(cc)[1] == '.txt': #文件名为txt
bb=os.path.join(ii[0],cc) #路径+文件名为txt
txtf.append(cc)
#txtf有所有文件名为txt的路径
for dd in txtf:
dict1=searchin(dd,key) #调用
if dict1:
print('=============================')
print('在文件【%s】中找到关键字【%s】' % (dd,key))
if date in 'yes':
p(dict1) #调用
def searchin(name,key):
f=open(name) #打开所有的txt文件
c=0 #记录行数
dict1=dict() #字典，存放关键字所在具体位置对应具体位置
for bb in f:
c +=1
if key in bb:
pos=inline(bb,key) #调用，关键字在每行对应的位置（所有关键字索引）
dict1[c]=pos
f.close()
return dict1
def inline(line,key):
pos=[]
begin=line.find(key) #返回关键字的索引（第一次出现）
while begin != -1: #全部索引都过一遍之后，会返回 -1
pos.append(begin+1) #用户是从1开始，pos里加入一个索引
begin =line.find(key,begin+1) #从下一个位置继续查找，begin+1
return pos
def p(dict1):
keys=dict1.keys() #显示出dict1里的key（前面的）
keys=sorted(keys) #从小到大进行key排序（字典是无序的）
for aa in keys:
print('关键字出现在第%s行，第%s个位置。'% (aa,str(dict1[aa])))
searchfile(key,date)

复制代码

运行之后能运行，但是有报错！如下：

请将该脚本放入需要查找的文件夹内，请输入关键字：g
请问是否打印关键字【g】在文件中的位置【yes/no】：e
=============================
在文件【b1.txt】中找到关键字【g】
关键字出现在第10行，第[2, 4]个位置。
=============================
在文件【b2.txt】中找到关键字【g】
关键字出现在第9行，第[1, 3, 5, 7]个位置。

Traceback (most recent call last):
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 62, in <module>
searchfile(key,date)
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 19, in searchfile
dict1=searchin(dd,key) #调用
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 33, in searchin
for bb in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 45: illegal multibyte sequence

112024 · 发表于 2020-2-9 17:22:16

有人随便回复一条吗？已经解决，论坛看见别人的问题跟我一样。
编码问题，你先用记事本打开文件，然后文件-另存为，编码选择 utf-8 。
然后这样打开文件：
f = open('文件路径', encoding='utf-8')

wp231957 · 发表于 2020-2-9 17:45:36

112024 发表于 2020-2-9 17:22
有人随便回复一条吗？已经解决，论坛看见别人的问题跟我一样。
编码问题，你先用记事本打开文件，然后文 ...

最大的可能就是你的路径里啥文件编码格式都有
所以open文件之前，需要先判断该文件的编码类型，如何获取文件的编码格式呢，请百度

大毛不困 · 发表于 2020-10-3 11:21:16

112024 发表于 2020-2-9 17:22
有人随便回复一条吗？已经解决，论坛看见别人的问题跟我一样。
编码问题，你先用记事本打开文件，然后文 ...

刚遇到同样的问题，感谢分享~

账号		自动登录	找回密码
密码			立即注册

[技术交流] “gbk”编解码器无法解码的问题，希望能有前辈解惑！！

马上注册，结交更多好友，享用更多功能^_^