鱼C论坛

 找回密码
 立即注册
查看: 2533|回复: 3

[技术交流] “gbk”编解码器无法解码的问题,希望能有前辈解惑!!

[复制链接]
发表于 2020-2-9 17:09:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
首先已经百度了,然后还是会出现这个问题,以前可能写的脚本太简单,这次多一点,出现了错误。                     希望能有前辈解惑,万分感谢!!!!
代码如下:
import os

key=input('请将该脚本放入需要查找的文件夹内,请输入关键字:')
date=input('请问是否打印关键字【%s】在文件中的位置【yes/no】:' % key)

def searchfile(key,date):
    all=os.walk(os.getcwd()) #当前工作环境,所有路径+目录+文件
    txtf=[]

    for ii in all:
        for cc in ii[2]:     #ii[2]=所有文件名
            if os.path.splitext(cc)[1] == '.txt':    #文件名为txt
                bb=os.path.join(ii[0],cc)     #路径+文件名为txt
                txtf.append(cc)
#txtf有所有文件名为txt的路径


    for dd in txtf:
        dict1=searchin(dd,key)   #调用
        if dict1:
            print('=============================')
            print('在文件【%s】中找到关键字【%s】' % (dd,key))
            if date in 'yes':
                p(dict1)     #调用



def searchin(name,key):
    f=open(name)  #打开所有的txt文件
    c=0      #记录行数
    dict1=dict()     #字典,存放关键字所在具体位置对应具体位置
 
    for bb in f:
        c +=1
        if key in bb:
            pos=inline(bb,key)     #调用,关键字在每行对应的位置(所有关键字索引)
            dict1[c]=pos

    f.close()
    return dict1



def inline(line,key):
    pos=[]
    begin=line.find(key)    #返回关键字的索引(第一次出现)
    while begin != -1:  #全部索引都过一遍之后,会返回 -1
        pos.append(begin+1)   #用户是从1开始,pos里加入一个索引
        begin =line.find(key,begin+1)     #从下一个位置继续查找,begin+1

    return pos


def p(dict1):
    keys=dict1.keys()    #显示出dict1里的key(前面的)
    keys=sorted(keys)    #从小到大进行key排序(字典是无序的)
    for aa in keys:
        print('关键字出现在第%s行,第%s个位置。'% (aa,str(dict1[aa])))



searchfile(key,date)


运行之后能运行,但是有报错!如下:


请将该脚本放入需要查找的文件夹内,请输入关键字:g
请问是否打印关键字【g】在文件中的位置【yes/no】:e
=============================
在文件【b1.txt】中找到关键字【g】
关键字出现在第10行,第[2, 4]个位置。
=============================
在文件【b2.txt】中找到关键字【g】
关键字出现在第9行,第[1, 3, 5, 7]个位置。


Traceback (most recent call last):
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 62, in <module>
    searchfile(key,date)
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 19, in searchfile
    dict1=searchin(dd,key)   #调用
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 33, in searchin
    for bb in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 45: illegal multibyte sequence
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-2-9 17:22:16 | 显示全部楼层
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文件-另存为,编码选择 utf-8 。
然后这样打开文件:
f = open('文件路径', encoding='utf-8')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-9 17:45:36 From FishC Mobile | 显示全部楼层
112024 发表于 2020-2-9 17:22
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文 ...

最大的可能就是你的路径里啥文件编码格式都有
所以open文件之前,需要先判断该文件的编码类型,如何获取文件的编码格式呢,请百度
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2020-10-3 11:21:16 | 显示全部楼层
112024 发表于 2020-2-9 17:22
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文 ...

刚遇到同样的问题,感谢分享~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-18 12:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表