鱼C论坛

 找回密码
 立即注册
查看: 2903|回复: 3

[技术交流] “gbk”编解码器无法解码的问题,希望能有前辈解惑!!

[复制链接]
发表于 2020-2-9 17:09:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
首先已经百度了,然后还是会出现这个问题,以前可能写的脚本太简单,这次多一点,出现了错误。                     希望能有前辈解惑,万分感谢!!!!
代码如下:
  1. import os

  2. key=input('请将该脚本放入需要查找的文件夹内,请输入关键字:')
  3. date=input('请问是否打印关键字【%s】在文件中的位置【yes/no】:' % key)

  4. def searchfile(key,date):
  5.     all=os.walk(os.getcwd()) #当前工作环境,所有路径+目录+文件
  6.     txtf=[]

  7.     for ii in all:
  8.         for cc in ii[2]:     #ii[2]=所有文件名
  9.             if os.path.splitext(cc)[1] == '.txt':    #文件名为txt
  10.                 bb=os.path.join(ii[0],cc)     #路径+文件名为txt
  11.                 txtf.append(cc)
  12. #txtf有所有文件名为txt的路径


  13.     for dd in txtf:
  14.         dict1=searchin(dd,key)   #调用
  15.         if dict1:
  16.             print('=============================')
  17.             print('在文件【%s】中找到关键字【%s】' % (dd,key))
  18.             if date in 'yes':
  19.                 p(dict1)     #调用



  20. def searchin(name,key):
  21.     f=open(name)  #打开所有的txt文件
  22.     c=0      #记录行数
  23.     dict1=dict()     #字典,存放关键字所在具体位置对应具体位置

  24.     for bb in f:
  25.         c +=1
  26.         if key in bb:
  27.             pos=inline(bb,key)     #调用,关键字在每行对应的位置(所有关键字索引)
  28.             dict1[c]=pos

  29.     f.close()
  30.     return dict1



  31. def inline(line,key):
  32.     pos=[]
  33.     begin=line.find(key)    #返回关键字的索引(第一次出现)
  34.     while begin != -1:  #全部索引都过一遍之后,会返回 -1
  35.         pos.append(begin+1)   #用户是从1开始,pos里加入一个索引
  36.         begin =line.find(key,begin+1)     #从下一个位置继续查找,begin+1

  37.     return pos


  38. def p(dict1):
  39.     keys=dict1.keys()    #显示出dict1里的key(前面的)
  40.     keys=sorted(keys)    #从小到大进行key排序(字典是无序的)
  41.     for aa in keys:
  42.         print('关键字出现在第%s行,第%s个位置。'% (aa,str(dict1[aa])))



  43. searchfile(key,date)
复制代码



运行之后能运行,但是有报错!如下:


请将该脚本放入需要查找的文件夹内,请输入关键字:g
请问是否打印关键字【g】在文件中的位置【yes/no】:e
=============================
在文件【b1.txt】中找到关键字【g】
关键字出现在第10行,第[2, 4]个位置。
=============================
在文件【b2.txt】中找到关键字【g】
关键字出现在第9行,第[1, 3, 5, 7]个位置。


Traceback (most recent call last):
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 62, in <module>
    searchfile(key,date)
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 19, in searchfile
    dict1=searchin(dd,key)   #调用
  File "C:\Users\yemu\Desktop\40指定文件夹查找关键字.py", line 33, in searchin
    for bb in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xaf in position 45: illegal multibyte sequence
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-2-9 17:22:16 | 显示全部楼层
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文件-另存为,编码选择 utf-8 。
然后这样打开文件:
f = open('文件路径', encoding='utf-8')
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-9 17:45:36 From FishC Mobile | 显示全部楼层
112024 发表于 2020-2-9 17:22
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文 ...

最大的可能就是你的路径里啥文件编码格式都有
所以open文件之前,需要先判断该文件的编码类型,如何获取文件的编码格式呢,请百度
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2020-10-3 11:21:16 | 显示全部楼层
112024 发表于 2020-2-9 17:22
有人随便回复一条吗?已经解决,论坛看见别人的问题跟我一样。
编码问题,你先用记事本打开文件,然后 文 ...

刚遇到同样的问题,感谢分享~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-7-15 13:52

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表