黄jz 发表于 2020-7-26 22:32:05

求助

import os
list2=[]
def search(name):
    os.chdir(name)
    list1=os.listdir()
    for i in list1:
      if '.txt'in i:
            name1=os.path.join(os.getcwd(),i)
            list2.append(name1)
      if os.path.isdir(i):
            name=os.path.join(os.getcwd(),i)
            search(name)
def exam(str1):
    count1=0
    count2=0
    list3=[]
    for i in list2:
      f1=open(i,'r',encoding='utf-8')
      if str1 in f1:
         print('在文件【',i,'】中找到关键字【',str1,'】')
         for eachline in f1:
            count1=count1+1
            if str1 in eachline:
                begin=eachline.find(str1)
                while begin != -1:
                  list3.append(begin)
                  begin=eachline.find(str1,begin+1)
            print('关键字出现在第',count1,'第',list3,'个位置。')
str1=input("请将该脚本放于待查找的文件夹内,请输入关键字:")
search('G:\新建文件夹 (4)')
exam(str1)








出现以下问题:
请将该脚本放于待查找的文件夹内,请输入关键字:愿
Traceback (most recent call last):
File "G:\新建文件夹 (4)\29.py", line 31, in <module>
    exam(str1)
File "G:\新建文件夹 (4)\29.py", line 19, in exam
    if str1 in f1:
File "E:\python\lib\codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte
>>>

Twilight6 发表于 2020-7-26 22:35:55

本帖最后由 Twilight6 于 2020-7-26 22:37 编辑




把 open 里面的encoding = 'utf-8' 去掉试试看

如果运行还是报错,那么就说明当前文件夹下不止有一种编码的 txt 文件

建议把这个代码文件拷贝到另一个重新新建的文件夹,然后把 txt 文本按下面操作存放到这个文件夹里放一起

然后将你需要比较的文本重新另存为,按照下面的操作来:

第一步,打开 txt 文件选择另存为:
https://xxx.ilovefishc.com/forum/202005/25/072650zqq1fqqmng421bqz.jpg

第二步设置编码为 utf-8:
https://xxx.ilovefishc.com/forum/202005/25/072647nvzjv2zemvgxet5g.jpg

然后重新运行代码,这样就不会报错了

页: [1]
查看完整版本: 求助