鱼C论坛

 找回密码
 立即注册
查看: 1885|回复: 12

文件系统课后题

[复制链接]
发表于 2022-3-2 16:20:06 From FishC Mobile | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
为什么我的代码和小甲鱼课后题的代码都报错啊,但是小甲鱼的代码可以多读取一个文件
KN)SR0G6}0}1}QJG49TF]B7(1).png
X`1MDXXO1_]TRD%[{SGH[O7.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-3-2 16:20:39 From FishC Mobile | 显示全部楼层
用了encoding直接报错,连文件都打不开
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-2 16:25:28 | 显示全部楼层
Tihool 发表于 2022-3-2 16:20
用了encoding直接报错,连文件都打不开

py 文件用 utf8 编码解不出来
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-3-2 16:45:21 From FishC Mobile | 显示全部楼层
python爱好者. 发表于 2022-3-2 16:25
py 文件用 utf8 编码解不出来

问一下如图的代码哪错了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-2 17:30:22 | 显示全部楼层
Tihool 发表于 2022-3-2 16:45
问一下如图的代码哪错了

有时候 gbk 不能解出所有的文件,看看动动手第 4 题 第 17 行代码里的说明 ,可以使用这种方法来处理!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-2 18:33:10 | 显示全部楼层
代码并没有错,这是因为你目录下的文件下不一定统一编码导致的,

你可以看一下我之前的帖子:https://fishc.com.cn/forum.php?m ... 057&pid=5736828
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-2 18:51:36 | 显示全部楼层

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-3-2 19:45:09 | 显示全部楼层
isdkz 发表于 2022-3-2 18:33
代码并没有错,这是因为你目录下的文件下不一定统一编码导致的,

你可以看一下我之前的帖子:https://fi ...

UnicodeDecodeError: 'gb2312' codec can't decode byte 0xf4 in position 126: illegal multibyte sequence
贴里的代码包括我自己改完的代码都是出现这条错误信息
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-3 07:13:31 | 显示全部楼层
Tihool 发表于 2022-3-2 19:45
UnicodeDecodeError: 'gb2312' codec can't decode byte 0xf4 in position 126: illegal multibyte seque ...

贴里的代码的异常信息放上来给我看看
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-3-4 20:52:16 | 显示全部楼层
isdkz 发表于 2022-3-3 07:13
贴里的代码的异常信息放上来给我看看

Traceback (most recent call last):
  File "F:\python作业库\文件\TEST (2).py", line 102, in <module>
    search_files(key, detail)
  File "F:\python作业库\文件\TEST (2).py", line 92, in search_files
    key_dict = search_in_file(each_txt_file, key)
  File "F:\python作业库\文件\TEST (2).py", line 65, in search_in_file
    text = raw.decode(chardet.detect(raw)['encoding'])  # 加上这句
UnicodeDecodeError: 'gb2312' codec can't decode byte 0xf4 in position 126: illegal multibyte sequence
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-4 20:56:43 | 显示全部楼层
本帖最后由 isdkz 于 2022-3-4 20:59 编辑
Tihool 发表于 2022-3-4 20:52
Traceback (most recent call last):
  File "F:\python作业库\文件\TEST (2).py", line 102, in
     ...


你用这个代码试试,cchardet 库检测编码的准确度和速度都比 chardet 库要好
  1. import os
  2. import cchardet                   #   加上这句

  3. def print_pos(key_dict):
  4.     keys = key_dict.keys()
  5.     keys = sorted(keys) # 由于字典是无序的,我们这里对行数进行排序
  6.     for each_key in keys:
  7.         print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))


  8. def pos_in_line(line, key):
  9.     pos = []
  10.     begin = line.find(key)
  11.     while begin != -1:
  12.         pos.append(begin + 1) # 用户的角度是从1开始数
  13.         begin = line.find(key, begin+1) # 从下一个位置继续查找

  14.     return pos


  15. def search_in_file(file_name, key):
  16.     with open(file_name, 'rb') as f:                  #    改这里
  17.         raw = f.read()                                 #    加上这句
  18.     if not raw:                                        #     加上这句
  19.         return                                     # 加上这句
  20.     text = raw.decode(cchardet.detect(raw)['encoding'])       #    加上这句
  21.     lines = text.splitlines()

  22.     count = 0 # 记录行数
  23.     key_dict = dict() # 字典,用户存放key所在具体行数对应具体位置
  24.    
  25.     for each_line in lines:                       #   f改成lines
  26.         count += 1
  27.         if key in each_line:
  28.             pos = pos_in_line(each_line, key) # key在每行对应的位置
  29.             key_dict[count] = pos
  30.    
  31.     # f.close()            删掉这句
  32.     return key_dict


  33. def search_files(key, detail):   
  34.     all_files = os.walk(os.getcwd())
  35.     txt_files = []

  36.     for i in all_files:
  37.         for each_file in i[2]:
  38.             if os.path.splitext(each_file)[1] == '.txt': # 根据后缀判断是否文本文件
  39.                 each_file = os.path.join(i[0], each_file)
  40.                 txt_files.append(each_file)

  41.     for each_txt_file in txt_files:
  42.         key_dict = search_in_file(each_txt_file, key)
  43.         if key_dict:
  44.             print('================================================================')
  45.             print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
  46.             if detail.lower() == 'yes':
  47.                 print_pos(key_dict)


  48. key = input('请将该脚本放于待查找的文件夹内,请输入关键字:')
  49. detail = input('请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):' % key)
  50. search_files(key, detail)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-3-4 21:24:21 | 显示全部楼层
isdkz 发表于 2022-3-4 20:56
你用这个代码试试,cchardet 库检测编码的准确度和速度都比 chardet 库要好

这个可以,谢谢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-3-4 21:26:51 | 显示全部楼层
Tihool 发表于 2022-3-4 21:24
这个可以,谢谢

不客气,如果可以的话给我点动力呗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-30 00:22

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表