鱼C论坛

 找回密码
 立即注册
查看: 1696|回复: 8

[已解决]Python os,习题的4个小问题。

[复制链接]
发表于 2021-1-27 09:23:58 | 显示全部楼层 |阅读模式
10鱼币
本帖最后由 Peteryo01223 于 2021-1-27 09:26 编辑

原题:
编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,则进入文件夹继续搜索)所有含有该关键字的文本文件(.txt后缀),要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符),程序实现如图(从略):

看答案后,照抄了一遍,加了encoding = 'UTF-8',及我自己的注释:可惜,运行报错。
  1. import os

  2. def print_pos(key_dict):
  3.     keys = key_dict.keys()
  4.     # 这里.keys()函数,以列表返回字典里所有的键
  5.     keys = sorted(keys)
  6.     # 由于字典是无序的,这里用sorted()对行数进行排序
  7.     for each_key in keys:
  8.         print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict.keys[each_key])))
  9.         # 最后的 str() 函数将指定的值转换为字符串。问题3:这里 each_key 怎么是行数呢?! each_key,它是个键或关键字吧?

  10. def pos_in_line(line, key):
  11. # 定义一个行内str的位置函数,为了在 line 中查找 key的位置
  12.     pos = [] # 先定义一个叫做位置 pos 的空列表
  13.     begin = line.find(key) # 用 find()方法定位,也就是找到字符串line中key的索引值
  14.     while begin != -1:
  15.     # 只要不是最后一位,就继续找。首次见到 while 的条件是 -1 的写法
  16.         pos.append(begin + 1)
  17.         # Python 的索引值和普通人不同,人是从1开始数,而索引是从0开始
  18.         begin = line.find(key, begin + 1)
  19.         # 继续迭代,从下一个位置继续找

  20.     return pos
  21.     # 保存好 pos 的值

  22. def search_in_file(file_name, key):
  23. # 定义一个文件内行位置的函数,为了在 file_name文件中查找出现了 key 的行的位置
  24.     f = open(file_name, encoding = 'UTF-8')
  25.     # 打开这个文件。我在此特意添加了 encoding = 'UTF-8'。
  26.     count = 0
  27.     # 给一个叫做 count 的变量赋值为零,以便下面对行数进行记录
  28.     key_dict = dict()
  29.     # 定义一个空的字典,用户存放 key 所在行数对应具体的位置

  30.     for each_line in f:
  31.     # 这个文件 f 中,的每一行
  32.         count += 1
  33.         # count 的变量加上1,即每统计一次,这个值都要加 1
  34.         if key in each_line:
  35.         # 如果 key 出现在了 each_line里面的话
  36.             pos = pos_in_line(each_line, key)
  37.             # 本函数负责算出 key 在每一行对应的位置
  38.             key_dict[count] = pos
  39.             # 把 pos 的值,当作value,给字典 key_dict 中对应 count的 key

  40.     f.close()
  41.     # 关闭 f, 确保数据不丢失
  42.     return key_dict
  43.     # 返回这个叫做 key_dict 的字典的值

  44. def search_files(key, detail):
  45. # 定义一个位置函数,为了保证如果当前文件夹内包含文件夹,则进入文件夹继续搜索
  46.     all_files = os.walk(os.getcwd())
  47.     # 用 os.getcwd(), 返回当前工作的这个目录
  48.     # 用 os.walk()方法, 遍历目录,统计出在目录树中全部的文件名,向上或者向下都包括了

  49.     txt_files = []
  50.     # 设置一个空列表,用于下面存储全部 txt s属性的文档

  51.     for i in all_files:
  52.     # 对于每一个目录树中的文件名
  53.         for each_file in i[2]:
  54.         # 对于第三个文件中的中的每个文件?问题4:这句话,想说什么?str i 当中,索引值为2的位置,的每一个 each? 不懂。
  55.             if os.path.splitext(each_file)[1] == '.txt':
  56.             # 根据后缀判断,如果是文本文件
  57.                 txt_files.append(each_file)
  58.                 # 就把这个文本文件放入 txt_files 列表

  59.     for each_txt_file in txt_files:
  60.     # 对于每一个在 txt_files 列表中出现的文件名
  61.         key_dict = search_in_file(each_txt_file, key)
  62.         # 把这个文件名,和对应的那个程序使用者在搜寻的 key,放入 key_dict 字典中
  63.         if key_dict:
  64.         # 如果key_dict 字典为真,即:发现了关键字了
  65.             print('========================================================')
  66.             print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
  67.             if detail in ['YES','Yes','yes']:  # 问题5:detail 是个变量,英语意思是细节,小甲鱼这个detail变量在定义什么,没看懂。
  68.                 print_pos(key_dict)
  69.                 # 运行此‘位置’函数

  70. key = input('请将该脚本放于待查找的文件夹内,请输入关键字:')
  71. detail = input('请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):' % key)
  72. search_files(key, detail) # 运行此函数
复制代码


运行后的报错:
  1. =========================== RESTART: F:/20210127a.py ===========================
  2. 请将该脚本放于待查找的文件夹内,请输入关键字:下
  3. 请问是否需要打印关键字【下】在文件中的具体位置(YES/NO):yes
  4. ========================================================
  5. 在文件【a.txt】中找到关键字【下】
  6. Traceback (most recent call last):
  7.   File "F:/20210127a.py", line 83, in <module>
  8.     search_files(key, detail) # 运行此函数
  9.   File "F:/20210127a.py", line 78, in search_files
  10.     print_pos(key_dict)
  11.   File "F:/20210127a.py", line 9, in print_pos
  12.     print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict.keys[each_key])))
  13. TypeError: 'builtin_function_or_method' object is not subscriptable
  14. >>>
复制代码


问题:
1. 报错该怎么改?
2. 第9行,print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict.keys[each_key]))),这里 each_key 怎么会是第几行的行数呢? 我理解,each_key,是一个键,一个关键字吧?
3. 第62行,for each_file in i[2]:,这是什么意思?str i当中,索引值为2的位置,的每一个 each?
4. 第77行,detail 是个变量,英语是 ‘细节’ 的意思,小甲鱼拿这个detail变量在定义什么。是随便命名的么?
最佳答案
2021-1-27 09:23:59
本帖最后由 逃兵 于 2021-1-27 09:49 编辑

1.报错
你抄错了
第9行应该为
  1. print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))
复制代码

第65行少抄一行
  1. each_file = os.path.join(i[0], each_file)
复制代码


原答案:
  1. import os

  2. def print_pos(key_dict):
  3.     keys = key_dict.keys()
  4.     keys = sorted(keys) # 由于字典是无序的,我们这里对行数进行排序
  5.     for each_key in keys:
  6.         print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))


  7. def pos_in_line(line, key):
  8.     pos = []
  9.     begin = line.find(key)
  10.     while begin != -1:
  11.         pos.append(begin + 1) # 用户的角度是从1开始数
  12.         begin = line.find(key, begin+1) # 从下一个位置继续查找

  13.     return pos


  14. def search_in_file(file_name, key):
  15.     f = open(file_name)
  16.     count = 0 # 记录行数
  17.     key_dict = dict() # 字典,用户存放key所在具体行数对应具体位置
  18.    
  19.     for each_line in f:
  20.         count += 1
  21.         if key in each_line:
  22.             pos = pos_in_line(each_line, key) # key在每行对应的位置
  23.             key_dict[count] = pos
  24.    
  25.     f.close()
  26.     return key_dict


  27. def search_files(key, detail):   
  28.     all_files = os.walk(os.getcwd())
  29.     txt_files = []

  30.     for i in all_files:
  31.         for each_file in i[2]:
  32.             if os.path.splitext(each_file)[1] == '.txt': # 根据后缀判断是否文本文件
  33.                 each_file = os.path.join(i[0], each_file)
  34.                 txt_files.append(each_file)

  35.     for each_txt_file in txt_files:
  36.         key_dict = search_in_file(each_txt_file, key)
  37.         if key_dict:
  38.             print('================================================================')
  39.             print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
  40.             if detail in ['YES', 'Yes', 'yes']:
  41.                 print_pos(key_dict)


  42. key = input('请将该脚本放于待查找的文件夹内,请输入关键字:')
  43. detail = input('请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):' % key)
  44. search_files(key, detail)
复制代码

最佳答案

查看完整内容

1.报错 你抄错了 第9行应该为 第65行少抄一行 原答案:
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-1-27 09:23:59 | 显示全部楼层    本楼为最佳答案   
本帖最后由 逃兵 于 2021-1-27 09:49 编辑

1.报错
你抄错了
第9行应该为
  1. print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))
复制代码

第65行少抄一行
  1. each_file = os.path.join(i[0], each_file)
复制代码


原答案:
  1. import os

  2. def print_pos(key_dict):
  3.     keys = key_dict.keys()
  4.     keys = sorted(keys) # 由于字典是无序的,我们这里对行数进行排序
  5.     for each_key in keys:
  6.         print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))


  7. def pos_in_line(line, key):
  8.     pos = []
  9.     begin = line.find(key)
  10.     while begin != -1:
  11.         pos.append(begin + 1) # 用户的角度是从1开始数
  12.         begin = line.find(key, begin+1) # 从下一个位置继续查找

  13.     return pos


  14. def search_in_file(file_name, key):
  15.     f = open(file_name)
  16.     count = 0 # 记录行数
  17.     key_dict = dict() # 字典,用户存放key所在具体行数对应具体位置
  18.    
  19.     for each_line in f:
  20.         count += 1
  21.         if key in each_line:
  22.             pos = pos_in_line(each_line, key) # key在每行对应的位置
  23.             key_dict[count] = pos
  24.    
  25.     f.close()
  26.     return key_dict


  27. def search_files(key, detail):   
  28.     all_files = os.walk(os.getcwd())
  29.     txt_files = []

  30.     for i in all_files:
  31.         for each_file in i[2]:
  32.             if os.path.splitext(each_file)[1] == '.txt': # 根据后缀判断是否文本文件
  33.                 each_file = os.path.join(i[0], each_file)
  34.                 txt_files.append(each_file)

  35.     for each_txt_file in txt_files:
  36.         key_dict = search_in_file(each_txt_file, key)
  37.         if key_dict:
  38.             print('================================================================')
  39.             print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
  40.             if detail in ['YES', 'Yes', 'yes']:
  41.                 print_pos(key_dict)


  42. key = input('请将该脚本放于待查找的文件夹内,请输入关键字:')
  43. detail = input('请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):' % key)
  44. search_files(key, detail)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-1-27 09:54:54 | 显示全部楼层
1.暂时还没完全看懂,还没解决,因为我把代码复制到本地尝试复现你的环境然后debug但是遇到了不同得报错哈哈哈。。。
2.这里注意,字典是无序的,但是根据代码04、06行,这里的keys是按顺序排列后的字典内关键字!所以这里的行数对应的是排序后的顺序
3.代码55行的os.walk()返回的每个元素都是一个三元组(root,dirs,files),故i[2]对应的是每个元素文件的文件名
4.联合代码第77、82行可以知道,这里detail是一个标志位,是在判断用户需不需要打印关键字在文件中的具体位置,如果你输入的是YES/Yes/yes就打印
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-1-27 10:02:57 | 显示全部楼层
本帖最后由 Peteryo01223 于 2021-1-27 10:05 编辑
逃兵 发表于 2021-1-27 09:48
1.报错
你抄错了
第9行应该为


好的,缺行问题,及抄错问题,我已经更正,谢谢。

不过,我用标准答案,run 后结果,前半部分正常,后半部分,还是报错。如下:
  1. =========================== RESTART: F:/20210127b.py ===========================
  2. 请将该脚本放于待查找的文件夹内,请输入关键字:下
  3. 请问是否需要打印关键字【下】在文件中的具体位置(YES/NO):yes
  4. ================================================================
  5. 在文件【F:\a.txt】中找到关键字【下】
  6. 关键字出现在第 14 行,第 [4] 个位置。
  7. 关键字出现在第 24 行,第 [12] 个位置。
  8. ================================================================
  9. 在文件【F:\b.txt】中找到关键字【下】
  10. 关键字出现在第 14 行,第 [4] 个位置。
  11. 关键字出现在第 24 行,第 [12] 个位置。
  12. Traceback (most recent call last):
  13.   File "F:/20210127b.py", line 56, in <module>
  14.     search_files(key, detail)
  15.   File "F:/20210127b.py", line 46, in search_files
  16.     key_dict = search_in_file(each_txt_file, key)
  17.   File "F:/20210127b.py", line 25, in search_in_file
  18.     for each_line in f:
  19.   File "C:\Users\user\AppData\Local\Programs\Python\Python38\lib\codecs.py", line 322, in decode
  20.     (result, consumed) = self._buffer_decode(data, self.errors, final)
  21. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xdf in position 0: invalid continuation byte
  22. >>>
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-1-27 10:07:04 | 显示全部楼层
Peteryo01223 发表于 2021-1-27 10:02
好的,缺行问题,及抄错问题,我已经更正,谢谢。

不过,我用标准答案,run 后结果,前半部分正常, ...

UnicodeDecodeError:“ utf-8”编解码器无法解码位置0的字节0xdf:无效的连续字节

你把encoding='utf-8'去掉试试看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-1-27 10:18:47 | 显示全部楼层
洛阳城 发表于 2021-1-27 09:54
1.暂时还没完全看懂,还没解决,因为我把代码复制到本地尝试复现你的环境然后debug但是遇到了不同得报错哈 ...

很有帮助的提示,谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-1-27 10:19:56 | 显示全部楼层
逃兵 发表于 2021-1-27 10:07
UnicodeDecodeError:“ utf-8”编解码器无法解码位置0的字节0xdf:无效的连续字节

你把encoding='utf ...

貌似不行的,我这个版本是 python38,每次查看中文 txt 文件,都不得不加上这个 encoding='utf-8‘,要不然 直接 copy 小甲鱼的标准答案,都会报错的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-1-27 10:35:00 | 显示全部楼层
Peteryo01223 发表于 2021-1-27 10:19
貌似不行的,我这个版本是 python38,每次查看中文 txt 文件,都不得不加上这个 encoding='utf-8‘,要不 ...

encoding='gbk'试一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-1-27 10:42:52 | 显示全部楼层
逃兵 发表于 2021-1-27 10:35
encoding='gbk'试一下

试了试,报错了。
  1. 请将该脚本放于待查找的文件夹内,请输入关键字:下
  2. 请问是否需要打印关键字【下】在文件中的具体位置(YES/NO):yes
  3. Traceback (most recent call last):
  4.   File "F:/20210127a.py", line 85, in <module>
  5.     search_files(key, detail) # 运行此函数
  6.   File "F:/20210127a.py", line 73, in search_files
  7.     key_dict = search_in_file(each_txt_file, key)
  8.   File "F:/20210127a.py", line 35, in search_in_file
  9.     for each_line in f:
  10. UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 2: illegal multibyte sequence
  11. >>>
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-12 09:25

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表