鱼C论坛

 找回密码
 立即注册
查看: 1113|回复: 0

[学习笔记] 论.技术.Python.(旧)零学Python第30讲:文件系统,一个高大上的东西

[复制链接]
发表于 2021-12-12 15:50:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 小蜂队 于 2021-12-14 20:15 编辑

0. 编写一个程序,统计当前目录下每个文件类型的文件数,程序实现如图:(注释来源于昨非)
194733ms9swmp1xorsap0z.png
  1. import os

  2. all_files = os.listdir(os.curdir)    #使用os.curdir表示当前目录更标准
  3. type_dict = dict()    #空字典

  4. for each_file in all_files:    #遍历文件的列表
  5.     if os.path.isdir(each_file):  #是文件夹时:
  6.         type_dict.setdefault('文件夹', 0)     #当这个键值对不存在时,以“文件夹”为键,插入字典中,设初始个数为0,之后,不再执行这一句(setdefault的特点)
  7.         type_dict['文件夹'] += 1     #个数自加一
  8.     else:     #当为其他文件形式时:
  9.         ext = os.path.splitext(each_file)[1]  
  10.         #splitext分离文件名与扩展名,返回(f_name, f_extension)元组,这里截取[1]第二个元素,也就是扩展名赋值给ext
  11.         type_dict.setdefault(ext, 0)  #同理,当这个扩展名的文件尚未记录时,以扩展名为键,插入字典中,并设初值为0,之后遇到,计数加一
  12.         type_dict[ext] += 1

  13. for each_type in type_dict.keys():  #遍历每个键值对,打印结果
  14.     print('该文件夹下共有类型为【%s】的文件 %d 个' % (each_type, type_dict[each_type]))

复制代码

1. 编写一个程序,计算当前文件夹下所有文件的大小,程序实现如图:
194801phv0hkau1l0kqzuk.png
  1. import os     #导入 os 模块

  2. all_files = os.listdir(os.curdir) # 使用os.curdir表示当前目录更标准
  3. file_dict = dict()    #创建一个空字典,空字典的名称为 file_dict

  4. for each_file in all_files:
  5.     if os.path.isfile(each_file):   #是文件类型时
  6.         file_size = os.path.getsize(each_file)    #获取文件大小,getsize 返回指定文件的尺寸,单位是字节
  7.         file_dict[each_file] = file_size    #file_size 作为 each_file 的值

  8. for each in file_dict.items():     #items() 用于返回字典中所有的键值对
  9.     print('%s【%dBytes】' % (each[0], each[1]))    #each[0] 表示的是字典中的键;each[1] 表示的是字典中的值
复制代码

2.编写一个程序,用户输入文件名以及开始搜索的路径,搜索该文件是否存在。如遇到文件夹,则进入文件夹继续搜索,程序实现如图:
1948265cvs2uu1cs1lke0l.png
  1. import os

  2. def search_file(start_dir, target) :
  3.     os.chdir(start_dir)
  4.    
  5.     for each_file in os.listdir(os.curdir) :
  6.         if each_file == target :
  7.             print(os.getcwd() + os.sep + each_file) # 使用os.sep是程序更标准
  8.         if os.path.isdir(each_file) :
  9.             search_file(each_file, target) # 递归调用
  10.             os.chdir(os.pardir) # 递归调用后切记返回上一层目录

  11. start_dir = input('请输入待查找的初始目录:')
  12. target = input('请输入需要查找的目标文件:')
  13. search_file(start_dir, target)
复制代码

3.编写一个程序,用户输入开始搜索的路径,查找该路径下(包含子文件夹内)所有的视频格式文件(要求查找mp4 rmvb, avi的格式即可),并把创建一个文件(vedioList.txt)存放所有找到的文件的路径,程序实现如图:
002143uezeughy7zs5e14e.png
  1. import os          #导入 os 模块

  2. def search_file(start_dir, target) :
  3.     os.chdir(start_dir)       #改变工作目录为 start_dir
  4.    
  5.     for each_file in os.listdir(os.curdir) :    #从当前的工作目录中导出所有文件
  6.         ext = os.path.splitext(each_file)[1]    #os.path.splitext() 分离文件名与扩展名,返回(f_path,f_extension)元组;并把扩展名赋值给 ext
  7.         if ext in target :      #当扩展名在目标文件中时
  8.             vedio_list.append(os.getcwd() + os.sep + each_file + os.linesep) # 使用os.sep是程序更标准,os.linesep 表示当前平台使用的终止符
  9.         if os.path.isdir(each_file) :      #是文件夹时
  10.             search_file(each_file, target)      # 递归调用
  11.             os.chdir(os.pardir)        # 递归调用后切记返回上一层目录

  12. start_dir = input('请输入待查找的初始目录:')
  13. program_dir = os.getcwd()         #为方便当前目录的引用,将 os.getcwd() 赋值给 program_dir

  14. target = ['.mp4', '.avi', '.rmvb']
  15. vedio_list = []                    #vedio_list 是个空列表,列表才有append()

  16. search_file(start_dir, target)

  17. f = open(program_dir + os.sep + 'vedioList.txt', 'w')            #按要求打开文件,此文件即使没有它也会自动创建
  18. f.writelines(vedio_list)                 #对文件进行写入
  19. f.close()                          # 关闭文件


复制代码

4.编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,则进入文件夹继续搜索)所有含有该关键字的文本文件(.txt后缀),要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符),程序实现如图:
195010g0ovzbv8a5aurqww (1).png
  1. import os      # 每个代码块有不同的分工,这是实现一个功能的重要思想,分开定义也避免了代码的臃肿,使代码块更加简介和易读

  2. def print_pos(key_dict):     #输出部分 代码块
  3.     keys = key_dict.keys()
  4.     keys = sorted(keys)      # 由于字典是无序的,我们这里对行数进行排序;sorted() 方法是返回一个排列后的新列表,而sort() 方法是对原列表原地排序
  5.     for each_key in keys:        #关键字出现在字典中时
  6.         print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))       #格式化操作

  7. # 关键字在段落中如何把它分离出来
  8. def pos_in_line(line, key):
  9.     pos = []        #建一个空列表
  10.     begin = line.find(key)     #find() 会返回目标值的索引值
  11.     while begin != -1:         #表示 begin 没到最后一个时
  12.         pos.append(begin + 1)     # 用户的角度是从1开始数
  13.         begin = line.find(key, begin+1)      # 从下一个位置继续查找

  14.     return pos

  15. #在文件中寻找关键字
  16. def search_in_file(file_name, key):
  17.     f = open(file_name)
  18.     count = 0     # 记录行数
  19.     key_dict = dict()     # 字典,用户存放key所在具体行数对应具体位置
  20.    
  21.     for each_line in f:
  22.         count += 1
  23.         if key in each_line:
  24.             pos = pos_in_line(each_line, key)      # key在每行对应的位置
  25.             key_dict[count] = pos                      #相当于 key_dict[count] = pos_in_line(each_line,key)  即 pos 作为键 “count” 的值
  26.    
  27.     f.close()          #关闭文件操作
  28.     return key_dict


  29. def search_files(key, detail):   
  30.     all_files = os.walk(os.getcwd())    #os.getcwd() 当前目录下;os.walk() 遍历 top 参数指定路径下的所有子目录,并将结果返回一个三元组
  31.     txt_files = []          #建立一个空列表

  32.     for i in all_files:
  33.         for each_file in i[2]:     #i[2] 表示在os.walk() 下生成的三元组中,返回文件
  34.             if os.path.splitext(each_file)[1] == '.txt': # 根据后缀判断是否文本文件;os.path.splitext() 分离文件名与扩展名,返回(f_name,f_extension)元组
  35.                 each_file = os.path.join(i[0], each_file)    #os.path.join() 将 path1,path2 各部分组合成一个路径名
  36.                 txt_files.append(each_file)        #添加到列表 txt_files 中

  37.     for each_txt_file in txt_files:
  38.         key_dict = search_in_file(each_txt_file, key)    #search_in_file 的作用域是全局,search_in_file(each_txt_file,key)返回的就是局部 key_dict,而这里的 key_dict 作用域只是局部,也就是在 search_file(key,detail)函数中
  39.         if key_dict:
  40.             print('================================================================')
  41.             print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
  42.             if detail in ['YES', 'Yes', 'yes']:
  43.                 print_pos(key_dict)


  44. key = input('请将该脚本放于待查找的文件夹内,请输入关键字:')
  45. detail = input('请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):' % key)
  46. search_files(key, detail)
复制代码



本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 01:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表