小蜂队 发表于 2021-12-12 15:50:42

论.技术.Python.(旧)零学Python第30讲:文件系统,一个高大上的东西

本帖最后由 小蜂队 于 2021-12-14 20:15 编辑

0. 编写一个程序,统计当前目录下每个文件类型的文件数,程序实现如图:(注释来源于昨非)

import os

all_files = os.listdir(os.curdir)    #使用os.curdir表示当前目录更标准
type_dict = dict()    #空字典

for each_file in all_files:    #遍历文件的列表
    if os.path.isdir(each_file):#是文件夹时:
      type_dict.setdefault('文件夹', 0)   #当这个键值对不存在时,以“文件夹”为键,插入字典中,设初始个数为0,之后,不再执行这一句(setdefault的特点)
      type_dict['文件夹'] += 1   #个数自加一
    else:   #当为其他文件形式时:
      ext = os.path.splitext(each_file)
      #splitext分离文件名与扩展名,返回(f_name, f_extension)元组,这里截取第二个元素,也就是扩展名赋值给ext
      type_dict.setdefault(ext, 0)#同理,当这个扩展名的文件尚未记录时,以扩展名为键,插入字典中,并设初值为0,之后遇到,计数加一
      type_dict += 1

for each_type in type_dict.keys():#遍历每个键值对,打印结果
    print('该文件夹下共有类型为【%s】的文件 %d 个' % (each_type, type_dict))


1. 编写一个程序,计算当前文件夹下所有文件的大小,程序实现如图:

import os   #导入 os 模块

all_files = os.listdir(os.curdir) # 使用os.curdir表示当前目录更标准
file_dict = dict()    #创建一个空字典,空字典的名称为 file_dict

for each_file in all_files:
    if os.path.isfile(each_file):   #是文件类型时
      file_size = os.path.getsize(each_file)    #获取文件大小,getsize 返回指定文件的尺寸,单位是字节
      file_dict = file_size    #file_size 作为 each_file 的值

for each in file_dict.items():   #items() 用于返回字典中所有的键值对
    print('%s【%dBytes】' % (each, each))    #each 表示的是字典中的键;each 表示的是字典中的值
2.编写一个程序,用户输入文件名以及开始搜索的路径,搜索该文件是否存在。如遇到文件夹,则进入文件夹继续搜索,程序实现如图:

import os

def search_file(start_dir, target) :
    os.chdir(start_dir)
   
    for each_file in os.listdir(os.curdir) :
      if each_file == target :
            print(os.getcwd() + os.sep + each_file) # 使用os.sep是程序更标准
      if os.path.isdir(each_file) :
            search_file(each_file, target) # 递归调用
            os.chdir(os.pardir) # 递归调用后切记返回上一层目录

start_dir = input('请输入待查找的初始目录:')
target = input('请输入需要查找的目标文件:')
search_file(start_dir, target)

3.编写一个程序,用户输入开始搜索的路径,查找该路径下(包含子文件夹内)所有的视频格式文件(要求查找mp4 rmvb, avi的格式即可),并把创建一个文件(vedioList.txt)存放所有找到的文件的路径,程序实现如图:

import os          #导入 os 模块

def search_file(start_dir, target) :
    os.chdir(start_dir)       #改变工作目录为 start_dir
   
    for each_file in os.listdir(os.curdir) :    #从当前的工作目录中导出所有文件
      ext = os.path.splitext(each_file)    #os.path.splitext() 分离文件名与扩展名,返回(f_path,f_extension)元组;并把扩展名赋值给 ext
      if ext in target :      #当扩展名在目标文件中时
            vedio_list.append(os.getcwd() + os.sep + each_file + os.linesep) # 使用os.sep是程序更标准,os.linesep 表示当前平台使用的终止符
      if os.path.isdir(each_file) :      #是文件夹时
            search_file(each_file, target)      # 递归调用
            os.chdir(os.pardir)      # 递归调用后切记返回上一层目录

start_dir = input('请输入待查找的初始目录:')
program_dir = os.getcwd()         #为方便当前目录的引用,将 os.getcwd() 赋值给 program_dir

target = ['.mp4', '.avi', '.rmvb']
vedio_list = []                  #vedio_list 是个空列表,列表才有append()

search_file(start_dir, target)

f = open(program_dir + os.sep + 'vedioList.txt', 'w')            #按要求打开文件,此文件即使没有它也会自动创建
f.writelines(vedio_list)               #对文件进行写入
f.close()                        # 关闭文件



4.编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,则进入文件夹继续搜索)所有含有该关键字的文本文件(.txt后缀),要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符),程序实现如图:

import os      # 每个代码块有不同的分工,这是实现一个功能的重要思想,分开定义也避免了代码的臃肿,使代码块更加简介和易读

def print_pos(key_dict):   #输出部分 代码块
    keys = key_dict.keys()
    keys = sorted(keys)      # 由于字典是无序的,我们这里对行数进行排序;sorted() 方法是返回一个排列后的新列表,而sort() 方法是对原列表原地排序
    for each_key in keys:      #关键字出现在字典中时
      print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict)))       #格式化操作

# 关键字在段落中如何把它分离出来
def pos_in_line(line, key):
    pos = []      #建一个空列表
    begin = line.find(key)   #find() 会返回目标值的索引值
    while begin != -1:         #表示 begin 没到最后一个时
      pos.append(begin + 1)   # 用户的角度是从1开始数
      begin = line.find(key, begin+1)      # 从下一个位置继续查找

    return pos

#在文件中寻找关键字
def search_in_file(file_name, key):
    f = open(file_name)
    count = 0   # 记录行数
    key_dict = dict()   # 字典,用户存放key所在具体行数对应具体位置
   
    for each_line in f:
      count += 1
      if key in each_line:
            pos = pos_in_line(each_line, key)      # key在每行对应的位置
            key_dict = pos                      #相当于 key_dict = pos_in_line(each_line,key)即 pos 作为键 “count” 的值
   
    f.close()          #关闭文件操作
    return key_dict


def search_files(key, detail):   
    all_files = os.walk(os.getcwd())    #os.getcwd() 当前目录下;os.walk() 遍历 top 参数指定路径下的所有子目录,并将结果返回一个三元组
    txt_files = []          #建立一个空列表

    for i in all_files:
      for each_file in i:   #i 表示在os.walk() 下生成的三元组中,返回文件
            if os.path.splitext(each_file) == '.txt': # 根据后缀判断是否文本文件;os.path.splitext() 分离文件名与扩展名,返回(f_name,f_extension)元组
                each_file = os.path.join(i, each_file)    #os.path.join() 将 path1,path2 各部分组合成一个路径名
                txt_files.append(each_file)      #添加到列表 txt_files 中

    for each_txt_file in txt_files:
      key_dict = search_in_file(each_txt_file, key)    #search_in_file 的作用域是全局,search_in_file(each_txt_file,key)返回的就是局部 key_dict,而这里的 key_dict 作用域只是局部,也就是在 search_file(key,detail)函数中
      if key_dict:
            print('================================================================')
            print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
            if detail in ['YES', 'Yes', 'yes']:
                print_pos(key_dict)


key = input('请将该脚本放于待查找的文件夹内,请输入关键字:')
detail = input('请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):' % key)
search_files(key, detail)


页: [1]
查看完整版本: 论.技术.Python.(旧)零学Python第30讲:文件系统,一个高大上的东西