鱼C论坛

 找回密码
 立即注册
查看: 1272|回复: 0

[学习笔记] 论.技术.Python.(旧)零学Python第30讲:文件系统,一个高大上的东西

[复制链接]
发表于 2021-12-12 15:50:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 小蜂队 于 2021-12-14 20:15 编辑

0. 编写一个程序,统计当前目录下每个文件类型的文件数,程序实现如图:(注释来源于昨非)
194733ms9swmp1xorsap0z.png
import os

all_files = os.listdir(os.curdir)    #使用os.curdir表示当前目录更标准
type_dict = dict()    #空字典

for each_file in all_files:    #遍历文件的列表
    if os.path.isdir(each_file):  #是文件夹时:
        type_dict.setdefault('文件夹', 0)     #当这个键值对不存在时,以“文件夹”为键,插入字典中,设初始个数为0,之后,不再执行这一句(setdefault的特点)
        type_dict['文件夹'] += 1     #个数自加一
    else:     #当为其他文件形式时:
        ext = os.path.splitext(each_file)[1]  
        #splitext分离文件名与扩展名,返回(f_name, f_extension)元组,这里截取[1]第二个元素,也就是扩展名赋值给ext
        type_dict.setdefault(ext, 0)  #同理,当这个扩展名的文件尚未记录时,以扩展名为键,插入字典中,并设初值为0,之后遇到,计数加一
        type_dict[ext] += 1

for each_type in type_dict.keys():  #遍历每个键值对,打印结果
    print('该文件夹下共有类型为【%s】的文件 %d 个' % (each_type, type_dict[each_type]))
1. 编写一个程序,计算当前文件夹下所有文件的大小,程序实现如图:
194801phv0hkau1l0kqzuk.png
import os     #导入 os 模块

all_files = os.listdir(os.curdir) # 使用os.curdir表示当前目录更标准
file_dict = dict()    #创建一个空字典,空字典的名称为 file_dict

for each_file in all_files:
    if os.path.isfile(each_file):   #是文件类型时
        file_size = os.path.getsize(each_file)    #获取文件大小,getsize 返回指定文件的尺寸,单位是字节
        file_dict[each_file] = file_size    #file_size 作为 each_file 的值

for each in file_dict.items():     #items() 用于返回字典中所有的键值对
    print('%s【%dBytes】' % (each[0], each[1]))    #each[0] 表示的是字典中的键;each[1] 表示的是字典中的值
2.编写一个程序,用户输入文件名以及开始搜索的路径,搜索该文件是否存在。如遇到文件夹,则进入文件夹继续搜索,程序实现如图:
1948265cvs2uu1cs1lke0l.png
import os

def search_file(start_dir, target) :
    os.chdir(start_dir)
    
    for each_file in os.listdir(os.curdir) :
        if each_file == target :
            print(os.getcwd() + os.sep + each_file) # 使用os.sep是程序更标准
        if os.path.isdir(each_file) :
            search_file(each_file, target) # 递归调用
            os.chdir(os.pardir) # 递归调用后切记返回上一层目录

start_dir = input('请输入待查找的初始目录:')
target = input('请输入需要查找的目标文件:')
search_file(start_dir, target)
3.编写一个程序,用户输入开始搜索的路径,查找该路径下(包含子文件夹内)所有的视频格式文件(要求查找mp4 rmvb, avi的格式即可),并把创建一个文件(vedioList.txt)存放所有找到的文件的路径,程序实现如图:
002143uezeughy7zs5e14e.png
import os          #导入 os 模块

def search_file(start_dir, target) :
    os.chdir(start_dir)       #改变工作目录为 start_dir 
    
    for each_file in os.listdir(os.curdir) :    #从当前的工作目录中导出所有文件
        ext = os.path.splitext(each_file)[1]    #os.path.splitext() 分离文件名与扩展名,返回(f_path,f_extension)元组;并把扩展名赋值给 ext 
        if ext in target :      #当扩展名在目标文件中时
            vedio_list.append(os.getcwd() + os.sep + each_file + os.linesep) # 使用os.sep是程序更标准,os.linesep 表示当前平台使用的终止符
        if os.path.isdir(each_file) :      #是文件夹时
            search_file(each_file, target)      # 递归调用
            os.chdir(os.pardir)        # 递归调用后切记返回上一层目录

start_dir = input('请输入待查找的初始目录:')
program_dir = os.getcwd()         #为方便当前目录的引用,将 os.getcwd() 赋值给 program_dir 

target = ['.mp4', '.avi', '.rmvb']
vedio_list = []                    #vedio_list 是个空列表,列表才有append()

search_file(start_dir, target)

f = open(program_dir + os.sep + 'vedioList.txt', 'w')            #按要求打开文件,此文件即使没有它也会自动创建
f.writelines(vedio_list)                 #对文件进行写入
f.close()                          # 关闭文件
4.编写一个程序,用户输入关键字,查找当前文件夹内(如果当前文件夹内包含文件夹,则进入文件夹继续搜索)所有含有该关键字的文本文件(.txt后缀),要求显示该文件所在的位置以及关键字在文件中的具体位置(第几行第几个字符),程序实现如图:
195010g0ovzbv8a5aurqww (1).png
import os      # 每个代码块有不同的分工,这是实现一个功能的重要思想,分开定义也避免了代码的臃肿,使代码块更加简介和易读

def print_pos(key_dict):     #输出部分 代码块
    keys = key_dict.keys()
    keys = sorted(keys)      # 由于字典是无序的,我们这里对行数进行排序;sorted() 方法是返回一个排列后的新列表,而sort() 方法是对原列表原地排序
    for each_key in keys:        #关键字出现在字典中时
        print('关键字出现在第 %s 行,第 %s 个位置。' % (each_key, str(key_dict[each_key])))       #格式化操作

# 关键字在段落中如何把它分离出来
def pos_in_line(line, key):
    pos = []        #建一个空列表
    begin = line.find(key)     #find() 会返回目标值的索引值
    while begin != -1:         #表示 begin 没到最后一个时
        pos.append(begin + 1)     # 用户的角度是从1开始数
        begin = line.find(key, begin+1)      # 从下一个位置继续查找

    return pos

#在文件中寻找关键字
def search_in_file(file_name, key):
    f = open(file_name)
    count = 0     # 记录行数
    key_dict = dict()     # 字典,用户存放key所在具体行数对应具体位置
    
    for each_line in f:
        count += 1
        if key in each_line:
            pos = pos_in_line(each_line, key)      # key在每行对应的位置
            key_dict[count] = pos                      #相当于 key_dict[count] = pos_in_line(each_line,key)  即 pos 作为键 “count” 的值
    
    f.close()          #关闭文件操作
    return key_dict


def search_files(key, detail):    
    all_files = os.walk(os.getcwd())    #os.getcwd() 当前目录下;os.walk() 遍历 top 参数指定路径下的所有子目录,并将结果返回一个三元组
    txt_files = []          #建立一个空列表

    for i in all_files:
        for each_file in i[2]:     #i[2] 表示在os.walk() 下生成的三元组中,返回文件
            if os.path.splitext(each_file)[1] == '.txt': # 根据后缀判断是否文本文件;os.path.splitext() 分离文件名与扩展名,返回(f_name,f_extension)元组
                each_file = os.path.join(i[0], each_file)    #os.path.join() 将 path1,path2 各部分组合成一个路径名
                txt_files.append(each_file)        #添加到列表 txt_files 中

    for each_txt_file in txt_files:
        key_dict = search_in_file(each_txt_file, key)    #search_in_file 的作用域是全局,search_in_file(each_txt_file,key)返回的就是局部 key_dict,而这里的 key_dict 作用域只是局部,也就是在 search_file(key,detail)函数中
        if key_dict:
            print('================================================================')
            print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
            if detail in ['YES', 'Yes', 'yes']:
                print_pos(key_dict)


key = input('请将该脚本放于待查找的文件夹内,请输入关键字:')
detail = input('请问是否需要打印关键字【%s】在文件中的具体位置(YES/NO):' % key)
search_files(key, detail)


本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-22 05:46

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表