论.技术.Python.(旧)零学Python第30讲:文件系统，一个高大上的东西

小蜂队 · 发表于 2021-12-12 15:50:42

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由小蜂队于 2021-12-14 20:15 编辑

0. 编写一个程序，统计当前目录下每个文件类型的文件数，程序实现如图：(注释来源于昨非)

import os
all_files = os.listdir(os.curdir) #使用os.curdir表示当前目录更标准
type_dict = dict() #空字典
for each_file in all_files: #遍历文件的列表
if os.path.isdir(each_file): #是文件夹时：
type_dict.setdefault('文件夹', 0) #当这个键值对不存在时，以“文件夹”为键，插入字典中，设初始个数为0，之后，不再执行这一句（setdefault的特点）
type_dict['文件夹'] += 1 #个数自加一
else: #当为其他文件形式时：
ext = os.path.splitext(each_file)[1]
#splitext分离文件名与扩展名，返回(f_name, f_extension)元组,这里截取[1]第二个元素，也就是扩展名赋值给ext
type_dict.setdefault(ext, 0) #同理，当这个扩展名的文件尚未记录时，以扩展名为键，插入字典中，并设初值为0，之后遇到，计数加一
type_dict[ext] += 1
for each_type in type_dict.keys(): #遍历每个键值对，打印结果
print('该文件夹下共有类型为【%s】的文件 %d 个' % (each_type, type_dict[each_type]))

复制代码

1. 编写一个程序，计算当前文件夹下所有文件的大小，程序实现如图：

import os #导入 os 模块
all_files = os.listdir(os.curdir) # 使用os.curdir表示当前目录更标准
file_dict = dict() #创建一个空字典，空字典的名称为 file_dict
for each_file in all_files:
if os.path.isfile(each_file): #是文件类型时
file_size = os.path.getsize(each_file) #获取文件大小，getsize 返回指定文件的尺寸，单位是字节
file_dict[each_file] = file_size #file_size 作为 each_file 的值
for each in file_dict.items(): #items() 用于返回字典中所有的键值对
print('%s【%dBytes】' % (each[0], each[1])) #each[0] 表示的是字典中的键；each[1] 表示的是字典中的值

复制代码

2.编写一个程序，用户输入文件名以及开始搜索的路径，搜索该文件是否存在。如遇到文件夹，则进入文件夹继续搜索，程序实现如图：

import os
def search_file(start_dir, target) :
os.chdir(start_dir)
for each_file in os.listdir(os.curdir) :
if each_file == target :
print(os.getcwd() + os.sep + each_file) # 使用os.sep是程序更标准
if os.path.isdir(each_file) :
search_file(each_file, target) # 递归调用
os.chdir(os.pardir) # 递归调用后切记返回上一层目录
start_dir = input('请输入待查找的初始目录：')
target = input('请输入需要查找的目标文件：')
search_file(start_dir, target)

复制代码

3.编写一个程序，用户输入开始搜索的路径，查找该路径下（包含子文件夹内）所有的视频格式文件（要求查找mp4 rmvb, avi的格式即可），并把创建一个文件（vedioList.txt）存放所有找到的文件的路径，程序实现如图：

import os #导入 os 模块
def search_file(start_dir, target) :
os.chdir(start_dir) #改变工作目录为 start_dir
for each_file in os.listdir(os.curdir) : #从当前的工作目录中导出所有文件
ext = os.path.splitext(each_file)[1] #os.path.splitext() 分离文件名与扩展名，返回(f_path,f_extension)元组；并把扩展名赋值给 ext
if ext in target : #当扩展名在目标文件中时
vedio_list.append(os.getcwd() + os.sep + each_file + os.linesep) # 使用os.sep是程序更标准，os.linesep 表示当前平台使用的终止符
if os.path.isdir(each_file) : #是文件夹时
search_file(each_file, target) # 递归调用
os.chdir(os.pardir) # 递归调用后切记返回上一层目录
start_dir = input('请输入待查找的初始目录：')
program_dir = os.getcwd() #为方便当前目录的引用，将 os.getcwd() 赋值给 program_dir
target = ['.mp4', '.avi', '.rmvb']
vedio_list = [] #vedio_list 是个空列表，列表才有append()
search_file(start_dir, target)
f = open(program_dir + os.sep + 'vedioList.txt', 'w') #按要求打开文件，此文件即使没有它也会自动创建
f.writelines(vedio_list) #对文件进行写入
f.close() # 关闭文件

复制代码

4.编写一个程序，用户输入关键字，查找当前文件夹内（如果当前文件夹内包含文件夹，则进入文件夹继续搜索）所有含有该关键字的文本文件（.txt后缀），要求显示该文件所在的位置以及关键字在文件中的具体位置（第几行第几个字符），程序实现如图：
195010g0ovzbv8a5aurqww (1).png

import os # 每个代码块有不同的分工，这是实现一个功能的重要思想，分开定义也避免了代码的臃肿，使代码块更加简介和易读
def print_pos(key_dict): #输出部分代码块
keys = key_dict.keys()
keys = sorted(keys) # 由于字典是无序的，我们这里对行数进行排序；sorted() 方法是返回一个排列后的新列表，而sort() 方法是对原列表原地排序
for each_key in keys: #关键字出现在字典中时
print('关键字出现在第 %s 行，第 %s 个位置。' % (each_key, str(key_dict[each_key]))) #格式化操作
# 关键字在段落中如何把它分离出来
def pos_in_line(line, key):
pos = [] #建一个空列表
begin = line.find(key) #find() 会返回目标值的索引值
while begin != -1: #表示 begin 没到最后一个时
pos.append(begin + 1) # 用户的角度是从1开始数
begin = line.find(key, begin+1) # 从下一个位置继续查找
return pos
#在文件中寻找关键字
def search_in_file(file_name, key):
f = open(file_name)
count = 0 # 记录行数
key_dict = dict() # 字典，用户存放key所在具体行数对应具体位置
for each_line in f:
count += 1
if key in each_line:
pos = pos_in_line(each_line, key) # key在每行对应的位置
key_dict[count] = pos #相当于 key_dict[count] = pos_in_line(each_line,key) 即 pos 作为键 “count” 的值
f.close() #关闭文件操作
return key_dict
def search_files(key, detail):
all_files = os.walk(os.getcwd()) #os.getcwd() 当前目录下;os.walk() 遍历 top 参数指定路径下的所有子目录，并将结果返回一个三元组
txt_files = [] #建立一个空列表
for i in all_files:
for each_file in i[2]: #i[2] 表示在os.walk() 下生成的三元组中，返回文件
if os.path.splitext(each_file)[1] == '.txt': # 根据后缀判断是否文本文件;os.path.splitext() 分离文件名与扩展名，返回(f_name,f_extension)元组
each_file = os.path.join(i[0], each_file) #os.path.join() 将 path1,path2 各部分组合成一个路径名
txt_files.append(each_file) #添加到列表 txt_files 中
for each_txt_file in txt_files:
key_dict = search_in_file(each_txt_file, key) #search_in_file 的作用域是全局，search_in_file(each_txt_file,key)返回的就是局部 key_dict，而这里的 key_dict 作用域只是局部，也就是在 search_file(key,detail)函数中
if key_dict:
print('================================================================')
print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
if detail in ['YES', 'Yes', 'yes']:
print_pos(key_dict)
key = input('请将该脚本放于待查找的文件夹内，请输入关键字：')
detail = input('请问是否需要打印关键字【%s】在文件中的具体位置（YES/NO）：' % key)
search_files(key, detail)

复制代码

账号		自动登录	找回密码
密码			立即注册

[学习笔记] 论.技术.Python.(旧)零学Python第30讲:文件系统，一个高大上的东西

马上注册，结交更多好友，享用更多功能^_^

本帖被以下淘专辑推荐:

浏览过的版块