论.技术.Python.(旧)零学Python第30讲:文件系统，一个高大上的东西,萌新交流区,萌新训练营,鱼C论坛

小蜂队 发表于 2021-12-12 15:50:42

论.技术.Python.(旧)零学Python第30讲:文件系统，一个高大上的东西

本帖最后由小蜂队于 2021-12-14 20:15 编辑

0. 编写一个程序，统计当前目录下每个文件类型的文件数，程序实现如图：(注释来源于昨非)

import os

all_files = os.listdir(os.curdir) #使用os.curdir表示当前目录更标准
type_dict = dict() #空字典

for each_file in all_files: #遍历文件的列表
if os.path.isdir(each_file):#是文件夹时：
   type_dict.setdefault('文件夹', 0) #当这个键值对不存在时，以“文件夹”为键，插入字典中，设初始个数为0，之后，不再执行这一句（setdefault的特点）
   type_dict['文件夹'] += 1 #个数自加一
else: #当为其他文件形式时：
   ext = os.path.splitext(each_file)
   #splitext分离文件名与扩展名，返回(f_name, f_extension)元组,这里截取第二个元素，也就是扩展名赋值给ext
   type_dict.setdefault(ext, 0)#同理，当这个扩展名的文件尚未记录时，以扩展名为键，插入字典中，并设初值为0，之后遇到，计数加一
   type_dict += 1

for each_type in type_dict.keys():#遍历每个键值对，打印结果
print('该文件夹下共有类型为【%s】的文件 %d 个' % (each_type, type_dict))

1. 编写一个程序，计算当前文件夹下所有文件的大小，程序实现如图：

import os #导入 os 模块

all_files = os.listdir(os.curdir) # 使用os.curdir表示当前目录更标准
file_dict = dict() #创建一个空字典，空字典的名称为 file_dict

for each_file in all_files:
if os.path.isfile(each_file): #是文件类型时
   file_size = os.path.getsize(each_file) #获取文件大小，getsize 返回指定文件的尺寸，单位是字节
   file_dict = file_size #file_size 作为 each_file 的值

for each in file_dict.items(): #items() 用于返回字典中所有的键值对
print('%s【%dBytes】' % (each, each)) #each 表示的是字典中的键；each 表示的是字典中的值
2.编写一个程序，用户输入文件名以及开始搜索的路径，搜索该文件是否存在。如遇到文件夹，则进入文件夹继续搜索，程序实现如图：

import os

def search_file(start_dir, target) :
os.chdir(start_dir)

for each_file in os.listdir(os.curdir) :
   if each_file == target :
         print(os.getcwd() + os.sep + each_file) # 使用os.sep是程序更标准
   if os.path.isdir(each_file) :
         search_file(each_file, target) # 递归调用
         os.chdir(os.pardir) # 递归调用后切记返回上一层目录

start_dir = input('请输入待查找的初始目录：')
target = input('请输入需要查找的目标文件：')
search_file(start_dir, target)

3.编写一个程序，用户输入开始搜索的路径，查找该路径下（包含子文件夹内）所有的视频格式文件（要求查找mp4 rmvb, avi的格式即可），并把创建一个文件（vedioList.txt）存放所有找到的文件的路径，程序实现如图：

import os       #导入 os 模块

def search_file(start_dir, target) :
os.chdir(start_dir)    #改变工作目录为 start_dir

for each_file in os.listdir(os.curdir) : #从当前的工作目录中导出所有文件
   ext = os.path.splitext(each_file) #os.path.splitext() 分离文件名与扩展名，返回(f_path,f_extension)元组；并把扩展名赋值给 ext
   if ext in target :    #当扩展名在目标文件中时
         vedio_list.append(os.getcwd() + os.sep + each_file + os.linesep) # 使用os.sep是程序更标准，os.linesep 表示当前平台使用的终止符
   if os.path.isdir(each_file) :    #是文件夹时
         search_file(each_file, target)    # 递归调用
         os.chdir(os.pardir)    # 递归调用后切记返回上一层目录

start_dir = input('请输入待查找的初始目录：')
program_dir = os.getcwd()       #为方便当前目录的引用，将 os.getcwd() 赋值给 program_dir

target = ['.mp4', '.avi', '.rmvb']
vedio_list = []                #vedio_list 是个空列表，列表才有append()

search_file(start_dir, target)

f = open(program_dir + os.sep + 'vedioList.txt', 'w')          #按要求打开文件，此文件即使没有它也会自动创建
f.writelines(vedio_list)             #对文件进行写入
f.close()                      # 关闭文件

4.编写一个程序，用户输入关键字，查找当前文件夹内（如果当前文件夹内包含文件夹，则进入文件夹继续搜索）所有含有该关键字的文本文件（.txt后缀），要求显示该文件所在的位置以及关键字在文件中的具体位置（第几行第几个字符），程序实现如图：

import os    # 每个代码块有不同的分工，这是实现一个功能的重要思想，分开定义也避免了代码的臃肿，使代码块更加简介和易读

def print_pos(key_dict): #输出部分代码块
keys = key_dict.keys()
keys = sorted(keys)    # 由于字典是无序的，我们这里对行数进行排序；sorted() 方法是返回一个排列后的新列表，而sort() 方法是对原列表原地排序
for each_key in keys:    #关键字出现在字典中时
   print('关键字出现在第 %s 行，第 %s 个位置。' % (each_key, str(key_dict)))    #格式化操作

# 关键字在段落中如何把它分离出来
def pos_in_line(line, key):
pos = []    #建一个空列表
begin = line.find(key) #find() 会返回目标值的索引值
while begin != -1:       #表示 begin 没到最后一个时
   pos.append(begin + 1) # 用户的角度是从1开始数
   begin = line.find(key, begin+1)    # 从下一个位置继续查找

return pos

#在文件中寻找关键字
def search_in_file(file_name, key):
f = open(file_name)
count = 0 # 记录行数
key_dict = dict() # 字典，用户存放key所在具体行数对应具体位置

for each_line in f:
   count += 1
   if key in each_line:
         pos = pos_in_line(each_line, key)    # key在每行对应的位置
         key_dict = pos                   #相当于 key_dict = pos_in_line(each_line,key)即 pos 作为键 “count” 的值

f.close()       #关闭文件操作
return key_dict

def search_files(key, detail):
all_files = os.walk(os.getcwd()) #os.getcwd() 当前目录下;os.walk() 遍历 top 参数指定路径下的所有子目录，并将结果返回一个三元组
txt_files = []       #建立一个空列表

for i in all_files:
   for each_file in i: #i 表示在os.walk() 下生成的三元组中，返回文件
         if os.path.splitext(each_file) == '.txt': # 根据后缀判断是否文本文件;os.path.splitext() 分离文件名与扩展名，返回(f_name,f_extension)元组
            each_file = os.path.join(i, each_file) #os.path.join() 将 path1,path2 各部分组合成一个路径名
            txt_files.append(each_file)    #添加到列表 txt_files 中

for each_txt_file in txt_files:
   key_dict = search_in_file(each_txt_file, key) #search_in_file 的作用域是全局，search_in_file(each_txt_file,key)返回的就是局部 key_dict，而这里的 key_dict 作用域只是局部，也就是在 search_file(key,detail)函数中
   if key_dict:
         print('================================================================')
         print('在文件【%s】中找到关键字【%s】' % (each_txt_file, key))
         if detail in ['YES', 'Yes', 'yes']:
            print_pos(key_dict)

key = input('请将该脚本放于待查找的文件夹内，请输入关键字：')
detail = input('请问是否需要打印关键字【%s】在文件中的具体位置（YES/NO）：' % key)
search_files(key, detail)

页: [1]

鱼C论坛's Archiver

论.技术.Python.(旧)零学Python第30讲:文件系统，一个高大上的东西