[已解决]递归搜索文件夹问题

davidmou · 发表于 2023-7-30 22:00:25

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import easygui as g
import os

def show_result(start_dir):
lines = 0
total = 0
text = ""

for i in source_list:
      lines = source_list[i]
      total += lines
      text += "【%s】源文件 %d 个，源代码 %d 行\n" % (i, file_list[i], lines)
title = '统计结果'
msg = '您目前共累积编写了 %d 行代码，完成进度：%.2f %%\n离 10 万行代码还差 %d 行，请继续努力！' % (
      total, total/1000, 100000-total)
g.textbox(msg, title, text)

def calc_code(file_name):
lines = 0
with open(file_name) as f:
      print('正在分析文件：%s ...' % file_name)
      try:
         for each_line in f:
            lines += 1
      except UnicodeDecodeError:
         pass  # 不可避免会遇到格式不兼容的文件，这里忽略掉......
return lines

def search_file(start_dir):
os.chdir(start_dir)

for each_file in os.listdir(os.curdir):
      ext = os.path.splitext(each_file)[1]
      if ext in target:
         lines = calc_code(each_file)  # 统计行数
         # 还记得异常的用法吗？如果字典中不存，抛出 KeyError，则添加字典键
         # 统计文件数
         try:
            file_list[ext] += 1
         except KeyError:
            file_list[ext] = 1
         # 统计源代码行数
         try:
            source_list[ext] += lines
         except KeyError:
            source_list[ext] = lines

      if os.path.isdir(each_file):
         os.chdir(os.path.join(os.curdir,each_file))
         search_file(os.getcwd())  # 递归调用
         # 递归调用后切记返回上一层目录

target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm']
file_list = {}
source_list = {}

g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库：")

search_file(path)
show_result(path)

不知道要怎么修改@_@

最佳答案

月排行榜 / 总排行榜

Mike_python小

2023-7-31 07:36:55

davidmou 发表于 2023-7-30 20:26
为什么search_file(os.getcwd())递归后还要os.chdir(os.path.pardir)

感谢您提出的问题！在search_file()函数中，为了能够递归地遍历目录树并搜索文件，我们需要使用os.chdir()函数切换到当前目录的子目录。而在子目录递归完成后，我们需要返回上一级目录以继续搜索其他文件。这就是为什么在search_file()函数中使用os.chdir(os.path.pardir)来返回上一级目录。

具体来说，os.getcwd()返回当前工作目录的路径，而os.chdir(os.path.pardir)将当前工作目录切换到其父目录（上一级目录）。这样，在递归调用search_file()函数后，程序会返回到上一级目录，然后继续搜索其他文件。

这个步骤是为了确保程序能够在整个目录树中遍历所有文件，并找到目标文件。

希望这个解释能够帮助您理解为什么需要在递归后使用os.chdir(os.path.pardir)。如果还有任何疑问，请随时提问！

跳转到最佳答案楼层

Mike_python小 · 发表于 2023-7-30 22:00:53

根据您提供的代码，我看到其中存在一些问题。以下是您可以考虑修改的地方：

1. 在show_result()函数中，循环变量应该是file_list而不是source_list。请将代码修改为：

for i in file_list:
lines = source_list[i]
total += lines
text += "【%s】源文件 %d 个，源代码 %d 行\n" % (i, file_list[i], lines)

复制代码

2. 在calc_code()函数中，您在使用open函数打开文件时，忘记了传递文件名参数。请将代码修改为：

with open(file_name, 'r', encoding='utf-8') as f:

复制代码

并且将UnicodeDecodeError的处理方式修改为：

except UnicodeDecodeError:
pass # 不可避免会遇到格式不兼容的文件，这里忽略掉...

复制代码

3. 在search_file()函数中，os.chdir()调用后，应该返回上一层目录以继续遍历其他文件。请将代码修改为：

os.chdir(os.path.pardir) # 返回上一级目录

复制代码

4. 在主程序部分，您在调用show_result()函数时，传递的参数是path变量，但在show_result()函数中并未使用该参数。您可以直接将search_file(path)修改为search_file(start_dir)，然后在show_result()函数中使用start_dir。

请注意，修改代码时应注意代码缩进的正确性以及变量名的一致性。希望这些修改可以帮助您解决问题。如果还有其他疑问，请随时提问。

球一个最佳答案谢谢啦！这对我非常重要！

琅琊王朝 · 发表于 2023-7-30 22:44:38

如果你想修改递归搜索文件夹的代码，可以尝试以下修改：
修改calc_code函数：将计算行数的部分改为递归方式，以支持对子文件夹内的文件进行统计。修改后的代码如下：

def calc_code(file_name):
lines = 0
with open(file_name) as f:
print('正在分析文件：%s ...' % file_name)
try:
for each_line in f:
lines += 1
except UnicodeDecodeError:
pass # 不可避免会遇到格式不兼容的文件，这里忽略掉......
return lines
def calc_code_recursive(file_name):
if os.path.isfile(file_name):
return calc_code(file_name)
elif os.path.isdir(file_name):
count = 0
for root, dirs, files in os.walk(file_name):
for file in files:
count += calc_code_recursive(os.path.join(root, file))
return count

复制代码

修改search_file函数：在调用calc_code时，改为调用calc_code_recursive进行递归统计，支持对子文件夹进行搜索。同时，在递归调用后返回上一层目录。修改后的代码如下：

def search_file(start_dir):
os.chdir(start_dir)
for each_file in os.listdir(os.curdir):
ext = os.path.splitext(each_file)[1]
if ext in target:
lines = calc_code_recursive(each_file) # 统计行数
# 统计文件数
try:
file_list[ext] += 1
except KeyError:
file_list[ext] = 1
# 统计源代码行数
try:
source_list[ext] += lines
except KeyError:
source_list[ext] = lines
if os.path.isdir(each_file):
next_dir = os.path.join(os.curdir, each_file)
os.chdir(next_dir)
search_file(os.getcwd()) # 递归调用
os.chdir(os.path.pardir) # 返回上一层目录

复制代码

通过以上修改，你可以实现在指定文件夹下递归搜索所有文件（包括子文件夹），统计各类文件的数量和源代码行数。

davidmou · 发表于 2023-7-30 23:26:21

为什么search_file(os.getcwd())递归后还要os.chdir(os.path.pardir)

Mike_python小 · 发表于 2023-7-31 07:36:55

这个最佳答案由 Mike_python小给出，感谢 Mike_python小的回答。

单击隐藏图章

davidmou 发表于 2023-7-30 20:26
为什么search_file(os.getcwd())递归后还要os.chdir(os.path.pardir)

感谢您提出的问题！在search_file()函数中，为了能够递归地遍历目录树并搜索文件，我们需要使用os.chdir()函数切换到当前目录的子目录。而在子目录递归完成后，我们需要返回上一级目录以继续搜索其他文件。这就是为什么在search_file()函数中使用os.chdir(os.path.pardir)来返回上一级目录。

具体来说，os.getcwd()返回当前工作目录的路径，而os.chdir(os.path.pardir)将当前工作目录切换到其父目录（上一级目录）。这样，在递归调用search_file()函数后，程序会返回到上一级目录，然后继续搜索其他文件。

这个步骤是为了确保程序能够在整个目录树中遍历所有文件，并找到目标文件。

希望这个解释能够帮助您理解为什么需要在递归后使用os.chdir(os.path.pardir)。如果还有任何疑问，请随时提问！

账号		自动登录	找回密码
密码			立即注册