鱼C论坛

 找回密码
 立即注册
查看: 1841|回复: 4

[已解决]递归搜索文件夹问题

[复制链接]
发表于 2023-7-30 22:00:25 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import easygui as g
import os


def show_result(start_dir):
    lines = 0
    total = 0
    text = ""

    for i in source_list:
        lines = source_list[i]
        total += lines
        text += "【%s】源文件 %d 个,源代码 %d 行\n" % (i, file_list[i], lines)
    title = '统计结果'
    msg = '您目前共累积编写了 %d 行代码,完成进度:%.2f %%\n离 10 万行代码还差 %d 行,请继续努力!' % (
        total, total/1000, 100000-total)
    g.textbox(msg, title, text)


def calc_code(file_name):
    lines = 0
    with open(file_name) as f:
        print('正在分析文件:%s ...' % file_name)
        try:
            for each_line in f:
                lines += 1
        except UnicodeDecodeError:
            pass  # 不可避免会遇到格式不兼容的文件,这里忽略掉......
    return lines


def search_file(start_dir):
    os.chdir(start_dir)

    for each_file in os.listdir(os.curdir):
        ext = os.path.splitext(each_file)[1]
        if ext in target:
            lines = calc_code(each_file)  # 统计行数
            # 还记得异常的用法吗?如果字典中不存,抛出 KeyError,则添加字典键
            # 统计文件数
            try:
                file_list[ext] += 1
            except KeyError:
                file_list[ext] = 1
            # 统计源代码行数
            try:
                source_list[ext] += lines
            except KeyError:
                source_list[ext] = lines

        if os.path.isdir(each_file):
            os.chdir(os.path.join(os.curdir,each_file))
            search_file(os.getcwd())  # 递归调用
             # 递归调用后切记返回上一层目录


target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm']
file_list = {}
source_list = {}

g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库:")

search_file(path)
show_result(path)


不知道要怎么修改@_@
最佳答案
2023-7-31 07:36:55
davidmou 发表于 2023-7-30 20:26
为什么search_file(os.getcwd())递归后还要os.chdir(os.path.pardir)

感谢您提出的问题!在search_file()函数中,为了能够递归地遍历目录树并搜索文件,我们需要使用os.chdir()函数切换到当前目录的子目录。而在子目录递归完成后,我们需要返回上一级目录以继续搜索其他文件。这就是为什么在search_file()函数中使用os.chdir(os.path.pardir)来返回上一级目录。

具体来说,os.getcwd()返回当前工作目录的路径,而os.chdir(os.path.pardir)将当前工作目录切换到其父目录(上一级目录)。这样,在递归调用search_file()函数后,程序会返回到上一级目录,然后继续搜索其他文件。

这个步骤是为了确保程序能够在整个目录树中遍历所有文件,并找到目标文件。

希望这个解释能够帮助您理解为什么需要在递归后使用os.chdir(os.path.pardir)。如果还有任何疑问,请随时提问!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-7-30 22:00:53 | 显示全部楼层
根据您提供的代码,我看到其中存在一些问题。以下是您可以考虑修改的地方:

1. 在show_result()函数中,循环变量应该是file_list而不是source_list。请将代码修改为:
for i in file_list:    lines = source_list[i]    total += lines    text += "【%s】源文件 %d 个,源代码 %d 行\n" % (i, file_list[i], lines)
2. 在calc_code()函数中,您在使用open函数打开文件时,忘记了传递文件名参数。请将代码修改为:
with open(file_name, 'r', encoding='utf-8') as f:
并且将UnicodeDecodeError的处理方式修改为:
except UnicodeDecodeError:     pass  # 不可避免会遇到格式不兼容的文件,这里忽略掉...
3. 在search_file()函数中,os.chdir()调用后,应该返回上一层目录以继续遍历其他文件。请将代码修改为:
os.chdir(os.path.pardir)  # 返回上一级目录
4. 在主程序部分,您在调用show_result()函数时,传递的参数是path变量,但在show_result()函数中并未使用该参数。您可以直接将search_file(path)修改为search_file(start_dir),然后在show_result()函数中使用start_dir

请注意,修改代码时应注意代码缩进的正确性以及变量名的一致性。希望这些修改可以帮助您解决问题。如果还有其他疑问,请随时提问。

球一个最佳答案谢谢啦!这对我非常重要!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-7-30 22:44:38 | 显示全部楼层
如果你想修改递归搜索文件夹的代码,可以尝试以下修改:
修改calc_code函数:将计算行数的部分改为递归方式,以支持对子文件夹内的文件进行统计。修改后的代码如下:
def calc_code(file_name):
    lines = 0
    with open(file_name) as f:
        print('正在分析文件:%s ...' % file_name)
        try:
            for each_line in f:
                lines += 1
        except UnicodeDecodeError:
            pass  # 不可避免会遇到格式不兼容的文件,这里忽略掉......
    
    return lines

def calc_code_recursive(file_name):
    if os.path.isfile(file_name):
        return calc_code(file_name)
    elif os.path.isdir(file_name):
        count = 0
        for root, dirs, files in os.walk(file_name):
            for file in files:
                count += calc_code_recursive(os.path.join(root, file))
        
        return count
修改search_file函数:在调用calc_code时,改为调用calc_code_recursive进行递归统计,支持对子文件夹进行搜索。同时,在递归调用后返回上一层目录。修改后的代码如下:
def search_file(start_dir):
    os.chdir(start_dir)

    for each_file in os.listdir(os.curdir):
        ext = os.path.splitext(each_file)[1]
        if ext in target:
            lines = calc_code_recursive(each_file)  # 统计行数
            # 统计文件数
            try:
                file_list[ext] += 1
            except KeyError:
                file_list[ext] = 1
            # 统计源代码行数
            try:
                source_list[ext] += lines
            except KeyError:
                source_list[ext] = lines

        if os.path.isdir(each_file):
            next_dir = os.path.join(os.curdir, each_file)
            os.chdir(next_dir)
            search_file(os.getcwd())  # 递归调用
            os.chdir(os.path.pardir)  # 返回上一层目录
通过以上修改,你可以实现在指定文件夹下递归搜索所有文件(包括子文件夹),统计各类文件的数量和源代码行数。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-7-30 23:26:21 | 显示全部楼层
为什么search_file(os.getcwd())递归后还要os.chdir(os.path.pardir)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-7-31 07:36:55 | 显示全部楼层    本楼为最佳答案   
davidmou 发表于 2023-7-30 20:26
为什么search_file(os.getcwd())递归后还要os.chdir(os.path.pardir)

感谢您提出的问题!在search_file()函数中,为了能够递归地遍历目录树并搜索文件,我们需要使用os.chdir()函数切换到当前目录的子目录。而在子目录递归完成后,我们需要返回上一级目录以继续搜索其他文件。这就是为什么在search_file()函数中使用os.chdir(os.path.pardir)来返回上一级目录。

具体来说,os.getcwd()返回当前工作目录的路径,而os.chdir(os.path.pardir)将当前工作目录切换到其父目录(上一级目录)。这样,在递归调用search_file()函数后,程序会返回到上一级目录,然后继续搜索其他文件。

这个步骤是为了确保程序能够在整个目录树中遍历所有文件,并找到目标文件。

希望这个解释能够帮助您理解为什么需要在递归后使用os.chdir(os.path.pardir)。如果还有任何疑问,请随时提问!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-25 23:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表