鱼C论坛

 找回密码
 立即注册
查看: 2253|回复: 4

[已解决]第35讲 第04题 小甲鱼给的答案不对?

[复制链接]
发表于 2020-11-5 09:49:23 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
rt
统计不了正确的行数?我有一个文件夹里面就放一个后续为.py的文件,里面有几十行,但是最后统计出来为0行,为什么?谢谢!

代码如下:

import easygui as g
import os

def show_result(start_dir):
    lines = 0
    total = 0
    text = ""

    for i in source_list:
        lines = source_list[i]
        total += lines
        text += "【%s】源文件 %d 个,源代码 %d 行\n" % (i, file_list[i], lines)
    title = '统计结果'
    msg = '您目前共累积编写了 %d 行代码,完成进度:%.2f %%\n离 10 万行代码还差 %d 行,请继续努力!' % (total, total/1000, 100000-total)
    g.textbox(msg, title, text)

def calc_code(file_name):
    lines = 0
    with open(file_name) as f:
        print('正在分析文件:%s ...' % file_name)
        try:
            for each_line in f:
                lines += 1
        except UnicodeDecodeError:
            pass # 不可避免会遇到格式不兼容的文件,这里忽略掉......
    return lines

def search_file(start_dir) :
    os.chdir(start_dir)
   
    for each_file in os.listdir(os.curdir) :
        ext = os.path.splitext(each_file)[1]
        if ext in target :
            lines = calc_code(each_file) # 统计行数
            # 还记得异常的用法吗?如果字典中不存,抛出 KeyError,则添加字典键
            # 统计文件数
            try:
                file_list[ext] += 1
            except KeyError:
                file_list[ext] = 1
            # 统计源代码行数
            try:
                source_list[ext] += lines
            except KeyError:
                source_list[ext] = lines
            
        if os.path.isdir(each_file) :
            search_file(each_file) # 递归调用
            os.chdir(os.pardir) # 递归调用后切记返回上一层目录
            
target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm']
file_list = {}
source_list = {}

g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库:")

search_file(path)
show_result(path)
最佳答案
2020-11-5 14:38:47
Python3.0以上的源文件是UTF-8编码的,而open()默认打开方式是GBK,所以正常情况下读取文件会触发 UnicodeDecodeError,但是代码中加入了:
        try:
        except UnicodeDecodeError:
            pass 
结果就会忽略掉这个错误,不会有任何提示,行数也不会被统计出来了。
一种方法是改成:
with open(file_name,encoding='utf-8') as f:
这样你的py文件能被正确读取,但是碰到GBK的文件会被忽略。
第二种方法是加入代码,出现UnicodeDecodeError就换一种方式打开文件,参见:https://fishc.com.cn/thread-161105-1-1.html
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-11-5 11:12:54 | 显示全部楼层
有可能因为编码问题触发了异常呢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-5 14:38:47 | 显示全部楼层    本楼为最佳答案   
Python3.0以上的源文件是UTF-8编码的,而open()默认打开方式是GBK,所以正常情况下读取文件会触发 UnicodeDecodeError,但是代码中加入了:
        try:
        except UnicodeDecodeError:
            pass 
结果就会忽略掉这个错误,不会有任何提示,行数也不会被统计出来了。
一种方法是改成:
with open(file_name,encoding='utf-8') as f:
这样你的py文件能被正确读取,但是碰到GBK的文件会被忽略。
第二种方法是加入代码,出现UnicodeDecodeError就换一种方式打开文件,参见:https://fishc.com.cn/thread-161105-1-1.html
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2020-11-7 07:02:10 | 显示全部楼层
txxcat 发表于 2020-11-5 14:38
Python3.0以上的源文件是UTF-8编码的,而open()默认打开方式是GBK,所以正常情况下读取文件会触发 UnicodeD ...

谢谢,可以了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-7 07:02:56 | 显示全部楼层
BngThea 发表于 2020-11-5 11:12
有可能因为编码问题触发了异常呢

谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-17 23:24

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表