11tadpole 发表于 2020-5-3 16:41:23

第35讲 统计当前代码量总和

我在做第35讲 统计当前代码量总和时,发现我的文件都无法被识别代码量,想弄清楚原因
运行的就是小甲鱼老师的代码
在calc_code(file_name)时,每次都会跳转到except UnicodeDecodeError
文件里面放的代码就是平常做作业写的代码,是有内容的,为什么就不兼容了呢
import easygui as g
import os

def show_result(start_dir):
    lines = 0
    total = 0
    text = ""

    for i in source_list:
      lines = source_list

      total += lines
      text += "【%s】源文件 %d 个,源代码 %d 行\n" % (i, file_list, lines)
    title = '统计结果'
    msg = '您目前共累积编写了 %d 行代码,完成进度:%.2f %%\n离 10 万行代码还差 %d 行,请继续努力!' % (total, total/1000, 100000-total)

    g.textbox(msg, title, text)

def calc_code(file_name):
    lines = 0
    with open(file_name) as f:
      print('正在分析文件:%s ...' % file_name)
      try:
            for each_line in f:
                lines += 1
      except UnicodeDecodeError:
            print('不兼容')
            pass # 不可避免会遇到格式不兼容的文件,这里忽略掉......
    return lines

def search_file(start_dir) :
    os.chdir(start_dir)
   
    for each_file in os.listdir(os.curdir) :
      ext = os.path.splitext(each_file)
      if ext in target :
            lines = calc_code(each_file) # 统计行数
            # 还记得异常的用法吗?如果字典中不存,抛出 KeyError,则添加字典键
            # 统计文件数

            try:
                file_list += 1
            except KeyError:
                file_list = 1
            # 统计源代码行数
            try:
                source_list += lines
            except KeyError:
                source_list = lines
            
      if os.path.isdir(each_file) :
            search_file(each_file) # 递归调用
            os.chdir(os.pardir) # 递归调用后切记返回上一层目录
            
target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm']
file_list = {}
source_list = {}

g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库:")

search_file(path)
show_result(path)

_荟桐_ 发表于 2020-5-3 18:02:17

看看那些py文件的编码

11tadpole 发表于 2020-5-4 11:53:29

_荟桐_ 发表于 2020-5-3 18:02
看看那些py文件的编码

怎么看编码?

_荟桐_ 发表于 2020-5-4 12:20:25

11tadpole 发表于 2020-5-4 11:53
怎么看编码?

有很多方法
用记事本打开,另存为,然后看右下角的编码
或者用notepad++,vscode之类的编辑器,都会在右下角显示文件编码,很方便

_荟桐_ 发表于 2020-5-4 12:23:15

把那一段改成这样,看看打印了什么
except UnicodeDecodeError as asdf:
            print('不兼容')
            print(asdf)
            pass # 不可避免会遇到格式不兼容的文件,这里忽略掉......

Tigeroad 发表于 2020-5-12 20:40:03

我也有这个问题,好多文件都不兼容呀

赚小钱 发表于 2020-5-12 21:36:04

没有考虑注释,和空行;
对于c这种编码风格灵活的,大括号换行应该不算;
可以学习 cloc 的源码,虽然是 perl 的。
页: [1]
查看完整版本: 第35讲 统计当前代码量总和