[已解决]请教：第035讲 EasyGui课后测试题中的第4题，为什么我统计的Py文件代码行数不对呢？

Niuniuaba · 发表于 2017-7-31 08:35:22

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

# 第035讲 EasyGui
# 动动手 4.写一个程序统计你当前的代码量总和，并显示离十万行代码量还差多远？
# 要求1: 递归搜索各个文件夹
# 要求2：显示各个类型的源文件和源代码数量
# 要求3：显示总行数与百分比

问题：统计py文件代码行数总是不对，不知为什么呢？

import easygui as g
import os
# 显示结果函数:
# source_list字典中keys为扩展名，values为行数；
# file_list字典中keys为扩展名，values为相应类型的文件数；
def show_result(start_dir):
lines = 0
total = 0
text = ""
for i in source_list:
lines = source_list[i] # 读取不同类型代码的行数
total += lines # 累加到total中
text += "【%s】源文件 %d 个，源代码 %d 行\n" % (i, file_list[i], lines)
# 以上(i, file_list[i], lines)是(扩展名，文件数，该类型文件代码量)
# 如（py,10,5700）即10个py文件，总共5700行代码
title = '统计结果'
msg = '您目前共累积编写了 %d 行代码，完成进度：%.2f %%\n离 10 万行代码还差 %d 行，请继续努力！' % (total, total/1000, 100000-total)
g.textbox(msg, title, text)
# 统计行数函数：统计文件中的行数，file_name为文件名
def calc_code(file_name):
lines = 0
with open(file_name) as f:
print('正在分析文件：%s ...' % file_name)
try:
for each_line in f:
lines += 1
except UnicodeDecodeError:
pass # 不可避免会遇到格式不兼容的文件，这里忽略掉......
return lines
# 根据指定路径搜索文件函数
def search_file(start_dir) :
os.chdir(start_dir) # 把指定路径改成工作路径，有了这行代码，后面文件操作会很简单
for each_file in os.listdir(os.curdir) :
ext = os.path.splitext(each_file)[1]
if ext in target :
lines = calc_code(each_file) # 调用统计行数函数
# 还记得异常的用法吗？如果字典中不存，抛出 KeyError，则添加字典键
# 统计文件数
try:
file_list[ext] += 1
except KeyError:
file_list[ext] = 1
# 统计源代码行数
try:
source_list[ext] += lines
except KeyError:
source_list[ext] = lines
# 如果路径还有文件夹，进入该文件夹继续搜索
if os.path.isdir(each_file) :
search_file(each_file) # 递归调用
os.chdir(os.pardir) # 递归调用后切记返回上一层目录(**这点很关键**)
target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm','.txt']
file_list = {} #字典file_list中 keys为扩展名，values为相应的文件数量
source_list = {} #字典source_listkeys为扩展名，values为代码行数
g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库：",title='打开文件夹',default="C:\Program Files\Python36")
search_file(path) # 搜索文件
show_result(path) # 显示结果

复制代码

问题：统计py文件代码行数不正确

最佳答案

月排行榜 / 总排行榜

ba21

2017-8-1 23:43:37

给你整了段解决文件编码问题的代码：
1,首先安装 https://pypi.python.org/pypi/chardet(3.0以上安装方法：下载.gz文件，解压后,进入chardet目录，执行 setup.py install )
2,代码修改处：

#以rb读取文件返回文件的编码(用到了chardet类)
with open(file_name, 'rb') as f:
raw = f.read()
result = chardet.detect(raw)
encoding = result['encoding']
lines = 0
with open(file_name,encoding=encoding) as f:
print('正在分析文件：%s ...' % file_name)
try:
for each_line in f:
lines += 1
except Exception as reason:
print(str(reason)) # 读取出错显示错误信息......
print('%s -> %s' % (file_name,lines))
return lines

复制代码

3,完整代码：

import easygui as g
import os
import chardet
# 显示结果函数:
# source_list字典中keys为扩展名，values为行数；
# file_list字典中keys为扩展名，values为相应类型的文件数；
def show_result(start_dir):
lines = 0
total = 0
text = ""
for i in source_list:
lines = source_list[i] # 读取不同类型代码的行数
total += lines # 累加到total中
text += "【%s】源文件 %d 个，源代码 %d 行\n" % (i, file_list[i], lines)
# 以上(i, file_list[i], lines)是(扩展名，文件数，该类型文件代码量)
# 如（py,10,5700）即10个py文件，总共5700行代码
title = '统计结果'
msg = '您目前共累积编写了 %d 行代码，完成进度：%.2f %%\n离 10 万行代码还差 %d 行，请继续努力！' % (total, total/1000, 100000-total)
g.textbox(msg, title, text)
# 统计行数函数：统计文件中的行数，file_name为文件名
def calc_code(file_name):
#以rb读取文件返回文件的编码(用到了chardet类)
with open(file_name, 'rb') as f:
raw = f.read()
result = chardet.detect(raw)
encoding = result['encoding']
lines = 0
with open(file_name,encoding=encoding) as f:
print('正在分析文件：%s ...' % file_name)
try:
for each_line in f:
lines += 1
except Exception as reason:
print(str(reason)) # 读取出错显示错误信息......
print('%s -> %s' % (file_name,lines))
return lines
# 根据指定路径搜索文件函数
def search_file(start_dir) :
os.chdir(start_dir) # 把指定路径改成工作路径，有了这行代码，后面文件操作会很简单
for each_file in os.listdir(os.curdir) :
ext = os.path.splitext(each_file)[1]
if ext in target :
lines = calc_code(each_file) # 调用统计行数函数
# 还记得异常的用法吗？如果字典中不存，抛出 KeyError，则添加字典键
# 统计文件数
try:
file_list[ext] += 1
except KeyError:
file_list[ext] = 1
# 统计源代码行数
try:
source_list[ext] += lines
except KeyError:
source_list[ext] = lines
# 如果路径还有文件夹，进入该文件夹继续搜索
if os.path.isdir(each_file) :
search_file(each_file) # 递归调用
os.chdir(os.pardir) # 递归调用后切记返回上一层目录(**这点很关键**)
target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm','.txt']
file_list = {} #字典file_list中 keys为扩展名，values为相应的文件数量
source_list = {} #字典source_listkeys为扩展名，values为代码行数
g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库：",title='打开文件夹',default="C:\Program Files\Python36")
search_file(path) # 搜索文件
show_result(path) # 显示结果

复制代码

跳转到最佳答案楼层

ba21 · 发表于 2017-7-31 09:52:45

下面代码忽略了一些编码无法正常读取的文件

try:
for each_line in f:
lines += 1
except UnicodeDecodeError:
pass # 不可避免会遇到格式不兼容的文件，这里忽略掉......

复制代码

ba21 · 发表于 2017-8-1 23:43:37

给你整了段解决文件编码问题的代码：
1,首先安装 https://pypi.python.org/pypi/chardet(3.0以上安装方法：下载.gz文件，解压后,进入chardet目录，执行 setup.py install )
2,代码修改处：

#以rb读取文件返回文件的编码(用到了chardet类)
with open(file_name, 'rb') as f:
raw = f.read()
result = chardet.detect(raw)
encoding = result['encoding']
lines = 0
with open(file_name,encoding=encoding) as f:
print('正在分析文件：%s ...' % file_name)
try:
for each_line in f:
lines += 1
except Exception as reason:
print(str(reason)) # 读取出错显示错误信息......
print('%s -> %s' % (file_name,lines))
return lines

复制代码

3,完整代码：

import easygui as g
import os
import chardet
# 显示结果函数:
# source_list字典中keys为扩展名，values为行数；
# file_list字典中keys为扩展名，values为相应类型的文件数；
def show_result(start_dir):
lines = 0
total = 0
text = ""
for i in source_list:
lines = source_list[i] # 读取不同类型代码的行数
total += lines # 累加到total中
text += "【%s】源文件 %d 个，源代码 %d 行\n" % (i, file_list[i], lines)
# 以上(i, file_list[i], lines)是(扩展名，文件数，该类型文件代码量)
# 如（py,10,5700）即10个py文件，总共5700行代码
title = '统计结果'
msg = '您目前共累积编写了 %d 行代码，完成进度：%.2f %%\n离 10 万行代码还差 %d 行，请继续努力！' % (total, total/1000, 100000-total)
g.textbox(msg, title, text)
# 统计行数函数：统计文件中的行数，file_name为文件名
def calc_code(file_name):
#以rb读取文件返回文件的编码(用到了chardet类)
with open(file_name, 'rb') as f:
raw = f.read()
result = chardet.detect(raw)
encoding = result['encoding']
lines = 0
with open(file_name,encoding=encoding) as f:
print('正在分析文件：%s ...' % file_name)
try:
for each_line in f:
lines += 1
except Exception as reason:
print(str(reason)) # 读取出错显示错误信息......
print('%s -> %s' % (file_name,lines))
return lines
# 根据指定路径搜索文件函数
def search_file(start_dir) :
os.chdir(start_dir) # 把指定路径改成工作路径，有了这行代码，后面文件操作会很简单
for each_file in os.listdir(os.curdir) :
ext = os.path.splitext(each_file)[1]
if ext in target :
lines = calc_code(each_file) # 调用统计行数函数
# 还记得异常的用法吗？如果字典中不存，抛出 KeyError，则添加字典键
# 统计文件数
try:
file_list[ext] += 1
except KeyError:
file_list[ext] = 1
# 统计源代码行数
try:
source_list[ext] += lines
except KeyError:
source_list[ext] = lines
# 如果路径还有文件夹，进入该文件夹继续搜索
if os.path.isdir(each_file) :
search_file(each_file) # 递归调用
os.chdir(os.pardir) # 递归调用后切记返回上一层目录(**这点很关键**)
target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm','.txt']
file_list = {} #字典file_list中 keys为扩展名，values为相应的文件数量
source_list = {} #字典source_listkeys为扩展名，values为代码行数
g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库：",title='打开文件夹',default="C:\Program Files\Python36")
search_file(path) # 搜索文件
show_result(path) # 显示结果

复制代码

小木船 · 发表于 2018-1-30 16:59:39

根据小甲鱼老师的课后作业参考答案，我敲了代码，计算文件行数那里，我找了3种方法，方法一和方法二明显不对，行数太少。方法三行数是对的。用到一个新的模块linecache，需要先导入：

import easygui as eg
import os
import linecache
def calc_code(filename):
lines = 0
with open(filename, 'r') as f:
print('正在计算文件%s的代码行数...'%filename)
try:
for each_line in f: #计算文件行数方法一
lines += 1
# lines = len(f.readlines()) #计算文件行数方法二
# lines = len(linecache.getlines(filename)) #计算文件行数方法三
except UnicodeDecodeError:
pass
return lines
def search_file(path):
os.chdir(path)
for each_file in os.listdir(os.curdir):
ext = os.path.splitext(each_file)[1]
if ext in target:
lines = calc_code(each_file)
try:
file_list[ext] += 1
except KeyError:
file_list[ext] = 1
try:
code_list[ext] += lines
except KeyError:
code_list[ext] = lines
if os.path.isdir(each_file):
search_file(each_file)
os.chdir(os.pardir)
def show_result(path):
total = 0
lines = 0
text = ''
for i in code_list:
lines = code_list[i]
total += lines
text += '【%s】源文件%d个，源代码%d行\n'%(i, file_list[i], lines)
msg = '您目前共累计编写了%d行代码，完成进度：%.2f%%\n离10万行代码还差%d行，请继续努力！'%(total, (total/100000)*100, 100000-total)
title = '统计结果'
eg.textbox(msg, title, text)
target = ['.py', '.java', '.c', '.pas', '.cpp', '.asm', '.h']
file_list = {}
code_list = {}
eg.msgbox('请打开您存放所有代码的文件夹......', '统计代码量')
path = eg.diropenbox('请选择您的代码库：')
search_file(path)
show_result(path)

复制代码

小木船 · 发表于 2018-1-30 17:04:41

代码运行结果

账号		自动登录	找回密码
密码			立即注册

[已解决]请教： 第035讲 EasyGui课后测试题中的第4题，为什么我统计的Py文件代码行数不对呢？

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块

[已解决]请教：第035讲 EasyGui课后测试题中的第4题，为什么我统计的Py文件代码行数不对呢？