[已解决]第35讲第04题小甲鱼给的答案不对？

mannono5 · 发表于 2020-11-5 09:49:23

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

rt
统计不了正确的行数？我有一个文件夹里面就放一个后续为.py的文件，里面有几十行，但是最后统计出来为0行，为什么？谢谢！

代码如下：

import easygui as g
import os

def show_result(start_dir):
lines = 0
total = 0
text = ""

for i in source_list:
      lines = source_list[i]
      total += lines
      text += "【%s】源文件 %d 个，源代码 %d 行\n" % (i, file_list[i], lines)
title = '统计结果'
msg = '您目前共累积编写了 %d 行代码，完成进度：%.2f %%\n离 10 万行代码还差 %d 行，请继续努力！' % (total, total/1000, 100000-total)
g.textbox(msg, title, text)

def calc_code(file_name):
lines = 0
with open(file_name) as f:
      print('正在分析文件：%s ...' % file_name)
      try:
         for each_line in f:
            lines += 1
      except UnicodeDecodeError:
         pass # 不可避免会遇到格式不兼容的文件，这里忽略掉......
return lines

def search_file(start_dir) :
os.chdir(start_dir)

for each_file in os.listdir(os.curdir) :
      ext = os.path.splitext(each_file)[1]
      if ext in target :
         lines = calc_code(each_file) # 统计行数
         # 还记得异常的用法吗？如果字典中不存，抛出 KeyError，则添加字典键
         # 统计文件数
         try:
            file_list[ext] += 1
         except KeyError:
            file_list[ext] = 1
         # 统计源代码行数
         try:
            source_list[ext] += lines
         except KeyError:
            source_list[ext] = lines

      if os.path.isdir(each_file) :
         search_file(each_file) # 递归调用
         os.chdir(os.pardir) # 递归调用后切记返回上一层目录

target = ['.c', '.cpp', '.py', '.cc', '.java', '.pas', '.asm']
file_list = {}
source_list = {}

g.msgbox("请打开您存放所有代码的文件夹......", "统计代码量")
path = g.diropenbox("请选择您的代码库：")

search_file(path)
show_result(path)

最佳答案

月排行榜 / 总排行榜

txxcat

2020-11-5 14:38:47

Python3.0以上的源文件是UTF-8编码的，而open()默认打开方式是GBK，所以正常情况下读取文件会触发 UnicodeDecodeError，但是代码中加入了：

try:
except UnicodeDecodeError:
pass

复制代码

结果就会忽略掉这个错误，不会有任何提示，行数也不会被统计出来了。
一种方法是改成：

with open(file_name,encoding='utf-8') as f:

复制代码

这样你的py文件能被正确读取，但是碰到GBK的文件会被忽略。
第二种方法是加入代码，出现UnicodeDecodeError就换一种方式打开文件，参见：https://fishc.com.cn/thread-161105-1-1.html

跳转到最佳答案楼层

BngThea · 发表于 2020-11-5 11:12:54

有可能因为编码问题触发了异常呢

txxcat · 发表于 2020-11-5 14:38:47

这个最佳答案由 txxcat 给出，感谢 txxcat 的回答。

单击隐藏图章

Python3.0以上的源文件是UTF-8编码的，而open()默认打开方式是GBK，所以正常情况下读取文件会触发 UnicodeDecodeError，但是代码中加入了：

try:
except UnicodeDecodeError:
pass

复制代码

结果就会忽略掉这个错误，不会有任何提示，行数也不会被统计出来了。
一种方法是改成：

with open(file_name,encoding='utf-8') as f:

复制代码

这样你的py文件能被正确读取，但是碰到GBK的文件会被忽略。
第二种方法是加入代码，出现UnicodeDecodeError就换一种方式打开文件，参见：https://fishc.com.cn/thread-161105-1-1.html

mannono5 · 发表于 2020-11-7 07:02:10

txxcat 发表于 2020-11-5 14:38
Python3.0以上的源文件是UTF-8编码的，而open()默认打开方式是GBK，所以正常情况下读取文件会触发 UnicodeD ...

谢谢，可以了

mannono5 · 发表于 2020-11-7 07:02:56

BngThea 发表于 2020-11-5 11:12
有可能因为编码问题触发了异常呢

谢谢

账号		自动登录	找回密码
密码			立即注册

[已解决]第35讲 第04题 小甲鱼给的答案不对？

马上注册，结交更多好友，享用更多功能^_^

[已解决]第35讲第04题小甲鱼给的答案不对？