[已解决]我文件夹内大部分.py结尾的文件这个程序都读取不了，但是又有少量的又可以读取，很怪

嘻嘻咯咯 · 发表于 2018-6-11 20:45:35

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import easygui as g
import os

def show_result(start):
lines = 0
total = 0
text =''
for i in source_list: #键 i可以是.py或者.c等
      lines = source_list[i]  #键 i对应的值赋给lines
      total += lines
      text += '【%s】源文件%d个，源代码%d行\n'%(i,file_list[i],lines)
title = '统计结果'
msg = '''您目前共累积编写%d行代码，完成进度：%.2f %%\n
离10万行代码还差%d行，请继续努力！'''%(total,total/1000,100000-total)
g.textbox(msg,title,text)

def calc_code(file_name):
lines = 0
with open(file_name,'r') as f:
      print('正在分析文件：%s...'%file_name)
      try:
         for each_line in f:
            #print(each_line[:-1])
            lines += 1
      except (UnicodeDecodeError,OSError):
         pass #不可避免会遇到格式不兼容的文件，忽略掉...
return lines

def search_file(path):
os.chdir(path)

for each_file in os.listdir(os.curdir):
      ext = os.path.splitext(each_file)[1]
      if ext in target:
         lines = calc_code(each_file) #统计行数
         #如果字典中不存在，抛出keyError则添加字典键
         #统计文件数
         try:
            file_list[ext] += 1    #键 += 文件数
         except KeyError:
            file_list[ext] = 1
         #统计源代码行数
         try:
            source_list[ext] += lines  #键 += 行数
         except KeyError:
            source_list[ext] = lines
      if os.path.isdir(each_file):
         search_file(each_file)    #递归调用
         os.chdir(os.pardir) #递归调用后返回上一层目录
#return file_list,source_list

target = ['.py']
file_list = {}    #字典文件_列表
source_list = {} #字典原始资料_列表

g.msgbox('请打开您存放所有代码的文件夹...','统计代码量')
path = g.diropenbox('请选择您的代码库：')

search_file(path)
show_result(path)

下面是结果
正在分析文件：002课.py...
正在分析文件：002课后0题.py...
正在分析文件：002课后1题.py...
正在分析文件：004课内题.py...
正在分析文件：004课内题1改.py...
正在分析文件：004课内题2改.py...
正在分析文件：004课内题3改.py...
正在分析文件：004课内题3改最终.py...
正在分析文件：005课后题0题继续改004课.py...
正在分析文件：005课后题1题.py...
正在分析文件：006课1题.py...
正在分析文件：006课后题.py...
正在分析文件：006课改005课1题.py...
正在分析文件：008课后1题.py...
正在分析文件：008课堂.py...
正在分析文件：009课后0题.py...
正在分析文件：009课后1题、2题.py...
正在分析文件：009课堂.py...
正在分析文件：010课后题.py...
正在分析文件：014课后练习.py...
正在分析文件：015课后进制转换.py...
正在分析文件：016课后题.py...
正在分析文件：017课后练习.py...
正在分析文件：018课后.py...
正在分析文件：019课后.py...
正在分析文件：020课后.py...
正在分析文件：022课后.py...
正在分析文件：022课堂递归.py...
正在分析文件：023024课后.py...
正在分析文件：023课堂兔子.py...
正在分析文件：024课堂汉罗塔.py...
正在分析文件：025课后通讯录.py...
正在分析文件：026课后用户登录程序.py...
正在分析文件：036课堂例子.py...
正在分析文件：038课继承和多继承fish.py...
正在分析文件：039课组合例题水池pool.py...
正在分析文件：046课练习温度转换.py...
正在分析文件：047课练习自定义列表.py...
正在分析文件：029课后0题.py...
正在分析文件：029课后1题.py...
正在分析文件：029课后2题3题.py...
正在分析文件：029课后4题.py...
正在分析文件：029课堂.py...
正在分析文件：030课后0题.py...
正在分析文件：030课后1题.py...
正在分析文件：030课后2题.py...
正在分析文件：030课后3题.py...
正在分析文件：030课后4题.py...
正在分析文件：31课练习.py...
正在分析文件：033课后0题.py...
正在分析文件：033课后1题.py...
正在分析文件：033课后2题.py...
正在分析文件：033课后3题 .py...
正在分析文件：32课堂练习.py...
正在分析文件：034课后用户登录程序改1.py...
正在分析文件：034课后练习.py...
正在分析文件：34课练习.py...
正在分析文件：35课后0题.py...
正在分析文件：35课后1题.py...
正在分析文件：35课后2题.py...
正在分析文件：35课后3题 .py...
正在分析文件：35课第一个界面小游戏.py...
正在分析文件：digui_1.py...
正在分析文件：MyTimer.py...
正在分析文件：p51_2.py...
正在分析文件：cat.py...
正在分析文件：youdaofanyi.py...
正在分析文件：关于全局变量局部变量的实验.py...
正在分析文件：异常处理练习.py...
正在分析文件：练习.py...
正在分析文件：练习MyTimer.py...

【.py】源文件71个，源代码33行

最佳答案

月排行榜 / 总排行榜

ba21

2018-6-11 21:30:40

是不是上面的
except (UnicodeDecodeError,OSError):
pass #不可避免会遇到格式不兼容的文件，忽略掉...
跳过了？

cchardet 比chardet准确度高，速度快
使用中，cchardet.detect()返回字典，其中confidence是检测精确度，encoding是编码形式

1：先判断文件编码

import cchardet as chardet

with open('c:\\111.txt','rb') as f:
msg=f.read()

enc = chardet.detect(msg)
enc = enc['encoding']
print(enc)

2。以指定编码打开文件
with open("新建文本文档.txt", "r", encoding=enc) as f:
print(f.read())

跳转到最佳答案楼层

ba21 · 发表于 2018-6-11 21:28:45

读不了有什么提示？？？

ba21 · 发表于 2018-6-11 21:30:40

是不是上面的
except (UnicodeDecodeError,OSError):
pass #不可避免会遇到格式不兼容的文件，忽略掉...
跳过了？

cchardet 比chardet准确度高，速度快
使用中，cchardet.detect()返回字典，其中confidence是检测精确度，encoding是编码形式

1：先判断文件编码

import cchardet as chardet

with open('c:\\111.txt','rb') as f:
msg=f.read()

enc = chardet.detect(msg)
enc = enc['encoding']
print(enc)

2。以指定编码打开文件
with open("新建文本文档.txt", "r", encoding=enc) as f:
print(f.read())

塔利班 · 发表于 2018-6-11 22:01:00

total += lines
int型和字典加什么

嘻嘻咯咯 · 发表于 2018-6-11 22:10:05

ba21 发表于 2018-6-11 21:30
是不是上面的
except (UnicodeDecodeError,OSError):
pass #不可避免会遇到格式不兼容的文 ...

额~你这个方法怎么记录文件内的行数呢？

嘻嘻咯咯 · 发表于 2018-6-11 22:17:35

塔利班发表于 2018-6-11 22:01
total += lines
int型和字典加什么

def calc_code(file_name):
lines = 0
with open(file_name,'rb') as f:
      print('正在分析文件：%s...'%file_name)
      try:
         f.seek(0,0)
         for each_line in f:
            #print(each_line[:-1])
            lines += 1
      except UnicodeDecodeError:
         pass #不可避免会遇到格式不兼容的文件，忽略掉...
return lines
我这样写就准确统计出来了，用的  ‘’rb‘’ 而不是默认的 ‘r’

账号		自动登录	找回密码
密码			立即注册