鱼C论坛

 找回密码
 立即注册
查看: 1270|回复: 5

[已解决]我文件夹内大部分.py结尾的文件这个程序都读取不了,但是又有少量的又可以读取,很怪

[复制链接]
发表于 2018-6-11 20:45:35 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import easygui as g
import os

def show_result(start):
    lines = 0
    total = 0
    text =''
    for i in source_list:   #键 i可以是.py或者.c等
        lines = source_list  #键 i对应的值赋给lines
        total += lines
        text += '【%s】源文件%d个,源代码%d行\n'%(i,file_list,lines)
    title = '统计结果'
    msg = '''您目前共累积编写%d行代码,完成进度:%.2f %%\n
    离10万行代码还差%d行,请继续努力!'''%(total,total/1000,100000-total)
    g.textbox(msg,title,text)

def calc_code(file_name):
    lines = 0
    with open(file_name,'r') as f:
        print('正在分析文件:%s...'%file_name)
        try:
            for each_line in f:
                #print(each_line[:-1])
                lines += 1
        except (UnicodeDecodeError,OSError):
            pass #不可避免会遇到格式不兼容的文件,忽略掉...
    return lines

def search_file(path):
    os.chdir(path)
   
    for each_file in os.listdir(os.curdir):
        ext = os.path.splitext(each_file)[1]
        if ext in target:
            lines = calc_code(each_file)    #统计行数
            #如果字典中不存在,抛出keyError则添加字典键
            #统计文件数
            try:
                file_list[ext] += 1     #键 += 文件数
            except KeyError:
                file_list[ext] = 1
            #统计源代码行数
            try:
                source_list[ext] += lines  #键 += 行数
            except KeyError:
                source_list[ext] = lines
        if os.path.isdir(each_file):
            search_file(each_file)      #递归调用
            os.chdir(os.pardir)    #递归调用后返回上一层目录
    #return file_list,source_list

target = ['.py']
file_list = {}      #字典 文件_列表
source_list = {}   #字典 原始资料_列表

g.msgbox('请打开您存放所有代码的文件夹...','统计代码量')
path = g.diropenbox('请选择您的代码库:')

search_file(path)
show_result(path)



下面是结果

正在分析文件:002课.py...
正在分析文件:002课后0题.py...
正在分析文件:002课后1题.py...
正在分析文件:004课内题.py...
正在分析文件:004课内题1改.py...
正在分析文件:004课内题2改.py...
正在分析文件:004课内题3改.py...
正在分析文件:004课内题3改最终.py...
正在分析文件:005课后题0题继续改004课.py...
正在分析文件:005课后题1题.py...
正在分析文件:006课1题.py...
正在分析文件:006课后题.py...
正在分析文件:006课改005课1题.py...
正在分析文件:008课后1题.py...
正在分析文件:008课堂.py...
正在分析文件:009课后0题.py...
正在分析文件:009课后1题、2题.py...
正在分析文件:009课堂.py...
正在分析文件:010课后题.py...
正在分析文件:014课后练习.py...
正在分析文件:015课后进制转换.py...
正在分析文件:016课后题.py...
正在分析文件:017课后练习.py...
正在分析文件:018课后.py...
正在分析文件:019课后.py...
正在分析文件:020课后.py...
正在分析文件:022课后.py...
正在分析文件:022课堂递归.py...
正在分析文件:023024课后.py...
正在分析文件:023课堂兔子.py...
正在分析文件:024课堂汉罗塔.py...
正在分析文件:025课后通讯录.py...
正在分析文件:026课后用户登录程序.py...
正在分析文件:036课堂例子.py...
正在分析文件:038课继承和多继承fish.py...
正在分析文件:039课组合例题水池pool.py...
正在分析文件:046课练习温度转换.py...
正在分析文件:047课练习自定义列表.py...
正在分析文件:029课后0题.py...
正在分析文件:029课后1题.py...
正在分析文件:029课后2题3题.py...
正在分析文件:029课后4题.py...
正在分析文件:029课堂.py...
正在分析文件:030课后0题.py...
正在分析文件:030课后1题.py...
正在分析文件:030课后2题.py...
正在分析文件:030课后3题.py...
正在分析文件:030课后4题.py...
正在分析文件:31课练习.py...
正在分析文件:033课后0题.py...
正在分析文件:033课后1题.py...
正在分析文件:033课后2题.py...
正在分析文件:033课后3题 .py...
正在分析文件:32课堂练习.py...
正在分析文件:034课后用户登录程序改1.py...
正在分析文件:034课后练习.py...
正在分析文件:34课练习.py...
正在分析文件:35课后0题.py...
正在分析文件:35课后1题.py...
正在分析文件:35课后2题.py...
正在分析文件:35课后3题 .py...
正在分析文件:35课第一个界面小游戏.py...
正在分析文件:digui_1.py...
正在分析文件:MyTimer.py...
正在分析文件:p51_2.py...
正在分析文件:cat.py...
正在分析文件:youdaofanyi.py...
正在分析文件:关于全局变量局部变量的实验.py...
正在分析文件:异常处理练习.py...
正在分析文件:练习.py...
正在分析文件:练习MyTimer.py...

【.py】源文件71个,源代码33行
最佳答案
2018-6-11 21:30:40
是不是上面的
except (UnicodeDecodeError,OSError):
            pass #不可避免会遇到格式不兼容的文件,忽略掉...
跳过了?

cchardet 比chardet准确度高,速度快
使用中,cchardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

1:先判断文件编码

import cchardet as chardet

with open('c:\\111.txt','rb') as f:
        msg=f.read()

enc = chardet.detect(msg)
enc = enc['encoding']
print(enc)



2。 以指定编码打开文件
with open("新建文本文档.txt", "r", encoding=enc) as f:
    print(f.read())

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-6-11 21:28:45 | 显示全部楼层
读不了有什么提示???
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-6-11 21:30:40 | 显示全部楼层    本楼为最佳答案   
是不是上面的
except (UnicodeDecodeError,OSError):
            pass #不可避免会遇到格式不兼容的文件,忽略掉...
跳过了?

cchardet 比chardet准确度高,速度快
使用中,cchardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

1:先判断文件编码

import cchardet as chardet

with open('c:\\111.txt','rb') as f:
        msg=f.read()

enc = chardet.detect(msg)
enc = enc['encoding']
print(enc)



2。 以指定编码打开文件
with open("新建文本文档.txt", "r", encoding=enc) as f:
    print(f.read())

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-6-11 22:01:00 | 显示全部楼层
total += lines
int型和字典加什么
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-6-11 22:10:05 | 显示全部楼层
ba21 发表于 2018-6-11 21:30
是不是上面的
except (UnicodeDecodeError,OSError):
            pass #不可避免会遇到格式不兼容的文 ...

额~你这个方法怎么记录文件内的行数呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-6-11 22:17:35 | 显示全部楼层
塔利班 发表于 2018-6-11 22:01
total += lines
int型和字典加什么

def calc_code(file_name):
    lines = 0
    with open(file_name,'rb') as f:
        print('正在分析文件:%s...'%file_name)
        try:
            f.seek(0,0)
            for each_line in f:
                #print(each_line[:-1])
                lines += 1
        except UnicodeDecodeError:
            pass #不可避免会遇到格式不兼容的文件,忽略掉...
    return lines
我这样写就准确统计出来了,用的  ‘’rb‘’   而不是默认的 ‘r’
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-25 03:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表