FK二十一 发表于 2021-10-4 13:05:22

顽固的字节

想知道大家遇到遍历文件时出现的多字节错误是怎么处理的。
如果用
       count=0
       try:
                for line in file:
                        count+=1
       except BaseException :
                        pass
那么在统计文件行数count时,因为for语句报错,导致直接pass,count=0. 。。。
所以我现在的处理方法是open(file,errors='ignore')
但是在计算count时发现总会虚高出几行,差不多三四行这样子(文件大概是四五十行这样)。
就是没有办法准确的计数,不知道大家是怎么处理的。



FK二十一 发表于 2021-10-4 13:10:57

虚高的问题应该是文件打开时因为太长自动换行了,导致多了几行。要怎么关闭自动换行嘞。。。

大马强 发表于 2021-10-4 13:21:17

发发代码

hrpzcf 发表于 2021-10-4 13:28:12

本帖最后由 hrpzcf 于 2021-10-4 13:30 编辑

读取文件出错绝大多数是因为打开的文件编码不对,而且文本文件本身不存在自动换行这个说法。

白two 发表于 2021-10-4 15:46:15

本帖最后由 白two 于 2021-10-4 15:47 编辑

打开的时候分行打开,例如:

f = open('name.txt', 'r', encoding='utf8')
name = f.read().splitlines()

FK二十一 发表于 2021-10-4 18:49:20

感谢
{:10_254:}{:10_254:}{:10_254:}
页: [1]
查看完整版本: 顽固的字节