鱼C论坛

 找回密码
 立即注册
查看: 1765|回复: 4

[已解决]python 新手,文件readline()报错

[复制链接]
发表于 2022-4-12 13:59:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
def file_compare(file1, file2):
    prefix = 'C:\\Learning_file\\'
    f1 = open(prefix + file1)
    f2 = open(prefix + file2)
    count = 0 # 统计行数
    differ = [] # 统计不一样的数量

    for line1 in f1:
        line2 = f2.readline()
        count += 1
        if line1 != line2:
            differ.append(count)

    f1.close()
    f2.close()
    return differ

file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')

differ = file_compare(file1, file2)

if len(differ) == 0:
    print('两个文件完全一样!')
else:
    print('两个文件共有【%d】处不同:' % len(differ))
    for each in differ:
        print('第 %d 行不一样' % each)
最佳答案
2022-4-12 18:57:15
电脑中的文本文件不可能是一种编码,编码检测机制才是最好的解决办法。

安装模块 cchardet 检测编码吧
import cchardet as chardet

def file_enc(file):
    with open(file, "rb") as f:
        msg = f.read()

    enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}

    return enc['encoding']


def file_compare(file1, file2):
    prefix = 'C:\\Learning_file\\'
    f1 = open(prefix + file1, encoding=enc) # 然后以指定编码打开文件
    f2 = open(prefix + file2, encoding=enc) # 然后以指定编码打开文件
    count = 0 # 统计行数
    differ = [] # 统计不一样的数量

    for line1 in f1:
        line2 = f2.readline()
        count += 1
        if line1 != line2:
            differ.append(count)

    f1.close()
    f2.close()
    return differ



file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')

differ = file_compare(file1, file2)

if len(differ) == 0:
    print('两个文件完全一样!')
else:
    print('两个文件共有【%d】处不同:' % len(differ))
    for each in differ:
        print('第 %d 行不一样' % each)
EU8Y_H09Q_8A30P(KKD(0PJ.png

这个怎么改,试了将open()里面加encoding = 'utf-8'然后还是报错

这个怎么改,试了将open()里面加encoding = 'utf-8'然后还是报错
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-4-12 14:01:51 | 显示全部楼层
def file_compare(file1, file2):
    prefix = 'C:\\Learning_file\\'
    f1 = open(prefix + file1, encoding='utf-8')           # 改了这里
    f2 = open(prefix + file2, encoding='utf-8')           # 改了这里
    count = 0 # 统计行数
    differ = [] # 统计不一样的数量

    for line1 in f1:
        line2 = f2.readline()
        count += 1
        if line1 != line2:
            differ.append(count)

    f1.close()
    f2.close()
    return differ

file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')

differ = file_compare(file1, file2)

if len(differ) == 0:
    print('两个文件完全一样!')
else:
    print('两个文件共有【%d】处不同:' % len(differ))
    for each in differ:
        print('第 %d 行不一样' % each)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-4-12 14:26:20 | 显示全部楼层
我用的anaconda里的jupter,会不会是这个编译器的问题啊


请输入需要比较的头一个文件名:something.txt
请输入需要比较的另一个文件名:something2.txt
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_7880\2847495758.py in <module>
     19 file2 = input('请输入需要比较的另一个文件名:')
     20
---> 21 differ = file_compare(file1, file2)
     22
     23 if len(differ) == 0:

~\AppData\Local\Temp\ipykernel_7880\2847495758.py in file_compare(file1, file2)
      6     differ = [] # 统计不一样的数量
      7
----> 8     for line1 in f1:
      9         line2 = f2.readline()
     10         count += 1

C:\Anaconda\envs\fish_c\lib\codecs.py in decode(self, input, final)
    320         # decode input (taking the buffer into account)
    321         data = self.buffer + input
--> 322         (result, consumed) = self._buffer_decode(data, self.errors, final)
    323         # keep undecoded input until the next call
    324         self.buffer = data[consumed:]

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-12 14:32:50 | 显示全部楼层
yixing 发表于 2022-4-12 14:26
我用的anaconda里的jupter,会不会是这个编译器的问题啊

跟那个无关,是编码问题
def file_compare(file1, file2):
    prefix = 'C:\\Learning_file\\'
    f1 = open(prefix + file1, encoding='utf-8-sig')           # 改了这里
    f2 = open(prefix + file2, encoding='utf-8-sig')           # 改了这里
    count = 0 # 统计行数
    differ = [] # 统计不一样的数量

    for line1 in f1:
        line2 = f2.readline()
        count += 1
        if line1 != line2:
            differ.append(count)

    f1.close()
    f2.close()
    return differ

file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')

differ = file_compare(file1, file2)

if len(differ) == 0:
    print('两个文件完全一样!')
else:
    print('两个文件共有【%d】处不同:' % len(differ))
    for each in differ:
        print('第 %d 行不一样' % each)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-12 18:57:15 | 显示全部楼层    本楼为最佳答案   
电脑中的文本文件不可能是一种编码,编码检测机制才是最好的解决办法。

安装模块 cchardet 检测编码吧
import cchardet as chardet

def file_enc(file):
    with open(file, "rb") as f:
        msg = f.read()

    enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}

    return enc['encoding']


def file_compare(file1, file2):
    prefix = 'C:\\Learning_file\\'
    f1 = open(prefix + file1, encoding=enc) # 然后以指定编码打开文件
    f2 = open(prefix + file2, encoding=enc) # 然后以指定编码打开文件
    count = 0 # 统计行数
    differ = [] # 统计不一样的数量

    for line1 in f1:
        line2 = f2.readline()
        count += 1
        if line1 != line2:
            differ.append(count)

    f1.close()
    f2.close()
    return differ



file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')

differ = file_compare(file1, file2)

if len(differ) == 0:
    print('两个文件完全一样!')
else:
    print('两个文件共有【%d】处不同:' % len(differ))
    for each in differ:
        print('第 %d 行不一样' % each)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-11 18:43

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表