鱼C论坛

 找回密码
 立即注册
查看: 1926|回复: 4

[已解决]python 新手,文件readline()报错

[复制链接]
发表于 2022-4-12 13:59:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
def file_compare(file1, file2):
    prefix = 'C:\\Learning_file\\'
    f1 = open(prefix + file1)
    f2 = open(prefix + file2)
    count = 0 # 统计行数
    differ = [] # 统计不一样的数量

    for line1 in f1:
        line2 = f2.readline()
        count += 1
        if line1 != line2:
            differ.append(count)

    f1.close()
    f2.close()
    return differ

file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')

differ = file_compare(file1, file2)

if len(differ) == 0:
    print('两个文件完全一样!')
else:
    print('两个文件共有【%d】处不同:' % len(differ))
    for each in differ:
        print('第 %d 行不一样' % each)
最佳答案
2022-4-12 18:57:15
电脑中的文本文件不可能是一种编码,编码检测机制才是最好的解决办法。

安装模块 cchardet 检测编码吧

  1. import cchardet as chardet

  2. def file_enc(file):
  3.     with open(file, "rb") as f:
  4.         msg = f.read()

  5.     enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}

  6.     return enc['encoding']


  7. def file_compare(file1, file2):
  8.     prefix = 'C:\\Learning_file\\'
  9.     f1 = open(prefix + file1, encoding=enc) # 然后以指定编码打开文件
  10.     f2 = open(prefix + file2, encoding=enc) # 然后以指定编码打开文件
  11.     count = 0 # 统计行数
  12.     differ = [] # 统计不一样的数量

  13.     for line1 in f1:
  14.         line2 = f2.readline()
  15.         count += 1
  16.         if line1 != line2:
  17.             differ.append(count)

  18.     f1.close()
  19.     f2.close()
  20.     return differ



  21. file1 = input('请输入需要比较的头一个文件名:')
  22. file2 = input('请输入需要比较的另一个文件名:')

  23. differ = file_compare(file1, file2)

  24. if len(differ) == 0:
  25.     print('两个文件完全一样!')
  26. else:
  27.     print('两个文件共有【%d】处不同:' % len(differ))
  28.     for each in differ:
  29.         print('第 %d 行不一样' % each)
复制代码
EU8Y_H09Q_8A30P(KKD(0PJ.png

这个怎么改,试了将open()里面加encoding = 'utf-8'然后还是报错

这个怎么改,试了将open()里面加encoding = 'utf-8'然后还是报错
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-4-12 14:01:51 | 显示全部楼层
  1. def file_compare(file1, file2):
  2.     prefix = 'C:\\Learning_file\\'
  3.     f1 = open(prefix + file1, encoding='utf-8')           # 改了这里
  4.     f2 = open(prefix + file2, encoding='utf-8')           # 改了这里
  5.     count = 0 # 统计行数
  6.     differ = [] # 统计不一样的数量

  7.     for line1 in f1:
  8.         line2 = f2.readline()
  9.         count += 1
  10.         if line1 != line2:
  11.             differ.append(count)

  12.     f1.close()
  13.     f2.close()
  14.     return differ

  15. file1 = input('请输入需要比较的头一个文件名:')
  16. file2 = input('请输入需要比较的另一个文件名:')

  17. differ = file_compare(file1, file2)

  18. if len(differ) == 0:
  19.     print('两个文件完全一样!')
  20. else:
  21.     print('两个文件共有【%d】处不同:' % len(differ))
  22.     for each in differ:
  23.         print('第 %d 行不一样' % each)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-4-12 14:26:20 | 显示全部楼层
我用的anaconda里的jupter,会不会是这个编译器的问题啊


请输入需要比较的头一个文件名:something.txt
请输入需要比较的另一个文件名:something2.txt
---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_7880\2847495758.py in <module>
     19 file2 = input('请输入需要比较的另一个文件名:')
     20
---> 21 differ = file_compare(file1, file2)
     22
     23 if len(differ) == 0:

~\AppData\Local\Temp\ipykernel_7880\2847495758.py in file_compare(file1, file2)
      6     differ = [] # 统计不一样的数量
      7
----> 8     for line1 in f1:
      9         line2 = f2.readline()
     10         count += 1

C:\Anaconda\envs\fish_c\lib\codecs.py in decode(self, input, final)
    320         # decode input (taking the buffer into account)
    321         data = self.buffer + input
--> 322         (result, consumed) = self._buffer_decode(data, self.errors, final)
    323         # keep undecoded input until the next call
    324         self.buffer = data[consumed:]

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-12 14:32:50 | 显示全部楼层
yixing 发表于 2022-4-12 14:26
我用的anaconda里的jupter,会不会是这个编译器的问题啊

跟那个无关,是编码问题
  1. def file_compare(file1, file2):
  2.     prefix = 'C:\\Learning_file\\'
  3.     f1 = open(prefix + file1, encoding='utf-8-sig')           # 改了这里
  4.     f2 = open(prefix + file2, encoding='utf-8-sig')           # 改了这里
  5.     count = 0 # 统计行数
  6.     differ = [] # 统计不一样的数量

  7.     for line1 in f1:
  8.         line2 = f2.readline()
  9.         count += 1
  10.         if line1 != line2:
  11.             differ.append(count)

  12.     f1.close()
  13.     f2.close()
  14.     return differ

  15. file1 = input('请输入需要比较的头一个文件名:')
  16. file2 = input('请输入需要比较的另一个文件名:')

  17. differ = file_compare(file1, file2)

  18. if len(differ) == 0:
  19.     print('两个文件完全一样!')
  20. else:
  21.     print('两个文件共有【%d】处不同:' % len(differ))
  22.     for each in differ:
  23.         print('第 %d 行不一样' % each)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-12 18:57:15 | 显示全部楼层    本楼为最佳答案   
电脑中的文本文件不可能是一种编码,编码检测机制才是最好的解决办法。

安装模块 cchardet 检测编码吧

  1. import cchardet as chardet

  2. def file_enc(file):
  3.     with open(file, "rb") as f:
  4.         msg = f.read()

  5.     enc = chardet.detect(msg) # 返回的是个字典 编码和准确度。如:{'encoding': 'UTF-8', 'confidence': 0.9900000095367432}

  6.     return enc['encoding']


  7. def file_compare(file1, file2):
  8.     prefix = 'C:\\Learning_file\\'
  9.     f1 = open(prefix + file1, encoding=enc) # 然后以指定编码打开文件
  10.     f2 = open(prefix + file2, encoding=enc) # 然后以指定编码打开文件
  11.     count = 0 # 统计行数
  12.     differ = [] # 统计不一样的数量

  13.     for line1 in f1:
  14.         line2 = f2.readline()
  15.         count += 1
  16.         if line1 != line2:
  17.             differ.append(count)

  18.     f1.close()
  19.     f2.close()
  20.     return differ



  21. file1 = input('请输入需要比较的头一个文件名:')
  22. file2 = input('请输入需要比较的另一个文件名:')

  23. differ = file_compare(file1, file2)

  24. if len(differ) == 0:
  25.     print('两个文件完全一样!')
  26. else:
  27.     print('两个文件共有【%d】处不同:' % len(differ))
  28.     for each in differ:
  29.         print('第 %d 行不一样' % each)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-29 09:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表