Peteryo01223 发表于 2021-1-19 15:27:43

第29课:一个任务。第1题。

原题目:
1. 编写一个程序,比较用户输入的两个文件,如果不同,显示出所有不同处的行号与第一个不同字符的位置,程序实现如图:

标准答案(在本Python code 存储的文件夹位置,我自己新建了两个文本,a.txt 和 b.txt。 但 copy以下答案,运行后,报错)
def file_compare(file1, file2):
    f1 = open(file1)
    f2 = open(file2)
    count = 0 # 统计行数
    differ = [] # 统计不一样的数量

    for line1 in f1:
      line2 = f2.readline()
      count += 1
      if line1 != line2:
            differ.append(count)

    f1.close()
    f2.close()
    return differ

file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')

differ = file_compare(file1, file2)

if len(differ) == 0:
    print('两个文件完全一样!')
else:
    print('两个文件共有【%d】处不同:' % len(differ))
    for each in differ:
      print('第 %d 行不一样' % each)


报错内容:
请输入需要比较的头一个文件名:a.txt
请输入需要比较的另一个文件名:b.txt
Traceback (most recent call last):
File "F:/20210119b.py", line 20, in <module>
    differ = file_compare(file1, file2)
File "F:/20210119b.py", line 7, in file_compare
    for line1 in f1:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 2: illegal multibyte sequence
难道又是因为 “小甲鱼的代码是教学用的,考虑的都是理想条件,在容错性和代码精简方面不是很到位”?请高手帮助。

昨非 发表于 2021-1-19 15:33:23

编码问题,第二行第三行open方法加个encoding='utf-8'的参数再试试

°蓝鲤歌蓝 发表于 2021-1-19 15:33:34

小甲鱼的课程里有说过怎么看报错信息吧。

jackz007 发表于 2021-1-19 15:35:10

本帖最后由 jackz007 于 2021-1-19 15:38 编辑

      故伎重演
      这两句
    f1 = open(file1)
    f2 = open(file2)
      改为
    f1 = open(file1 , encoding = 'UTF-8')
    f2 = open(file2 , encoding = 'UTF-8')
      小甲鱼的文件八成是在 Linux 系统下生成,所以,汉字采用的应该是 UTF-8 编码。
      凡是读文本文件遇到编码问题,首先通过为 open() 添加 encoding = 'UTF-8' 选项进行解决

Peteryo01223 发表于 2021-1-19 16:07:24

昨非 发表于 2021-1-19 15:33
编码问题,第二行第三行open方法加个encoding='utf-8'的参数再试试

牛!行了。
这个问题,看来很重要,没听小甲鱼提到过似的。

Peteryo01223 发表于 2021-1-19 16:08:09

jackz007 发表于 2021-1-19 15:35
故伎重演
      这两句



谢谢解释背后的缘由~

Peteryo01223 发表于 2021-1-19 16:08:43

°蓝鲤歌蓝 发表于 2021-1-19 15:33
小甲鱼的课程里有说过怎么看报错信息吧。

哦哦,我实在记不住~

昨非 发表于 2021-1-19 16:12:06

Peteryo01223 发表于 2021-1-19 16:07
牛!行了。
这个问题,看来很重要,没听小甲鱼提到过似的。

这个问题反反复复有人问
页: [1]
查看完整版本: 第29课:一个任务。第1题。