第29课:一个任务。第1题。
原题目:1. 编写一个程序,比较用户输入的两个文件,如果不同,显示出所有不同处的行号与第一个不同字符的位置,程序实现如图:
标准答案(在本Python code 存储的文件夹位置,我自己新建了两个文本,a.txt 和 b.txt。 但 copy以下答案,运行后,报错)
def file_compare(file1, file2):
f1 = open(file1)
f2 = open(file2)
count = 0 # 统计行数
differ = [] # 统计不一样的数量
for line1 in f1:
line2 = f2.readline()
count += 1
if line1 != line2:
differ.append(count)
f1.close()
f2.close()
return differ
file1 = input('请输入需要比较的头一个文件名:')
file2 = input('请输入需要比较的另一个文件名:')
differ = file_compare(file1, file2)
if len(differ) == 0:
print('两个文件完全一样!')
else:
print('两个文件共有【%d】处不同:' % len(differ))
for each in differ:
print('第 %d 行不一样' % each)
报错内容:
请输入需要比较的头一个文件名:a.txt
请输入需要比较的另一个文件名:b.txt
Traceback (most recent call last):
File "F:/20210119b.py", line 20, in <module>
differ = file_compare(file1, file2)
File "F:/20210119b.py", line 7, in file_compare
for line1 in f1:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 2: illegal multibyte sequence
难道又是因为 “小甲鱼的代码是教学用的,考虑的都是理想条件,在容错性和代码精简方面不是很到位”?请高手帮助。 编码问题,第二行第三行open方法加个encoding='utf-8'的参数再试试 小甲鱼的课程里有说过怎么看报错信息吧。 本帖最后由 jackz007 于 2021-1-19 15:38 编辑
故伎重演
这两句
f1 = open(file1)
f2 = open(file2)
改为
f1 = open(file1 , encoding = 'UTF-8')
f2 = open(file2 , encoding = 'UTF-8')
小甲鱼的文件八成是在 Linux 系统下生成,所以,汉字采用的应该是 UTF-8 编码。
凡是读文本文件遇到编码问题,首先通过为 open() 添加 encoding = 'UTF-8' 选项进行解决 昨非 发表于 2021-1-19 15:33
编码问题,第二行第三行open方法加个encoding='utf-8'的参数再试试
牛!行了。
这个问题,看来很重要,没听小甲鱼提到过似的。 jackz007 发表于 2021-1-19 15:35
故伎重演
这两句
谢谢解释背后的缘由~ °蓝鲤歌蓝 发表于 2021-1-19 15:33
小甲鱼的课程里有说过怎么看报错信息吧。
哦哦,我实在记不住~ Peteryo01223 发表于 2021-1-19 16:07
牛!行了。
这个问题,看来很重要,没听小甲鱼提到过似的。
这个问题反反复复有人问
页:
[1]