S先森 发表于 2020-7-4 18:06:53

29讲作业1

firstfile = input('请输入需要比较的头一个文件名:')
secondfile = input('请输入需要比较的另一个文件名:')
f = open('D:\\桌面\\'+ firstfile)
g = open('D:\\桌面\\'+ secondfile)
different = []
count = 1
for line0 in f:
    line1 = g.readline()
    if line0 != line1:
      different.append(count)
    count += 1
f.close()
g.close()
print('两个文件共有【%d】处不同:'%len(different))
for i in different:
    print('第%d行不一样'%different)
      
报错:
请输入需要比较的头一个文件名:record0.txt
请输入需要比较的另一个文件名:record1.txt
回溯(最后调用):
File "D:\桌面\py练习代码\作业1.py", line 7, in <module>
    for line0 in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence

Twilight6 发表于 2020-7-4 18:07:53


在 open 里面加上 encoding ='utf-8'参数试试,更改下编码:

f = open('D:\\桌面\\'+ firstfile,encoding='utf-8')
g = open('D:\\桌面\\'+ secondfile,encoding='utf-8')

S先森 发表于 2020-7-4 18:11:55

Twilight6 发表于 2020-7-4 18:07
在 open 里面加上 encoding ='utf-8'参数试试,更改下编码:

可以了!这是为什么啊??

Twilight6 发表于 2020-7-4 18:36:21

S先森 发表于 2020-7-4 18:11
可以了!这是为什么啊??

文件编码 和我们打开的编码不一致,导致解码过程中字节长度对应不上去,解码失败,就算成功,也是乱码

S先森 发表于 2020-7-4 20:00:43

Twilight6 发表于 2020-7-4 18:36
文件编码 和我们打开的编码不一致,导致解码过程中字节长度对应不上去,解码失败,就算成功,也是乱码

再请教一个问题:
for i in different:
    print('第%d行不一样'%different)

报错:
回溯(最后调用):
File "D:\桌面\py练习代码\作业1.py", line 16, in <module>
    print('第%d行不一样'%different)
IndexError: list index out of range
页: [1]
查看完整版本: 29讲作业1