鱼C论坛

 找回密码
 立即注册
查看: 2797|回复: 7

[已解决]第29课:一个任务。第1题。

[复制链接]
发表于 2021-1-19 15:27:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
原题目:
1. 编写一个程序,比较用户输入的两个文件,如果不同,显示出所有不同处的行号与第一个不同字符的位置,程序实现如图:

标准答案(在本Python code 存储的文件夹位置,我自己新建了两个文本,a.txt 和 b.txt。 但 copy以下答案,运行后,报错)
  1. def file_compare(file1, file2):
  2.     f1 = open(file1)
  3.     f2 = open(file2)
  4.     count = 0 # 统计行数
  5.     differ = [] # 统计不一样的数量

  6.     for line1 in f1:
  7.         line2 = f2.readline()
  8.         count += 1
  9.         if line1 != line2:
  10.             differ.append(count)

  11.     f1.close()
  12.     f2.close()
  13.     return differ

  14. file1 = input('请输入需要比较的头一个文件名:')
  15. file2 = input('请输入需要比较的另一个文件名:')

  16. differ = file_compare(file1, file2)

  17. if len(differ) == 0:
  18.     print('两个文件完全一样!')
  19. else:
  20.     print('两个文件共有【%d】处不同:' % len(differ))
  21.     for each in differ:
  22.         print('第 %d 行不一样' % each)
复制代码


报错内容:
  1. 请输入需要比较的头一个文件名:a.txt
  2. 请输入需要比较的另一个文件名:b.txt
  3. Traceback (most recent call last):
  4.   File "F:/20210119b.py", line 20, in <module>
  5.     differ = file_compare(file1, file2)
  6.   File "F:/20210119b.py", line 7, in file_compare
  7.     for line1 in f1:
  8. UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 2: illegal multibyte sequence
复制代码

难道又是因为 “小甲鱼的代码是教学用的,考虑的都是理想条件,在容错性和代码精简方面不是很到位”?请高手帮助。
最佳答案
2021-1-19 15:33:23
编码问题,第二行第三行open方法加个encoding='utf-8'的参数再试试
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2021-1-19 15:33:23 | 显示全部楼层    本楼为最佳答案   
编码问题,第二行第三行open方法加个encoding='utf-8'的参数再试试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-1-19 15:33:34 | 显示全部楼层
小甲鱼的课程里有说过怎么看报错信息吧。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-1-19 15:35:10 | 显示全部楼层
本帖最后由 jackz007 于 2021-1-19 15:38 编辑

        故伎重演
        这两句
  1.     f1 = open(file1)
  2.     f2 = open(file2)
复制代码

        改为
  1.     f1 = open(file1 , encoding = 'UTF-8')
  2.     f2 = open(file2 , encoding = 'UTF-8')
复制代码

        小甲鱼的文件八成是在 Linux 系统下生成,所以,汉字采用的应该是 UTF-8 编码。
        凡是读文本文件遇到编码问题,首先通过为 open() 添加 encoding = 'UTF-8' 选项进行解决
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2021-1-19 16:07:24 | 显示全部楼层
昨非 发表于 2021-1-19 15:33
编码问题,第二行第三行open方法加个encoding='utf-8'的参数再试试

牛!行了。
这个问题,看来很重要,没听小甲鱼提到过似的。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-1-19 16:08:09 | 显示全部楼层
jackz007 发表于 2021-1-19 15:35
故伎重演
        这两句

谢谢解释背后的缘由~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-1-19 16:08:43 | 显示全部楼层
°蓝鲤歌蓝 发表于 2021-1-19 15:33
小甲鱼的课程里有说过怎么看报错信息吧。

哦哦,我实在记不住~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-1-19 16:12:06 | 显示全部楼层
Peteryo01223 发表于 2021-1-19 16:07
牛!行了。
这个问题,看来很重要,没听小甲鱼提到过似的。

这个问题反反复复有人问
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-26 15:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表