鱼C论坛

 找回密码
 立即注册
查看: 436|回复: 3

53课最后一题

[复制链接]
发表于 2018-9-9 20:51:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request
import chardet
i = 1
with open('urls.txt','r') as f:
    while i <= 5:
        URL = f.readline()
        response = urllib.request.urlopen(URL)
        answer = response.read()
        type_encode = chardet.detect(answer)['encoding']
        answer = answer.decode(type_encode)
        file_name = 'url_%d.txt'%i
        i += 1
        file_URL = open(file_name,'w',encoding=type_encode)
        file_URL.write(answer)
        file_URL.close()

以上是我写的代码(没有红字部分)用于读取网页并保存,却一直跳出问题
UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position
对比答案后发现少了红字这部分代码..answer之前不是已经解码了吗,为什么会在
写入过程中还有'xbb'啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-9-9 21:35:03 | 显示全部楼层
楼主 我正学习C语言 需要一个VIP账号查看课后作业 求帮忙
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-9 23:15:40 From FishC Mobile | 显示全部楼层
gbk解不了,试试utf-8吧,
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-10 08:52:54 | 显示全部楼层
拉了盏灯 发表于 2018-9-9 23:15
gbk解不了,试试utf-8吧,

红字部分不是解码过程啊,是在解码完之后写入文本过程中发生的解码错误...而且python默认解码就是utf-8吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-7 00:16

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表