鱼C论坛

 找回密码
 立即注册
查看: 3069|回复: 6

[已解决]想随便爬下学校的网站,发现recode时候会报错。提示utf8无法被解码。

[复制链接]
发表于 2015-12-23 00:15:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request
data=None
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36'}

url="http://www.eco.sdu.edu.cn/"
req = urllib.request.Request(url,data,headers)
response = urllib.request.urlopen(req)
print(response)

html=response.read().decode('utf-8')
print (html)

提示结果:'utf-8' codec can't decode byte 0xbb in position 255: invalid start byte
最佳答案
2015-12-23 00:52:14
楼主我今天测试煎蛋的也有这个问题,坐等人回答。论坛发代码的在发帖里高级工具里找找里面有,也可以用
复制代码
成对包含。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2015-12-23 00:16:19 | 显示全部楼层
另外,我也比较好奇怎么在论坛上直接发代码。求教。。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-12-23 00:52:14 From FishC Mobile | 显示全部楼层    本楼为最佳答案   
楼主我今天测试煎蛋的也有这个问题,坐等人回答。论坛发代码的在发帖里高级工具里找找里面有,也可以用
复制代码
成对包含。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-12-23 10:07:13 | 显示全部楼层
额,拿手机回复的,没想到会这样,那个新手专区有解释。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-12-23 14:42:36 | 显示全部楼层
检查元素
网页head第一行
  1. <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
复制代码

所以请decode('gbk')
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-12-23 21:24:23 | 显示全部楼层
FDMa 发表于 2015-12-23 14:42
检查元素
网页head第一行

谢谢!授人以渔!太棒了~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-12-23 22:16:15 | 显示全部楼层
65230215 发表于 2015-12-23 21:24
谢谢!授人以渔!太棒了~

有一个偷懒的办法,写小程序的时候可以耍耍,大项目就不要这样写
  1. response.read().decode()
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-18 21:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表