鱼C论坛

 找回密码
 立即注册
查看: 1683|回复: 5

代码找错

[复制链接]
发表于 2017-12-15 15:38:27 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
第60课上课的内容,完全照着敲的代码,但是报错了,不会改,求大神帮忙,把代码粘贴如下

import urllib.request
import re


def open_url(url):
    req=urllib.request.Request(url)
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/57.0')
    page=urllib.request.urlopen(req)
    html=page.read().decode('utf-8')

    return html

def get_img(html):
    p=r'<img class="BDE_Image" src="([^"]+\.jpg)"'
    imglist=re.findall(p,html)

    for each in imglist:
        filename=each.split("/")[-1]
        urllib.request.urlretrieve(each,filename,None)


if __name__=='__main__':
    url="http://tieba.baidu.com/p/3563409202"
    get_img(open_url(url))
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-12-15 15:42:39 | 显示全部楼层
错误信息?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-12-15 15:58:15 | 显示全部楼层
你添加的头部信息req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/57.0')
换一个,这个可能是过期了。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-12-15 16:05:29 | 显示全部楼层
代码是没有什么错误,原因是你在加入自定义头的时候
'User-Agent','Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/57.0'
里面带有  中文字符
你可以尝试注释这一句。或都找到其中的中文字符改英文即可
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-12-27 11:07:03 | 显示全部楼层
°蓝鲤歌蓝 发表于 2017-12-15 15:58
你添加的头部信息req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefo ...

但我就是用我现在用的火狐浏览器获取的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-12-27 11:13:30 | 显示全部楼层
liaoyx 发表于 2017-12-27 11:07
但我就是用我现在用的火狐浏览器获取的

就是这个头的问题。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-23 03:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表