|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
1.小甲鱼讲的是关于爬取百度贴吧某一页的图片网址
2.我是按照小甲鱼的代码写的
3.运行没有报错,但是也没有输出图片网址
4.附上图片及源代码
# 爬取百度贴吧图片网址
import urllib.request
import re
# 打开网址(1)
def open_url(url):
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36')
response = urllib.request.urlopen(req)
html = response.read(300).decode('utf-8')
return html
# 获取图片网址(2)
def get_img(html):
p = r'<img class="BDE_Image" src="([^"]+\.jpg)"'
imglist = re.findall(p,html)
for each in imglist:
print(each)
# 调用函数(3)
if __name__ == '__main()__':
url = "https://tieba.baidu.com/p/5283758736"
get_img(open_url(url))
|
-
小甲鱼的代码
-
我自己写的代码的运行结果
-
我自己写的代码
-
小甲鱼代码的运行结果
|