爬虫-斗图网表情爬取

396355023 · 发表于 2019-4-12 16:26:40

您需要登录才可以下载或查看，没有账号？立即注册

x

新人第一条虫。有不足的地方请指正。

import requests
import re
def getDouTu(page):
url = requests.get('https://www.doutula.com/article/list/?page={}'.format(page)).text
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like\
Gecko) Chrome/55.0.2883.87 Safari/537.36"}
reg = r'data-original="(.*?)".*?alt="(.*?)"'
reg = re.compile(reg, re.S)
imagesList = re.findall(reg, url)
for i in imagesList:
image_url = i[0]
image_title = i[1]
print(image_url, image_title)
if image_url[-1] == "g":
response = requests.get(image_url)
filename = '%s.jpg' % image_title
with open(filename, "wb") as jpg:
jpg.write(response.content)
elif image_url[-1] == "f":
response = requests.get(image_url)
filename = '%s.gif' % image_title
with open(filename, "wb") as gif:
gif.write(response.content)
return
for i in range(1,1000):
getDouTu(i)

复制代码

过默 · 发表于 2019-4-14 21:51:50

怎么爬，点不会，复制了加微信15850526647

396355023 · 发表于 2019-4-21 14:05:44

过默发表于 2019-4-14 21:51
怎么爬，点不会，复制了加微信15850526647

你加我18181228878

账号		自动登录	找回密码
密码			立即注册

[作品展示] 爬虫-斗图网表情爬取