鱼C论坛

 找回密码
 立即注册
查看: 9748|回复: 201

[作品展示] 简单爬虫,爬取王者荣耀英雄皮肤

  [复制链接]
发表于 2020-2-29 16:52:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 一个账号 于 2020-3-26 09:59 编辑
  1. import urllib.request
  2. import re
  3. import random
  4. import os
  5. import time

  6. def url_open(url):
  7.     '''
  8.     listip = ['117.94.213.165:8118','119.179.136.97:8060','114.228.73.217:6666']
  9.    
  10.     proxy_support = urllib.request.ProxyHandler({'http':random.choice(listip)})

  11.     opener = urllib.request.build_opener(proxy_support)
  12.     opener.addheaders = [('User-Agent',' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36')]
  13.     urllib.request.install_opener(opener)
  14.     '''
  15.     #这一部分使用的代理,我用着太慢,就没使了
  16.     req = urllib.request.Request(url)
  17.     req.add_header('User-Agent',' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36')
  18.     response = urllib.request.urlopen(req)
  19.     html = response.read()
  20.     return html

  21. def make_file(url):
  22.     html = url_open(url).decode('gbk')
  23.     a = html.find("cover-name") + 12
  24.     b = html.find('</h2>')
  25.     name = html[a:b]
  26.     os.mkdir(name)
  27.     os.chdir(name)
  28.     save_hero(url)
  29.     os.chdir(path = "..")

  30. def save_hero(url):
  31.     html = url_open(url).decode("gbk")
  32.     a = re.findall(r'game.gtimg.cn/.+hero-info/\d{3}/\d{3}-bigskin-.\.jpg',html)
  33.     a = a[0]
  34.     for i in range(1,7):
  35.         a = a[:67] + str(i) + a[68:]
  36.         img_url = "http://" + a
  37.         file_name = img_url.split('/')[-1]
  38.         try:
  39.             imghtml = url_open(img_url)
  40.             with open(file_name,'wb') as f:
  41.                 f.write(imghtml)
  42.         except:
  43.             break
  44.    

  45.    
  46. def heropic(folder = 'herolist'):
  47.     os.mkdir(folder)
  48.     os.chdir(folder)
  49.    
  50.     url = 'https://pvp.qq.com/web201605/herolist.shtml'
  51.     html = url_open(url).decode("gbk")
  52.     herolist = re.findall(r'herodetail/\d\d\d\.shtml',html)
  53.     herodetail = []
  54.     for i in range(len(herolist)):
  55.         herodetail.append( 'https://pvp.qq.com/web201605/' + herolist[i])
  56.     for j in range(len(herodetail)):
  57.         make_file(herodetail[j])

  58. if __name__ == "__main__":
  59.     heropic()
复制代码


模仿着小甲鱼的爬虫写了一下,可能有一些代码冗余

还有就是在源代码没看到前五个英雄的链接,所以只能爬93个英雄的皮肤

关于这点我也不知道咋办,希望有大佬指导下
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-2-29 18:36:25 | 显示全部楼层
嘻嘻嘻嘻嘻嘻嘻学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-29 18:55:47 | 显示全部楼层
楼主无敌于世间
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-29 19:07:05 | 显示全部楼层
小白路过,学习学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-29 19:48:45 | 显示全部楼层
新手上路学习学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-29 21:37:55 | 显示全部楼层
666
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-3-2 10:11:54 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-3-2 10:52:39 | 显示全部楼层
呃呃呃呃呃
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-2 16:46:59 | 显示全部楼层
学习学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-2 19:34:35 | 显示全部楼层
瞅一瞅
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-2 21:10:10 | 显示全部楼层
想见识一下

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-2 21:26:15 | 显示全部楼层
涨涨见识
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-2 21:57:53 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-3-2 23:32:49 | 显示全部楼层
看看拉
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-2 23:56:24 | 显示全部楼层
学习学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-3 00:22:36 | 显示全部楼层
学习
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-3-8 11:53:24 | 显示全部楼层
无敌
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-3-8 12:08:08 | 显示全部楼层
厉害啊
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-8 13:33:28 | 显示全部楼层
回复学习学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-8 13:42:28 | 显示全部楼层
是只能看的那种吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-17 10:29

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表