鱼C论坛

 找回密码
 立即注册
查看: 1215|回复: 15

[已解决][Python]爬取王者荣耀的周免英雄

[复制链接]
发表于 2020-5-8 10:54:17 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我找不到周免英雄的地方,只有91(?)个英雄,而我只想爬取周免的英雄

                               
登录/注册后可看大图

↑周免英雄

                               
登录/注册后可看大图

↑所有的

然后我get的就是第二个的...

有什么办法可以获取周免?
最佳答案
2020-5-8 11:20:13

好了
from selenium import webdriver
from requests import get
import os

try:
    os.mkdir("Img")
    os.chdir("Img")
except:
    os.chdir("Img")
    
wd = webdriver.Chrome(r'D:\webdrivers\chromedriver.exe')
wd.get('https://pvp.qq.com/web201605/herolist.shtml')

wd.find_element_by_xpath('/html/body/div[3]/div/div/div[2]/div[1]/ul[2]/li[1]/span/i').click()
url = wd.find_elements_by_xpath('/html/body/div[3]/div/div/div[2]/div[2]/ul/li/a/img')
for i in range(len(url)):
    with open(f"{i}.jpg", 'wb') as f:
        f.write(get(url[i].get_attribute("src")).content)

wd.quit()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-5-8 11:02:08 | 显示全部楼层
本帖最后由 March2615 于 2020-5-8 11:04 编辑

https://pvp.qq.com/web201605/herolist.shtml
这个页面有周免英雄

图片中周免英雄以一个链接形式给出
https://pvp.qq.com/web201605/herodetail/105.shtml(就是元素前面加上http)
进入这个页面就可以爬取对应英雄的信息了
王者周免.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:02:26 | 显示全部楼层
URL发出来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-8 11:03:48 | 显示全部楼层

https://pvp.qq.com/web201605/herolist.shtml
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:05:59 | 显示全部楼层
Pythonnewers 发表于 2020-5-8 11:03
https://pvp.qq.com/web201605/herolist.shtml

我给你用selenium写个行吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-8 11:10:04 | 显示全部楼层
March2615 发表于 2020-5-8 11:02
https://pvp.qq.com/web201605/herolist.shtml
这个页面有周免英雄

不是,点进去还是全部英雄,还是要选择标签来看周免英雄
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-8 11:10:39 | 显示全部楼层
qiuyouzhi 发表于 2020-5-8 11:05
我给你用selenium写个行吗

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:17:47 | 显示全部楼层

调试中....马上发出来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:18:23 | 显示全部楼层
qiuyouzhi 发表于 2020-5-8 11:17
调试中....马上发出来

NPNP
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:20:13 | 显示全部楼层    本楼为最佳答案   

好了
from selenium import webdriver
from requests import get
import os

try:
    os.mkdir("Img")
    os.chdir("Img")
except:
    os.chdir("Img")
    
wd = webdriver.Chrome(r'D:\webdrivers\chromedriver.exe')
wd.get('https://pvp.qq.com/web201605/herolist.shtml')

wd.find_element_by_xpath('/html/body/div[3]/div/div/div[2]/div[1]/ul[2]/li[1]/span/i').click()
url = wd.find_elements_by_xpath('/html/body/div[3]/div/div/div[2]/div[2]/ul/li/a/img')
for i in range(len(url)):
    with open(f"{i}.jpg", 'wb') as f:
        f.write(get(url[i].get_attribute("src")).content)

wd.quit()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:23:22 | 显示全部楼层

不NP
我查了半天BUG,发现少了个s。。。只能爬到一个。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-8 11:27:33 | 显示全部楼层
qiuyouzhi 发表于 2020-5-8 11:23
不NP
我查了半天BUG,发现少了个s。。。只能爬到一个。。。

谢谢了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:27:58 | 显示全部楼层

安装驱动了吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 11:28:05 | 显示全部楼层
它页面最上面就是本周周免啊,下面才是全部英雄
只不过要爬取的话需要进到该英雄的详细页面去爬取

不过无所谓了,大佬的速度可快多了
王者周免.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-8 12:40:18 From FishC Mobile | 显示全部楼层
老廉颇改版好评
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-5-8 12:57:34 | 显示全部楼层

哈哈哈,早改了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-27 04:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表