Pythonnewers 发表于 2020-5-8 10:54:17

[Python]爬取王者荣耀的周免英雄

我找不到周免英雄的地方,只有91(?)个英雄,而我只想爬取周免的英雄
https://s1.ax1x.com/2020/05/08/YnDSyT.png
↑周免英雄
https://s1.ax1x.com/2020/05/08/YnD71x.png
↑所有的

然后我get的就是第二个的...

有什么办法可以获取周免?{:10_243:}

March2615 发表于 2020-5-8 11:02:08

本帖最后由 March2615 于 2020-5-8 11:04 编辑

https://pvp.qq.com/web201605/herolist.shtml
这个页面有周免英雄

图片中周免英雄以一个链接形式给出
https://pvp.qq.com/web201605/herodetail/105.shtml(就是元素前面加上http)
进入这个页面就可以爬取对应英雄的信息了

qiuyouzhi 发表于 2020-5-8 11:02:26

URL发出来

Pythonnewers 发表于 2020-5-8 11:03:48

qiuyouzhi 发表于 2020-5-8 11:02
URL发出来

https://pvp.qq.com/web201605/herolist.shtml

qiuyouzhi 发表于 2020-5-8 11:05:59

Pythonnewers 发表于 2020-5-8 11:03
https://pvp.qq.com/web201605/herolist.shtml

我给你用selenium写个行吗

Pythonnewers 发表于 2020-5-8 11:10:04

March2615 发表于 2020-5-8 11:02
https://pvp.qq.com/web201605/herolist.shtml
这个页面有周免英雄



不是,点进去还是全部英雄,还是要选择标签来看周免英雄

Pythonnewers 发表于 2020-5-8 11:10:39

qiuyouzhi 发表于 2020-5-8 11:05
我给你用selenium写个行吗

行{:10_298:}

qiuyouzhi 发表于 2020-5-8 11:17:47

Pythonnewers 发表于 2020-5-8 11:10


调试中....马上发出来

永恒的蓝色梦想 发表于 2020-5-8 11:18:23

qiuyouzhi 发表于 2020-5-8 11:17
调试中....马上发出来

NPNP

qiuyouzhi 发表于 2020-5-8 11:20:13

Pythonnewers 发表于 2020-5-8 11:10


好了
from selenium import webdriver
from requests import get
import os

try:
    os.mkdir("Img")
    os.chdir("Img")
except:
    os.chdir("Img")
   
wd = webdriver.Chrome(r'D:\webdrivers\chromedriver.exe')
wd.get('https://pvp.qq.com/web201605/herolist.shtml')

wd.find_element_by_xpath('/html/body/div/div/div/div/div/ul/li/span/i').click()
url = wd.find_elements_by_xpath('/html/body/div/div/div/div/div/ul/li/a/img')
for i in range(len(url)):
    with open(f"{i}.jpg", 'wb') as f:
      f.write(get(url.get_attribute("src")).content)

wd.quit()

qiuyouzhi 发表于 2020-5-8 11:23:22

永恒的蓝色梦想 发表于 2020-5-8 11:18
NPNP

不NP
我查了半天BUG,发现少了个s。。。只能爬到一个。。。{:10_262:}

Pythonnewers 发表于 2020-5-8 11:27:33

qiuyouzhi 发表于 2020-5-8 11:23
不NP
我查了半天BUG,发现少了个s。。。只能爬到一个。。。

谢谢了{:10_256:}

qiuyouzhi 发表于 2020-5-8 11:27:58

Pythonnewers 发表于 2020-5-8 11:27
谢谢了

{:10_256:}安装驱动了吧

March2615 发表于 2020-5-8 11:28:05

它页面最上面就是本周周免啊,下面才是全部英雄
只不过要爬取的话需要进到该英雄的详细页面去爬取

不过无所谓了,大佬的速度可快多了

jkluoling1992 发表于 2020-5-8 12:40:18

老廉颇改版好评

Pythonnewers 发表于 2020-5-8 12:57:34

jkluoling1992 发表于 2020-5-8 12:40
老廉颇改版好评

哈哈哈,早改了
页: [1]
查看完整版本: [Python]爬取王者荣耀的周免英雄