鱼C论坛

 找回密码
 立即注册
查看: 997|回复: 7

[已解决]selenium的基础爬取数据问题

[复制链接]
发表于 2021-9-1 13:44:49 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
from selenium.webdriver import Firefox
from selenium.webdriver.common.keys import Keys
import time

web = Firefox()
web.get("http://lagou.com")
web.find_element_by_xpath('//*[@id="cboxClose"]').click()
time.sleep(1)
web.find_element_by_xpath('//*[@id="search_input"]').send_keys('python', Keys.ENTER)
time.sleep(1)
content = web.find_elements_by_xpath('/html/body/div[6]/div[3]/div[1]/div[3]/ul/li')
print(content)


这是一个爬取拉勾网上python求职岗位的程序。
但是运行出来后,爬取的数据竟然为空。
一时没找到问题在哪,哪位前辈帮忙看看啊,谢谢啊!
最佳答案
2021-9-1 14:56:40
多等一会
from selenium.webdriver import Firefox
from selenium.webdriver.common.keys import Keys
import time


web = Firefox()
web.get("http://lagou.com")
web.find_element_by_xpath('//*[@id="cboxClose"]').click()
time.sleep(1)
web.find_element_by_xpath('//*[@id="search_input"]').send_keys('python', Keys.ENTER)
time.sleep(10)
result = web.find_elements_by_xpath('//li')
print(result)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-9-1 14:56:40 | 显示全部楼层    本楼为最佳答案   
多等一会
from selenium.webdriver import Firefox
from selenium.webdriver.common.keys import Keys
import time


web = Firefox()
web.get("http://lagou.com")
web.find_element_by_xpath('//*[@id="cboxClose"]').click()
time.sleep(1)
web.find_element_by_xpath('//*[@id="search_input"]').send_keys('python', Keys.ENTER)
time.sleep(10)
result = web.find_elements_by_xpath('//li')
print(result)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-1 16:04:34 | 显示全部楼层

为什么你用的 ('//li') 就可以,而我个  ('/html/body/div[6]/div[3]/div[1]/div[3]/ul/li')  是在标签上直接复制的xpath,为啥不行啊?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-2 13:42:30 | 显示全部楼层

你好,前辈,我这个问题在哪你看来应该是比较简单的。
//i 和我在源代码里复制出来的xpath 有什么不同啊?
为什么我复制的xpath不能得到我想要的结果?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-2 14:45:59 | 显示全部楼层
江湖散人 发表于 2021-9-2 13:42
你好,前辈,我这个问题在哪你看来应该是比较简单的。
//i 和我在源代码里复制出来的xpath 有什么不同 ...


xpath和我实际实际浏览看到的对不上
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-2 16:53:00 | 显示全部楼层
suchocolate 发表于 2021-9-2 14:45
xpath和我实际实际浏览看到的对不上

系统错误吗?
为啥对不上啊?都是在系统里直接复制的,应该不会错吧,是不是哪里有什么窍门啊?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-9-2 17:43:41 | 显示全部楼层
江湖散人 发表于 2021-9-2 16:53
系统错误吗?
为啥对不上啊?都是在系统里直接复制的,应该不会错吧,是不是哪里有什么窍门啊?

你自己一层一层对一下就知道了。
至少我一般很少用逐层指定。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-9-2 19:07:52 | 显示全部楼层
suchocolate 发表于 2021-9-2 17:43
你自己一层一层对一下就知道了。
至少我一般很少用逐层指定。

好吧,谢谢你啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-13 13:31

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表