鱼C论坛

 找回密码
 立即注册
查看: 1843|回复: 2

[已解决]seleium显式等待如何处理一个没有明显结束信号的网站

[复制链接]
发表于 2020-8-24 19:07:36 | 显示全部楼层 |阅读模式
10鱼币
目标是:https://phpinfo.me/domain/
一个子域名查询网站,需要在查到所有子域名之后,返回查到的结果。但是正常的python爬虫是获取页面后立刻读取网页内容的,该网站需要等待网页爆破子域名结束后才能返回所有结果,因此我使用了selenium的WebDriverWait模块,想按照页面某个元素的变化(比如某些查询功能的网站,查询完毕后会提示‘查询成功!’之类)进行等待,待结果全部显示后再爬取内容。但目标网站并没有明显提示,只有查询框下第一行的文本会在查询结束后停止跳动,如图:
微信图片_20200824185850.png
暂时没有思路,烦请哪位大佬帮忙介绍一种应对方法!
最佳答案
2020-8-24 19:07:37
本帖最后由 suchocolate 于 2020-8-25 11:34 编辑

当结束时那个元素的text就不动了,所以加一个循环检查,对比text就知道结束了:
1.png
  1. from selenium.webdriver import Firefox
  2. import time


  3. def ck_fuzz(driver):
  4.     while True:
  5.         previous_name = driver.find_element_by_id('fuzz').text
  6.         time.sleep(5)
  7.         last_name = driver.find_element_by_id('fuzz').text
  8.         if previous_name == last_name:
  9.             return True


  10. if __name__ == '__main__':
  11.     url = 'https://phpinfo.me/domain/'
  12.     driver = Firefox(executable_path='geckodriver')
  13.     driver.get(url)
  14.     # print(driver.page_source)
  15.     driver.find_element_by_id('domain').send_keys('baidu.com')
  16.     driver.find_element_by_tag_name('button').click()
  17.     ck_fuzz(driver)
  18.     # Write your code below
复制代码

最佳答案

查看完整内容

当结束时那个元素的text就不动了,所以加一个循环检查,对比text就知道结束了:
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-8-24 19:07:37 | 显示全部楼层    本楼为最佳答案   
本帖最后由 suchocolate 于 2020-8-25 11:34 编辑

当结束时那个元素的text就不动了,所以加一个循环检查,对比text就知道结束了:
1.png
  1. from selenium.webdriver import Firefox
  2. import time


  3. def ck_fuzz(driver):
  4.     while True:
  5.         previous_name = driver.find_element_by_id('fuzz').text
  6.         time.sleep(5)
  7.         last_name = driver.find_element_by_id('fuzz').text
  8.         if previous_name == last_name:
  9.             return True


  10. if __name__ == '__main__':
  11.     url = 'https://phpinfo.me/domain/'
  12.     driver = Firefox(executable_path='geckodriver')
  13.     driver.get(url)
  14.     # print(driver.page_source)
  15.     driver.find_element_by_id('domain').send_keys('baidu.com')
  16.     driver.find_element_by_tag_name('button').click()
  17.     ck_fuzz(driver)
  18.     # Write your code below
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-8-30 20:59:30 | 显示全部楼层
suchocolate 发表于 2020-8-25 11:21
当结束时那个元素的text就不动了,所以加一个循环检查,对比text就知道结束了:

懂了,多谢
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-26 11:34

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表