|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
想通过selenium下载文献
举例网址 https://sci-hub.tw/10.1021/cm0608903
图片是检查下载按钮的元素
这是报错信息
- d = c.find_element_by_xpath('/html/body/viewer-pdf-toolbar//div[1]/div[1]/div[2]/cr-icon-button[2]//div/iron-icon')
- Traceback (most recent call last):
- File "<input>", line 1, in <module>
- File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 394, in find_element_by_xpath
- return self.find_element(by=By.XPATH, value=xpath)
- File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 978, in find_element
- 'value': value})['value']
- File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 321, in execute
- self.error_handler.check_response(response)
- File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 242, in check_response
- raise exception_class(message, screen, stacktrace)
- selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"/html/body/viewer-pdf-toolbar//div[1]/div[1]/div[2]/cr-icon-button[2]//div/iron-icon"}
- (Session info: chrome=81.0.4044.122)
复制代码
是我哪里出错了吗
请大佬指教或者贴一个能实现保存的代码?谢谢了
你好,我尝试用selenium实现了你说的下载pdf 的功能,网页打开可能会有一些慢。
我这里下载pdf文件使用的是界面左边的↓save按钮。如果出现了↓save按钮但是网页还在加载中,可以先停止加载,有这个按钮就能实现下载功能啦!
- from selenium import webdriver
- import bs4
- browser = webdriver.Chrome()
- browser.get("https://sci-hub.tw/10.1021/cm0608903")
- soup = bs4.BeautifulSoup(browser.page_source, "html.parser")
- browser.find_element_by_xpath("//div[@id='buttons']/ul/li/a").click()
复制代码
|
-
|