| 
 | 
 
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册  
 
x
 
想通过selenium下载文献 
举例网址 https://sci-hub.tw/10.1021/cm0608903 
 
图片是检查下载按钮的元素 
 
 
这是报错信息 
- d = c.find_element_by_xpath('/html/body/viewer-pdf-toolbar//div[1]/div[1]/div[2]/cr-icon-button[2]//div/iron-icon')
 
 - Traceback (most recent call last):
 
 -   File "<input>", line 1, in <module>
 
 -   File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 394, in find_element_by_xpath
 
 -     return self.find_element(by=By.XPATH, value=xpath)
 
 -   File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 978, in find_element
 
 -     'value': value})['value']
 
 -   File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 321, in execute
 
 -     self.error_handler.check_response(response)
 
 -   File "D:\Install\Python-3.5.2\install\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 242, in check_response
 
 -     raise exception_class(message, screen, stacktrace)
 
 - selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"/html/body/viewer-pdf-toolbar//div[1]/div[1]/div[2]/cr-icon-button[2]//div/iron-icon"}
 
 -   (Session info: chrome=81.0.4044.122)
 
 
  复制代码 
 
是我哪里出错了吗 
请大佬指教或者贴一个能实现保存的代码?谢谢了
你好,我尝试用selenium实现了你说的下载pdf 的功能,网页打开可能会有一些慢。 
我这里下载pdf文件使用的是界面左边的↓save按钮。如果出现了↓save按钮但是网页还在加载中,可以先停止加载,有这个按钮就能实现下载功能啦!
 - from selenium import webdriver
 
 - import bs4
 
  
- browser = webdriver.Chrome()
 
 - browser.get("https://sci-hub.tw/10.1021/cm0608903")
 
 - soup = bs4.BeautifulSoup(browser.page_source, "html.parser")
 
 - browser.find_element_by_xpath("//div[@id='buttons']/ul/li/a").click()
 
  复制代码 
 
 
 |   
- 
 
 
 
 
 
 
 
 |