鱼C论坛

 找回密码
 立即注册
查看: 1608|回复: 3

关于chrome浏览器滚动条滚动问题

[复制链接]
发表于 2018-12-25 19:40:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
最近在做爬虫时遇到了浏览器的滚动加载问题,我利用chrome按照网上的方法控制网页滚动,但是无论什么方法都不能让滚动条滚动,由于网页是异步加载的,也就导致无法获得漫画图片的地址
所以想请教以下我的代码应该怎么修改呢?
网址:https://ac.qq.com/ComicView/index/id/635294/cid/1
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-12-26 08:12:05 | 显示全部楼层
selenium

js="var q=document.getElementById('id').scrollTop=10000"
driver.execute_script(js)
或:

js="var q=document.documentElement.scrollTop=10000"
driver.execute_script(js)
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-12-26 09:58:11 | 显示全部楼层
塔利班 发表于 2018-12-26 08:12
selenium

js="var q=document.getElementById('id').scrollTop=10000"

用第一种方法报错返回的  raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.WebDriverException: Message: unknown error: Cannot set property 'scrollTop' of null
第二种方法不报错,但是没有反应  
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-12-26 09:58:55 | 显示全部楼层
塔利班 发表于 2018-12-26 08:12
selenium

js="var q=document.getElementById('id').scrollTop=10000"

这是源代码
import os
import re
import requests
from tkinter import *
from lxml import etree
import time
# 导入chrome无头浏览器
from selenium import webdriver
#from selenium.webdriver.chrome.options import Options

def url_key(url):                    #这里把最大章节的网址传了进来,进行网页规则分析
    #chrome_options = Options()
    #chrome_options.add_argument("--headless")
    driver = webdriver.Chrome() #chrome_options=chrome_options)
   
    driver.get(url)
    time.sleep(2)
    #滚动条滚动
    for i in range(1, 2):
        js = "var q=document.documentElement.scrollTop=10000"
        driver.execute_script(js)
        
        ###########注释中的这几种命令我都试过了,都无法让滚动条滚动####################
        #print(document.body.scrollTop)
        #print(window.pageYOffset.scrolltop)
        #print(document.documentElement.scrollTop)
        #driver.implicitly_wait()
        time.sleep(1)
        
    webpage = driver.page_source  #获取页面资源
    #driver.close()
    return webpage  # 返回最新一章的页面内容,用作查看url规则

urlchapter = 'https://ac.qq.com/ComicView/index/id/635294/cid/1'
htmls = url_key(urlchapter)  # 利用最新章节网页进行规则分析
html = etree.HTML(htmls)  #etree解析网页
img_url = html.xpath('//@src')
print(img_url)
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-12 16:03

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表