鱼C论坛

 找回密码
 立即注册
查看: 2157|回复: 6

动态网页爬取问题

[复制链接]
发表于 2022-6-19 13:44:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
最近在学python的爬虫 可是在使用selenium爬取动态网页遇到了下面的错误(使用的webdriver是edge):
Traceback (most recent call last):
  File "<pyshell#8>", line 1, in <module>
    dirver.get("网址")
  File "D:\python\Python\Python310-32\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 442, in get
    self.execute(Command.GET, {'url': url})
  File "D:\python\Python\Python310-32\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 430, in execute
    self.error_handler.check_response(response)
  File "D:\python\Python\Python310-32\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 247, in check_response
    raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.WebDriverException: Message: unknown error: cannot determine loading status
from unknown error: missing or invalid columnNumber
  (Session info: MicrosoftEdge=102.0.1245.44)
Stacktrace:
Backtrace:
        Microsoft::Applications::Events::EventProperties::unpack [0x00DF8B23+58371]
        Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CD3901+1430161]
        Microsoft::Applications::Events::ILogConfiguration::operator* [0x00AB353E+3502]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA2167+63143]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA188A+60874]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA6A61+81825]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA6FBC+83196]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA6D98+82648]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA6435+80245]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA55CD+76557]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA59A8+77544]
        Microsoft::Applications::Events::IModule::Teardown [0x00AAF94B+118411]
        Microsoft::Applications::Events::ILogConfiguration::operator* [0x00AB8BFB+25707]
        Microsoft::Applications::Events::ILogConfiguration::operator* [0x00ABAF70+34784]
        Microsoft::Applications::Events::IModule::Teardown [0x00AA5C72+78258]
        Microsoft::Applications::Events::ILogConfiguration::operator* [0x00AB8931+24993]
        Microsoft::Applications::Events::GUID_t::GUID_t [0x00AFF37C+239644]
        Microsoft::Applications::Events::GUID_t::GUID_t [0x00AF1136+181718]
        Microsoft::Applications::Events::GUID_t::GUID_t [0x00AD4466+63750]
        Microsoft::Applications::Events::GUID_t::GUID_t [0x00AD51F6+67222]
        Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00FF1335+617557]
        Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F71273+93075]
        Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F70F17+92215]
        Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F74FAA+108746]
        Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F7195A+94842]
        Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CE55E7+1503095]
        Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CEF618+1544104]
        Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CEF7A2+1544498]
        Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00D01E02+1619858]
        BaseThreadInitThunk [0x754DFA29+25]
        RtlGetAppContainerNamedObjectPath [0x772A7A7E+286]
        RtlGetAppContainerNamedObjectPath [0x772A7A4E+238]

这句错误我认为大抵上就是关键:
selenium.common.exceptions.WebDriverException: Message: unknown error: cannot determine loading status
from unknown error: missing or invalid columnNumber

可是在网上也没查到相关信息 基本上是这段不一样
missing or invalid columnNumber

希望有大佬可以帮忙解决一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-6-20 07:19:35 From FishC Mobile | 显示全部楼层
不发代码,比较奇葩
使用edge也比较少见
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-20 07:52:49 | 显示全部楼层
可能是由于网页还没有加载完元素你就请求了,
可以增加、延长等待时间试试
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-20 15:10:16 | 显示全部楼层
driver.get('网址'),这个网址是不是应该替换成你要访问的网址?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-20 19:23:18 | 显示全部楼层
suchocolate 发表于 2022-6-20 15:10
driver.get('网址'),这个网址是不是应该替换成你要访问的网址?

我这里将网址隐藏起来了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-20 19:24:28 | 显示全部楼层
Lai013 发表于 2022-6-20 07:52
可能是由于网页还没有加载完元素你就请求了,
可以增加、延长等待时间试试

selenium的driver里的get函数不是会等到页面全部加载完后才会继续执行的吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-20 22:13:29 | 显示全部楼层
临时用户3.14159 发表于 2022-6-20 19:24
selenium的driver里的get函数不是会等到页面全部加载完后才会继续执行的吗

并不是,想稳妥,还是得用selenium的ec
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-17 20:40

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表