鱼C论坛

 找回密码
 立即注册
查看: 2409|回复: 6

动态网页爬取问题

[复制链接]
发表于 2022-6-19 13:44:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
最近在学python的爬虫 可是在使用selenium爬取动态网页遇到了下面的错误(使用的webdriver是edge):

  1. Traceback (most recent call last):
  2.   File "<pyshell#8>", line 1, in <module>
  3.     dirver.get("网址")
  4.   File "D:\python\Python\Python310-32\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 442, in get
  5.     self.execute(Command.GET, {'url': url})
  6.   File "D:\python\Python\Python310-32\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 430, in execute
  7.     self.error_handler.check_response(response)
  8.   File "D:\python\Python\Python310-32\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 247, in check_response
  9.     raise exception_class(message, screen, stacktrace)
  10. selenium.common.exceptions.WebDriverException: Message: unknown error: cannot determine loading status
  11. from unknown error: missing or invalid columnNumber
  12.   (Session info: MicrosoftEdge=102.0.1245.44)
  13. Stacktrace:
  14. Backtrace:
  15.         Microsoft::Applications::Events::EventProperties::unpack [0x00DF8B23+58371]
  16.         Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CD3901+1430161]
  17.         Microsoft::Applications::Events::ILogConfiguration::operator* [0x00AB353E+3502]
  18.         Microsoft::Applications::Events::IModule::Teardown [0x00AA2167+63143]
  19.         Microsoft::Applications::Events::IModule::Teardown [0x00AA188A+60874]
  20.         Microsoft::Applications::Events::IModule::Teardown [0x00AA6A61+81825]
  21.         Microsoft::Applications::Events::IModule::Teardown [0x00AA6FBC+83196]
  22.         Microsoft::Applications::Events::IModule::Teardown [0x00AA6D98+82648]
  23.         Microsoft::Applications::Events::IModule::Teardown [0x00AA6435+80245]
  24.         Microsoft::Applications::Events::IModule::Teardown [0x00AA55CD+76557]
  25.         Microsoft::Applications::Events::IModule::Teardown [0x00AA59A8+77544]
  26.         Microsoft::Applications::Events::IModule::Teardown [0x00AAF94B+118411]
  27.         Microsoft::Applications::Events::ILogConfiguration::operator* [0x00AB8BFB+25707]
  28.         Microsoft::Applications::Events::ILogConfiguration::operator* [0x00ABAF70+34784]
  29.         Microsoft::Applications::Events::IModule::Teardown [0x00AA5C72+78258]
  30.         Microsoft::Applications::Events::ILogConfiguration::operator* [0x00AB8931+24993]
  31.         Microsoft::Applications::Events::GUID_t::GUID_t [0x00AFF37C+239644]
  32.         Microsoft::Applications::Events::GUID_t::GUID_t [0x00AF1136+181718]
  33.         Microsoft::Applications::Events::GUID_t::GUID_t [0x00AD4466+63750]
  34.         Microsoft::Applications::Events::GUID_t::GUID_t [0x00AD51F6+67222]
  35.         Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00FF1335+617557]
  36.         Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F71273+93075]
  37.         Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F70F17+92215]
  38.         Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F74FAA+108746]
  39.         Microsoft::Applications::Events::ILogManager::DispatchEventBroadcast [0x00F7195A+94842]
  40.         Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CE55E7+1503095]
  41.         Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CEF618+1544104]
  42.         Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00CEF7A2+1544498]
  43.         Microsoft::Applications::Events::ISemanticContext::SetTicket [0x00D01E02+1619858]
  44.         BaseThreadInitThunk [0x754DFA29+25]
  45.         RtlGetAppContainerNamedObjectPath [0x772A7A7E+286]
  46.         RtlGetAppContainerNamedObjectPath [0x772A7A4E+238]
复制代码


这句错误我认为大抵上就是关键:
  1. selenium.common.exceptions.WebDriverException: Message: unknown error: cannot determine loading status
  2. from unknown error: missing or invalid columnNumber
复制代码


可是在网上也没查到相关信息 基本上是这段不一样
  1. missing or invalid columnNumber
复制代码


希望有大佬可以帮忙解决一下
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-6-20 07:19:35 From FishC Mobile | 显示全部楼层
不发代码,比较奇葩
使用edge也比较少见
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-20 07:52:49 | 显示全部楼层
可能是由于网页还没有加载完元素你就请求了,
可以增加、延长等待时间试试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-20 15:10:16 | 显示全部楼层
driver.get('网址'),这个网址是不是应该替换成你要访问的网址?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-20 19:23:18 | 显示全部楼层
suchocolate 发表于 2022-6-20 15:10
driver.get('网址'),这个网址是不是应该替换成你要访问的网址?

我这里将网址隐藏起来了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-20 19:24:28 | 显示全部楼层
Lai013 发表于 2022-6-20 07:52
可能是由于网页还没有加载完元素你就请求了,
可以增加、延长等待时间试试

selenium的driver里的get函数不是会等到页面全部加载完后才会继续执行的吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-20 22:13:29 | 显示全部楼层
临时用户3.14159 发表于 2022-6-20 19:24
selenium的driver里的get函数不是会等到页面全部加载完后才会继续执行的吗

并不是,想稳妥,还是得用selenium的ec
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-28 11:31

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表