鱼C论坛

 找回密码
 立即注册
查看: 1940|回复: 5

[已解决]爬虫爬取职位信息

[复制链接]
发表于 2023-7-18 10:16:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
请问各位大佬,在这里眠怎么搜索不到这些职位信息呢
最佳答案
2023-7-18 11:08:26


没有的话应该是加密或编码传输了
屏幕截图(76).png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-7-18 10:16:51 | 显示全部楼层
在爬取职位信息时,有几个常见的问题可能导致你无法搜索到特定的职位信息:

1. 网站结构变化:网站的结构可能会发生变化,导致你之前编写的爬虫代码无法正确解析页面内容。这种情况下,你需要检查网站的结构是否发生了变化,并相应地修改你的爬虫代码来适应新的结构。

2. 反爬虫机制:一些网站会采取反爬虫机制来阻止爬虫程序的访问。他们可能使用验证码、频率限制、JavaScript 加密等技术来防止自动化访问。在这种情况下,你可能需要使用一些反反爬虫的技巧,如模拟人工操作、使用代理IP、使用头信息伪装等方法来绕过反爬虫机制。

3. 动态加载内容:一些网站使用 JavaScript 动态加载职位信息,而不是在页面加载时就将所有内容呈现出来。如果你的爬虫只是简单地获取初始页面的内容,而没有处理动态加载的内容,那么你可能无法获取到完整的职位信息。在这种情况下,你可以使用类似 Selenium 的工具来模拟浏览器行为,并获取完整的页面内容。

4. 访问权限限制:有些网站可能对访问进行限制,比如需要登录才能查看职位信息,或者有特定的会员权限才能访问。如果你没有提供正确的访问凭证,那么你可能无法获取到职位信息。在这种情况下,你可以尝试使用相应的登录接口或提供合适的凭证来进行登录和访问。

综上所述,要解决找不到职位信息的问题,你需要仔细检查网站的结构变化、处理反爬虫机制、处理动态加载内容以及处理访问权限限制等问题,并相应地修改和优化你的爬虫代码。此外,还需要注意尊重网站的爬取规则,遵守相关法律法规,并尽量以合理、低频的方式进行爬取,避免给网站带来过大的负担。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-7-18 10:24:50 | 显示全部楼层
本帖最后由 isdkz 于 2023-7-18 10:26 编辑

可能你是加载了网页之后才打开开发者工具的,所以就没有记录到相应的请求

你重新刷新一下网页再搜索看看,记得加载网页之前开发者工具一定要开着


Snipaste_2023-07-18_10-25-22.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-7-18 10:42:31 | 显示全部楼层
isdkz 发表于 2023-7-18 10:24
可能你是加载了网页之后才打开开发者工具的,所以就没有记录到相应的请求

你重新刷新一下网页再搜索看看 ...

还是没有,你试试https://www.lagou.com/jobs/list_ ... =true&suginput=
这个看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-7-18 11:08:26 | 显示全部楼层    本楼为最佳答案   


没有的话应该是加密或编码传输了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-7-18 11:14:13 | 显示全部楼层
isdkz 发表于 2023-7-18 11:08
没有的话应该是加密或编码传输了

好吧,感谢感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-26 09:14

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表