wcq15759797758 发表于 2021-7-6 20:20:15

搜索淘宝关键词太频繁被反爬措施一直跳滑动验证码求助

本帖最后由 wcq15759797758 于 2021-7-6 20:24 编辑

搜索关键词的id标题数据已经调试出来了,可是反爬太严重了现在寸步难行 求大哥支个招
我直接用cookies绕过登录了
代理IPUA伪装 参数上传 已试过


Kayko 发表于 2021-7-6 20:45:11

来了来了

Jin_Yu 发表于 2021-7-7 12:53:13

路过~

wx626810 发表于 2021-7-7 18:09:38

1.手动拉验证码然后重新填cookie
2.selenium模拟点击然后.get_cookies()
3.Opencv或者其他图片识别库,求个梯度,然后模板匹配一下滑块位置求一个X轴和Y轴,抓包滑块提交请求,多半是请求参数是图片X轴和Y轴,然后模拟提交获取cookie

立面昬 发表于 2021-7-9 19:28:58

留个脚印方便以后学习

YunGuo 发表于 2021-7-12 21:15:49

代理ip池

wcq15759797758 发表于 2021-7-12 22:32:09

YunGuo 发表于 2021-7-12 21:15
代理ip池

已经试过还是会跳

FrankJZ 发表于 2021-7-20 16:39:28

这是好东西,cy

LYWX 发表于 2023-2-20 17:25:04

学习

陶远航 发表于 2023-4-9 17:56:49

如果您已经尝试了代理IP、UA伪装和参数上传等方式,但仍然被反爬虫机制识别并封禁,可以考虑以下几个方向:

1. 使用selenium等自动化测试工具:selenium可以模拟真实的浏览器操作,包括点击、滚动、输入等,可以更好地模拟用户行为,减少被反爬虫机制识别的可能性。

2. 使用分布式爬虫:使用分布式爬虫可以将爬虫程序分散到多个不同的IP地址上运行,从而降低单个IP被反爬虫机制封禁的可能性。

3. 降低爬取频率:将爬取间隔时间延长,或者使用随机的爬取间隔时间,可以避免被反爬虫机制识别为高频率爬虫。

4. 使用验证码识别技术:如果被反爬虫机制使用了验证码来防御爬虫,可以使用OCR等技术对验证码进行识别,从而实现自动化。

注意:在爬取数据时,一定要遵守网站的爬取规则,尊重网站的合法权益,不要对网站造成过度的压力和损害。

cuxx 发表于 2023-4-9 19:03:16

插眼
页: [1]
查看完整版本: 搜索淘宝关键词太频繁被反爬措施一直跳滑动验证码求助