搜索淘宝关键词太频繁被反爬措施一直跳滑动验证码求助,Python交流,编程语言专区,鱼C论坛

wcq15759797758 发表于 2021-7-6 20:20:15

搜索淘宝关键词太频繁被反爬措施一直跳滑动验证码求助

本帖最后由 wcq15759797758 于 2021-7-6 20:24 编辑

搜索关键词的id标题数据已经调试出来了，可是反爬太严重了现在寸步难行求大哥支个招
我直接用cookies绕过登录了
代理IPUA伪装参数上传已试过

Kayko 发表于 2021-7-6 20:45:11

来了来了

Jin_Yu 发表于 2021-7-7 12:53:13

路过~

wx626810 发表于 2021-7-7 18:09:38

1.手动拉验证码然后重新填cookie
2.selenium模拟点击然后.get_cookies()
3.Opencv或者其他图片识别库，求个梯度，然后模板匹配一下滑块位置求一个X轴和Y轴，抓包滑块提交请求，多半是请求参数是图片X轴和Y轴，然后模拟提交获取cookie

立面昬 发表于 2021-7-9 19:28:58

留个脚印方便以后学习

YunGuo 发表于 2021-7-12 21:15:49

代理ip池

wcq15759797758 发表于 2021-7-12 22:32:09

YunGuo 发表于 2021-7-12 21:15
代理ip池

已经试过还是会跳

FrankJZ 发表于 2021-7-20 16:39:28

这是好东西，cy

LYWX 发表于 2023-2-20 17:25:04

学习

陶远航 发表于 2023-4-9 17:56:49

如果您已经尝试了代理IP、UA伪装和参数上传等方式，但仍然被反爬虫机制识别并封禁，可以考虑以下几个方向：

1. 使用selenium等自动化测试工具：selenium可以模拟真实的浏览器操作，包括点击、滚动、输入等，可以更好地模拟用户行为，减少被反爬虫机制识别的可能性。

2. 使用分布式爬虫：使用分布式爬虫可以将爬虫程序分散到多个不同的IP地址上运行，从而降低单个IP被反爬虫机制封禁的可能性。

3. 降低爬取频率：将爬取间隔时间延长，或者使用随机的爬取间隔时间，可以避免被反爬虫机制识别为高频率爬虫。

4. 使用验证码识别技术：如果被反爬虫机制使用了验证码来防御爬虫，可以使用OCR等技术对验证码进行识别，从而实现自动化。

注意：在爬取数据时，一定要遵守网站的爬取规则，尊重网站的合法权益，不要对网站造成过度的压力和损害。

cuxx 发表于 2023-4-9 19:03:16

插眼

页: [1]

鱼C论坛's Archiver

搜索淘宝关键词太频繁被反爬措施一直跳滑动验证码求助