搜索淘宝关键词太频繁被反爬措施一直跳滑动验证码求助
本帖最后由 wcq15759797758 于 2021-7-6 20:24 编辑搜索关键词的id标题数据已经调试出来了,可是反爬太严重了现在寸步难行 求大哥支个招
我直接用cookies绕过登录了
代理IPUA伪装 参数上传 已试过
来了来了
路过~ 1.手动拉验证码然后重新填cookie
2.selenium模拟点击然后.get_cookies()
3.Opencv或者其他图片识别库,求个梯度,然后模板匹配一下滑块位置求一个X轴和Y轴,抓包滑块提交请求,多半是请求参数是图片X轴和Y轴,然后模拟提交获取cookie 留个脚印方便以后学习 代理ip池 YunGuo 发表于 2021-7-12 21:15
代理ip池
已经试过还是会跳 这是好东西,cy 学习
如果您已经尝试了代理IP、UA伪装和参数上传等方式,但仍然被反爬虫机制识别并封禁,可以考虑以下几个方向:
1. 使用selenium等自动化测试工具:selenium可以模拟真实的浏览器操作,包括点击、滚动、输入等,可以更好地模拟用户行为,减少被反爬虫机制识别的可能性。
2. 使用分布式爬虫:使用分布式爬虫可以将爬虫程序分散到多个不同的IP地址上运行,从而降低单个IP被反爬虫机制封禁的可能性。
3. 降低爬取频率:将爬取间隔时间延长,或者使用随机的爬取间隔时间,可以避免被反爬虫机制识别为高频率爬虫。
4. 使用验证码识别技术:如果被反爬虫机制使用了验证码来防御爬虫,可以使用OCR等技术对验证码进行识别,从而实现自动化。
注意:在爬取数据时,一定要遵守网站的爬取规则,尊重网站的合法权益,不要对网站造成过度的压力和损害。
插眼
页:
[1]