请问像这个网站该怎么用requests爬
本帖最后由 sheenblue 于 2021-2-2 09:54 编辑https://i.loli.net/2021/02/02/JGxme4LuoVIgaFq.jpg
我用requests就提示非法请求,要怎么绕过好?是不是要带上cookies,请问该怎么带,网上查了些方法,弄不透。
用selenium爬,电脑带不动。
麻烦各位大佬了
网站地址:https://www.fenxiangyin.com/ ===>一、分析网页
1、浏览器打开页面:https://www.fenxiangyin.com/member/default/login
2、点右键检查,点Network,随便输入用户名和密码点登入
3、发现有且只有一个login的post请求,重点关注如下数据
General
Request URL: https://www.fenxiangyin.com/member/default/login
Form Data
_csrf: 02ydHwx6O44KuoBcqP8F_n59u0VkBFLttk_lbNBmuJ-EXtRaPC1Ly0Pqyi3KnkDHBgnzASk9YKbsO6s96Rf_zQ==
LoginForm: affeafa
LoginForm: werwwar
postionUrl:
===>二、写代码测试(略过,要点如下):
1、请求方式是post,因此用的方法是requests.post()
2、参数必须携带headers,以及至少包含LoginForm和LoginForm的params数据
3、根据返回的response数据,看看是否需要验证码,如果不用那后面应该简单了。。。
如果需要那对你来说就太难了,你可以考虑暂时放弃了,去B站搜索下爬虫教程好好学学基础 笨鸟学飞 发表于 2021-2-2 18:08
===>一、分析网页
1、浏览器打开页面:https://www.fenxiangyin.com/member/default/login
2、点右键检查 ...
我利用cookie+requests爬进去了,可是遇到了这个网址
https://www.fenxiangyin.com/goods/detail?goods_id=286
我想保存这个网址里的图片,却发现网页源码找不到图片链接,用requests也找不到,不知道该怎么破 登陆的账号密码要发一下,我可不想注册一个。 本帖最后由 YunGuo 于 2021-2-3 18:52 编辑
sheenblue 发表于 2021-2-2 21:56
我利用cookie+requests爬进去了,可是遇到了这个网址
https://www.fenxiangyin.com/goods/detail?goods_ ...
图片接口:https://www.fenxiangyin.com/goods/get-goods-gallery-list
参数:goods_id(商品id)
请求这个接口,带上必要的参数,能拿到图片链接。
另外,这个接口能拿到详情图:https://www.fenxiangyin.com/goods/info
参数和上面一样,都是商品id,goods_id
页:
[1]