sheenblue 发表于 2021-2-2 09:53:36

请问像这个网站该怎么用requests爬

本帖最后由 sheenblue 于 2021-2-2 09:54 编辑

https://i.loli.net/2021/02/02/JGxme4LuoVIgaFq.jpg
我用requests就提示非法请求,要怎么绕过好?是不是要带上cookies,请问该怎么带,网上查了些方法,弄不透。
用selenium爬,电脑带不动。
麻烦各位大佬了
网站地址:https://www.fenxiangyin.com/

笨鸟学飞 发表于 2021-2-2 18:08:29

===>一、分析网页
1、浏览器打开页面:https://www.fenxiangyin.com/member/default/login
2、点右键检查,点Network,随便输入用户名和密码点登入
3、发现有且只有一个login的post请求,重点关注如下数据
General
   Request URL: https://www.fenxiangyin.com/member/default/login

Form Data
   _csrf: 02ydHwx6O44KuoBcqP8F_n59u0VkBFLttk_lbNBmuJ-EXtRaPC1Ly0Pqyi3KnkDHBgnzASk9YKbsO6s96Rf_zQ==
   LoginForm: affeafa
   LoginForm: werwwar
   postionUrl:
===>二、写代码测试(略过,要点如下):
1、请求方式是post,因此用的方法是requests.post()
2、参数必须携带headers,以及至少包含LoginForm和LoginForm的params数据
3、根据返回的response数据,看看是否需要验证码,如果不用那后面应该简单了。。。
如果需要那对你来说就太难了,你可以考虑暂时放弃了,去B站搜索下爬虫教程好好学学基础

sheenblue 发表于 2021-2-2 21:56:22

笨鸟学飞 发表于 2021-2-2 18:08
===>一、分析网页
1、浏览器打开页面:https://www.fenxiangyin.com/member/default/login
2、点右键检查 ...

我利用cookie+requests爬进去了,可是遇到了这个网址
https://www.fenxiangyin.com/goods/detail?goods_id=286
我想保存这个网址里的图片,却发现网页源码找不到图片链接,用requests也找不到,不知道该怎么破

°蓝鲤歌蓝 发表于 2021-2-2 23:36:48

登陆的账号密码要发一下,我可不想注册一个。

YunGuo 发表于 2021-2-3 18:49:24

本帖最后由 YunGuo 于 2021-2-3 18:52 编辑

sheenblue 发表于 2021-2-2 21:56
我利用cookie+requests爬进去了,可是遇到了这个网址
https://www.fenxiangyin.com/goods/detail?goods_ ...

图片接口:https://www.fenxiangyin.com/goods/get-goods-gallery-list
参数:goods_id(商品id)
请求这个接口,带上必要的参数,能拿到图片链接。

另外,这个接口能拿到详情图:https://www.fenxiangyin.com/goods/info
参数和上面一样,都是商品id,goods_id
页: [1]
查看完整版本: 请问像这个网站该怎么用requests爬