鱼C论坛

 找回密码
 立即注册
查看: 2183|回复: 9

[已解决]爬虫 给个大概思路就好 谢谢了

[复制链接]
发表于 2021-2-9 12:11:47 | 显示全部楼层 |阅读模式
60鱼币
https://bbs.mihoyo.com/ys/
这个网站怎么爬?
最佳答案
2021-2-9 12:11:48
本帖最后由 YunGuo 于 2021-2-14 01:25 编辑

你看我发的图,看你按了f12后是不是会直接跳转到这个地方,然后看不到网页内容,如果是,就点击我发的图点那个红框中的停用断点(或者快捷键Ctrl+F8)。如果不是这个问题,请麻烦你发图,不然不知道你的问题。。。。另外,小白到这个程度,不知道什么是断点,什么是抓包分析,那么建议你去找这方面的教程学一学,毕竟都是爬虫基础,别走还没学会,就去跑。

最佳答案

查看完整内容

你看我发的图,看你按了f12后是不是会直接跳转到这个地方,然后看不到网页内容,如果是,就点击我发的图点那个红框中的停用断点(或者快捷键Ctrl+F8)。如果不是这个问题,请麻烦你发图,不然不知道你的问题。。。。另外,小白到这个程度,不知道什么是断点,什么是抓包分析,那么建议你去找这方面的教程学一学,毕竟都是爬虫基础,别走还没学会,就去跑。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-2-9 12:11:48 | 显示全部楼层    本楼为最佳答案   
本帖最后由 YunGuo 于 2021-2-14 01:25 编辑

你看我发的图,看你按了f12后是不是会直接跳转到这个地方,然后看不到网页内容,如果是,就点击我发的图点那个红框中的停用断点(或者快捷键Ctrl+F8)。如果不是这个问题,请麻烦你发图,不然不知道你的问题。。。。另外,小白到这个程度,不知道什么是断点,什么是抓包分析,那么建议你去找这方面的教程学一学,毕竟都是爬虫基础,别走还没学会,就去跑。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-2-9 14:55:30 | 显示全部楼层
本帖最后由 YunGuo 于 2021-2-9 15:37 编辑

你要爬什么?帖子?还是图片?
大部分爬虫思路都是这样:
首先你得分析网站的结构,数据是动态加载的?还是存在网页源代码中的?
如果是存在网页源代码中,那就简单,直接请求到数据然后去提取就行;
如果是动态加载,数据就是通过浏览器渲染后才显示在网页中的,这就说明,数据是有另外单独的接口的,找到这个数据接口然后去请求接口就可以拿到数据。
一般找数据接口常用的方法就是关键词查找,通过一些特定关键词快速定位数据接口,比如你这个原神社区的帖子数据,关键词就可以是page;
PP~Q_Q5C8Z2SZORT_{K%X`C.png
那么为什么是page?因为这个论坛数据是通过ajax请求的(点击加载更多时网站没有刷新,直接加载出来了数据,这就是异步请求的特征),既然这样,那么它应该是有翻页参数的,通过这个参数关键词就可以快速定位到数据接口
最后去请求这个接口,带上必须的参数,就可以拿到数据。
这个论坛,不管是帖子,还是同人图片(暂时我只分析了这个两个),你都可以用上面这个方法,关键词找接口,请求接口,拿到数据。


最后,附上接口,你可以先自己试试,再看我找到的接口。
论坛帖子:https://api-static.mihoyo.com/takumi/apihub/wapi/webHome?gids=2&page=1&page_size=20
同人图帖子:https://bbs-api.mihoyo.com/post/wapi/getForumPostList?forum_id=29&gids=2&is_good=false&is_hot=false&page_size=20&sort_type=1
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-2-13 15:26:43 | 显示全部楼层
YunGuo 发表于 2021-2-9 14:55
你要爬什么?帖子?还是图片?
大部分爬虫思路都是这样:
首先你得分析网站的结构,数据是动态加载的?还 ...

为什么我f12打不开的?
先开f12在跳转也不行
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-2-13 16:12:25 | 显示全部楼层
应该是网站的禁止调试的代码吧。先停用断点,再刷新整个网页,就可以去抓包分析了。
}}6){PES[F{5~{Y2(2{QUUI.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-2-13 16:50:55 | 显示全部楼层
YunGuo 发表于 2021-2-13 16:12
应该是网站的禁止调试的代码吧。先停用断点,再刷新整个网页,就可以去抓包分析了。

不会呀.停用断点和抓包分析是什么意思?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-2-13 18:51:46 | 显示全部楼层
chrome 浏览器 直接 右键 --> 查看网页源代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-2-16 18:34:25 | 显示全部楼层
谷歌浏览器毫无压力,直接F12或者右击都可以
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-2-18 17:31:06 | 显示全部楼层
极臻 发表于 2021-2-16 18:34
谷歌浏览器毫无压力,直接F12或者右击都可以

为什么我不行,我也是谷歌呀。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-2-18 17:38:26 | 显示全部楼层
YunGuo 发表于 2021-2-14 01:24
你看我发的图,看你按了f12后是不是会直接跳转到这个地方,然后看不到网页内容,如果是,就点击我发的图点 ...

谢谢了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-16 13:52

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表