鱼C论坛

 找回密码
 立即注册
查看: 3027|回复: 3

[已解决]有没有通过主页面爬取子页面的链接方法

[复制链接]
发表于 2022-11-21 16:00:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
比如只通过这个网站:
豆瓣.com



获取到:
豆瓣.com/review/best/
豆瓣.com/tv/
等等....

不让我发链接。大佬们将就看下!
最佳答案
2022-11-24 10:23:42
你要是学习过web渗透,就会知道很简单。
首先,网上有很多别人写好的工具,一般我们称之为攻击网站之前的获取域名信息。
如果你要自己实现的话,可以去网上找一个域名字典,然后利用爬虫,去访问,如果返回200,即说明这个网页存在,返回404则不存在
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-11-21 19:36:02 | 显示全部楼层
我觉得你需要一个“网站下载器”软件
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-24 10:23:42 | 显示全部楼层    本楼为最佳答案   
你要是学习过web渗透,就会知道很简单。
首先,网上有很多别人写好的工具,一般我们称之为攻击网站之前的获取域名信息。
如果你要自己实现的话,可以去网上找一个域名字典,然后利用爬虫,去访问,如果返回200,即说明这个网页存在,返回404则不存在
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-24 10:26:46 | 显示全部楼层
这个属于web渗透信息收集中的内容,网上有很多别人写好的工具,如果你自己写的话,需要一个域名字典,然后写个python爬虫,去一一访问,如果返回200,表示存在,返回404,表示不存在。
大体是这个思路。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-25 13:13

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表