鱼C论坛

 找回密码
 立即注册
查看: 1701|回复: 0

[技术交流] python写一个爬虫,爬取一个反共网站的情报内容,将关键内容爬取出来并保存

[复制链接]
发表于 2021-9-24 10:30:51 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 sym945 于 2021-9-24 10:42 编辑

情况是公安网警交给我们公司的一个任务,对一个反共黑客网站进行定时情报收集,目标是把该网站展示的攻克成果给爬取出来,当该博客再次更新攻克成果时候比较新的成果,将新成果记录下来,定时邮件发送给网监,因为公司其他人都有别的任务,目前剩下的人就我一个人看学过一些python,老大就把任务给我了,爬虫部分还没看,要边看边学,希望大佬提供一些帮助,已经爬取出关键内容了,因为目前爬取出打印出来的包含了标签还有内容,需要将<a>标签的链接还有内容给保存出来方便以后进行比较,代码如下图
微信图片_20210924101848.png
<a>标签链接访问内容,如下图
微信图片_20210924102133.png
要实现结果是把访问之后的页面进行截图,然后把网站中展示的内容给提取出来,发送邮件给网监,请问大佬们要怎么实现,有没有参考的知识资料
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-14 12:18

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表