0x01 需求
最近连续有好几个项目都是从客户被勒索病毒攻击开始,为了能够迅速了解到在暗网中哪些客户被勒索组织公布了,以及情况如何,有多大的数据被泄露了,对应的组织是什么,于是考虑监控暗网中常见的勒索组织的首页从而获取这些信息。
经过技术调研,发现已经有如下的网站提供了整合后的信息,并同时提供了源代码:
源代码信息:
网站提供的公开服务已经能够满足我的需求,同时考虑到我并不需要实时性非常高,直接监控网站就是最好的选择。
0x02 使用n8n快速搭建
对某个网站进行监控并获得所需的信息,在网站没有反爬措施的情况下有非常多的办法和选择。由于我已经部署了n8n软件,借助成熟的软件直接开发一个流程是最简单的办法。
使用的每个组件不具体表述,搭建完成后的流程如下图供参考:

在这个流程中,具体记录的踩坑点在第二个Extract Incident
功能中。记录信息如下:
抓取的事件内容
在网站的recent
功能中,提供了一个<table>
展示最近100条的勒索事件,其每一行的格式如下(为了方便展示,我去掉了最外层的table/tr/tdoby等标签):
<td><center> 2025-04-14 </center></td><td> MENTAL HEALTH </td><td> <a href="/group/inc ransom">inc ransom</a></td>",
"<td><center> 2025-04-14 </center></td><td> REFFINDO-PT Pupk Indonesia (Indonesia) </td><td> <a href="/group/nightspire">nightspire</a></td>
需要注意的地方
获取到这个表格内容后,我理所当然的使用td
标签获取每个事件的一些说明,但是我发现在n8n中无法获取到对应的内容。经过搜索官方的社区,确认这个问题是因为单独这一段代码并不是一个符合要求的html代码..所以我添加了一个组件用于补全这个html片段成为一个标准的可被分析的内容:

补全后,后续的代码节点就可以正常获取到内容并组装:

最后的效果
设置了一个每小时执行的定时任务,在发现事件后即发送到Discord的Channel里面:

0x03 使用AI的示例
上面搞了那么久,其实分析HTML或者甚至整个流程都可以通过一句话要求AI完成,在不考虑价格的前提下,我非常建议使用AI来执行这个任务,非常省时…

发表回复