【开源威胁情报挖掘1】引言 + 开源威胁情报挖掘框架 + 开源威胁情报采集与识别提取

本文介绍: 网络安全威胁情报的价值网络安全威胁情报是指来自外部的与安全威胁相关的信息资源。这些信息包括了各种恶意威胁的特征、攻击者的行为模式以及攻击方式等。这些情报可以帮助安全人员快速识别恶意威胁攻击，并采取及时的响应和防御措施。开源威胁情报挖掘技术的崭露头角传统的威胁情报挖掘存在信息量不足的问题，而开源威胁情报挖掘技术通过从多方开源情报来源中收集和分析信息，为这一领域注入了新的活力。美国和欧洲是最早在政府层面积极开展开源情报挖掘技术研究的国家和地区，他们将其作为政府的常规情报搜集手段，并在网络安全领域取得了显著成果。

目前计划在网络安全领域的开源威胁情报挖掘展开进一步实验和论文写作，欢迎交流。

本文基于2022年1月《信息安全学报》崔琳等老师的论文基于开源信息平台的威胁情报挖掘综述进行梳理了解。

该论文为我们提供了一个全面的开源威胁情报挖掘框架，涵盖了该领域的关键方向、技术应用及未来趋势。
注意：这篇论文发布时间稍早，最前沿的视角需要之后再去补充阅读其他相关论文。

关键词：开源威胁情报;识别提取;融合评价;关联分析

这篇综述的内容相当扎实，所以预期分几次完成阅读。

网络安全威胁情报是指来自外部的与安全威胁相关的信息资源。这些信息包括了各种恶意威胁的特征、攻击者的行为模式以及攻击方式等。这些情报可以帮助安全人员快速识别恶意威胁攻击，并采取及时的响应和防御措施。

传统的威胁情报挖掘存在信息量不足的问题，而开源威胁情报挖掘技术通过从多方开源情报来源中收集和分析信息，为这一领域注入了新的活力。美国和欧洲是最早在政府层面积极开展开源情报挖掘技术研究的国家和地区，他们将其作为政府的常规情报搜集手段，并在网络安全领域取得了显著成果。近年来，中国也在积极采集和整理网络开源威胁信息，并拓展了开源威胁情报的应用范围。

本文深入分析了近6年来100多篇相关文献，系统梳理了威胁情报挖掘技术的技术理论和在网络安全检测中的应用场景。
文章归纳总结出了开源威胁情报挖掘的一般流程框架模型，并针对关键场景进行了深入分析和论述，包括开源威胁情报的采集与识别提取、融合评价以及关联应用。
研究还系统评述了这三部分研究工作中的细分热点方向，并从技术应用场景、所使用的技术、性能评估以及优缺点评价等多个角度对各解决方案进行了系统优劣势分析。

可以看出，随着目标场景变化，恶意攻击者将网络空间攻击的复杂性和影响力提升到前所未有的程度，其攻击模式、数量与种类层出不穷。这些新型攻击充分利用了web、电子邮件、应用程序等多种传播方式，且可在网络系统中相互渗透，以捕获有价值的数据，具有常态化、专业化、多矢量、多阶段等特性。由于新型攻击的这些特性，加之攻击者的先手优势，这也对现今网络空间的威胁防护提出了新的挑战。
传统安全防御方法大多依靠部署于边界或特殊节点的防火墙、入侵检测系统等安全设备，通过基于启发式和签名等静态检测方法，将每个攻击向量视为一个单独路径进行分阶段独立检查，而缺少全局视角，难以应对攻击策划精妙、更新迭代频繁的新型网络威胁攻击。

针对网络空间所面临的新型安全威胁，一个重要的防护手段是深度挖掘网络威胁的情报信息，并将其引入至安全检测全周期中，从而主动发现并防御恶意且极难检测的攻击行为。
网络威胁情报(CyberTh re atIntel li gence，CTI)挖掘技术通过收集、挖掘、识别实时网络威胁信息并将其转化为威胁情报。一般来说，威胁情报是指可用于解决威胁或应对危害的知识，包括威胁来源、攻击意图、攻击手法、攻击目标信息，具有知识密度大、准确性高、关联性强等特点，能够为安全分析的各个阶段提供有力的数据支撑，并可针对多态、复杂的高智能威胁与攻击做出及时响应防御。

美国非常重视威胁情报，从战略、法律、标准、防御体系、与私营部门的信息共享方面都制定了相对完善的机制[2]。美国也是最早在政府层面开展开源情报挖掘技术研究的国家，并将其作为政府的常规情报搜集手段。当前美国已建立起了覆盖地方、企业、政府等多个层面的开源威胁情报挖掘体系，重点着眼于开源威胁情报的挖掘技术研究及深度利用。
欧洲网络与信息安全局于2019年建立了一个整合各方资源的统一开源威胁情报挖掘共享中心，强调扩大网络威胁情报的收集范围，包括来自相关学科的事件信息，并将这些数据的收集、存储和分析标准化。
国家应急响应中心CNCERT以及国内各大知名安全公司如绿盟，360等近年都陆续构建了国内顶尖的开源威胁情报平台，能够实时采集整理网络开源威胁信息，并拓展开源威胁情报的应用，使其成为我国网络安全防御体系的关键组成部分，贯穿于态势感知平台、下一代防火墙、入侵检测系统等众多的安全产品之中。
近年来，我国威胁情报市场发展势头良好，其中威胁情报安全服务提供商的收入也在连年增长。但相较而言，我国的威胁情报体系发展仍处于起步阶段，虽然涌现了一批较为出色的威胁情报公司，并在部分厂商的实际情景中开始落地应用。但总体来看，其开发及应用主要集中于商业威胁情报，对于开源威胁情报的关注相对较少，同时缺乏有效、可靠的威胁情报的挖掘采集、质量评价手段，其对应基于开源威胁情报的网络安全分析技术也较为落后，没有形成情报挖掘分析、评价与利用为一体的威胁情报综合服务平台。

尽管开源威胁情报已成为安全行业的研究及应用热点，但仍然存在许多制约开源威胁情报产业链发展的关键问题尚待解决，包括开源威胁情报挖掘关联、质量评价、落地应用等关键技术的研究。
近年来，学术界结合云计算、大数据等前沿技术对这些关键技术问题进行了深入研究探索。如图2所示，学术研究热度连年上升反映出该领域已持续受到关注，研究和分析已有的开源威胁情报研究概况，对于进一步推进我国开源威胁情报挖掘分析工作的发展，提高国家网络安全的整体防御能力，具有重要的意义。

《网络威胁情报权威指南》给出的定义，威胁情报是指对企业可能产生潜在或直接危害的信息集合。
这些威胁信息经过搜集、分析、整理, 能帮助企业研判面临的威胁并做出正确应对, 以保护企业的关键资产。

现代方法：现代方法通过开源信息平台的安全应用发展，利用自动化获取和识别技术，提供了解决传统方法限制的新途径。这包括从安全论坛和博客等平台获取非结构化语义文本数据。
本节依据开源情报信息载体的不同, 将其划分为技术博客、社区论坛、社交媒体、公开报告、通用方法等五个开源威胁情报识别提取平台并依此筛选分析代表性的相关研究工作，接下来，针对这五个平台中开源威胁情报的识别提取研究工作进行分别阐述。

话题检测技术：结合命名实体识别 (NER)、支持向量机 (SVM)、逻辑回归 (LR) 和随机森林 (RF) 等机器学习分类方法，这些技术帮助过滤掉与威胁情报无关的非结构化信息内容，并实时跟踪目标内容源。

开源威胁情报采集与识别提取是威胁情报挖掘的基础，需要进一步发展，以提高采集准确率并扩展其在威胁分析和预防应用中的作用。

公共报告作为开源威胁情报的重要来源，通常包含安全、漏洞或威胁等相关主题，并由专业人员发布。尽管这些报告时效性可能不高，它们在形式和内容上的专业性使其成为覆盖大量威胁情报信息的重要资源。

IOC提取是从开源情报数据中提取威胁情报实体的核心研究点。这包括命名实体识别技术或其他人工智能处理技术（如正则表达式匹配、SVM等），用于定位和提取IOC，并应用机器挖掘技术获取目标实体关系。最终，这些数据会根据实际需求进行标准化威胁情报格式输出。

本节将开源威胁情报识别提取研究工作划分为技术博客, 社区论坛, 社交媒体, 公开报告, 通用方法五个平台, 并对这些平台的开源威胁情报识别提取工作进行详细对比分析, 如表 2 所示,
其中每一行代表一项研究工作,
第 1 列代表该项研究的主要提取平台;
第 3 列为该研究主要的技术应用场景;
第 4列是为实现该研究所应用的技术方法;
第 5 列为性能评估;
第 6 列为通过总结优缺点对该项研究工作的评价。

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

威胁开源情报

基于开源信息平台的威胁情报挖掘综述

写在最前面

1 引言

近年来的一些新型网络安全威胁类型

挖掘网络威胁的情报信息

威胁情报分类：内、外部威胁情报

国内外开源威胁情报挖掘分析工作

主要贡献

研究范围和方法

2 开源威胁情报挖掘框架

1. 开源威胁情报采集与识别

2. 开源威胁情报融合评价

3. 开源威胁情报关联分析

3 开源威胁情报采集与识别提取

传统与现代威胁情报采集的对比

3.1 开源威胁情报采集方法

3.2 开源威胁情报识别提取

3.2.1 技术博客

端到端模型的应用

大规模数据处理模型

图挖掘技术

基于CNN的模型

深度学习方法

3.2.2 社区论坛

针对暗网信息的预处理概率模型

暗网和深网的威胁情报原型系统

利用机器学习算法的分类方法

自动挖掘IOC信息的工具

3.2.3 社交媒体

事件提取方法

自我学习框架

端到端模型

分析框架

基于社交媒体数据的OSCTI自动提取框架

挑战与展望

3.2.4 公共报告

漏洞报告的自动化收集工具

弥补公共报告的信息不足

公共代码库中的威胁情报挖掘

从非结构化报告中提取威胁情报

挑战与展望

3.2.5 通用方法

NLP和模式识别框架

虚拟化结构和分布式处理系统

事件驱动的智能框架

轻量级在线框架

挑战与展望

IOC提取的核心要素

3.3 总结与讨论

技术应用与比较

实体识别技术

关系模型构建

机器学习分类

神经网络的未来应用

挑战与展望

4 开源威胁情报融合评价

prompt：阅读梳理文献的尝试

相关文章

发表回复 取消回复

发表回复取消回复