焦点期刊
在线客服

著作编辑 著作编辑

咨询邮箱:568476783@qq.com

计算机论文

大数据分析的网络安全风险挖掘和估计方法

时间:2022-09-03 22:46 所属分类:计算机论文 点击次数:

1引言
互联网技术发展迅速,互联网网络环境高度开放。一些攻击者利用网络的不确定性和多样性攻击网络,严重威胁网络运行安全[1-2]。以往的网络防御方法只利用数据包中包含的信息获取风险估计结果,风险估计结果的准确性较低。为了保证网络运行的安全,网络管理者实时明确网络运行状态,提前明确网络安全风险,采取相应的防御措施抵御风险,是保证网络安全运行的重要基础[3-5]。目前,许多研究学者对网络安全风险进行了大量的研究。韩晓露、何春蓉等人利用直觉模糊集和注意力机制评价网络安全趋势[6-7],但网络安全风险仍存在报警过多、误报率高的缺陷。从大量网络大数据中挖掘有用的网络安全风险数据是准确评估网络安全风险的关键。当网络发生攻击时,会形成大量的报警信息,提高数据挖掘的难度[8]。高效的大数据挖掘方法对提高网络安全风险评估的准确性非常重要。为此,本文提出了基于大数据分析的网络安全风险挖掘和估计方法,并对其性能进行了测试和分析。
2大.网络安全风险挖掘与估计方法数据分析
提取数据挖掘的相关规则
收集大量网络数据中的安全事件,由于收集的网络安全事件格式差异较大,需要对安全事件进行综合处理,便于挖掘相关规则。利用挖掘相关规则分析网络安全风险的类似病毒[9]、类似漏洞等攻击行为,提高网络安全风险评估的准确性。利用大数据分析技术提取网络安全事件相关规则。W={w1,w2,…,wn}表示安全事件元素集合,R={r1,r2,…,rn}表示数据集,数据集R中包含的元素ri它们都是由W建立的集合,即存在riW。定义1:利用集合R内元素建立集合R内元素C,可以满足数据集中的元素Cri当所需数量为l时,可获得数据集R中集合C的支持度计算公式如下:(1)(1)定义2:存在集合C和集合D满足AW∩IDW时间,使用表示C→D的置信度。挖掘数据集可以满足最小置信度和最小支持度C→D即大数据挖掘方法所需挖掘的相关规则。通过挖掘事务集中的频繁项目集合,可以获得不同事务之间的相关规则。网络安全事件具有规模大的特点[10],选择云计算平台Hadoop平台实现了大量网络安全事件相关规则的挖掘。大数据分析技术挖掘的相关规则分为两部分:(1)挖掘频繁项集,挖掘频繁项集应满足最小支撑;(2)利用数据挖掘获得的频繁项集挖掘符合最小置信条件的相关规则。Hadoop平台利用Map函数以及Reduce函数获取项目集子集和综合获取子集支持,通过分析所有子集支持获得挖掘网络安全事件中的频繁项目支持,挖掘网络安全事件数据集中包含的频繁项目集。Hadoop平台挖掘相关规则的过程如下:最小支持度β原始网络安全事件数据集R作为Hadoop平台运算输入;将能够满足最小支持的频繁项作为能够满足最小支持的项目Hadoop平台运算输出。Map任务:(1)根据输入文件路径,将原始网络安全数据集分为n大小的数据子集,并对分割的子集进行格式化处理,获得键值对,其中value与key分别表示数据信息和字符偏移。(2)获得不同子集中的键值对基础Map函数读取、数据信息value利用split函数分析,将分析结果传输到集合中;(3)使用输出key表示所有子集,设子集value值等于1;(4)调用所有可选的调用Combin函数,全部Map在网络安全数据中生成相同的端子key值的键值是正确的,通过Combin函数合并所有相同的键值对,改进通过网络发送的键值对Reduce端部造成运算效率低的缺陷;Reduce任务:(1)排序Combin函数发送的键值对,合并相同key值的键值是正确的,获得的,获得的键值是使用的Re-duce函数读取,累加键值对中L()内值。R内网络安全数据集key集合支持的数量,获得的结果,即获得的结果,即Reduce终端具有频繁候选项集的全球支持;(2)根据最小支持将高于最小支持的候选项集发送到存储数据的外表中,利用获得的外表查询挖掘获得的频繁项集,将频繁项设置为MapReduce程序输入及输入相关文件。最小置信度δ并满足最小置信度δ相关规则分别作为挖掘网络安全事件相关规则的输入输出,操作过程如下:(1)选择Map函数启动setup法律连接数据库;(2)分割存储数据建立外表中的频繁项集,完成分割后获取数量为n的数据子集,将所有数据格式化到键值对;(3)分析value内部频繁项集内部元素,完成分析后获得相应的value值用(C,D,SValue)这意味着获得什么(C,D)(4)求解频繁项集中元素子集C,读取元素子集C支持度sup(C),利用表示C→D的置信度。(5)当获得的信用度高于设定阈值时,获得的频繁项集包含子集外的所有元素和子集的相关规则,并使用获得的差集和子集建立key值,该key值的置信度值为value。通过上述过程挖掘网络安全事件的相关规则,利用支持向量机的方法根据挖掘的相关规则实现网络安全风险估计。