贝叶斯网络在入侵检测中的应用

2017-05-27 21:13陈亚奇
中国新通信 2017年9期
关键词:贝叶斯样本概率

陈亚奇

【摘要】 互联网的高速发展给人们的生活带来了非常大的方便,而同时也产生了许多安全方面的问题。因此,与入侵检测相关的研究也越来越被人们所关注。入侵检测技术作为保护网络安全的重要技术手段,自第一次被提出至今已经有了20多年的时间。它可以快速的判断网络数据中是否存在攻击行为而得到了快速发展。贝叶斯分类算法因为其推理和预测的高准确性,成为数据分类中一种非常重要的方法。本文提出了一种基本贝叶斯网络的入侵检测算法,利用属性间的依赖关系构建贝叶斯网络,对样本进行分类。

【关键字】 贝叶斯网络 入侵检测 算法

一、贝叶斯网络介绍

贝叶斯网络,在图论里被解释成一种有向无环图。在图里面每一个节点表示一个特征属性变量或者类型属性变量。当节点之间不具备条件独立关系时,他们之间将有一条有向边将彼此连接起来。每个节点都为其保存一个相应的联合概率表。如果该节点为子节点,一定存在其父节点通过一条有向边指向自己,表示子节点对父节点有依赖关系。该节点的所附的概率表则是已知父节点情况下,在属性取值范围内各个属性值发生的条件概率。如果该节点是根节点,他的概率表则表示此节点各个属性值在属性值取值范围内发生的概率。

四、算法实验

本文采用的是数据集是Kdd Cup 99数据集,这个数据集在入侵检测研究领域是非常重要的实验数据,它一共包括将近500万个样本,每个样本对应一个网络连接记录。其中,每个样本包括四十一个网络特征属性,第四十二个属性列是对类属性的一种标记。这个数据集包括的四大攻击类型分别是:DOS,拒绝服务攻击;R2L,来自远程电脑没有权限的登陆;U2R,没有权限的本机超级用户访问;Probing,表示对电脑某些端口的监控。其中还有一种正常的类型被标记为:Normal。

首先对数据进行清理,设样本数为n,将样本分为k=1+3.32*log2(n)组,如果属性值的取值l在下面的区间[min((max min)/ ),min (1) ((max min)/ )]lklk???范围内,那么l就是属性值离散化后的结果。

通过计算得到的部分概率表:

五、结束语

本文提出了基于贝叶斯网络的入侵检测算法。贝叶斯作为一种强大的推理工具,在数据分类上有很多优势。通过实验得出,贝叶斯网络在入侵检测有较好的分类效率。

参 考 文 献

[1] 刘完芳. 入侵检测系统的特征提取方法研究及其完成[D].湖南:湖南大学,2007:1-24.

[2] 罗守山. 入侵檢测[M].北京:北京邮电大学出版社,2004:1-10.

猜你喜欢
贝叶斯样本概率
概率与统计(1)
概率与统计(2)
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯网络概述
贝叶斯公式的应用和推广
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
概率与统计解答题集锦
基于支持向量机的测厚仪CS值电压漂移故障判定及处理