基于机器学习的网络流量分析系统的应用与研究

2021-07-19 13:16陶俊杰李明东姜飞
锦绣·下旬刊 2021年8期
关键词:网络

陶俊杰 李明东 姜飞

摘要:随着网络带宽的快速增长和各种网络业务的广泛应用,网络流量的建模和预测变得越来越重要。为了更好地对网络流量进行建模和预测,本文一方面对现有的几种流量模型进行了总结和分析,分为短相关模型和长相关模型;另一方面分析了常用的流量预测方法,特别是神经网络、模糊理论和小波分析。在实际测量中,采用FIR神经网络模型对网络流量进行预测。最后,展望了流量预测在网络安全领域的应用前景和发展方向。

关键词:网络;流量分析;自相似性

1 网络异常流量分析检测系统的设计与实现

通过分析用户需求,可以知道异常流量分析与检测系统首先要具备的功能就是快速高效的检测出网络中的异常流量。它的核心模块就是检测模块,除此之外,它还应包括:流量采集,日常运维,故障管理等功能模块,如图 1 所示。其中,流量采集模块主要的功能是采集和存储网络中的数据流量,对流量数据进行预处理,使其能够在流量监测模块进行检测;流量监测模块则主要对网络中的流量进行检测,对于异常流量进行响应处理;日常运维模块则主要对网络设备状态进行监控,并对网络流量进行可视化监视,以及异常流量进行人工干预等;故障处理模块主要在网络中出现大量异常流量时进行快速响应处理,包括对异常流量的告警上报及阻断等措施。

1.1网络流量预测方法

用数学模型来描述网络流量, 虽然能对未来时刻的网络流量进行一定的预测, 但要更加灵活、高效地进行流量预测还需要人工智能等一些方法。同时, 网络流量行为随着时间和地域的不同会呈现出很大的变化,因此想提供一种针对网络流量的通用化预测是很困难的,理想的预测方式应该是自适应的而且一定要能够给用户提供足够的可信信息。在网络流量预测中,还存在着可预测性问题,即在一定的预测步长内的最小预测差以及在可接受的预测误差范围内最大的预测步长。

1.2 流量感知模块

在流量感知模块中,使用了 k-means 聚类的方法进行流量数据的聚类,使正常数据和异常数据尽量区分开。在模型训练部分,通过聚类算法将网络流量数据分成差异较大的数据簇,再将每个数据簇的中心点与训练数据库的正常流量数据进行距离运算,根据事先设定好的异常流量阈值判定该数据簇是否为异常流量数据簇,从而达到异常流量的检测目的。框架中,训练模型部分用于生成正常流量数据簇模型,将在线检测部分的不确定数据根据聚类结果来判别正常数据和异常数据,之后将确定为异常的流量数据送入异常流量数据集,改进实时监测模块的检测模型,在下一轮的数据检测时能够更好检测出异常行为。

2 网络流量的实际测量和预测

2.1 网络流量测量与数据的正规化

为了对神经网络在网络流量预测中的效果进行分析, 我们首先进行了网络流量的实际测量。在我们的研究工作中,我们是在某大学校园网的中心交换机上进行流量测量的,流量统计的间隔时间为5min,所采用的是SNMP协议。由于是在大学的校园网上测量,星期一至星期五网络活动较频繁,所测量到的数据变化范围较大, 最小值和最大值之间相差近3个数量级。

2.2 网络流量的随机模拟

用 Trous 算法对网络流量进行分解采用 Trous算法对实际测试到的网络流量时间序列进行分解.本文以 Berkeley 实验室 1994 年在广域网上监测到的数据作为原始网络流量 .从原始数据中取得 1 024 s 的样本数据( 包的统计时间尺度为1 s) , S k 进行尺度数为3 的变换(一般认为至多有 lgn 个不同尺度, 其中为序列长度)。

3 流量预测结果

我们进行网络流量实际预测时,具体做法是:选择某个星期二的一整天24,流量统计的间隔时间是5min,共288个数据。由于早上才上班,所以主要考虑8点(即第96个时刻)后的预测情况。使用式(1)对原始数据正规化后, 再对正规化数据进行训练, 对下周星期二的流量数据提前一步做预测。预测时采用边学习边预测的方式,滑动时间窗口为15,即每次预测前都学习前15个时刻的流量数据。我们主要考察FIR过滤器的阶取不同值时,对预测结果的影响。

4 结束语

随着互联网和物联网技术的发展,网络中异常流量的检测必然成为最主要的安全手段之一,如何面对大数据时代下的异常流量进行高效性的检测,是今后将长期研究的问题。本文通过提出一种将机器学习算法和网络流量分析技术相结合的方法,设计一套对网络异常流量。进行检测的系统框架,使其面对大数据流量时也能保持高效准确的检测,为网络异常流量检测问题提供了新的思路。

参考文献

[1]罗智慧.网络安全流量分析关键技术研究[J].网络安全技术与应用.2020(1):17-18.

[2]Aimin Sang , San- Qi Li.A predictability analysis of network traffic[J].Computer Networks , 2002 ; 39 ( 4 ) : 329~345

[3]A Adas.Traffic models in broadband networks[J].IEEE Communica-tions Magazine , 1997 ; 35 ( 7 ) : 82~8

基金項目:2020年安徽省教育厅关高等学校省级质量工程项目,课程思政项目(编号:2020szsfkc1004);

2020年校级质量工程线下课程(编号:szxy2020xxkc07);2020年宿州学院专创融合重点课程建设项目(编号:szxy2020zckc22);2020年校级质量工程项目(编号:szxy2020xnfz02).

猜你喜欢
网络
网络语言暴力现象及对策分析
抚州市广播电视台非编制作系统网络探究
以网络为载体的政府管理模式创新路径分析
历史文化类旅游产品网络营销探讨—以故宫为例
计算机网络管理技术探析
刍议计算机网络信息化管理
油气集输系统信息化发展形势展望
基于网络的信息资源组织与评价现状及发展趋势研究
基于网络的中学阅读指导
新形势下地市报如何运用新媒体走好群众路线