聚类分析和神经网络的无线网络流量预测研究

2021-04-08 01:55李刚

现代电子技术 2021年7期

李刚

（北京工业大学软件工程学院，北京 100022）

0 引言

随着移动技术、传感器技术、无线通信技术、微电子技术等不断发展和融合，出现了许多类型的无线通信网络系统，给人们的工作和生活带来便利[1-3]。随着无线网络用户不断增多，每天无线网络的数据量不断增加，尤其到了节假日、周末以及晚上等上网高峰期，无线网络拥塞的概率相当高，严重影响人们正常上网[4-6]。无线网络流量预测可以帮助管理人员和网络公司预测无线网络流量的变化特点，同时跟踪网民上网的行为特性，这样可以提前制定相应的无线网络管制方案，以防止出现无线网络拥塞现象。因此无线网络流量预测成为无线网络管理研究中的一个重要方向，对其进行研究具有重要的理论和实际应用价值[7]。

由于无线网络是一个新事物，其网络流量的预测基本沿用有线网络的流量建模方法，传统无线网络流量预测模型主要为时间序列分析法，首先将无线网络流量历史样本按时间先后顺序进行排列，选择一部分无线网络流量历史样本作为训练样本，对无线网络流量预测模型的参数进行估计，并且对另一部分无线网络流量历史样本进行预测，对预测效果进行统计和分析。传统模型主要针对小规模的无线网络，不能满足现代无线网络向大规模方向发展的要求[8-10]。现代无线网络流量预测模型主要为非线性建模技术，如：灰色理论的无线网络流量预测模型、RBF 神经网络的无线网络流量预测模型、BP神经网络的无线网络流量预测模型等，它们通常有较强的自适应学习能力，可以对无线网络流量变化特点进行拟合，无线网络流量预测效果要优于传统无线网络流量预测模型[10-12]。训练样本集合的构建对无线网络流量预测结果具有决定性的影响，目前主要根据时间的前后进行训练样本集合选择，或者采用随机方式选择训练样本集合，这样无法建立性能最优的无线网络流量预测模型，无法获得高精度的无线网络流量预测结果，同时使得无线网络流量预测建模时间长，影响无线网络流量预测建模效率[13-14]。

针对当前无线网络流量预测精度低、预测结果可信度低等问题，为了获得理想的无线网络流量预测结果，设计了聚类分析和神经网络的无线网络流量预测模型，采用聚类分析算法构建最优的训练样本，然后引入神经网络建立无线网络流量预测模型，与其他无线网络流量预测模型方法进行了对比测试，验证了本文无线网络流量预测建模方法的可行性，并且预测结果要明显优于其他模型，是一种精度高、效率高的无线网络流量预测建模方法。

1 聚类分析和神经网络的无线网络流量预测模型

1.1 聚类分析算法

当前聚类分析算法很多，如k-均值聚类分析算法、模糊均值聚类算法，其中模糊均值聚类算法的通用性强、性能较优，因此本文选择模糊均值聚类算法对无线网络流量预测过程中的样本进行预处理，选择最优的训练样本集合。设无线网络流量的数据集为X={x1,x2,…,xn}，n表示样本的数量，那么该无线网络流量的数据集可以划分为c类，它们的聚类中心集合为V={v1,v2,…,vc}，每一个无线网络流量均可以划分到相应的类别中，每一类有一个隶属度值uij，它们构成一个隶属度矩阵U= (uij)c×n，模糊均值聚类算法的一般优化目标函数为：

式中：m表示模糊系数；dij表示样本xj与聚类中心vi之间的距离。

1.2 神经网络

极限学习机是一种基于深度学习理论的神经网络算法，与其他神经网络一样，由大量的神经元构成。相对于传统BP 神经网络或者RBF 神经网络，极限学习机不需要计算输入权值和隐含层阈值，因此学习速度加快，基本结构如图1 所示。

图1 极限学习机结构

设极限学习机的输入权值和隐含层阈值分别为a和b，极限学习机模型可以表示为：

在极限学习机的学习过程中，误差O逐渐减小，输出层的权重值可以通过下式得到：

式中H+表示H的逆矩阵。

1.3 聚类分析和神经网络的无线网络流量预测模型工作步骤

1）对某一个无线网络通信系统一段时间的流量数据进行采集，并做如下归一化操作：

式中xmax表示无线网络流量的最大值。

2）采用模糊聚类分析算法对无线网络流量数据进行聚类操作，选择与每一个无线网络预测样本点相关的训练样本集合。

3）设置极限学习机隐含层神经元数，同时初始化输入权值和隐含层阈值。

4）采用极限学习机对无线网络流量训练样本进行学习。

5）构建隐含层的输出矩阵，计算输出层的权重值。

6）统计无线网络流量训练误差，如果误差超过了无线网络管理的实际要求范围，返回到步骤4）继续进行学习。

7）极限学习机训练终止，建立无线网络流量的预测模型。

基于聚类分析和神经网络的无线网络流量预测流程如图2 所示。

图2 聚类分析和神经网络的无线网络流量预测流程

2 无线网络流量预测的实例分析

2.1 无线网络流量数据

为了对聚类分析和神经网络的无线网络流量预测效果进行评价，收集了200 个无线网络流量数据作为研究对象，变化曲线如图3 所示。

图3 200 个无线网络流量数据

选择ARMA 的无线网络流量预测模型、BP 神经网络的无线网络流量预测模型进行对比测试。为了体现无线网络流量预测结果的可靠性，进行5 次仿真对比实验，每一次实验的训练样本和测试样本数量如表1所示。

表1 无线网络流量的训练样本和测试样本数量个

2.2 无线网络流量预测精度对比

统计3 种模型的无线网络流量预测精度，如图4 所示。从图4 可以发现，随着无线网络流量训练样本数量的不断增加，无线网络流量预测精度不断上升，这是因为训练样本越多，那么无线网络流量训练效果就更优，建立的无线网络流量预测模型更好。在相同数量训练样本情况下，ARMA 的无线网络流量预测精度最低，因为它是一种线性建模技术，与无线网络流量变化特点不相适应；BP 神经网络的预测精度要高于ARAM，因为其是一种非线性建模技术，可以更好地跟踪无线网络流量变化趋势；而本文模型的无线网络流量预测精度最高，这是因为通过模糊聚类分析算法可以构建更优的训练样本集合，同时引入极限学习机进行学习，学习性能更优，减少了无线网络流量预测误差，预测结果更加可靠。

图4 无线网络流量预测精度比较

2.3 无线网络流量的建模时间比较

统计3 种模型的无线网络流量训练时间和预测时间，结果如表2 所示。从表2 可以看出，无线网络流量的测试时间相差不大，但是训练时间差异很大，其中BP 神经网络的训练时间最长，因为其收敛速度比较慢，而本文方法的训练时间最短，因为其选择了最优的训练样本数据，减少了训练时间的复杂度，提升了无线网络流量预测的建模速度。

表2 无线网络流量预测的建模时间对比 s

3 结语

为了解决当前无线网络流量预测过程中存在的一些难题，本文采用聚类分析算法构建最优的训练样本，采用神经网络中的极限学习机对训练样本进行学习，与其他无线网络流量预测模型进行对比实验，结果表明，本文模型是一种速度快、误差小的无线网络流量建模工具。