基于LSTM的电缆负荷温度预测方法研究

2021-09-22 06:14冯虎宗张宗涛李翔陈江张昆荣
电子技术与软件工程 2021年15期
关键词:神经元电缆聚类

冯虎宗 张宗涛 李翔 陈江 张昆荣

(甘肃电器科学研究院 甘肃省天水市 741000)

随着我国电网不断壮大,使得电力电缆铺设的范围和密度也同步扩大。电力电缆在长时间内以高压方式供电的过程中会直接引起电缆的发热,进而可能导致电网局部的温度超标,破坏绝缘介质,最终影响电网的安全可靠地运行和导致电网火灾;同样,若传统电缆导体正常运行时的温度太低,会大大降低对电缆资源的利用率。因此电缆温度预测具有重要的现实意义。

本文提出了一种基于LSTM神经网络的电缆温度预测方法,首先用SOM神经网络将电缆温度序列进行分类并构建各类数据集,其次将各类数据集使用LSTM对其进行训练,最后使用测试数据对训练好的网络进行验证,并将结果与常见方法对比,证明本文方法的有效性和准确性。

1 神经网络原理

1.1 LSTM基本原理

包含三个循环结构的LSTM如图1所示,每个循环结构有两个输出,其中一个即为单元状态,LSTM系统由输入门、遗忘门、输出门和单元状态组成。输入门决定当前时刻网络的输入数据有多少需要保存到单元状态。遗忘门决定上一时刻的单元状态有多少需要保留到当前时刻。输出门控制当前单元状态有多少需要输出到当前的输出值。各环节用公式相互连接,从数学角度实现物理抽象概念。

图1:LSTM内部结构图

公式(1)决定丢弃何种信息,公式(2)、(3)决定更新何种信息,公式(4)示意细胞状态的变化,公式(5)、(6)决定信息的输出。其中σ一般选择sigmoid函数,将输出控制在0和1之间,0代表“全部不允许通过”,1表示“允许全部通过”。W=[Wf, Wi, WC, Wo]表示待训练的权重矩阵,B=[bf, bi, bC, bo]表示偏置量,表示不同时间的细胞状态。

1.2 SOM基本原理

Som自组织神经网络通过学习输入空间中的数据,从一种降维的角度对数据进行无监督学习。不同于一般的神经网络使用反向传递算法进行训练,SOM利用竞争学习策略,让神经元之间自发互相竞争并逐步优化网络。并且使用近邻关系函数来维持输入空间的拓扑结构,使输入空间中相邻或相似的样本会被映射到靠近的神经元中,从而不需要人工介入的同时也可以对数据进行聚类,且不同于k-means等聚类算法,并不预先估计聚类结果,可以最大化的挖掘出数据关系。SOM网络由输入层和输出层构成。输出层又叫竞争层,一般设置为由神经元构成的二维平面;输入层与普通BP网络输入层类似,其大小由样本数据的特征向量大小决定。

训练过程如下:

第一步:初始化权值矩阵,假设一条输入数据有D个维度,为映射到二维神经元上,竞争层有n×m个神经元。故有n×m个D维矩阵。

第二步:选取一个样本X=(x1, x2, x3…xD),遍历竞争层的每一个神经元,计算X与神经元之间的相似度,经过多种实验处理,本文最终采用欧氏距离表示X与神经元之间的相似度。选取最小距离的神经元作为优胜神经元,又叫BMU(best matching unit),根据邻域半径确定优胜邻域包括的点,即与BMU距离较近的所有神经元。

第三步:更新优胜邻域内的节点权值矩阵,越靠近BMU的神经元更新幅度越大,越远离BMU的神经元更新幅度越小。

1.2.1 党参总皂苷纳米乳处方筛选。室温下,将党参总皂苷分别溶于表面活性剂(Cremophor EL40、Tween-80、Span-80)、助表面活性剂(PEG400、1,2-丙二醇)、油(辛酸癸酸甘油三酯、橄榄油)中,涡旋振荡,直至不再溶解,测定药物在各溶剂中的溶解情况。

θ(i,j)是一种对更新幅度的约束,与更新神经元和BMU之间的距离有关,本文用可以近似估计为高斯函数的bubble函数来表示。

第四步:迭代次数+1,返回第二步,直到满足设定的迭代次数。

2 基于LSTM的电缆负荷温度预测方法

2.1 预测方法

本文提出基于LSTM的电缆负荷温度预测方法,具体步骤如下:

(1)数据预处理:将不同电缆温度样本数据进行归一化处理,消除量纲之间的影响的同时也使数据更适应神经网络,并按一定比例划分为训练数据集和测试数据集。

(2)SOM聚类:提取各条数据之间的差异性,将归一化的数据输入SOM神经网络,把相同聚类结果的数据归为一类,为下一步的LSTM神经网络提供不同类别的数据集以提高预测精度。

(3)LSTM模型选择:选取多种LSTM网络结构,分别输入训练数据并计算误差,选择误差最小的网络结构作为本文选取的LSTM网络模型。并分别使用SOM聚类后的数据集训练LSTM网络参数。

(4)预测输出并验证:先由SOM神经网络对测试数据集进行聚类,然后将测试数据输入到训练好的该类别LSTM网络中得到本文预测值,并与真实值、BP神经网络和ARMA方法进行对比。

2.2 LSTM网络结构选择

一般来说,LSTM网络中参数的多少与网络的学习能力呈正相关,与训练时间和效率呈负相关。不同的Time_step和cell_size同样会对预测结果产生不同的影响。

表1:不同LSTM网络结构参数

3 实验与分析

为验证本文提出的基于LSTM的电缆负荷温度预测方法,实验数据选取来自某市1个月的193条电缆负荷温度,预测时间分辨率为一小时。实验的软件框架是TensorFlow,运行Windows10,64位操作系统。硬件方面,服务器是acer,AN515-52-73QL,CPU是i5-8300H,2.30GHz,内存是8GB。

3.1 电缆温度数据样本

相同的数据维度之间,最大值与最小值之间可能存在较大差距。在构建数据集时需要尽可能的消除一切影响,为了消除指标之间的量纲影响,本文采用现有神经网络体系下比较简单且实用的最大-最小标准化处理方法,将电缆负荷温度序列的所有数据分别归一化至[0,1]区间内,如公式8所示,该方法可以加快神经网络的训练速度。

式中,xmax表示序列中最大值,xmin表示序列中最小值,xold是样本数据归一化前的值,xnew是数据归一化后的值。将归一化的数据经过SOM自组织网络。

为保证实验的科学性,随机从每种样本中选取40个作为训练样本,10个作为测试样本,并使用在预测领域常用的评价指标均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)来衡量平均实验结果。

3.2 仿真结果分析

使用2.2章节选取的LSTM神经网络模型对各类样本数据进行仿真,训练的Batch_size设置为5,学习速率为0.004,采用Dropout方式优化全连接层,Dropout参数设置为0.5。流程如2.1章所示,具体先将SOM网络分类的数据格式调整为LSTM的输入形式;然后分别对每种数据进行训练和预测;最后为最大化消除实验带来的偶然性,将每种网络对每种数据进行多次实验,取结果平均值作为最终预测结果进行对比。

本文算法在MSE、RMSE、MAE三项指标都有较好表现。从宏观上看,比如在类别1中,本文算法MSE比第二名的BP神经网络算法低了0.9055,RMSE比第二名的BP神经网络算法低了0.4836,MAE比第二名的BP算法低了0.4912,其它类别也同样表现最好。微观上尽管在某写固定时间不如其它方法接近真实值,但整体上与真实结果更加拟合。实验结果证明本文提出的算法学习能力更强,更能发掘和领悟到电缆负荷温度变化趋势,能够为后续研究提供依据。

表2:不同LSTM网络训练误差

4 结论

针对电力电缆负荷温度不易直接测量的问题,本文通过SOM与LSTM神经网络相结合的方式对电缆负荷温度进行预测,首先利用SOM神经网络对不同电缆进行聚类并构建不同类别的数据集,其次从不同结构的LSTM模型中选择出适应该数据集的网络结构,以时间序列作为输入变量,建立了电缆温度预测模型。结果表明,通过SOM与LSTM网络相结合的方式,可以更为精确的对电缆负荷温度作出预测,能够为现有的电缆温度不易直接测量、目前预测精确度不高等问题提出新的解决方案与参考价值。

猜你喜欢
神经元电缆聚类
《从光子到神经元》书评
海底电缆——将世界连接起来
跃动的神经元——波兰Brain Embassy联合办公
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
高温超导电缆
高温超导电缆
基于二次型单神经元PID的MPPT控制
毫米波导引头预定回路改进单神经元控制
一种层次初始的聚类个数自适应的聚类方法研究