基于空间相似度和深度学习的中长期用电量预测

2021-06-03 02:45章剑光刘理峰林海峰张永建
浙江电力 2021年5期
关键词:用电量类别用电

章剑光,刘理峰,林海峰,张永建

(国网浙江省电力有限公司绍兴供电公司,浙江 绍兴 312000)

0 引言

提升用电量预测的精度一直是智能电网建设的热点研究方向。同时,准确的用电量预测对电网规划和经济部门的管理决策具有重要的指导意义[1]。电力公司收集了大量的用户用电数据,从数据分布的角度,这些数据呈现规律复杂、峰谷特征多样化等特点。无论是负荷数据还是用电量数据,对数据进行合理聚类,归纳同类型数据的统一特征,对其进行特性分析是必要的。良好的特性分析不仅可以提高预测的准确性,还可以提高预测的效率[2]。因此,用户类别聚类往往是用电量预测的必要前序环节。

我国根据电价类型和负荷特性将电力用户划分为居民用户、商业用户、工业用户、非工业用户和其他用户共5 类。目前,在电量预测工作中,各类用户用电需求发展规律存在较大差异。用电数据与用电预测效果之间存在两大矛盾:一是追求数据的拟合精度可能会降低预测方法的泛化性;二是过于追求复杂算法,会由于数据需求量太大而降低可操作性。因此,需要从新的思路出发,采用新的方法进行中长期用电量预测。

相关文献开展了关于用户分类的研究。传统的聚类方法针对电力用户侧数据,在选取特征和权值的基础上,采用聚类方法对样本进行相似性搜索[3]。文献[4-5]分别使用了K-means 聚类、KMedoids 聚类进行数据划分,还有类似于文献[6]使用的DBSCAN 等基于数据密度的划分方法。另外,文献[7]引入GMM(混合高斯模型)对用电量计量数据聚类,从而划分用户类别。上述分类方法侧重于根据用电数据的数值分布来确定聚类簇,却相对欠缺对用电曲线形状相似性的分析,而形状相似性是区分用户类别的潜在重要指标。

另外,关于用电量预测方面的研究,本质上和负荷预测任务相似,是时间序列的回归问题。针对提升时间序列预测精度的问题已有一定的研究。传统的研究方法,如文献[8]和文献[9],分别使用了自回归滑动平均模型和自回归积分滑动模型实现时间序列数据的预测。目前的研究方法中,研究人员将机器学习、深度学习技术应用于预测任务,文献[10]提出了一种递归笛卡尔遗传规则进化人工神经网络用于峰值负荷预测,模型可以预测一年中各个季节的不同负荷模式;文献[11]提出了LSTM(长短时记忆神经网络)来解决传统RNN(循环神经网络)丢失历史数据信息的问题,通过评价指标,已经证明对时间序列数据,深度学习方法比传统方法具备更好的预测效果。

本文以提升各行业用电量预测的精度作为研究目标,提出了一种先聚类、后预测的方法。利用DTW(动态时间规整)距离作为定量指标来区分每条用电曲线类别;利用层次聚类方法在聚类后建立各行业的独立用电量数据集,使每个独立数据集内的用电曲线具备相似的变化规律。最后,通过深度循环神经网络,分别建立LSTM 和GRU(门控循环单元)深度网络模型针对各个行业建立单独的用电量预测模型,并利用MSE(均方误差)作为定量评价预测效果的指标。

1 基于动态时间规整的用户聚类

合理、准确地区分用电用户的类别对分析各行业用电特征具有重要意义,也是提升后续预测任务精度的基础。本文为了提升后续用电量预测的精度,首先使用DTW 距离和层次聚类法对用户进行聚类。使用DTW 距离作为定量评价用电曲线相似性的依据,根据该距离使用层次聚类法求取每条用电曲线所属的类别,并建立对应类别的数据集,作为后续训练深度预测网络的训练集。

用户的用电量数据随时序不断地采集、记录,以本文面向的数据对象为例,每条用电曲线代表一个单独的用户,曲线的每个数值点表示当日的用电量,如图1 所示。

图1 某用户用电量数据分布示例

1.1 动态时间规整方法理论及其必要性

动态时间规整是时间序列的聚类方法之一。常用的时间序列聚类方法及其对应的相似度评价指标如表1 所示。该方法主要是基于动态时间规整来度量时间序列之间的相似度或者距离,然后将时间序列数据划分为不同组,同一组中的时间序列在空间形状上是相似的。本文使用DTW 距离作为区分各用电曲线类别的原因是,欲将具有相似形状的曲线划分到一起,使得单个数据集内的数据具备明显的空间相似性,以便于学习器更好地学习组内数据特征,进而提升用电量预测的准确性。

表1 时间序列数据聚类方法及其指标

DTW 距离适用于衡量两个时间序列在总体上相似、而在X 轴上局部特征并不匹配的情况。若采用传统的基于欧式距离的聚类方法,则有可能得出不准确的聚类结果,如图2 所示。

图2 采用欧式距离的聚类示意图

图2 中,展示了两条用户年用电量曲线,使用K-means 算法处理原始数据后,结果表明两个用户属于同一类别。虽然两条曲线的取值范围相似,基于欧式距离的算法据此得出了两个用户用电量规律相同的结论,然而从曲线中可看出两个用户在局部用电行为上存在极大的不同,将他们归类为同一类别是不合理的,将影响后续的用电预测效果。因此,应该发掘使用新方法克服传统方法分类用户不准确的问题,基于DTW 距离并结合层次分析法是解决该问题的有效方案。

相较于传统的基于欧式距离的方法,DTW通过局部拉伸或压缩两个时间序列以使其尽可能地相似,然后汇总每一个对齐元素的距离,从而得到两个时间序列的相似性。DTW 较好地解决了欧氏距离无法处理对应数据间沿时间轴方向伸缩、弯曲和线性飘移的问题[12]。DTW 距离计算过程的数学描述如下。

以两个时间序列比较为例,设X=(x1,x2,…,xn),Y=(y1,y2,…,ym),定义非负函数f(x)为每一对元素xi和yi局部相异性测度函数如式(1)所示[13],并进一步定义弯曲曲线如式(2)所示:

式中:Φx(k)和Φy(k)分别映射X 和Y 的时间指数,并且Φx(k)∈{1,…,t},Φy(k)∈{1,…,t},其中,k=1,…,T。

对于给定Φ,计算弯曲时间序列X 和Y 的平均累积变形:

式中:mΦ(k)为权重系数;MΦ为对应的归一化常数,有Φx(k)≤Φx(k+1)。

DTW 通过X 和Y 的求解组合,寻求多个曲线的最优对齐弯曲路径,即:

基于上述理论,通过DTW 来表征不同用户用电量曲线的相似性,定量地反映了用户之间的用电规律相似程度,为后续的聚类环节提供最主要的依据。

1.2 层次聚类方法理论

层次聚类法是一种通过计算不同类别数据之间相似度而创建的具有层次结构的嵌套聚类树。

如本文1.1 节所述,将DTW 距离作为定量计算不同用户用电规律相似性的依据,而后将该相似度由高到低进行排序,逐步连接各个点形成层次聚类树。层次聚类法在本文所提出整体方案中的一般流程为:

(1)移除网络中的所有边,得到有n 个孤立节点的初始状态,n 个孤立节点是n 个用户的年用电量数据。

(2)计算网络中每对节点彼此的相似度,即计算各条用电曲线之间的DTW 距离。

(3)根据相似度从强到弱连接相应节点对,形成树状图。

(4)按照相似度的大小横切树状图,使得每个簇中的曲线具备形状相似性。

在获取层次聚类树状图后,将树枝上每一个树分支作为一个分类单位;然后,将每个类别的数据单独作为一个数据集,对每个类别中的全部数据在相同的时间步上进行求和,为后续预测模型提供具备相似形状规律的训练集。

2 深度学习模型

RNN 通过将信息从网络的上一层传输到下一层,使得网络隐含层每个时刻的输出都依赖于以往时刻的信息,从而使得网络整体具备信息保持能力,较好地适用于数据回归任务。

2.1 数据离差标准化

数据标准化对提升模型收敛速度和提升模型精度具有重要意义。由于原始数据的数值分布区域广,导致训练网络时的损失较大,无法得出有效的结果,因此,通过标准化方法将数值压缩至区间[0,1]中。

常用的数值标准化方法包括离差数据标准化(Min-Max 标准化)、log 函数转换和Z-score 标准化等等。在原始数据确定的情况下,数据集的最大、最小值已经确定,因此本文使用Min-Max 标准化方法对原始数据的数值范围进行约束。

对序列x1,x2,…,xn进行Min-Max 标准化的数学描述如式(5)所示:

式中:y1,y2,…,yn是产生的无量纲新序列,其数值区间为[0,1]。

2.2 长短时记忆神经网络

LSTM 是RNN 的一种扩展,专门设计用来避免长期依赖问题。与朴素RNN 不同,LSTM 存在4 个以特殊方式相互影响的神经网络层,网络模块示意如图3 所示。在LSTM 中,通过门结构来对增加或删除信息,而门结构是选择性地让信息通过的方式,通常由一个Sigmoid 神经网络层和逐点乘积操作组成。

图3 LSTM 核心结构

LSTM 网络具有输入门、遗忘门、输出门3种门结构,用以保持和更新信息流状态。按照信息进入网络的顺序,依次是遗忘门、输入门和输出门,第一阶段是遗忘门,从信息流中提出了部分信息;下一阶段是输入门,输入门确定新信息是否可被存放到细胞状态中;最后一个阶段是输出门,输出门确定输出值。LSTM 是以3 个门结构组成的单元,3 个门结构的数学描述如下:

(1)遗忘门。遗忘门以上一层的输出ht-1和本层要输入的序列数据xt作为输入,σ 代表激活函数sigmoid,w 和b 分别代表待求的权重矩阵和偏置项(以下同),得到输出ft。ft取值范围为[0,1]区间,表示的是上一层细胞状态被遗忘的概率,即边界值0 指的是完全舍弃,边界值1 指的是完全保留。

(2)输入门。输入门包含两部分,第一部分使用sigmoid 激活函数输出为it,第二部分使用tanh激活函数,输出为

式中:WC为输入门的权重参数。

(3)输出门。输出门用来控制该层的细胞状态有多少被过滤。首先使用sigmoid 激活函数得到一个[0,1]区间取值的ot,接着将细胞状态Ct通过tanh 激活函数处理后与ot相乘,即是本层的输出ht。

式中:W0为输出门的权重参数。

LSTM 模型解决了信息持久性的问题,因此更好地利用历史时间序列,获取高准确率的预测结果。

2.3 GRU 神经网络

GRU 是RNN 的一种,与LSTM 一样,其目标也是解决长期记忆依赖和反向传播中的梯度消失等问题。传统的GRU 分类模型是一种基于LSTM的模型变体,从网络结构角度而言,它在LSTM的基础上将遗忘门和输入门合并成更新门,使得最终的模型比标准的LSTM 模型更简单,即实现了以更少参数量实现相同甚至更高准确率的数据预测结果。

GRU 的输入输出结构与普通的RNN 相同。有一个当前的输入xt,和上一个节点传递下来的隐状态ht-1,这个状态包含了之前节点的相关信息。结合xt和ht-1,GRU 会得到当前隐藏节点的输出和传递给下一个节点的隐状态ht。GRU 的网络结构模型如图4 所示。

图4 GRU 核心结构

GRU 的内部计算过程,首先通过上一个传输下来的状态ht-1和当前节点xt的输入来获取2个门控状态。其数学理论如下所示:

式中:rt为控制重置的门控;zt为控制更新的门控;Wr,wz分别为对应层的可训练权重参数。

得到门控信号之后,使用重置门控来得到重置之后的数据,将前向状态ht-1与控制门控rt相乘,并与输入xt进行拼接,通过一个tanh 激活函数将数据放缩到[-1,1]的范围内,得到式(13)。

式中:wh为本层的权重参数;ht主要包含当前输入xt的数据,将ht添加到当前的隐藏状态,相当于记忆了当前的状态。

在这个阶段,同时进行了遗忘和记忆两个步骤。同时,需使用先前得到的更新门控zt,门控信号zt的范围为[0,1],该信号越接近1,代表记忆下来的数据越多;而越接近0 则代表遗忘的越多。由此可得当前状态ht更新计算公式,如式(14)所示:

GRU 的优点在于可以使用同一个门控zt同时进行遗忘和选择记忆,相比之下,LSTM 则需要使用多个门控。GRU 的结构大大简化了训练过程中的复杂程度,实现训练过程的简单化、快速化。

3 实例分析

本仿真实例通过某地区2019 年200 位用户的年用电量数据,实现基于DTW 距离的用户类别划分、基于深度循环网络的单类用户月用电量预测。仿真实例所使用的编程语言为Python 3.6,使用的深度学习架构为Tensorflow。

3.1 用户聚类实例

如图5 所示,图中左上方是计算得到的DTW 距离值,X,Y 轴方向上是2 个用户的用电量曲线,图中横、纵坐标分别表示2 条用电曲线对应的日期天数。图中坐标轴内的弯曲线段,代表最优对齐弯曲路径,该线段越趋近于直线表示2 条用电量曲线具备越高的形状相似性。

图5 最优对齐弯曲路径图

然后,根据层次聚类法理论,计算数据集中所有曲线相互之间的DTW 距离并将其作为区分所有曲线类别的依据。绘制层次聚类树如图6 所示。为了更直观清晰地展示聚类效果,图中仅展示了随机选择的20 个用户的层次聚类树,该聚类树可看作反映全体数据集的局部信息图。可看出聚类树中每个小分支中的用电量曲线具备较强的形状相似性,曲线之间的数字代表邻近用电量曲线的DTW 距离。

为了直观地对比DTW 聚类与传统聚类方法的效果,并使得横向对比更具代表性,统一了不同算法的聚类数目。以图6 展示的层次聚类树为例,以该图从上到下为序,编号0 至13 一簇为同一类别;编号2 至9 为同一类别;编号1 至8为同一类别。

另外,本实例分别复现了部分相关文献所使用的K-means 算法、GMM 算法,对全体用户进行了聚类以作对比。为了更清晰地展示聚类结果,图7、图8 分别展示了利用K-means 和GMM对图6 中20 个用户聚类的可视化结果。

图6 基于DTW 的部分用户层次聚类树

如图7、图8 所示,使用叉形、正方形和圆形图例分别代表3 类用户。传统的K-means 和GMM 等基于欧式距离的方法主要根据用电量数值大小来进行聚类,在图中可发现该类算法仅按照数值大小区分3 类用户。GMM 由于在Gaussian数值基础上引入了概率分布,一定程度上缓解了该问题,但空间相似特性仍未得到充分表征。为进一步验证本文所提聚类方法的效果,后续通过对比2 种聚类方法并结合深度网络的预测结果来反映总体性能的优劣。

图7 基于K-means 算法的部分用户聚类结果

图8 基于混合高斯模型的部分用户聚类结果

3.2 各类用户用电量预测

针对已获得的各类用户的独立数据集,建立每类用户单独的预测模型。训练网络时,训练集和测试集的比例为9:1,即使用十一个月的用电量数据训练网络,最后一个月的用电量数据与预测结果进行对比。本仿真实例分别使用K-means,GMM 和DTW聚类的结果,输入使用LSTM 和GRU 构建的用电量预测模型,通过实验的预测结果验证聚类算法的效果。

训练LSTM 和GRU 网络时均使用Adam 作为优化器,固定使用2 个LSTM 或GRU 串联,隐藏层层数设为10 层。结合多次实验的超参数设置经验值,对某一类别多次实验求取平均结果。使用MSE(均方根误差)作为预测效果的评价指标,该数值越小代表预测效果越好。使用LSTM作为预测网络的实验结果,如表2 所示。

表2 基于LSTM 预测器的实验结果

由表2 可知,总体趋势上看,采用DTW 作为用户聚类方法,相比较于传统的K-means 算法在LSTM 网络上对中长期用电量具有更好的预测能力。为了对比LSTM 神经网络的预测效果,还利用GRU 网络进行了进一步验证,结果如表3 所示。

通过表2、表3 的综合比较发现,相较于传统的数值聚类方法,使用基于空间相似度的DTW方法对用户聚类后,再结合深度网络进行预测效果更好。另外,GRU 的预测效果略优于LSTM。基于此,展示每个类别GRU 网络的预测结果,如图9 所示。

表3 基于GRU 预测器的实验结果

图9 中,横轴为时间序列,纵轴为标准化后的用电量,为无量纲数值(以下同)。为证明本文所提方法针对同一类别的不同用户依然具备良好的效果,进一步预测了用户类别中某独立用户的用电量,预测结果对比如表4 所示,独立用户的预测可视化结果如图10 所示。

图9 3 类用户用电量GRU 预测结果

表4 独立用户实验结果

图10 独立用户GRU 预测结果

总体而言,无论是某一类用户,还是某类用户中的个体用户,经过DTW 距离聚类后的预测结果,从曲线形状上看和原始数据高度相似,亦证明了本文所提出的基于空间相似度聚类的用电量预测方法具有较好的效果。

4 结语

本文以用电用户类别聚类及数据回归为核心,提出了提升中长期用电量预测精度的方法。通过DTW 距离定义了不同用户用电量曲线的形状相似性,利用层次聚类法根据DTW 距离绘制了层次聚类树求取用户类别。然后,根据分类结果,将数据集训练对应的LSTM 和GRU 深度网络模型,建立了中长期用电量预测。对比实验结果表明:采用DTW 形状相似度聚类后的用户类别划分准确,有利于进一步的数据回归研究;在实验条件相同的情况下,GRU 深度网络比LSTM深度网络具备更好的数据预测效果,适用于回归任务。

该研究为基于用户用电行为的类别划分提出了新的研究思路,通过实验证明了基于空间相似度指标的用户类别划分是有效的,深度循环神经网络GRU 具备良好的数据预测性能。

猜你喜欢
用电量类别用电
02 国家能源局:1~7月全社会用电量同比增长3.4%
01 国家能源局:3月份全社会用电量同比增长3.5%
9 月份全社会用电量同比增长6.8%
安全用电知识多
国家能源局:3月份全社会用电量同比下降4.2%
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意
壮字喃字同形字的三种类别及简要分析
服务类别