求解大规模电网在线稳定评估的广泛内核CVM算法

2014-08-16 12:53马志昊刘涤尘邵雅宁
电力系统保护与控制 2014年21期
关键词:决策树复杂度分类器

马志昊,王 波,刘涤尘,邵雅宁



求解大规模电网在线稳定评估的广泛内核CVM算法

马志昊,王 波,刘涤尘,邵雅宁

(武汉大学电气工程学院,湖北 武汉 430072)

针对SVM等各类传统算法耗时过长,无法满足在线要求的问题,提出了一种基于广泛内核核向量机(ECVM)的大规模电力系统在线稳定评估算法。首先基于决策树算法对原始特征量进行特征筛选,然后基于ECVM分类器快速给出电力系统稳定状态的评估结果。该算法简化了最小闭包球问题中新球心的计算过程,避免了每次迭代都要解决QP问题,降低了算法的复杂度。在New England 39节点系统和某实际系统下的仿真结果表明了所提算法的优越性,为大规模电力系统的在线稳定评估提供了新思路。

核向量机;决策树;在线;稳定评估

0 引言

电力系统的安全稳定运行直接关系到国民经济的发展。系统一旦发生故障,若不能及时有效地对故障加以控制而使电网失稳运行、甚至解列,将引发大规模停电事故,造成极为严重的后果。

目前,常用的电力系统稳定评估分析方法大致可分为三类,即时域仿真法、直接法和机器学习方法。传统的时域仿真类方法因计算耗时长,适用于离线稳定分析,而难以满足在线应用的需要;基于能量函数的直接法则存在难以适应复杂模型的问题,无法直接应用于对大规模电网的分析。机器学习类方法由于其计算量小、评估速度快,能够发现潜在问题、预见规律等优点,已经在电网稳定评估研究中得到了广泛应用。

支持向量机(SVM)是一种20世纪90年代中期发展起来的基于统计学习的机器学习方法。基于SVM的稳定评估充分利用SVM在处理有限样本、非线性及高维辨识中的优势,能够很好地解决神经网络类方法中出现的维数灾难问题,从而大大提高评估的稳定性和精度。但是,由于SVM需要解决的是一个二次规划(QP)问题,其算法的空间复杂度和时间复杂度分别为O()和O()(为样本的个数)。电力系统规模越大,所需的样本数越多,SVM法运算时间越长,且运算时要耗费的计算机资源也越多,因此,传统的SVM法不适用于大规模电力系统稳定状态的在线评估。针对这一问题, Tsang等人提出了核向量机(Core Vector Machine, CVM)的概念。CVM将QP问题转化为最小闭包球(Minimum Enclosing Ball, MEB)问题,利用近似算法求得问题的近似最优解,可以将算法的时间复杂度降低到线性规模。理论上,CVM算法的时间复杂度与训练样本集的大小成线性关系,而空间复杂度与训练样本集的大小无关。文献[12]采用核向量机对大规模数据进行学习,通过对比支持向量机验证了核向量机的有效性和优越性,然而这一模型所需的学习训练时间依然较长,难以满足系统在线稳定判别的需要。文献[13]基于量子遗传算法(QGA)对核向量机进行了改进,作为配电网理论线损计算的方法,改善了理论线损的计算精度。

为了进一步缩短训练时间,为大规模电力系统的在线稳定评估提供保证,本文提出了一种基于广泛内核的核向量机(Extensive Kernel Core Vector Machine, ECVM)稳定评估方法。该方法将MEB问题转为中心约束的MEB问题,能够去除内核的限制条件,从而降低了算法的复杂度,削减了最后核心集,使算法可以更高效地学习大样本数据集。大量实验结果表明,基于ECVM的稳定评估具有时间复杂度和空间复杂度低的优点,能够明显提高训练速度,非常适合用于大规模电力系统的在线稳定评估。

1 ECVM算法

1.1 传统核向量机算法

图1 近似闭包球

(2)进行迭代运算。在第次迭代中,如果所有的训练样本点都落在球之内,则迭代结束;否则,找到离球体的中心最远的样本点,并生成一个新的核心集。

(4)令迭代步长增1,并返回到第2步。

1.2ECVM算法

对于传统的CVM算法,其时间主要耗费在第(2)步,即获取一个新球心的QP问题。为了进一步降低算法的时间复杂度,优化迭代过程,本文拟用ECVM算法来进行对电力系统稳定性的评估。ECVM算法步骤如下:

(2)进行迭代运算。在第次迭代中,如果所有的训练样本点都落在球体之内,则迭代结束;否则,找到离球的中心最远的样本点,并生成新的核心集。

(4)令迭代步长增1,并返回到第2步。

由于ECVM算法避免了子QP问题求解,其算法的时间复杂度和空间复杂度分别为和,低于CVM算法的时间复杂度和空间复杂度,不仅如此,ECVM核心集中的核向量的数量也大大减少了,其训练速度明显短于SVM和CVM。因此,适用于大规模电力系统的稳定在线评估。

2 基于ECVM的在线稳定评估算法

基于机器学习的稳定评估方法要用到两个数据集,即训练数据集和测试数据集。训练数据集用于建立和学习评估模型,而测试数据集则用于检验评估模型的有效性及适应性。在本文中,训练数据集由两个矩阵组成,记为和。其中,是一个×矩阵,指的是样本的个数,指的是特征的个数;是一个×1矩阵,指的是个样本所对应的稳定状态。测试数据集也由两个矩阵组成,记为和。其中,是一个×矩阵,是一个×1矩阵。

本文提出的基于ECVM的稳定评估算法由四个步骤组成:

(1)建立知识库:对不同运行方式和预想事故集进行离线仿真,获取数据集;

(2)特征选择:对输入变量做特征选取、压缩与降维等预处理,降低输入空间维数,消除冗余特征,提高预测效率;

(3)ECVM训练:使用训练数据集对ECVM分类器进行训练,建立输入特征与输出,即稳定评估结果之间的映射关系;

(4)模型评估:使用测试数据集来评估ECVM分类器的有效性。

算法流程如图2所示。

图2基于ECVM的在线稳定评估算法流程

2.1建立知识库

知识库的建立其实是一个数据准备的过程。一般来说,可以通过离线(或在线)获得电力系统运行中海量的原始数据,也可以利用时域仿真等方法在系统模型上设置各种预想事故从而产生仿真样本,然后从中提取需要的特征量数据。本文选择对不同运行方式和预想事故集进行离线仿真,通过PSASP程序中提供的稳定判别标准判断各个样本的稳定状态,将所得样本按照各发电机间最大功角差是否超过180°分为稳定和不稳定两类。

为了消除与噪声不一致的数据,在进行特征选择前,需要先对数据进行清理,然后进行数据集成操作。

2.2 特征选择

电力系统稳定过程所包含的数据具有数量大、特征量差别小的特点。由于ECVM分类器不能解决输入特征变量选取问题,因此,需要对输入变量做特征选取、压缩与降维等预处理,以缩减样本空间、提高评估速度。

决策树(Decision Tree,DT)是用二叉树形图来表示处理逻辑的一种工具。作为一种数据挖掘方法,决策树算法具有很多其他方法所没有的优点,如:①训练速度快,执行快;②对数据分布形式不做假设,可以获得非线性的映射;③非黑箱式操作,可以形成易于人们理解的规则;④具有内置的特征选择能力。考虑到在线稳定评估对时间的需求,本文选择基于决策树的方法对原始特征进行选择。

基于决策树的稳定特征提取算法如下:

(1)基于基尼分割规则,使用和构建一棵决策树。

(3)计算决策树的BER值。BER定义如式(1)所示。

(4)对所有的非叶子节点进行如下操作。

对的第个节点剪枝,也就是将第个节点变为叶子节点。剪枝后的树记为。先计算的BER值,然后计算第个节点的重要性指标。的定义如式(2)。

百里香对一直跟随左右的川矢队长说:“我的香肠为什么香传百里,奥妙就在这里!半个时辰之后,待猪安静下来,捉来杀了,迅速用开水去毛,取出大肠,用白麻扎好两头,放入蒸笼蒸熟,再切成片,就可以吃了!”

2.3 ECVM训练

ECVM训练即选取合适的核函数及相关参数,并使用训练数据集对ECVM分类器进行训练,建立输入特征与输出之间的映射关系。

对于ECVM,常用的核函数有三种,即多项式核函数,高斯径向基核函数和sigmod核函数。为了选取最合适的核函数和参数,本文对这三种核函数进行了测试。在测试时,相关参数设置如下:(1)对多项式核函数,,其中,为特征的个数;(2)对于高斯径向基核函数和sigmod核函数,使用搜索算法来选择最佳的值。

大量的分析数据表明,使用RBF核函数可以得到最好的分类结果,在使用RBF核函数时,的取值为5e-6。

2.4 模型评估

模型评估即使用测试数据集来评估所构建的分类模型的有效性。评估分类模型性能的指标有分类准确率和敏感度。

分类准确率为

(4)

其中:为状态数,在本文中主要针对两种状态,即稳定状态和不稳定状态进行分类;为第种状态;为第种状态被分类器正确分类的样本数;为第种状态被分类器错误分类的样本数。准确率和敏感度越高,样本被正确识别的机率越高,分类器也就越准确。

3 实例分析

3.1实例1

基于New England 10机39节点系统进行仿真构造样本集,在PSASP中进行暂态稳定仿真,验证本文所提方法的可行性。共得到1 080个样本,随机抽取其中的810个样本组成训练集,另外270个样本作为测试集。各状态下的样本个数如表1所示。

表1 实例1各状态下的样本数

3.1.1 特征选择的结果及分析

为了真实可靠地反映系统稳定状态,本文基于文献[7]选取了系统发生故障后的32维特征量组成初始特征量集,每个样本由上述特征量集以及1个表征是否稳定的相量组成。基于决策树算法中的节点重要性指标从初始特征量集的32维特征中筛选出10维重要特征,并忽略其余特征以降低分类器输入的维度。所选特征以及其所对应的值大小如表2所示。

3.1.2 ECVM分类结果及分析

基于3.3节的分析结果,在Matlab中采用RBF核函数对ECVM模型进行训练,并使用测试集验证算法的正确率TA,算法的分类准确率为95.9%,两种状态下的敏感度SN如表3所示。可以看出,针对两种状态下的样本,该方法都有较高的分类正确率,达到了95%以上,表明ECVM算法具有较好的普适性。

3.1.3 ECVM和传统算法的比较

为验证ECVM算法的优越性,使用传统的SVM算法和CVM算法对仿真样本进行稳定评估并与ECVM算法进行比较。以3.1.1节中筛选出的10个特征量作为输入训练SVM模型和CVM模型,将所得结果与ECVM算法的结果进行对比,如表4所示。

表2 分类器输入特征量

表3 实例1各状态下算法敏感度

表4 实例1 ECVM与传统算法的比较

由表4可知,ECVM算法的训练时间比CVM算法和SVM算法分别缩短了36.3%和59.3%,实时性得到了较大提高,且算法的准确率并未降低。

3.2 实例2

为了验证算法在多场景下的适用性,本文基于某实际系统构建样本集并进行仿真。依照4.1节所述方法设置故障,共得到3 600个样本,抽取其中的2 700个组成训练集,另外900个作为测试集。各状态下的样本个数如表5所示。

表5 实例2各个状态下的样本数

用实例1中选择出的10维特征对ECVM模型进行训练,并使用测试集检测模型,各个状态下的敏感度SN如表6所示。

表6 实例2各状态下算法敏感度

为验证ECVM算法的优越性,使用传统的SVM算法和CVM算法对仿真样本进行稳定评估并与ECVM算法进行比较,如表7所示。

表7 实例2 ECVM与传统算法的比较

由表7可知,ECVM算法的训练时间比CVM算法和SVM算法分别缩短了53.5%和68.9%,相比于实例1,训练时间缩短的比例更大,这是由于ECVM算法通过避免子QP问题的求解降低了算法的复杂度,因此在学习大样本数据时具有优势,更适用于大规模电力系统的在线稳定评估。

4 结论

针对大规模电力系统在线稳定评估实时性要求高的特点,本文提出了一种基于ECVM算法的在线稳定评估方法,该算法简化了最小闭包球问题中新球心的计算过程,从而降低了算法的复杂度。在New England 10机39节点系统和某实际系统中进行了仿真验证,结果表明:与传统的SVM算法以及CVM算法相比,该方法的训练速度得到了较大提高,弥补了传统算法的固有缺陷,且适用于多种场景,满足了大规模电力系统稳定状态在线评估的实时性要求,具有一定的理论和实际意义。

[1] 卢锦玲, 朱永利, 赵洪山, 等. 提升型贝叶斯分类器在电力系统暂态稳定评估中的应用[J]. 电工技术学报, 2009, 24(5): 177-182.

LU Jin-ling, ZHU Yong-li, ZHAO Hong-shan, et al. Power system transient stability assessment based on boosting Bayesian classifier[J]. Transactions of China Electrotechnical Society, 2009, 24(5): 177-182.

[2] PAVELLA M, ERNST D, RUIZVEGA D. Transient stability of power systems: a unified approach to assessment and control[M]. Boston: Kluwer Academic Publishers, 2000.

[3] 王同文, 管霖, 张尧. 人工智能技术在电网稳定评估中的应用综述[J]. 电网技术, 2009, 33(12): 60-65.

WANG Tong-wen, GUAN Lin, ZHANG Yao. A survey on application of artificial intelligence technology in power system stability assessment[J]. Power System Technology, 2009, 33(12): 60-65.

[4] 童晓阳, 叶圣永. 数据挖掘在电力系统暂态稳定评估中的应用综述[J]. 电网技术, 2009, 33(20): 88-93.

TONG Xiao-yang, YE Sheng-yong. A survey on application of data mining in transient stability assessment of power system[J]. Power System Technology, 2009, 33(20): 88-93.

[5] 吴琼, 杨以涵, 刘文颖. 基于最小二乘支持向量机的电力系统暂态稳定在线预测[J]. 中国电机工程学报, 2007, 27(25): 38-43.

WU Qiong, YANG Yi-han, LIU Wen-ying. Electric power system transient stability on-line prediction based on least squares support vector machine[J]. Proceedings of the CSEE, 2007, 27(25): 38-43.

[6] 余涛, 周斌, 甄卫国. 强化学习理论在电力系统中的应用及展望[J]. 电力系统保护与控制, 2009, 37(14): 122-128.

YU Tao, ZHOU Bin, ZHEN Wei-guo.Application and development of reinforcement learning theory in power systems[J]. Power System Protection and Control, 2009, 37(14): 122-128.

[7] 唐飞, 王波, 查晓明, 等. 基于双阶段并行隐马尔科夫模型的电力系统暂态稳定评估[J]. 中国电机工程学报, 2013, 33(10): 90-97.

TANG Fei, WANG Bo, ZHA Xiao-ming, et al. Power system transient stability assessment based on two-stage parallel hidden Markov model[J]. Proceedings of the CSEE, 2013, 33(10): 90-97.

[8] VAPNIK V.统计学习理论的本质[M]. 张学工, 译. 北京: 清华大学出版社, 2000.

VAPNIK V. The nature of statistical learning theory[M]. ZHANG Xue-gong, trans. Beijing: Tsinghua University Press, 2000.

[9] 李昌, 罗国阳. 结合支持向量机的卡尔曼预测算法在VRLA蓄电池状态监测中的应用[J]. 电工技术学报, 2012, 26(11): 168-174.

LI Chang, LUO Guo-yang. Application of Kalman prediction algorithm combined with SVM in monitoring states of VRLA battery[J]. Transactions of China Electrotechnical Society, 2012, 26(11): 168-174.

[10]霍思敏, 王科, 陈震海, 等. 基于轨迹输入特征支持向量机的湖南电网暂态稳定在线识别[J]. 电力系统保护与控制, 2012, 40(18): 19-23.

HUO Si-min, WANG Ke, CHEN Zhen-hai, et al. Hunan power grid transient stability online detection based on support vector machine with trajectory input features[J]. Power System Protection and Control, 2012, 40(18): 19-23.

[11] TSANG W I, KWOK J T, CHEUNG P M. Core vector machines: fast SVM training on very large data sets[J]. Journal of Machine Learning Research, 2005(6): 363-392.

[12] 程国建, 蔡磊, 潘华贤. 核向量机在大规模机器学习中的应用[C] // 第十一届中国青年信息与管理学者大会论文集, 2009.

CHENG Guo-jian, CAI Lei, PAN Hua-xian. Core vector machine in application of large-scale machine learning[C] // Conference Proceedings of Eleventh China Youth Information and Management Scholars, 2009.

[13] 彭宇文, 刘克文. 基于改进核心向量机的配电网理论线损计算方法[J]. 中国电机工程学报, 2011, 31(34): 120-126.

PENG Yu-wen, LIU Ke-wen. A distribution network theoretical line loss calculation method based on improved core vector machine[J]. Proceedings of the CSEE, 2011, 31(34): 120-126.

[14] 王奇安, 陈兵. 基于广泛内核的CVM算法的入侵检测[J]. 计算机研究与发展, 2012, 49(5): 974-982.

WANG Qi-an, CHEN Bing. Intrusion detection system using CVM algorithm with extensive kernel methods[J]. Journal of Computer Research and Development, 2012, 49(5): 974-982.

[15] 邵振国, 林智敏, 林韩, 等. 在线安全预警中的预想事故生成[J]. 电力系统自动化, 2008, 32(7): 15-18.

SHAO Zhen-guo, LIN Zhi-min, LIN Han, et al. Online determination of predictive contingency in security forewarning analysis[J]. Automation of Electric Power Systems, 2008, 32(7): 15-18.

[16] 叶圣永, 王晓茹, 周曙, 等. 基于马尔可夫链蒙特卡罗方法的电力系统暂态稳定概率评估[J]. 电工技术学报, 2012, 27(6): 168-174.

YE Sheng-yong, WANG Xiao-ru, ZHOU Shu, et al. Power system probabilistic transient stability assessment based on Markov Chain Monte Carlo Method[J]. Transactions of China Electrotechnical Society, 2012, 27(6): 168-174.

[17] 叶圣永, 王晓茹, 刘志刚, 等. 基于Stacking 元学习策略的电力系统暂态稳定评估[J]. 电力系统保护与控制, 2011, 39(6): 12-16.

YE Sheng-yong, WANG Xiao-ru, LIU Zhi-gang, et al. Power system transient stability assessment based on Stacking meta-learning strategy[J]. Power System Protection and Control, 2011, 39(6): 12-16.

[18] 王圆圆, 李京. 基于决策树的高光谱数据特征选择及其对分类结果的影响分析[J]. 遥感学报, 2007, 11(1): 69-76.

WANG Yuan-yuan, LI Jing. Analysis of feature selection and its impact on hyperspectral data classification based on decision tree algorithm[J]. Journal of Remote Sensing, 2007, 11(1): 69-76.

Extensive kernel core vector machine method for on-line stability assessment of large-scale power system

MA Zhi-hao, WANG Bo, LIU Di-chen, SHAO Ya-ning

(School of Electrical Engineering, Wuhan University, Wuhan 430072, China)

As traditional algorithm such as SVM is time-consuming and unable to meet the requirements of assessment online, this paper proposes an extensive kernel core vector machine (ECVM) based on-line stability assessment algorithm of large-scale power system. Firstly, the original feature is extracted based on the decision tree algorithm and then a quick assessment conclusion is given based on ECVM classifier. This algorithm simplifies the new globe calculation process in the minimum enclosing ball issues to avoid the QP problem resolved at each iteration so that the complexity of algorithm is reduced. The simulation results in the New England 39-bus system and a real power system show the superiority of the proposed algorithm, which provides a new idea for the online stability assessment of large-scale power system.

This work is supported by Major Projects on Planning and Operation Control of Large Scale Grid of State Grid Corporation of China (No. SGCC-MPLG029-2012) and National Natural Science Foundation of China (No. 51207113).

core vector machine; decision tree; on line; stability assessment

TM77

A

1674-3415(2014)21-0034-06

2014-02-11

马志昊(1990-),男,硕士研究生,主要研究方向为电力系统运行与控制。E-mail: mzh5418@163.com

国家自然科学基金(51207113);国家电网公司大电网重大专项资助项目课题(SGCC-MPLG029-2012)

猜你喜欢
决策树复杂度分类器
一种针对不均衡数据集的SVM决策树算法
一种低复杂度的惯性/GNSS矢量深组合方法
决策树和随机森林方法在管理决策中的应用
基于实例的强分类器快速集成方法
求图上广探树的时间复杂度
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于决策树的出租车乘客出行目的识别
某雷达导51 头中心控制软件圈复杂度分析与改进
出口技术复杂度研究回顾与评述