基于大数据技术的电力分区多源异构数据集成系统设计

2023-01-24 12:51黄勇光
电子设计工程 2023年2期
关键词:数据源异构分区

黄勇光,黄 兵

(1.深圳供电局有限公司,广东深圳 518000;2.南方电网深圳数字电网研究院有限公司,广东深圳 518000)

西电东送项目的开发,使电网之间联系越来越 紧密,电力供需关系复杂,因此电网中存在许多潜在风险,如何保障电网运行的稳定性是现阶段电力企业亟待解决的问题[1-3]。电力资源是人类生产、生活的基本保障[4],电力系统的稳定运行直接影响电力供应[5]。当电力系统发生停电事故后,快速地恢复系统正常供电,对降低电力公司与相关企业的经济损失具有重要的意义[6]。电力分区在电网事故发生时实现减载,有利于电网系统运行的稳定。电力分区多源异构数据具有数据数量大、数据类型多、数据获取方式多样化等特点[7]。为了降低原始数据间的逻辑差异,采用数据集成将各类分散的数据进行统一集成、存储[8]。

但是以往电力分区多源异构数据集成系统非常局限,如文献[9]研究了基于三维GIS 平台的电网数据资产可视化系统,在电力分区多源异构数据集成过程中,采用三维GIS 技术,进行空间信息集成,由于该系统比较繁琐复杂,导致电力分区多源异构数据集成效率不佳;文献[10]研究了基于改进局部拓展算法的电力系统,在电力分区多源异构数据集成中,采用改进局部拓展算法,对输电线路加权化处理,构造加权无向复杂网络模型。由于该系统智能化程度不高导致电力分区多源异构数据集成效果差。大数据技术的核心是对大量数据进行分析,在不同类型的数据中寻找有价值的信息技术。因此,该文设计了基于大数据技术的电力分区多源异构数据集成系统。

1 集成系统设计

1.1 系统总体结构

数据接口层、数据集成层和数据发布层[11-12],构成了基于大数据技术的电力分区多源异构数据集成系统,系统总体结构如图1 所示。

由图1 可知,将设备数据、电力分区多源异构数据传输到数据接口层,在数据接口层进行数据特征提取,配置合适的交互接口,再通过数据集成层中灵活分布式集群进行数据采集并采用电力分区多源异构数据融合算法实现数据融合集成,数据发布层负责电力分区多源异构数据的发布。

图1 系统总体结构

1.2 系统硬件

基于大数据技术的电力分区多源异构数据集成系统的硬件如图2 所示。

由图2 可知,系统硬件包括工作站、网络交换机、局域网、接口服务器、集成服务器和发布服务器。其中接口服务器用于不同业务平台数据接口处理;集成服务器用于存储数据加工服务器信息;发布服务器用于部署配电网运行。系统硬件与软件的连接通过电力通信光纤网实现[13]。

图2 系统硬件

1.3 电力分区多源异构数据融合算法

设各数据源的可信度为pi,m个数据源用S=(S1,S2,…,Sm)描述,n个决策用A=(A1,A2,…,An)描述,数据融合算法的流程为:

1)求解数据源对决策的支持度

数据是在数据库内提取,并把不同类型数据转换成决策的支持度,用式(1)描述:

其中,支持度的三角模糊数用(aij,bij,cij)描述,且0≤aij≤bij≤cij≤1;第i数据源对第j决策目标的支持度用Sij描述。

官厅水库黑土洼湿地系统2016年水质监测评价分析……………………………………… 杨垒,吴玉欣,王彦芹(3-137)

2)明确有序加权平均算子权重向量

按照决策者的偏好选取合适的模糊语义量化准则,明确式(1)中参数和的值。为了明确模糊语义量化算子f(x)的取值范围,设定大多数参数值的范围为(0.3,0.8),至少一半参数值的范围为(0,0.5)。

按照f(x)计算出有序加权平均权重向量q=(q1,q2,…,qn),数据源个数用n描述,根据式(1)计算出q的值。

3)决策的支持度按照支持度值Sij与各数据源可信度pi完成转换。

按照支持度值Sij与各数据源可信度pi由大到小排序,采用有序加权平均权重向量并通过模糊判决法进行转换,转化过程如式(2)所示:

其中,支持度值最小值、最大值、平均值分别用Sij_min、Sij_max、Sij_average描述。

得到转换后的决策支持度值,用式(3)描述:

4)为了获取各决策的最终决策值,将转换后的支持度和有序加权平均权重向量进行电力分区多源异构数据融合[14-16]。各决策的最终决策值用式(4)描述:

5)处理电力分区多源异构数据集成问题时,决策内容按照决策值大小而定。

2 实验分析

为了验证该文系统的性能,在Lab Windows 测试环境下,运行内存6 GB,选取某电力分区4 000个多源异构数据作为实验对象,实验对比系统采用文献[9]的三维GIS 平台的电网数据资产可视化系统、文献[10]的改进局部拓展算法的电力系统,分别应用三种系统进行对比实验。

为了验证系统的有效性,采用三种系统对实验数据进行信息覆盖率测试,结果如图3 所示。

图3 信息覆盖率

由图3 可知,该文系统在信息覆盖率上比其他两种系统具有明显的优势,采用该文系统最大信息覆盖率为95%,分别比其他两种系统高出10%、20%。

分别采用三种系统在运行相同实验数据条件下,进行数据融合方面稳定性的对比实验,设置三种系统的工作时间均为120 min,每间隔10 min 记录一次数据结果,稳定性测试结果如表1 所示。

表1 系统稳定性

由表1 结果可知,该文系统比其他两种系统的稳定性具有显著优势,采用该文系统的平均稳定性为97.21%,分别比其他两种系统平均稳定性高出14.80%、8.89%。

采用三种系统进行实验数据的融合测试,记录数据融合时的运行时间,实验对比结果如图4 所示。

图4 运行时间

通过图4 可知,在相同条件下,该文系统数据融合运行时间明显少于三维GIS 平台的电网数据资产可视化系统、改进局部拓展算法的电力系统,该文系统数据融合平均运行时间低至15.75 ms,分别比其他两种系统快11.12 ms、7.13 ms。随着数据数量的增加,该文系统数据融合运行时间趋于稳定。

采用三种系统进行实验数据的存储测试,记录三种系统的数据存储时间,实验对比结果如图5所示。

图5 数据存储时间

由图5 可知,在相同条件下,该文系统数据存储时间明显少于其他两种系统,该文系统平均存储时间低至19 ms,分别比其他两种系统快13 ms、20 ms。

采用三种系统测试数据发布的准确率,结果如图6 所示。

由图6 可知,该文系统的数据发布准确率明显高于其他两种系统,该文系统的数据发布平均准确率为99%,比其他两种系统的数据发布平均准确率高10%、19%,说明该文系统数据发布的准确率高。

图6 数据发布准确率

3 结论

为了提高电力分区多源异构数据集成效率,设计了基于大数据技术的电力分区多源异构数据集成系统。通过该文系统对电力分区多源异构数据集成管理,实验结果表明该文系统的信息覆盖率高、系统稳定性良好、系统性能最佳。由于时间与精力有限,仍有很多问题需深入研究。

未来研究方向为:1)在不断丰富电力数据后,运用更先进的技术,更加精细化处理电力分区数据。2)推广该文系统的应用范围,可将所设计系统运用在智能电网的建设中。

猜你喜欢
数据源异构分区
贵州省地质灾害易发分区图
试论同课异构之“同”与“异”
上海实施“分区封控”
吴健:多元异构的数字敦煌
浪莎 分区而治
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
异构醇醚在超浓缩洗衣液中的应用探索
LTE异构网技术与组网研究
大空间建筑防火分区设计的探讨