基于采集大数据的智能应用研究

2018-05-08 07:12韩海安弓俊才郭易鑫
山西电力 2018年2期
关键词:台区用电用户

韩海安,弓俊才,郭易鑫

(1.国网山西省电力公司计量中心,山西太原 030002;2.国网山西省电力公司,山西太原 030001)

0 引言

目前,大数据应用已经越来越引起国网公司和各省电力公司的关注。在营销专业大数据中,数据量信息量最大的是用电信息采集系统,国网数据中心数据显示,全国每日产生营销基础数据130 TB,用电信息采集系统数据45 TB。

随着现场计量装置的升级换代、通信信道的不断提速,作为最直接、最全面获取电力用户用电信息的智能电能表和采集终端,提供的数据将更加丰富,实现全量数据的高频采集也将成为现实。采集大数据不同于调度、运检等其他电力大数据,其优势和特点就在于直接联系着电力用户,通过电能表提供的各类数据,利用大数据工具加以分析利用。除了可以实现传统的计量收费业务外,还可以反应出用户的用电行为、用电习性、用电特点等,甚至对用户自身的结构、特征等等几乎都可以依靠1只智能电能表提供的数据分析和挖掘出来,真正实现了智能电能表支撑起能源互联网建设。更重要的是,在大数据时代里,挖掘大数据价值,就能拓展增值业务,满足客户多样化需求提供有效支撑。

近年来,围绕营销大数据,尤其是采集大数据,各网省均展开了深化应用工作部署,如基于在线监测与智能诊断的计量装置状态检测及轮换、供应商质量评价、用户能效及需求响应潜力分析评估、基于客户用电全生命周期的客户标签库建设等等。同时,为现场工作人员提供台区健康状态全面分析,搭建数学模型,针对台区运营、问题分析、问题诊断、故障处理及优质服务等方面提供有力支撑。

1 营销专业大数据应用中存在的问题

营销专业大数据分析工作中出现的一些问题,在一定程度上制约了营销专业的发展,致使多样化营销水平发展较缓。

a)数据采集问题。受限于当前采集通讯和主站架构,用电信息采集系统针对单相智能电能表能按日为单位采集表底示数,而无法采集电压、电流、功率等数据,导致用电信息采集的数据维度单一。

b)数据匹配问题。SG186中的客户基础档案数据、采集系统中的用采档案数据以及运检PMS系统中的设备档案数据,这三者都有台区的相关信息,三大系统中档案数据不完全一一对应,影响了大数据分析结果的准确性和实用性。

c)数据协同问题。各专业的信息系统建设,由于建设年代和厂商不同,导致数据分散存储而成为信息孤岛。虽然采用了“接口+中间库”的方式进行数据联通,但由于系统性能、传输质量、安全策略、专业壁垒等限制,使得多源、分散的数据难以形成实时、高效的数据协同,极大地限制了大数据的共享,降低了大数据的的应用效果。

d)分析对象问题。目前采集数据应用主要是针对基于Oracle存储的结构化数据进行分析和应用,而对于同样数量庞大的工单、发文、规程等文本,以及照片、图片等非结构化数据尚未开展深入的研究分析。

e)应用领域问题。在采集大数据应用方面,一是主要在国网和省级层面开展,在基层供电所人员管理、基层现场工作支撑等方面的研究和实际应用的还不够多,随着基层末端融合工作的推进,基层营销人员对采集大数据分析的需求和应用会越来越迫切。二是主要数据源以营销专业大数据为主,围绕营销提质增效、开拓市场开展应用,结合公司其他专业电力大数据开展跨专业支撑还不够多,将采集大数据与社会经济数据、政府管理数据等海量的公司外部大数据融合分析应用还不够多。

f)智能应用问题。目前,采集大数据应用大多着眼于友好的可视化展示,使用户能够更好地理解大数据分析的结果(是什么),部分应用尝试做对分析结果的成因分析(为什么),很少应用尝试进行对策分析(怎么办)。这就在一定程度上折射出当前大数据应用对智能化的重视还不够,应用的友好性还不足,还不能充分的满足用户的多元化需求。

2 营销专业大数据应用模式建议

a)通过大数据分析应用,在降本增效、提高工作质量、提升工作效率、提高优质服务水平方面取得成效;在支撑电力市场拓展、用户用能潜力挖掘、电力客户竞争等方面取得成效。

b)充分结合基层实际,突出实用、实效,在短时间内各类系统难以重构的情况下,构建统一的数据资源池。以营销数据管理为重点,实现营销专业内部大数据整合,打破公司各专业系统壁垒,通过营销数据整合、规范、共享,支撑多专业大数据分析应用。

c)拓展数据结构,实现多元化分析。通过对海量的规章、制度、报告、发文、工单等文本数据的深入分析和挖掘,与营销专业结构化数据形成完整的数据生态圈,实现业务从源头到末端全过程追踪和分析。

d)建设智能化的知识推荐体系。使得基层人员在从事各项工作时,可以快捷地获得知识帮助和策略推荐,同时,与基于文本分析和自动化合规性检查结合,可以提升工作效率,降低错误率。

3 窃电嫌疑用户分析主题应用

针对现场窃电手段更新换代,窃电装置日趋多样化,窃电金额大幅度增加,山西省以计量原理为基础,结合窃电实际案例分析,细化梳理窃电特征,建立窃电分析模型,并通过历史数据反复验证,优化模型,为现场反窃电工作提供可靠依据。基于用电信息采集系统采集的用户用电行为数据和智能电表的事件上报数据,结合历史积累的窃电查处数据和窃电模式分析数据,通过深入挖掘与窃电行为密切相关的电压电流不平衡、电压电流断相、失压失流等采集数据,以多维的大数据分析为基础,构建反窃电指标,建立反窃电计算模型。

以大数据、机器学习、人工智能为管理提供科学、直观的决策支持,创造新型精细化的运营管理体系。准确、快速定位窃电嫌疑用户,执行有针对性的排查,减少了反窃电工作量,降低了反窃电工作成本,提高反窃电行动的效率。

3.1 窃电用户识别模型

电能表计量电量的多少主要取决于电压、电流、功率因数三要素和时间的乘积。窃电一般采用改变计量回路二次接线等方式窃电,监测窃电时产生的电流、电压、用电量变化可以精准捕获窃电的起止过程,实现精准防窃电。

从主站采集电量、负荷及线损的历史样本数据,对历史样本数据进行预处理,即构成窃电分析所需的专家样本库。专家样本虽在一定程度上能直接反映用户窃电行为的某些规律,但作为构建模型的样本,特征不明显,因此需要在此基础上构造指标体系(包括电压类指标、电流类指标、负荷类指标、用电量指标、线损类指标等)。在反复分析历史窃电案例基础上,确立了窃电评价指标体系,然后采用神经网络和CART决策树构建窃电用户识别模型,输入项包括电量趋势下降指标、线损类指标和告警类指标,输出项为窃电标识(见图1)。

图1 窃电嫌疑系数

3.2 窃电嫌疑分析

a)疑似窃电用户用电情况分析。通过对模型挖掘出来的窃电嫌疑用户进行窃电嫌疑度排名,对嫌疑度高的用户进行用电分析。包括电量分析、电压分析、电流分析、异常事件分析,其中用电量分析针对时间维度,分析疑似窃电用户月度、年度用电量变化趋势、96点电量曲线、96点电压曲线、96点电流曲线变化情况。

b)行业用电特征分析。分析各类行业疑似窃电用户用电量特征,日、月、季、年用电量变化规律和特性,疑似窃电用户96点电量曲线与行业96点平均电量曲线拟合。根据计算出的拟合值,确定疑似窃电用户用电目的是观察疑似窃电用户的用电特征与其对应行业用电特征是否相似,预判疑似窃电用户是否窃电。

所采用模型需综合考虑行业用电设备、用电性质、历史数据及基础档案信息,通过神经网络和海量数据优化模型,提高预判疑似窃电用户准确性。

c)疑似窃电用户总体情况分析。通过模型挖掘出全省各地市的疑似窃电用户,对这些疑似用户进行区域分布分析、用电趋势分析,多种维度分析有窃电嫌疑的用户群,从而对疑似窃电用户进行跟踪观察。下一步,将结合用电性质、行业特征、生产特点等总结归纳提升数学模型,提升窃电疑似用户的预判精准度。

4 台区健康状态评价及可视化主题应用

台区健康状态评价及可视化应用是以精细化、网格化管理为出发点,将智能电网建设末端的台区与台区管理人员作为抓手,围绕分析现状、发现问题、解决问题角度建立大数据分析模型。实现台区经理人、用户、电表的定位,为台区经理人在台区运营、问题分析、问题诊断、故障处理、优质服务提供支撑。通过对台区健康状态综合评价分析,一是建立完整科学的台区综合大数据打分算法,实现台区一键式体检,帮助台区负责人和公司管理人员及时掌握台区的综合健康状态。二是通过大数据算法为台区负责人提供台区综合健康问题的推荐处理方法,提高台区负责人排查处理台区问题的效率。三是建立台区异常信息推送和分析展示平台,多维度关联用户指标参数,展示异常全量信息,为台区负责人集中提供台区相关的综合信息。四是建立台区负责人标兵晾晒台,将台区负责人按所管辖台区健康水平评分,并进行全省排名展示,激励台区责任人责任心。

4.1 分析模型

台区健康状态综合评价分析模型结合传统状态指标设计和评价体系,结合基于大数据技术的机器学习的方式方法进行综合的对标分析和组合优化。

传统的指标评价方法的核心算法包括环比评分主观赋权、熵权客观赋权、基于灰色关联度分析的评价矩阵。机器学习算法体系包括基于聚类分析的台区状态画像和标签化、基于人工神经网络方法的状态健康度函数逼近。分析模型包括以下3种。

a)台区健康状态综合评价模型。针对每个台区日常运营管理的各项工作(如采集、费控、消缺、线损管理等),基于围绕台区相关各业务系统的数据(如用电信息采集系统、营销业务应用系统、费控系统、采集运维闭环管理系统等),采用大数据的算法,从多个维度(如采集成功率、费控成功率、线损合格率等)对每个台区单项工作开展的情况进行动态体检和评分。并基于单项评分综合考虑台区的多种因素对台区的运行状况进行动态的综合评分,从而全面、准确地反映台区的总体运行状况和运营管理水平,为精确管理提供清晰、完整的数据支撑(见图2)。

图2 台区健康状态评价模型拓扑

b)台区经理工作综合评价模型。按照以下4个维度进行评价。

工作响应速度:主要评价台区经理人对推送的问题台区线下排查响应速度情况的分析和评价。

问题处理质量:主要评价台区经理人对台区问题处理效果,是否提升了台区的运行状况。

工具掌握情况:主要评价提取台区经理在使用信息化工具的掌握情况,以及随时使用信息化工具处理台区问题效率。

台区经理人基本情况:主要基于台区运行状态,并结合台区经理人的学历、年龄情况进行关联分析,分析台区经理人工作能力的匹配程度。

c)台区健康问题智能诊疗模型。通过对各用户历史事件的分析,形成各指标的推荐雏形,然后根据采集、线损、费控、设备4个指标横向分析综合情况,最终实现问题的综合推荐,提醒台区经理处理问题存在的关键用户。同时,根据用户问题的具体情况,给台区经理人相应的处理建议。

关于台区问题诊断处理是台区评分低的单个用户,采用频繁项集挖掘算法找出各个用户指标关联规则。例如,采集和费控经常一起出现问题,根据这一现象推出采集和费控的关联原因。

频繁模式挖掘算法有两处参数需做进一步细化处理,一个是支持度,另一个是置信度。通俗的讲支持度衡量元素占总样本的比例,例如项集内同时含有A和B的元素占总样本的比例,这是衡量这一现象发生的频率。置信度是在所有含有A元素的项集中有B的概率,这是判断A与B有关联性的参数。

台区问题的解决方法,充分利用了采闭环系统中的方案库,通过频繁模式挖掘算法,在解决方案库中找到匹配度高的解决方案,将此方案推荐给台区经理。

4.2 可视化

基于宽带载波优势,通过对采集系统稍加改进,实现台区实时拓扑图自动绘制功能微应用开发。借助配网监测装置,实时监测台区低压侧各级供电开关状态,可视化动态显示停电区域,实现可视化动态展示“变压器—开关—智能表”拓扑关系,精准定位停电范围,为供电服务指挥平台提供精准数据支撑和可视化应用。

选取太原某小区为试点台区,更换宽带载波模块并加装配网监测装置,凭借宽带实时拓扑功能,智能展示小区内各级供电开关拓扑示图,并实时监测开关状态。

5 结束语

采集大数据是营销大数据中最重要的数据源。文章基于采集系统,搭建了大数据平台,并在反窃电行为分析、台区可视化管理等方面进行了一定程度的研究,为满足客户多样化需求提供有效支撑。

猜你喜欢
台区用电用户
配电台区变-户拓扑关系异常辨识方法
安全用电知识多
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
用电安全要注意
降低台区实时线损整治工作方法
关注用户
10kV变压器台区设计安装技术研究
关注用户
低压台区载波抄表技术研究