基于人工免疫系统聚类算法的用电客户信用分析

2012-06-17 09:34高建宏
山东电力技术 2012年3期
关键词:繁殖率抗原用电

慕 晓,高建宏

(1.华北电力大学经济与管理学院,北京 102206;2.烟台供电公司,山东 烟台 264001 )

0 引言

我国各地电力客户拖欠电费、违章用电、窃电现象时有发生。加强用电客户信用管理,才能确保应收账款的回收和资产保全,有效控制不良应收账款,降低企业坏账比例,缩短业务流程,跟踪分析单个客户或行业客户的付款历史和习惯,为未来的交易提供风险防范,有效降低电力公司的经营风险,保护供电企业的合法利益。

首先研究人工免疫系统聚类分析原理,提出实数编码的人工免疫系统聚类分析过程。然后确定用电客户信用分析指标,最后根据电力公司客户数据,采用人工免疫系统聚类分析方法对用电客户进行聚类,探讨人工免疫系统应用于电力客户信用分析的可行性。

1 人工免疫系统聚类分析过程

人工免疫系统是一种全局随机概率搜索方法,具有多样性、耐受性、免疫记忆、分布式并行处理、自组织、自学习、自适应和鲁棒性等特点[1]。通过用抗体代表问题的可行解,抗原代表问题的约束条件和目标函数,采用能体现抗体促进和抑制的期望繁殖率来选择父个体,从而达到快速收敛到全局最优解的目的。人工免疫系统一般由以下几个部分构成:编码、产生初始抗体群体、计算亲和力和期望繁殖率、遗传进化操作和终止条件。

实数编码的人工免疫系统聚类分析计算步骤描述如下:

第1步,输入n个抗原。在算法中假定把n个数据对象 Xj(j=1,2,…,n)作为 n 个被捕获的抗原输入。

第2步,形成父代群体。抗体的产生可以根据问题的具体特点和性质,用经验的办法确定类别数,从数据中找出从直观上看来是比较合适的代表点作为初始抗体;也可以将全部数据随机地分成c类,计算每个类的质心,将这些质心作为初始抗体;最简单的办法是随机地抽取c个数据作为初始抗体。

第3步,对初始抗体进行评价,评价标准采用期望繁殖率ev。其计算方法如下[1]:

1)计算抗体v的浓度。

其中 ayvw≥Tac时,acvw=1;否则,acvw=0,Tac是已确定的浓度阈值。抗体v和抗体w间的相似度为

实数编码的人工免疫系统在计算两个抗体相似度时采用欧式空间二次泛数Hv,w;

式中,m为数据对象中决策变量的个数,wiv和wiw代表抗体v和w中第i个决策变量值。axv为抗原与抗体的亲和力,用于表明抗体对抗原的识别程度。抗体v和抗原w的亲和力为

其中,J(u,c)表示抗原和抗体之间的结合度[1-2],一般情况下采用目标函数值来表示[3]。

这里 uij是向量 Xj属于组 ci(i=1,2,3…,c)的程度,它的值介于0和1之间。每一次分组时,n个对象按亲和力的大小,分属与不同 ci(i=1,2,3…,c),其中:

对每个 k≠i,如果 Xj-ci2≤Xj-ck2,uij=1,否则,uij=0。

2)计算抗体v的期望繁殖率。

抗体的期望繁殖率同时体现出了免疫系统对高亲合度抗体的促进和对高浓度抗体的抑制,这样可以维持抗体的多样性,避免过早陷入局部最优[1]。

第4步,形成父代群体。将初始群体按ev的降序排列,并取前c个个体构成父代群体;再按照axv降序排序同时取前n个个体存入记忆库中。

第6步,新群体的产生。基于第4步的计算结果对抗体群体按照其评价结果进行交叉和变异处理,得到新群体。再从记忆库中取出记忆的个体,共同构成新一代群体。之后,转去执行第3步。

2 基于人工免疫系统聚类算法的用电客户信用分析

国际上对企业信用传统的评估要素主要有品格、能力、资本、担保、经营状况5个要素[4],基于我国用电客户的基本情况,并依据相关文献资料[4-8],认为对用电客户的信用分析主要应立足于客户的综合素质上,具体应包括:1)上门递交停电通知单。2)上门递交催收通知单。3)商业信用。用电客户的商业信用是客户履行各种经济承诺的能力及可信度。由企业形象、法人代表的品德、经营业务市场前景、资产负债率、盈利额、付电费比率、净资产收益率、总资产净利率等指标构成。4)安全信用。5)法律追讨。6)违规用电或窃电。

以某电力公司分析用电客户信用为例进行用电客户信用分析,有关数据见表1。

在分析时,把 A、B、C、D、E、F 企业的数据作为被捕获的抗原输入,将全部数据随机地分成3类。

设定浓度阈值Tac为0.8,聚类种类c为3,即以c1类表示用电客户信用高、c2类表示用电客户信用中等、c3类表示用电客户信用低。得到如下结果:

表1 用电客户信用指标值

3 结论

人工免疫系统聚类分析并行完成计算,算法实现相对简单,只要确定了浓度阈值和聚类个数就可得到结果,该方法能够适用于大数据量,使对专业知识的要求降到最低,对于数据不同的顺序不敏感。在获得最优解方面具有优越性,人工免疫系统用于电力客户信用分析是非常可行的,但浓度阈值的大小将影响聚类的结果。

猜你喜欢
繁殖率抗原用电
提高肉羊繁殖率的综合性技术措施
用煤用电用气保障工作的通知
安全用电知识多
为生活用电加“保险”
用电安全要注意
提高母牛繁殖率的三要素
浅谈提高母牛繁殖率的技术措施
梅毒螺旋体TpN17抗原的表达及纯化
结核分枝杆菌抗原Lppx和MT0322人T细胞抗原表位的多态性研究
APOBEC-3F和APOBEC-3G与乙肝核心抗原的相互作用研究