神经网络在我国电商企业客户流失风险预测中的应用研究

2018-09-14 01:12程昊樊重俊
经济研究导刊 2018年18期
关键词:神经网络变量人工

程昊 樊重俊

引言

近年来,数据挖掘与数据仓储成为企业掌握瞬息万变的市场动向的利器。其中,最主要的功能在于能在庞大的数据库中,找出前所未有的知识,并进一步地整合与累积成为企业赖以生存的商业智慧的一部分。换言之,数据挖掘提供管理者一个有效率的信息获取方式,从庞大的使用者数据与交易记录,取得隐含其中的宝贵信息。而传统上利用市场调查与问卷方式来了解客户满意度的方式,可能会因为抽样方式的不佳、受试者填答的真实性等等,而导致取样误差或分析偏差,进而影响结果的准确性;从现有企业的数据库中利用数据挖掘的技术来进行数据分析,在许多的研究中都证明了可得到较佳的结果,此为本研究动机之一。所以,本研究将针对某知名电商企业所能提供的客户数据库做深入的分析,期望能利用数据挖掘技术中的人工类神经网络方法来对客户进行分类,并评估此模型的适当性。本研究的主要目的在于建立与评估人工类神经网络模式应用于某电商企业的客户流失模型;而主要的研究問题,则在于如何建立某电商企业的客户流失模型,并希望能由电商企业所提供的客户数据库,挖掘出流失客户的主要特性。

一、网络客户流失研究

客户流失通常是指客户终止使用企业的服务或产品。流失客户可分为两类,一类是已经流失的客户,另一类是潜在的流失客户,此类客户表现出将要流失的趋势,与企业的联系及交易的频率、金额等逐步减少。客户流失预测是客户关系管理(CRM)体系中一个重要的研究问题,现代客户关系管理是以客户为中心的一系列企业管理方式。CRM通过管理和分析存储的客户历史数据,提升企业的产品和服务,帮助企业发展新客户和保持老客户,提高企业的竞争力。为有效地保持老客户,需要构建高效的预测模型,发现潜在流失客户。

客户流失预测研究经过多年发展已经获得不错的成果,客户流失中的一些问题也得到有效的解决。目前的研究,主要是客户流失预测为分类问题。根据研究的发展阶段以及不同阶段,其使用的方法有聚类算法、回归分析、决策树算法等。这些算法构建的预测模型虽然可解释性较强,但随着数据量的增加,特别是进入大数据时代,对数据的处理能力严重不足。因此,使用人工智能的方法进行预测,人工智能中具有代表性的算法是人工神经网络。

二、预测模型及规则

在某电商企业所提供的客户数据库中,经数据前置整理与数据剔除后共剩下7个变量可用,分别为性别、年龄、会龄、订单金额、付款方式、居住地区与流失状况;按流失及未流失的比例共抽出37 400笔数据作为训练模式之用,而剩下的12 200笔数据则保留为测试之用。由于人工类神经网络对于变量的选取有较大的自由度,没有如回归分析般的限制。因此,在网络结构中的隐藏层数目、隐藏层中神经元数目、训练的学习率大小等,都需要以主观逻辑判断,或以不同组合加以测试,并没有一定道理可资遵循。因此,对本研究所需的网络参数设置进行说明:一是输入层的输入变量,共有7个自变量,分别为性别、年龄、会龄、订单金额、付款方式、居住地区、与流失状况,因此设置7个输入层的输入变量。隐藏层数目,考虑网络的学习速率,本研究采用的隐藏层数目为1。二是隐藏层中神经元数目,本研究设置隐藏层中神经元数目为11、12、13。三是训练与测试样本比例,训练样本与测试样本的比例为8∶2,各为374与122笔。四是训练的学习率,以0.002、0.004、0.006三种组合测试。五是输出层的输出变量。本研究为分类型的网络问题,因此输出层的输出变量为l(未流失)、2(流失)的二元变量。

三、验证预测规则准确率

本研究在人工类神经网络模式的建构方面以MathWorks公司所出版的matlab软件进行分析。在网络参数的相关设置中,学习率将测试0.002、0.004、0.006等三种组合,而有关网络停止训练准则方面则以训练数据的RMSE值(roott mean squared error,RMSE,均方根误差)小于或等于0.0001,或最多训练10 000次为条件,并以拥有最小测试数据RMSE值的网络结构为最佳的网络模式。在本研究中则以隐藏层中神经元数目为11、学习率为0.00U4的RMSE为最小(如表1所示),且重复测试10次,其值均在0.361793~0.363392之间,可见非常稳定。而由表2得知,整体的正确判别率为54.09%,而个别的判别正确率以{1-1}的比率最高,为92.3%,意即原始群体为第1类的样本(未流失)被正确地判别到第1类(未流失)的比率为92.3%。

由上述的分析可知,本研究发现经由人工类神经网络所分类出的流失客户,其整体的正确判别率为54.09%;而检视其分类后的结果,发现流失客户的重要特征为男性、年龄介于30~40岁、会龄为1年、订单金额为8 001~9 000元、以现金支付方式、居住在上海市内的客户。此外,鉴于以往使用经验法则来辨别客户是否流失、进而采取保留客户措施的手法不甚符合科学研究的精神,因此本研究所提出的人工类神经网络的模式建构程序,不但在办识客户流失的正确率高,且执行效率颇佳,对于电商企业在进行客户保留措施的决策上提供相当重要的线索,是一项值得建议使用的工具。

结语

本研究所提出的人工类神经网络的模式建构程序,主要的目的是希望通过人工类神经网络的学习、辨识能力,来发展一个更为快速、精确的分类模式。此外,为验证所提模式的有效性,本研究利用某电商企业所提供的数据来进行实证研究。结果显示,人工类神经网络的整体分类绩效为54.09%,具有颇佳的分类效果。所以,运用人工类神经网络于电商企业以执行客户流失分析是一项值得建议使用的工具。

参考文献:

[1]  武小军,孟苏芳.基于客户细分和AdaBoost的电子商务客户流失预测研究[J].工业工程,2017,(2):99-107.

[2]  叶志龙,黄章树.线上客户流失的建模与预测研究[J].管理现代化,2016,(3):96-98.

[3]  邵帅锋.基于BP神经网络对保险公司客户流失进行分析和预测研究[D].兰州:兰州大学,2016.

[4]  高洁.基于灰色模型和神经网络的客户流失量预测[J].内蒙古师范大学学报:自然科学汉文版,2015,(6):765-768.

[5]  王学文,单其帅,魏彦凤.基于BP神经网络的电信客户流失风险预测[J].科技视界,2013,(28):113-114.

[6]  冯倩.网购客户流失的实证分析[D].重庆:西南财经大学,2013.

[7]  任剑锋,张新祥.电子商务客户流失的建模与预测研究[J].计算机仿真,2012,(5):363-366.

[8]  林睿,迟学芝.基于人工神经网络的电商客户流失分析模型[J].电脑知识与技术,2012,(3):665-667.

猜你喜欢
神经网络变量人工
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
人工“美颜”
基于自适应神经网络的电网稳定性预测
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
人工制冷
分离变量法:常见的通性通法
不可忽视变量的离散与连续
人工降雪
轻松把握变量之间的关系