数据挖掘技术在相互保险中的应用

2021-07-13 08:12郭耘慧江西省工业和信息化研究院江西省南昌市330036

江西通信科技 2021年2期

郭耘慧江西省工业和信息化研究院江西省南昌市 330036

高杰江西财经大学现代经济管理学院江西省南昌市 330013

0 引言

改革开放以来，特别是在中国正式加入世贸组织以来，我国的保险行业进入到了飞速发展时期，加上人口基数红利期的到来，老百姓对自身健康的日益重视，保险业这个关系到国计民生的朝阳产业，受到了巨大的关注。市场主体不断增加，同时也面临越来越多的挑战和竞争，数据处理成为很多保险公司最亟待解决的问题，如何能够通过可靠有效专业的方式来对数据进行处理，为管理决策服务，成为了许多保险企业的迫切需要。很多保险公司在多年的发展之下已经累积了很多老客户营销数据，这其中很多客户每年都会为保险公司增加大批的加保保费收入，同时，拓展新客户的难度和所需花费的成本都比开发老客户要大得多，客户资源争夺战也逐渐发展成为保险业的竞争焦点。

因此对经营相互保险等产品的相关保险公司而言，通过相关数据挖掘工具自主发现海量数据库中潜藏着的某些规律，为精确发现并且定位客户投保的趋势提供了很大帮助。同时给出了更为科学的支持理论以及决策方法，增强了企业在决策方面的科学性和有效性，直接降低了商业成本。相互保险在我国的保险行业中占有很少的市场份额，在市场竞争逐渐激烈的今天，保险企业必须要学会不断地挖掘自身潜力，提升客户服务品质。在相互保险行业中通过应用数据挖掘这一技术能够更加有效的发现潜藏在客户投保信息中有价值的规律，通过对客户投保过的数据进行分析，挖掘出相关信息，对客户下一步的投保进行预测，从而进行交叉销售，改善服务质量，并且提高保险企业的盈利水平。因此，采用数据挖掘中的关联规则技术对相互保险产品的交叉销售进行研究，通过分析投保客户的历史数据来预测相关客户下一步将会购买什么产品，从而更好的采取有针对性的销售策略，提高相关保险产品的销售量，达到为企业提高赢利的目的。

1 相互保险

1.1 相互保险简介

相互保险是当今世界保险市场上最主要的形式之一，它是指由一些对同一危险有某种保障要求的人所组成的组织，以互相帮助为目的，实行“共享收益，共摊风险”。集团成员交纳保费形成基金，发生灾害损失时用这笔基金来弥补灾害损失。相互保险组织没有外部股东，由全体投保人共同所有，不存在投保人与保险人之间的利益冲突。从国际上看，相互保险组织具有以下三个独特优势：一是投保人和保险人利益一致，能够较好地实现以客户利益为中心，并由客户参与管理，从而有效避免保险人不当经营和被保险人欺诈所导致的道德风险。二是展业费用较低，核灾定损准确度较高，可以有效降低经营成本，为会员提供更经济的保险服务。三是由于没有股东盈利压力，其资产和盈余都用于被保险人的福利和保障，可以发展有利于被保险人长期利益的险种。

1.2 相互保险发展现状

根据国际相互合作保险组织联盟(ICMIF)统计数据，截至2014年，全球相互保险收入1.3万亿美元，占全球保险市场总份额的27.1%，覆盖9.2亿人。中金公司之前发布的一份研报预计，中国相互保险市场前景广阔，预计10年后相互保险市场份额有望达到10%，市场空间达到7600亿元左右。2015年1月，中国保监会出台《相互保险组织监管试行办法》，正式对相互保险公司这一组织机构开闸，目前已经有20多家机构申请牌照。虽然能借力“互联网+”，但相互保险的发展仍面临许多挑战。

2 数据挖掘技术

数据挖掘是人工智能和数据库领域研究的热点问题，所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程，它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等，高度自动化地分析企业的数据，作出归纳性的推理，从中挖掘出潜在的模式，帮助决策者调整市场策略，减少风险，作出正确的决策。知识发现过程由以下三个阶段组成：①数据准备；②数据挖掘；③结果表达和解释。数据挖掘可以与用户或知识库交互。

数据挖掘是通过分析每个数据，从大量数据中寻找其规律的技术，主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集；规律寻找是用某种方法将数据集所含的规律找出来；规律表示是尽可能以用户可理解的方式（如可视化）将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

2.1 数据准备

我们主要将Apriori算法应用于相互保险产品的交叉销售中，用关联分析方法相互保险产品进形行处理，隐藏于某些产品的相关性我们可以发现。所以选取了某个保险公司的客户投保记录数据作为研究对象，选择了其中投保险种在两种以上的客户作为输入样本进行相关性分析。下面我们用编号来表示各种险种，如下表1所述。

表1 险种代码编号

收集到的客户投保数据如下，见下表2。

表2 客户投保数据库样本

如果一人同时投保了两个险种，如个人意外伤害保险和重大疾病保险，则我们就可以表示成{I2,I5}的形式。

下面我们对表2进行处理，生成改进的客户投保数据库样本，如下表3。输出下列关联规则：

表 3 改进的客户投保数据库样本

图1 频繁集的产生过程

2.2 关联规则的度量描述

经常用于选择关联规则的度量有三个。第一，支持度（support)，第二，置信度，第三，提升度。下面我们将分别对它们进行介绍：

（1）支持度是指事务集中既包含X又包含Y的事务数在所有事务数中所占的百分比。计算公式如下：

support(X→Y)=P(XUY)

（2）置信度是指事务集中含X也包含Y的事务数在包含X的事务数中所占的百分比。计算公式如下：

confidence(X→Y)=P(Y/X)=P(XUY)/P(X)

（3）提升度是指置信度与包Y的事务数所占百分比的比值。计算公式如下：

其中，P(X)为包含X的事务数所占的百分比。

2.3 结论分析

由规则“I1,I2→I3”可以知道一般相互保险客户在购买个人定期寿险和个人意外伤害保险时，同时选择购买个人意外伤害医疗保险的可能性比较大。

由规则“I1,I3→I2”可以知道一般相互保险客户在购买个人定期寿险和个人意外伤害医疗保险时，同时选择购买个人意外伤害保险的可能性比较大。

根据上面的这些规则，相互保险公司就可以制定出合理的相互保险产品销售匹配方案，例如将个人意外伤害保险和个人意外伤害医疗保险在一起对客户进行推荐。从而使公司更有针对性的向客户推荐产品，增加成功销售的概率，进一步扩大公司收益。另外，公司也可以据此做一些特定的邮件跟踪服务，进而掌控更多客户资源。通过对上面的模型进行分析验证，可以看出，Apriori模型在相互保险产品交叉销售中应用的优良效果。随着相互保险公司客户数据的不断扩大和完善，此模型也可以对后期的销售工作起着一定的指导意义。但同时为了研究方便，选取的样本数据较少，与实际应用的效果可能存在着偏差，模型的训练结果也存在着一定的主观性，这是在以后的研究过程中有待改善的地方。

3 结束语

随着商业社会竞争愈演愈烈，相互保险公司为了增强自身的实力，必然在客户关系管理方面更加广泛的应用数据挖掘这一技术。相互保险公司通过应用数据挖掘这一技术，相互保险公司的历史销售数据进行深层次分析，挖掘出隐含其中的有用信息，从而找准客户需求，对客户进行有针对性的销售，提升企业的竞争能力和企业的盈利水平，已经成为了未来的一种发展趋势。数据挖掘中的关联分析功能在推动销售预测的发展中有着重要意义，这一技术在未来必将广泛应用。同时这一技术在社会发展和技术人员的努力下，应用效果必将越来越准确，对相互保险公司的发展也占据着越来越重要的地位。