论文网
首页 理科毕业工程毕业正文

基于数据挖掘技术的寿险险种推荐模型研究

  • 投稿蘑菇
  • 更新时间2015-09-16
  • 阅读量652次
  • 评分4
  • 92
  • 0

邓华丽①DENGHua-li;张良均②ZHANGLiang-jun

(①广州番禺职业技术学院财经学院,广州511483;②广州泰迪智能科技有限公司,广州510663)

(①InstituteofFinanceandEconomics,GuangzhouPanyuPolytechnic,Guangzhou511483,China;

②GuangzhouTeddyIntelligentTechnologyCo.,Ltd.,Guangzhou510663,China)

摘要:本文利用数据挖掘技术对大量人寿保险数据进行处理和分析,首先从三方数据中抽取属性航班和险种做数据探索及初步处理,分析这两者之间的相关性,做出简单的预测购买险种判断;然后使用软件分析并自动从大量的预测变量中筛选出与险种相关的变量,采用多层感知器对三维属性构建神经网络模型,利用模型对搭乘航班的顾客做精准的险种推销。

Abstract:Thispaperusesdataminingtechniquestoprocessandanalyzealargeamountoflifeinsurancedata.Atthefirst,itsearchesanddealswiththedatabyextractingattributesandinsurancetypesfromthird-partydatatoanalyzethecorrelationbetweenthetwoandmakesimplepredictionjudgmentsofbuyinginsurance.Then,itusessoftwaretoanalyzeandautomaticallyfilteroutthevariablesassociatedwithinsurancefromalargenumberofpredictorvariables.Themulti-layerperceptronisusedtobuildneuralnetworkmodelsforthreedimensionalproperties,themodelsareusedtoselltheaccuratecoverageoftheflightcustomers.

教育期刊网 http://www.jyqkw.com
关键词 :数据挖掘;人寿保险;多层感知器;精准营销

Keywords:datamining;lifeinsurance;multilayerperceptron;precisionmarketing

中图分类号:F840文献标识码:A文章编号:1006-4311(2015)21-0031-03

0引言

随着人们收入水平的提高和消费意识的改变,保险产品日益增多,公众对购买保险的热情日益增高,保险行业迅猛发展。但与此同时,保险决策者在获取利益时也注意到了行业存在的巨大风险。保险业与其他行业相比,最大的差异在于它是以多样化的风险为经营对象的特殊服务业,不同的客户有着完全不同的需求,也为保险公司提供不同的收益率。在保险业,从业人员通常根据客户价值、客户贡献、客户理赔风险、保险市场、保险产品等对市场进行细分。在保险行业过去客户理赔的研究中,少有涉及数据挖掘的领域,多半利用传统统计方法或是单纯的专业分析,这些方法虽然能够发现数据的一些表面特征,但可能都忽略了海量数据中隐含的尚未被挖掘出的潜在有效信息,而数据挖掘为另一种从不同角度切入的新方法,保险公司可以利用数据库中多年来收集起来却没有实际运用到的宝贵数据,通过数据挖掘技术,了解所拥有的客户的特征,对不同客户做相应的险种推销,据此在一定程度上节省了人力物力和时间资源。

本文笔者根据保险公司的客户资料,综合三种客户相关数据进行分析,通过数据挖掘技术,发现规律,构建模型,建立推荐系统,针对不同客户群体给出合理的产品推荐意见,帮助保险公司实现精准营销。

1数据挖掘

1.1数据探索与初步处理

首先进行数据探索,检验人寿保险的三方数据集的数据质量,绘制图表,做初级的统计分析,了解人寿保险样本数据集的结构和规律。数据探索有助于选择合适的数据去做预处理和建模。

1.1.1数据结构

人寿保险数据的构成包括三个方面:寿险业务系统记录的保险交易数据、客户在保险公司官网浏览的日志轨迹、还有部分从第三方收集的关联信息。具体情况见图1。

保险交易数据来自寿险核心业务系统,记录了从接触客户尝试签订保险合同,到最终保险合同终止的业务周期中的全部信息。这部分数据会经过预处理,最终的数据存储在关系型数据库中。

保险交易数据经过梳理后,需建立一个雪花型数据表存储结构,这组结构中的表都用ct开头(c客户,t交易)(见图2),表明结构表以客户为中心,交易为分支,组织待分析数据。这种结构设计扩展灵活,未来可根据分析的需要增加分支或相应的字段。另外会设立一些des开头的表,描述险种属性等。

所有签署了保险合同的客户,都可以通过官网注册并登陆,在官网上可以完成多项自助操作。系统将收集用户在官网上浏览和操作的轨迹信息,记录到日志文件中(见表1),形成官网客户轨迹信息日志数据,供后续分析使用。

来自第三方的外部数据是指根据客户在投保时保留的手机号码,证件等信息,可以通过第三方获得一些客户在互联网上活动的资料,例如去哪网的航班信息还有购买航意险的信息等等(见表2)。这类信息一般是结构化或非结构化的文件。

1.1.2数据统计分析

在探索客户所乘航班与购买险种的关系中,通过取得的181个人寿保险的样本数据进行初级统计分析,发现181个样本数据中是分别由三个二字代码MD、MZ、CZ开头的76个航班,由相关性分析76个航班与险种的关系几乎为0。而航班的二字字母代码即为所属航空公司的代码,虽然具体航班与险种没什么关系,但根据实际情况,也许航空公司与险种会有一定的关系。现需对原样本数据做处理,如图3,对原航班数据做数据变换得到所需要的航班类型,然后分析二字代码即航空公司与险种的关系。

简单统计航班类型及购买了保险的乘客个数如表3。

简单统计险种的类型及购买了此险种的乘客个数如表4。

1.1.3险种与航班类型交叉分析

采用SPSS对航班类型和险种做交叉验证,得到表5。

由表5得到的初步结论是:

客户乘坐CZ开头的航班最多人购买的险种是畅行两全险,其概率是34.26%;

客户乘坐MD开头的航班最多人购买的险种是红两全险,其概率是45.95%;

客户乘坐MZ开头的航班最多人购买的险种是顺达综合意外险,其概率是38.89%。

故初步营销方案即是向乘坐CZ、MD、MZ开头的航班的客户可分别相应推荐畅行两全险、红两全险、顺达综合意外险。

1.2数据深入处理

由2.1的前期工作之后,现对所有数据做属性规约抽取与险种(针对乘客营销的险种)相关性较强的属性:航班类型、已投保(乘客日常已投保的险种)。

1.2.1多层感知器

单个感知器能够完成线性可分数据的分类问题,是一种最简单的可以“学习”的机器,但无法解决非线性问题。而多个感知器组合,便可以实现复杂空间的分割,解决非线性问题。多层感知器是一种前馈人工神经网络模型,其将输入的多个数据集映射到单一的输出的数据集上。

多层感知器的基础模型就是由多个感知器组合:

使用多层感知器前,先对航班类型和已投保的名义变量变换成度量变量。变换结果对应如表6。

对名义变量变换成度量变量之后,用SPSS对变换后的181个数据使用多层感知器神经网络,分类结果导出如表7。

由表7可以看到,采用多层感知器神经网络预测分类结果的正确比高达93.2%,故可采用多层感知器模型对航空乘客做精准推荐相应的险种。

1.2.2多层感知器与径向基函数对比

由径向基函数做出的结果如表8。

两种神经网络对比,多层感知器预测分类结果更优。

2结论

在大数据膨胀时代的保险业,单单靠简单的统计和人为专业分析处理数据是难以可持续发展下去的,若能基于数据挖掘技术,充分利用历史存留下来的数据,挖掘出其价值,便可以根据历史数据展望未来,实现精准营销。本文使用数据挖掘工具SPSS对人寿保险的三类数据做处理分析,挖掘出具有哪些属性的客户会选择哪些险种,建立多层感知器神经网络模型,为人寿保险公司推销险种节省时间及人力物力资源,这也是说明数据挖掘技术在人寿保险营销方面具有重要地位的实证之一。

教育期刊网 http://www.jyqkw.com
参考文献:

[1]张彪.个人寿险市场营销存在问题与对策研究[J].市场营销,2014,12.

[2]杨海建.论保险市场营销[J].保险研究,2001,01(006).

[3]杨静.人寿保险行业内销售误导现象分析及治理措施[D].复旦大学,2010,06.

[4]陈希.数据挖掘技术在保险客户理赔分析中的应用[J].知识丛林,2010,04.

[5]宋加升,陈琰.改进的K_Means聚类算法在保险客户信用分析中的算法实现[J].哈尔滨理工大学学报,2009,02.