基于BP神经网络的移动运营数据分析

2016-05-14 15:49张世睿
软件导刊 2016年7期
关键词:BP神经网络

张世睿

摘要摘要:运营数据通常是用户对移动应用喜好最直接的体现,运营数据中存在着很多有价值的信息。如果能够更快地通过运营数据分析和了解用户、迎合用户喜好,就能赢得更多的用户,在竞争中占据有利地位。针对移动应用设计复杂、运营数据分析不直观的特点,提出一种基于BP人工神经网络的运营数据分析方法,建立了以移动应用关卡常见数据为输入,运营数据为输出的神经网络模型。实验表明,该方法能够有效对移动应用关卡设计和配置所吸引的用户数量和复玩率进行预测,从而指导移动应用的开发、设计及评价。

关键词关键词:BP神经网络;运营数据;游戏关卡

DOIDOI:10.11907/rjdk.161379

中图分类号:TP301文献标识码:A文章编号文章编号:16727800(2016)007002103

0引言

随着移动互联网的发展和智能设备的普及,移动应用在人们日常生活中变得越来越重要,越来越多的厂商投入到移动应用的开发中来,各种相似功能的应用层出不穷。因此,如何在移动互联网发展的浪潮下了解用户需求,开发更加吸引用户、使用户满意的产品,从而在激烈的行业竞争中获取最多的用户数量,就成了目前移动应用开发商重点关注的问题。移动应用的运营数据是用户评价最直观的反馈,如何从大量且无规律的运营数据中了解用户的想法就成了当今移动互联网界研究的重点。本文提出一种基于人工神经网络的运营数据分析方法,通过对移动运营数据加以分析,预测并指导移动应用设计的方向。实验结果表明,基于人工神经网络的移动应用数据分析具有很强的指导作用,结果符合实际,可大大提高产品吸引力。

1移动运营数据分析的一般方法

移动运营数据的分析方法一般分为两大类,一类是很多中小公司采用的较为简单的分析方法,即根据应用每日用户的登录频次、滞留时间、特定功能的使用情况等绘制合适的曲线,分析哪一块功能更容易受用户的青睐,根据版本更新之后用户的数量是否增加等制定下一阶段的开发和设计任务。这种方法的好处是实现起来较为简单,不需要很多的知识储备,数据收集和分析也比较容易。然而这种方法的缺点也是显而易见的,即对数据的分析更多是基于人的主观认识,而非理性客观的评价,容易导致产生带有偏见的结果,不利于企业的发展。另一类运营数据的分析方法是基于数据挖掘知识,目前研究较多的有针对用VOLOS H, NALLI S, PANNEERSELVAM S,et al.Aerie:flexible filesystem interfaces to storageclass memory .Proceedings of the Ninth European Conference on Computer Systems. ACM, 2014: 14.

P M CHEN, W T NG,S CHANDRA,et al.The rio file cache:surviving operating system crashes[J].In Proc. of the Architectural Support for Programming Languages and Operating Systems,1996.

ANI A WANG,GEOFFREY H KUENNING, PETER REIHER,et al.The conquest file system:better performance through a disk/persistentRAM hybrid design[J].ACM Transactions on Storage,2006(3):309348.

CHEN J, WEI Q, CHEN C,et al.FSMAC: A file system metadata accelerator with nonvolatile memory .Mass Storage Systems and Technologies (MSST), 2013 IEEE 29th Symposium on. IEEE, 2013: 111.

QIU S, REDDY A L.Nvmfs:a hybrid file system for improving random write in nandflash ssd.Mass Storage Systems and Technologies (MSST), 2013 IEEE 29th Symposium,2013: 15.

CHEN F, MESNIER M P, HAHN S. A protected block device for persistent memory.Mass Storage Systems and Technologies (MSST), 2014 30th Symposium on. IEEE, 2014: 112.

责任编辑(责任编辑:陈福时)户忠诚度方面的分析[1]、用户流失方面的预测分析[24],以及用户兴趣挖掘[5]和聚类分析[6]等。这些分析和预测方法为移动运营提供了较为理性和可靠的数据,对于应用开发商的计划订制和用户群体分析有很大帮助。

然而,这些方法都只是通过运营数据对用户某一单方面的行为进行分析和预测,没有考虑到应用系统设计和运营过程中诸如设计、奖励、活动等复杂因素。本文提出一种基于BP人工神经网络的移动运营数据分析方法,具有利用人工神经网络可逼近任意复杂非线性关系、可学习和自适应的特点,建立起了相应的数学模型。

2人工神经网络的基本原理

人工神经网络(Artificial Neural Network)是由大量简单的处理单元连接组成的一种网络模型,主要用来模拟人类大脑运行的一些基本逻辑和结构,反映了人脑功能的很多基本特性,但是人工神经网络并不是人脑真实反映,只是对人脑作出了某种程度的简化和模拟[7]。图1展示了一个较为典型的人工神经网络细胞。

由于人工神经网络是由大量的神经元根据某种结构组合而成,因此通常按照其组合方式进行分类。较为常见的网络结构可以分为前馈神经网络、反馈型神经网络和自组织网络三类。前馈网络也称前向网络。该网络只在训练过程会有反馈信号,层间没有向后的反馈信号,因此被称为前馈网络。BP神经网络属于前馈网络的一种。反馈型神经网络是一种从输出到输入具有反馈连接的神经网络,其结构比前馈网络要复杂得多。

自组织神经网络是一种无导师学习网络。它通过自动寻找样本中的内在规律和本质属性,自组织、自适应地改变网络参数与结构。网络运作过程分为学习和工作两种状态。网络学习主要是指根据学习算法来调整神经元间的联接权值,使得网络输出更符合实际。学习算法分为有导师学习与无导师学习两类。

有导师学习算法将一组训练集送入网络,根据网络的实际输出与期望输出间的差别来调整连接权。有导师学习算法的主要步骤包括:①从样本集合中取一个样本(Ai,Bi);②计算网络的实际输出O;③求D=Bi-O;④根据D调整权矩阵W;⑤对每个样本重复上述过程,直到对整个样本集来说,误差不超过规定范围。

BP算法是一种出色的有导师学习算法。由于本文针对移动运营数据进行分析,从而建立起应用设计和运营数据相关的数学模型,因而选择基于BP算法的有导师人工神经网络,采用已知的运营数据作为训练集进行网络训练,建立数学模型,并通过该模型来验证实际项目中的数据情况,以此来验证该网络模型的准确程度和可靠性。

3样本数据与模型构造

3.1样本数据

本文以国内某手机游戏公司的一款跑酷游戏为例,由于其关卡模式为当前主推模式且数据信息较多,因此选择该模式下的前40关为研究对象,考察不同关卡布局、设计和奖励下玩家总体的游玩次数。

本文选取版本3.2的前40关数据作为训练集构造神经网络模型。选取版本4.0的前40关的数据作为实验数据验证该模型的准确性。

3.2模型构造

神经网络模型的建立主要需考虑两方面的问题: 一是确定网络结构 ; 二是调整学习参数。首先考虑神经网络结构。网络结构主要包括网络的链接方式、网络层数和各网络层节点的个数,本文采用目前使用最为广泛的神经网络。

模型输入参数选取可以直观获得、不需要加工的数值,避免因为人为主观因素的干扰导致模型无法客观对应用的设计进行评价从而无法模拟出真实移动运营数据。在关卡设计中,常见的对数据产生影响的直观因素如下:

(1)关卡序号。越靠前的关卡越容易吸引更多的用户参与,关卡序号的表示方法从1开始,依次递增。

因此,根据上述信息,将关卡的序号、类型、奖励级别、挑战次数作为网络模型的数据参数。模型的输出参数代表所关心的玩家对应用喜好意愿的表达,通常认为以下参数能够表达玩家对于关卡的喜好:关卡挑战次数、关卡复玩率、下一关挑战率。

通过资料可知[8],三层的BP网络可以逼近任意的映射关系,且与通常使用的一个隐藏层的网络相比,两个隐藏层的网络对提高最终的预测准确率来说并没有显著帮助。隐藏层中节点数目选择较复杂,并没有统一的规则去指导,因此本文根据设置隐藏层节点个数的不同对数据准确性进行了测试,最终确定隐藏层几点的个数为20。

本文输入数据均为正数,因此通过线性归一化方法将数据归一化到[0,1]范围上:f(x)=x-minmax-min(1)由于数据均归一化到[0,1]区间,因此第一层激活函数选择S型函数,第二层激活函数选择线性激活函数,公式如下:f(x)=11+e-x(0

按照上文所述构建网络模型,训练函数选择有动量和自适应lr的梯度下降法进行训练,训练参数设置迭代次数为20 000次,训练目标最小误差位0.003,训练速度为0.01。 网络训练完成后,将一组测试数据输入程序中,用来测试该网络的识别成功率,将上下浮动5%的数据作为正确数据进行处理,进行了四次实验,得到结果如表3所示。

识别准确率都稳定在80%以上,尤其是复玩率,稳定在87.5%以上。将上述模型数据与常规运营数据分析方法的结果进行对比,从图2可以看到基于BP神经网络的方法更加准确客观,不掺杂分析人员的主观因素。

4结语

本文提出了一种基于BP神经网络的移动运营数据分析方法,建立起移动游戏关卡设计因素和运营数据之间的关系。经过仿真实验证明了该方法有效,相对于传统的人工分析方法准确率较高且稳定可靠,可以作为一种提高运营数据分析准确率的方法应用于实践。

参考文献参考文献:

[1] 刘芳,郭宇春.基于数据挖掘的用户忠诚度分析[J].计算机技术与发展,2013,23(7):1417.

[2]刘光远,苑森淼,董立岩.数据挖掘方法在用户流失预测分析中的应用[J].计算机工程与应用,2007,43(9):154156.

[3]叶进,林士敏.基于贝叶斯网络的推理在移动客户流失分析中的应用[J].计算机应用,2005,25(3):673675.

[4]田玲,邱会中,郑莉华.基于神经网络的电信客户流失预测主题建模及实现[J].计算机应用,2007,27(9):22942297.

[5]郭岩,白硕,杨志峰,等.网络日志规模分析和用户兴趣挖掘[J].计算机学报,2005,28(9):14831496.

[6]徐涌,陈恩红,王煦法.基于神经网络的Web用户行为聚类分析[J].小型微型计算机系统,2001,22(6):699702.

[7]施鸿宝 .神经网络及其应用[D].西安: 西安交通大学出版社 ,1993.

[8]LIPPMANN R P.An introd

猜你喜欢
BP神经网络
基于神经网络的北京市房价预测研究
一种基于OpenCV的车牌识别方法
基于遗传算法—BP神经网络的乳腺肿瘤辅助诊断模型
一种基于改进BP神经网络预测T/R组件温度的方法
基于BP神经网络的光通信系统故障诊断
提高BP神经网络学习速率的算法研究
就bp神经网络银行选址模型的相关研究
基于DEA—GA—BP的建设工程评标方法研究
BP神经网络算法在数值预报产品释用中的应用