基于MAC地址收集与定位技术的广告定向投放系统

2015-05-30 10:48王倩
企业技术开发·中旬刊 2015年6期
关键词:定位技术数据挖掘

王倩

摘 要:文章提出了基于MAC地址收集与定位的智能广告定向推送方案,课题对现有的Wi-Fi定位技术进行改进,研发出被动Wi-Fi定位技术,该技术通过对智能手机MAC地址的收集,建立MAC地址到手机用户身份的一一映射,实现对大型购物商场消费者位置信息更加精确、灵敏地收集,同时借助数据挖掘技术对用户位置信息分析,得出消费者在这些区域的行为习惯,最后将这些行为习惯与用户消费倾向联系,即可对用户推送个性化的商品信息。

关键词:MAC地址;被动Wi-Fi;定位技术;数据挖掘

中图分类号:TP311.52 文献标识码:A 文章编号:1006-8937(2015)17-0059-03

1 研究背景

随着科学技术的高速发展和人们生活水平品质的不断提高,定位服务将成为IT业务范围内的重要组成部分之一。近几年来,各种定位技术不断发展,定位服务市场发展迅速,定位服务的需求量也日益趋增,定位技术也必将给诸多领域带来巨大的变革。目前,定位技术主要包括GPS定位技术,红外线室内定位技术,超声波定位技术,蓝牙技术,射频识别技术,超宽带技术,Wi-Fi技术,ZigBee技术。其中,GPS定位技术较为成熟,应用广泛,是获取室外环境位置信息的最常用方式。但由于卫星信号容易受到各种建筑物的遮挡,GPS定位技术并不适用于室内和建筑物密集的区域;随着智慧城市的建设,城市Wi-Fi热点的增多,近几年兴起的基于Wi-Fi网络的无线定位技术应用的日渐广泛,在室内定位领域优势明显,成为了GPS定位技术最好的补充。

现有的Wi-Fi定位技术主要运用于实时定位系统,提供基于位置的服务。另一方面,Wi-Fi定位技术可以通过对位置数据的收集和分析,将定位与个性化技术结合起来应用于商业领域。通过Wi-Fi定位,Wi-Fi网络的部署者可以获取用户的位置信息、行动轨迹,在海量数据的基础上,借助相应的数据分析软件,可以了解用户的消费习惯。如在大型购物商场中,通过历史数据分析得出某一Wi-Fi终端用户在商场的特定货区停留的频率较高,商场就可向该用户定向推送该货区的相关信息,方便用户购买商品并提高购买率。

在商业时代,广告已成为商家向消费者传统传递信息、提高知名度的常用手段。传统的广告投放模式分为以下几种:报纸杂志广告;电视广告;广播;户外广告媒体。经分析,这些广告模式普遍存在的问题有:

①有限的灵活性。广告主在遇到市场情况变化时,需变更广告内容困难,缺乏时效性;②缺乏及时性。广告的受众可能无法及时获取所需的广告信息;③缺乏针对性。大部分广告的投放对人群没有选择性,只对相当小比例的受众为有用信息,造成广告的覆盖面浪费。

为了改善传统广告模式,市场有如下几种应对策略,个性化推送技术就是在这种背景下产生:①会员模式。记录会员的消费信息,根据会员的历史消费记录,通过短信、电话等方式来推荐会员可能感兴趣的商品信息。这种推送方式存在数据量过大、推送不精确、推送成本过高、效率低下等缺点,无法大规模推广。②RTB(RealTimeBidding,实时竞价)模式。RTB广告是网络广告的一种,是一种在每个广告展示曝光的基础上进行实时竞价的广告类型。RTB广告的特点在于通过分析用户历史浏览记录,得出用户相关信息,如年龄、性别、兴趣爱好等。当用户打开网页时,网页会根据用户的兴趣爱好展示不同的广告。RTB模式放大了网络广告的指向性和精准度,使需求方的效益最大化。但RTB模式是依托于互联网平台,对线上用户兴趣爱好等信息进行挖掘,无法收集到用户线下的消费习惯,有一定的局限性。

针对以上问题,本论文提出了基于MAC地址收集与定位的智能广告定向推送方案。随着城市大型购物商城的增多,商业圈成为城市主要经济增长点,其辐射区域,包括小区、写字楼,地铁站,人流量巨大,是天然的广告投放平台,具有巨大的商业潜力。本方案基于这一背景,对现有的Wi-Fi定位技术进行改进,研发出被动Wi-Fi定位技术,该技术通过对智能手机MAC地址的收集,建立MAC地址到手机用户身份的一一映射,实现对大型购物商场消费者位置信息更加精确、灵敏地收集,同时借助数据挖掘技术对用户位置信息分析,得出消费者在这些区域的行为习惯,如经常停留在商场的特定货区。最后将这些行为习惯与用户消费倾向联系,即可对用户推送个性化的商品信息。本课题将用户的位置信息与消费习惯建立映射,进行广告的定向推送,填补了国内外这一研究领域的空白。

2 国内外研究现状

2.1 Wi-Fi定位技术

Wi-Fi定位技术最先由美国的SkyhookWireless公司提出,后来许多人对相关算法进行改进。Wi-Fi定位的原理为:Wi-Fi热点的位置通常固定不变,只要通电,都会向周围发射信号,该信号包含全球唯一的ID—MAC地址。通过侦测附近所有AP(Wi-Fi热点)的MAC地址,发送到相关位置服务器上,服务器通过数据库中已存在的MAC地址的坐标,计算出客户端的地址。这样,客户端只需侦听周围的AP,检测每个AP信号的强弱,发送给定位服务器,服务器根据这些信息,查询每个AP在数据库中记录的坐标,通过相关算法就能得出客户端的具体位置。

现有的Wi-Fi定位技术需要智能手机用户主动搜索AP热点,将AP的MAC地址上传给服务器,经服务器处理返回位置信息。定位过程需要用户的主动参与,如果AP部署者想主动收集大量用户的位置信息,这种定位技术便存在低效率的缺陷。

本课题提出的被动Wi-Fi定位技术对现有的Wi-Fi技术加以改进,从传统的用户客户端主动搜索AP地址转变为AP主动搜索用户客户端即智能手机的MAC地址。定位过程只需用户的智能手机终端开启Wi-Fi模式,无需用户的额外操作,具有简单、高效的特点。

2.2 个性化推荐技术

个性化推荐技术主要依托于大数据,利用数据挖掘等技术对数据进行分析得出规律性的结论。上文提到的RTB广告模式也是利用个性化推荐技术向用户投放其可能较为感兴趣的广告。2007年,雅虎推出了SmartAds广告方案。雅虎掌握了海量的用户信息,如用户的性别、年龄、收入水平、地理位置以及生活方式,再加上对用户搜索、浏览行为的记录,使得雅虎可以为用户呈现个性化的横幅广告。

在国内,个性化推荐技术也迅速发展,2009年7月,国内首个个性化推荐系统科研团队北京百分点信息科技有限公司成立,该团队专注于个性化推荐、推荐引擎技术与解决方案,在其个性化推荐引擎技术与数据平台上汇集了国内外百余家知名电子商务网站与资讯类网站,并通过这些B2C网站每天为数以千万计的消费者提供实时智能的商品推荐。在不远的将来,个性化推荐技术将是推送领域中的主潮流。

本课题提出的智能广告定向投放系统同样应用了个性化推荐技术。MAC地址装置收集的数据为用户的位置信息,数据收集后根据预先设定的关联规则从中根据提取出用户的相关信息与倾向,最后通过相应的推送设备实现广告的定向推送。

3 研究意义

在获取方式上:随着时代的发展,智能手机对人们生活的影响越来越大,基于位置的服务越来越受人们的重视。根据全球移动互联网数据发布平台——艾媒咨询发布的报告显示,在2013年10月香港举行的媒体大会中,业内人士预计到2015年,中国智能手机用户将达到6亿人。并根据相关的调查研究表明有80%的人习惯一直开着Wi-Fi,因此利用被动MAC地址定位技术的优势也就越发明显。这种技术相比传统的GPS定位和Wi-Fi定位,不仅弥补了GPS在建筑密集或者室内应用的限制,也避免了用Wi-Fi定位时对手机用户敏感信息的摄取。此获取方式新颖、创新,能够在手机用户不主动连接Wi-Fi的情况,获取其MAC地址,与用户的身份绑定度高,收集到大量的数据,更有利于数据的分析、研究,具有重要的社会意义。

在数据分析上:大数据时代的来临,意味着数据和信息对企业、商家的重要性,商家的决策不能依靠于感觉和经验,而应该基于数据的分析,数据量越大其分析结果越可信。由此可见,数据收集和数据分析的重要性,该系统可以根据用户大量的位置信息分析出消费者的消费倾向和兴趣爱好,应用了基于大数据的数据分析和数据挖掘的相关知识,在技术上具有很大的研究和实施价值。

在商业应用上:消费者的购物倾向是商家一直十分关注的问题,商家的决策往往依赖于消费者。广告是商家吸引消费者的重要方式之一,尤其是对非理性消费者,会起到十分明显的作用。该系统基于位置的营销策略具有很大的优势,能够精准投放广告,做到有的放矢,不再是普遍撒网的广投,而是具有针对性的智能投放广告,更加充分地利用了社会资源,强化了商家与客户之间的沟通,提高企业效率和顾客价值,因此具有很高的社会意义和商业应用价值。

在发展前景上:“智慧城市”是未来城市的发展方向,城市的智能化越来越受人们的关注。智能终端功能越来越强,应用越来越广,基于位置的个性化服务越来越受重视,电梯的普及度越来越高,该系统中利用电梯进行广告的投放,利用了电梯中信号屏蔽,定位精准的特点,使得此智能广告定向投放系统具有很高的效率,针对性显著。必将是未来广告投放系统的发展趋势,具有很好的发展前景。

4 课题主要内容

4.1 课题简介

本课题以大数据时代为背景,结合终端MAC地址采集技术、数据挖掘与数据分析以及终端即时推送技术,设计与开发针对移动终端一部分信息的采集、定位、分析后的定向推送的系统。项目前期包括对技术支持、硬件支持的研究,结合专业学习进行整体架构;中期主要为信息采集、分析与推送系统的构建与开发;后期包括对系统的评测与完善,商业化应用的研究与探索。

4.2 基本思路

任意一个网络设备一旦生产出来以后,其MAC地址永远唯一且不能由用户改变,因而可以根据一台拥有上网功能的移动终端的MAC地址唯一确定一个用户。并且终端通过网络发出请求或发送信息时,MAC地址作为终端信息会被放在数据包头部在数据链路层上进行传输识别,以区别于其他的网络终端设备。因此,对于打开Wi-Fi连接的移动终端,MAC地址信息采集器(即Wi-FiMonitors)可以收集分析从而得到移动终端的ID(MAC地址)、位置信息(以采集器的位置为基准的定位)。以这种形式作为一条数据信息,将这些数据信息通过服务器终端进行数据挖掘与数据分析得出一系列终端用户可能的个人倾向与喜好。在数据的采集与分析达到足够置信度时,若移动终端经过带有MAC地址信息采集器的终端投放屏幕,将其相关可能信息定向推送至终端屏幕,以此达到信息的定向推送,提高信息传递的效率与准确度。

4.3 研究方法

4.3.1 MAC地址的采集

理论上,在没有共用一个网络的情况下,MAC地址采集器可以通过移动终端探测附近有无可用Wi-Fi网络而发出的probe数据包的头部来分析出MAC地址。但在一般情况下,终端发出的请求频率过低或强度不够,使得MAC地址采集器难以捕获或搜集到。由于采集过程是基于硬件的接收与处理,在该层面上难以突破,因而需要转向提高手机终端发送probe数据包的频率和概率。

①利用仿真AP来模仿一些热门的公共Wi-Fi的SSID,刺激移动终端发出连接握手请求,同时发出probe数据包,被MAC地址采集器采集并收集。②在存在隐藏Wi-Fi的地方投放MAC地址采集器,利用终端设备主动连接隐藏Wi-Fi,将MAC地址等打包的信息在其可广播到的范围内广播并等待回应的动作,获取该终端设备的MAC地址。

然后通过实物测验,对不同情况不同距离的终端测试,借此来完善MAC地址的采集技术。

4.3.2 定位技术

根据之前选择获取MAC地址的方法,MAC地址采集器也可作为Wi-Fi定位AP对移动终端进行定位。

从硬件的角度来分析,由于WIFI定位是根据终端侦听周围有哪些AP以及各AP的信号强度以及数据库中各MAC地址所对应的AP物理位置计算出终端的位置,那么从理论上,终端侦听到的AP信号越多,定位就会越准确。结合本课题,依靠AP探测终端发射信号的强弱,利用组网AP也可用AP来定位移动终端,同理AP越多定位越准确。考虑到经济与定位精确度的矛盾,借助理论模型建立以及现实具体实验相结合的方式,得出两者的最优方案。

从软件方法的角度来分析,目前所用的定位算法为三边定位算法(所谓三边定位算法,就是指以三个AP为圆心,以AP到待测终端的距离为半径做圆,得到三个圆的焦点,建立方程求解出距离),但由于现实情况未知,往往不能很精准的三圆交于一点,存在不可控误差。我们期望借助于现有数学模型,如加入质心定位等,加之自己的应用实践得出一个较为准确可靠的定位算法。

4.3.3 数据挖掘与数据分析

对于某个采集器的一条信息,存储形式,见表1。

对于MAC地址采集器收集的大量数据在服务器端进行如下处理:

Tstay=Tend-Tstart

Tstay为该ID在此处的逗留时间Tmin;

规定用户在某处的最小可能逗留时间。

定义TimeID为该ID在该处出现的次数,当且仅当Tstay≥Tmin时,该条数据信息的分析流程如图2所示。

TimeID=TimeID+1

规定固定用户的出现次数阈值Timethreshold。

当且仅当TimeID≥Timethreshold时,表示该ID在此处达到可信水平,该用户为此处的固定用户,该处附近的信息对他有较大的价值,符合定向推送要求。

4.3.4 屏幕投放

屏幕投放是以MAC地址采集、定位、数据分析为前提,当经过分析后的终端再次经过带有MAC地址采集器的屏幕时,通过智能屏幕进行定向信息推送。

由于同一时间可能存在多个终端用户在此附近,推送信息的选择我们采取建立多元统计回归建模的方法,根据不同用户的偏好、偏好的相关性以及用户数量,结合实际情况通过屏幕传达较为准确与合适的信息。

考虑到先后顺序、临界资源以及系统的可靠性与稳定性,对输出设备——屏幕上锁,补充该算法,保证临界资源的稳定性,并结合实际情况创新突破,如提出一些可抢占临界资源的特殊情况、增加队列优先级序列表等。

参考文献:

[1] 时国怀.大数据时代,在街头安装收集移动设备MAC地址的Wi-Fi

装置,会否是新商机,有哪些运用可能

[3] 谢希仁.计算机网络[M].北京:电子工业出版社,2013.

[4] 雷地球,罗海勇,刘晓明.一种基于Wi-Fi的室内定位系统设计与实现[A].第六届和谐人机环境联合学术会议(HHME2010)[C].2010.

[5]陆霞.Wi-Fi定位技术——基于质心定位的三边定位算法的研究[J].电脑知识与技术:学术交流,2013,(9).

[6] 李礁.基于SMS推送的Android定位寻人系统研究与实现[J].软件导刊,2013,(7).

[7] 庞浩.基于WIFI定位技术的动线管理系统的研究与实现[D].上海:东华大学,2012.

[8] 李路明.基于WiFi定位的轨迹预测的研究和实现[D].西安:西安电子科技大学,2013.

[9] 雷家毅.Android平台基于WiFi的定位算法与系统设计[D].上海:华东理工大学,2013.

猜你喜欢
定位技术数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
物联网定位技术综述
室内定位技术研究
浅析输电线路故障区域定位技术的应用
无线传感器网络定位技术可靠性分析
一种基于Hadoop的大数据挖掘云服务及应用
基于RFID的消防员室内定位技术研究
基于图像处理的石英晶片定位技术研究
数据挖掘的分析与探索