几种网络用户行为模型的对比研究

2017-05-18 12:59刘彩红魏战争
漯河职业技术学院学报 2017年2期
关键词:泊松间隔特征

刘彩红, 魏战争

(1.漯河职业技术学院, 河南 漯河 462002; 2.驻马店财经学校, 河南 驻马店 463000)

几种网络用户行为模型的对比研究

刘彩红1, 魏战争2

(1.漯河职业技术学院, 河南 漯河 462002; 2.驻马店财经学校, 河南 驻马店 463000)

无论是个体还是群体,驱动用户行为的动力学原理是构成网络用户行为动力模型的基础。由于行为的复杂性,在网络社区行为模型构建中,常用的研究方法有两种,即基于事件间隔时间特性和基于事件空间特性。从研究模型来看,网络行为分析依据不同的网络结构和统计方法,在模型量化及用户行为特征量的表征上通过对正常行为的建模来发现网络存在的安全漏洞,并提出积极主动的防御对策。

复杂网络;网络行为;模型构建;对比研究

人的行为规律具有社会学、医学、心理学、经济学等多重领域的综合特征,在复杂的网络社会中,基于用户行为模型的构建主要集中在时间、空间维度的对比分析上。对于时间特性的研究,主要侧重于在某一时间间隔内两个具有连续特征的行为事件发生率,如发送两条微博的时间间隔、连续两次访问同一网站的时间间隔等;而对于空间特性的研究,主要从用户位置的变化探讨网络用户的行为特点,如以手机网络来精确定义用户的空间运动轨迹和特征等。总体来看,对于网络用户行为特性的研究主要集中在幂率特性、区域特性、重复特性三个方面。

1 网络用户行为模型研究的特点

对于网络用户行为的特征研究,主要从时间、空间两个维度来展开。在时间维度上,传统的实证研究发现,用户行为具有随机性,服从泊松分布特征;但近年来,随着复杂网络理论研究成果的推出,基于时间间隔及事件等待间隔的行为特征服从幂率分布,即p(τ)-τ-α,也就是说,对于行为特征既有长时间的静默,也有短时间的阵发。与传统泊松分布相比,幂率分布在衰减速度上较慢,且出现较大概率值的可能性要高于泊松分布;Oliveira等人以电子邮件发送为例,指出收发邮件的时间间隔服从幂率分布;国内学者在对钱学森、傅雷、鲁迅等人的邮件记录进行分析时发现其也服从幂率分布特征。网络互联带来的移动通信服务,让更多的人能够随时随地登陆网络并使用网络。周涛等人通过Netflix网络对448235名用户观看同一电影的时间间隔分布进行分析,得出用户点击电影的时间间隔服从幂率分布,并提出活跃度概念,用以表征用户在某段时间内的点击行为总数;Vazquez等人通过对圣母大学图书馆借阅行为进行研究,从书籍的签出到期刊归还记录,其时间差也服从幂率指数。在空间特性研究中,用户行为的位置信息与时间信息相比更具隐秘性。有学者利用现代科技来对微生物、海洋生物等运动行为进行实证记录,发现这些生物在空间上也服从幂率分布;Brockmann等人通过电子支票来分析人的空间行为,也有学者利用手机的精确定位同样发现人类空间运动服从幂率分布。另外,在人类行为轨迹统计中,对于某一特定行为具有重复性,而不是随机性;Barabasi在其著作《Burst》中提出,93%的人类活动具有可预测性。

2 常用的网络用户行为模型研究

2.1 优先排队量化模型

Barabasi是最早提出优先排队模型的,并利用具体任务的优先级来进行不同场景、不同视角的分析。在优先级排队模型中,对于网络用户行为的复杂性,主要从假设中加以简化。如利用时间离散化,将连续的行为按照时间间隔来分解;利用单位化处理时间作为某一离散任务的处理过程;对于任务队列保持永不停止的状态;对于生产者、消费者都处于不停执行任务的状态;对于任务选择基于三种方式,即随机法、先来先服务、最高优先级服务。通过对优先级模型的假设,在模型建立过程中,首先每一个用户被赋予某一任务,并根据任务队列被赋予优先级xi(xi∈[0,1]),在任一时步下,生产者产生新的任务交给任务队列,消费者以概率P来进行优先级任务选择,而对于(1-P)则以随机任务方式进行消费,记录下本任务的消费时步;对于任务的等待时间则可以记作“τw=消费时步-生产时步”;当p→1时表示用户按照优先级来选择任务,通过模型得出τw的概率分布符合幂率特征;当p→0时,表示按照随机法进行任务选择,模型得出τw的概率符合泊松特征。然而,对于优先级排队模型,由于涉及太多假设,削弱了模型的适用性;Vazquez等人利用生产任务速率θ和消费任务速率λ来探讨任务队列的长度L,得出当L=2时,等待时间精确为

(1)当p→0时,则有

说明理论推理与仿真结果具有一致性,服从指数衰减下的泊松分布。

(2)当p→1时,则有

这时,每个任务的等待时间为1,没有被消费的任务等待时间也服从幂率分布。

(3)当p<1且为定值时,τw→∞,则可以得到:

2.2 自适应兴趣驱动模型

对于网络用户来说,很多情况下在参与网络行为中是基于事件的兴趣驱动。例如,以网络娱乐为主的用户,其上网、收发邮件、参与社区讨论等行为,并非是建立在任务优先级上,而是更多地基于人类自身动力学驱动下完成。当参与某些行为过于频繁时,兴趣会降低;相反,当参与行为频率下降时,兴趣会回升。其模型规则为:当时间为离散化条件下,在时步t内参与某项事件的概率为r(t),则在t+1时步下,r(t+1)=α(t)r(t),其中α(t)的表达式为

有学者提出基于兴趣驱动的非线性递减函数行为动力模型,表示为

对于本式中的t-1=Δt,当Δt小于阈值时,则重新回到1,其特点在于利用指数来调整幂率分布。

2.3 非齐次泊松模型

在网络用户行为分析中,Malmgren等人提出行为的周期性。如对于微博娱乐,从时间上与人的行为具有一定的周期性,如晚上睡前参与网络行为,也是符合一些人的行为习惯的。为此,利用幂率分布,从时间间隔上引入周期性概念,得出级联式非齐次泊松模型。

我们用pd(t)和pw(t)分布表示两个嵌套的周期函数,pd(t)表示一天的概率,pw(t)表示一周的概率。则事件发生概率ρ(t)表示为

ρ(t)=Nwpd(t)pw(t)

对于嵌套的泊松过程,表示某网络用户参与某一事件的概率依赖于另一周期函数,本模型实质上是对网络用户周期性行为的表述,即每一周的某一固定时间参与某事件,每一天也是这样。我们从仿真结果中发现,对于网络用户中的周期性行为,其时间间隔具有长尾幂率现象,说明该模型解释了某一连续时间段上的网络行为具有周期性特征。

2.4 其他模型

从用户行为动力学入手来探讨网络用户行为模型,很多学者从时间特性上来构建模型,除了上述几种模型之外,还有Gotz利用随机游走理论来构建人类行为模型,并从实证中来挖掘用户的行为表征,进一步细化模型参数;闫强等人在兴趣模型基础上发现,用户获得的关注是驱动用户网络行为的重要因素;在不同场景下的网络用户行为动力学模型中,Blanchard等人提出截止时间下用户动力学模型,并从多个行为关系比较中得出,交互行为是驱动行为频率的重要因素;另外,在基于空间特性的用户行为模型研究中,Barabasi等人从用户位置信息变化中提出,不同地域下的人类运动模型具有层次性,如国家、省会城市、中心城市、县域城市等具有一定的行为层次性。

3 基于在线网络用户行为建模的关键点研究

用户行为在基于在线网络模型构建中,除了用户行为动力学实证模型之外,以社交网络、论坛为代表的在线网络,其用户行为建模设计需要关注以下几个问题。

一是对个体用户行为内在、外在特征量的表征。随着在线网络用户行为数据的剧增,基于多维度视角来研究用户行为特征量,需要借助于数学理论推导和用户行为仿真明确表征量问题,如社会关注度特征下的用户兴趣、交互式行为研究中不同个体间的行为研究,不同用户群体特别是不同分组群体的规律性行为,群体间如何协作及制约用户行为与社交网络之间的内因、外因关系等。

二是利用在线网络中的不同用户角色,从用户整个生命周期探讨不同节点角色的相互关系。有学者提出,社交网络中的节点角色发现是进行用户行为分析的核心,角色发现与社团发现之间存在关联,社团发现是基于社会行为的抱团行为,旨在表征社团中紧密关联的群体人的角色特征;同样,在不同社团群体内部,也常常存在相同角色的个体,如拥有两个员工的老板与拥有两个客户的推销员,在节点角色扮演上具有相似的网络行为。

三是话题发现与演化。从在线网络用户行为分析上,对于用户以往行为的梳理与归结,相对于新的网络应用及服务,能够对用户行为进行预测和评断。如在某社交网络中,以信息传播为载体的人际沟通,以发表个人观点、融入社会大众的参与互动为主要方式,而由于人的行为与思想具有复杂性,在社交网络中的行为趋向受到更多舆论信息的影响。因此,还需要从传播动力学、演化跟踪等统计方法中引入特征的概率分布,来构建不同话题模型的动态特征权重,进而实现话题的演化与漂移。常用的演化方法有两个:一是自然语言方法,凭借信息抽取技术,以文字间的话题关联为表达、传播、扩散特征;二是机器学习技术,通过关联度分析、文本聚类、分类预测等算法实现话题的形成和演化。

4 结语

在网络用户行为模型的探讨中,随着在线社交网络的发展,基于用户行为的数据挖掘及关系算法是催生建模理论的重要驱动力,而在网络用户行为模型各个特征量的表征上,随着网络用户数据规模的扩大,还需要从多维度、细粒度、动态分析上进行理论推导和实证仿真研究,尤其是对于个体、群体间的行为特征量的细化,从用户思想、习惯及社会角色扮演中梳理更为精确的用户特性,为后续研究提供参考。

[1] 张仕斌,肖姗,昌燕,闫丽丽.基于云模型理论的网络用户行为评判模型研究[J].小型微型计算机系统, 2013(10).

[2]BarabásiAlbert-László.Theoriginofburstsandheavytailsinhumandynamics[J].Nature,2005,435(7039):207-211.

[3] 王小军,颜嘉元,周涌杰,吴玉杰.网络行为分析监控系统研究与设计[J]. 杭州电子科技大学学报, 2012(1).

[责任编辑 吴保奎]

Comparative Study on Several Network User Behavior Models

LIU Cai-hong1, WEI Zhan-zheng2

(1.Luohe Vocational Technology College, Luohe 462000, China;2. Zhumadian Finance & Economics School, Zhumadian 463000, China)

Whether it is an individual or group, the dynamics principle of driving user behavior is the foundation of network user behavior dynamic model. Because of the complexity of the behavior, there are always two research methods in network community behavior model building: one is based on the time between events and the space of events. From the research model, the analysis of network behavior according to the different network structure and the statistical method, on the quantification of models and the characteristic quantities of user behavior, and by modeling the normal behavior to discover the network security vulnerabilities. It will have a very important practical significance to put forward proactive defense countermeasure.

complex network; network behavior; model building; contrastive research

2016-12-19

刘彩红(1976-),女,河南临颍人,硕士研究生,讲师,研究方向:计算机应用。

10.3969/j.issn.1671-7864.2017.02.007

TP393.06

A

1671-7864(2017)02-0024-03

猜你喜欢
泊松间隔特征
根据方程特征选解法
基于泊松对相关的伪随机数发生器的统计测试方法
一类带有两个参数的临界薛定谔-泊松方程的多重解
带有双临界项的薛定谔-泊松系统非平凡解的存在性
间隔问题
不忠诚的四个特征
间隔之谜
抓住特征巧观察
上楼梯的学问
泊松分布信息熵的性质和数值计算