基于社交平台大数据的暴雨时空分析

2019-06-10 09:31李雪尘熊薪
科技创新导报 2019年5期
关键词:新浪微博暴雨

李雪尘 熊薪

摘   要:在来自社交平台大数据的支持下,已有多项研究揭示灾害发展趋势、灾难位置与影响范围,展现了社交媒体数据对灾害研究的帮助。本文以2012年北京大暴雨为研究对象,通过分析用户提及行为与暴雨时空变化,通过微博中暴雨数据反映了用户在现实中的亲近社交关系、实时展现暴雨相关信息并预测其发展趋势,有助于研究灾害动向以及其间用户关系。

关键词:时空大数据  提及行为  暴雨  新浪微博

中图分类号:P954                                   文献标识码:A                       文章编号:1674-098X(2019)02(b)-0119-03

Abstract: In this paper, the 2012 Beijing heavy rain was taken as the research object. By analyzing the users' mentioned behaviors and the temporal and spatial changes of the heavy rain, the heavy rain data in the microblog reflected the users' close social relationship in reality, presented the information related to the heavy rain in real time and predicted its development trend, which was conducive to the study of the disaster trend and the relationship between users.

Key Words: Spatiotemporal big data; Mention behavior; Heavy rains; Weibo

大数据拥有速度快多样化等优点,从海量数据中挖掘巨大价值使人们能更好地理解世界[1]。如2014年陈佳等人基于手机定位数据推测出用户特征[2]。在大数据高速发展的同时, Facebook、Twitter等社交平台因便利高速,其用户与日俱增,为政治、科技、娱乐等不同领域的研究提供新可能[3]。在社交媒体用户行为分析与时空分布研究的基础上,可通过将用户行为与极端事件关联来研究灾害。

基于新浪微博数据,本文研究了2012年北京暴雨发生时与发生前后的用户提及行为,并据此分析社交平台中暴雨的时空变化。具体表现为以用户为节点,提及关系为度,构建网络形成组件,对组件分类探讨并对比分析暴雨期间不同城市内的微博信息在时空范围上的演变趋势。

1  实验方法

本文以2012年7月北京特大暴雨为研究对象,通过微博提供的API搜集暴雨期间的微博数据,从中筛选出带有“@”的信息并据此构建网络与组件,分析暴雨中用户的行为规律。

1.1 构建组件

在网络爬虫的支持与关键词“北京暴雨”的限制下,本文借助新浪微博获取此灾害发生时社交平台内用户发布的相关信息,经过预处理得到24855条有效数据。据此筛选出从2012年7月21日起之后连续3d内的16759条数据,其中部分包含地理坐标,作为研究灾害时空变化趋势的依据。之后从所有数据中识别出6529个被@的用户,作为节点以形成网络。

从网络中筛选出2089条包含提及关系的微博,所形成的提及网络中包括拥有不同数量节点与微博的1854个组件。将组件的平均度、平均聚集系数、中心性系数、网络直径可视化并据此对组件进行分类,之后用幂律分布验证不同组件节点变化规律,在2.1中主要分析一个节点数较多且聚集系数较大的组件。

1.2 时空分析

将兴趣时间段内所有包含地理坐标的微博以经纬度的形式可视化,同时筛选出含有提及关系的微博,以相同方式可视化后与前者对比,可观察出提及微博聚集程度的减弱。并从网络中随机抽取微博进行人工分类以分析用户提及行为的原因。

之后分析暴雨中与城市相关的微博信息在时空范围内的变化。从不同角度对比上海、天津、北京、重庆、武汉、深圳的微博差異,统计了每个城市在不同时间点被提及的次数、每个城市不同时间点发出的微博总数、每个城市不同时间点的提及数量与总微博数量之比,将城市被提及数量可视化,并统计每个地区数据集内每小时的提及次数、微博数量。

2  实验结果

2.1 组件分析

基于1.1的方法形成的网络中含有一个聚集系数较大的组件(图1),针对此组件聚集系数较大的特点,可将其解释为一个在地理上聚集且互动较多的用户形成的社区。作为基于提及关系的组件,其聚集系数较大说明提及网络可体现亲近社交关系,即提及行为能反映较强的用户相关性,与Minh-Duc Luu在[4]中通过对比提及与转发关系发现前者能更好展现用户交互行为的结果一致。

另外,此组件内没有中心节点,是由暴雨中相邻用户间的提及关系形成组件,将用户地理空间的相邻性体现在虚拟空间。说明此组件内用户很可能因暴雨产生联系,具有朋友关系的可能性较小。此组件作为聚集系数不为0的唯一正常组件,其用户群体在虚拟空间与现实空间都聚集,且空间关系邻近,内部节点数和微博数都较多,依次可看出用户提及行为的规律性,以及虚拟空间与现实空间的关联。此组件内的用户因地理空间产生联系并表现为微博中的提及关系,且网络中的其它大组件反映出在微博中能高效传递消息的用户一般为名人或大流量媒体,说明用户倾向提及现实或网络中具有影响力的对象,或在突发事件中具有短暂紧密关系的其它个体。

2.2 时空变化

对组件的分析有助于理解用户提及行为的规律性,但不能明显反映暴雨时空变化。此小节剖析暴雨发生前至暴雨发生后网络中不同城市被提及情况与内部微博信息,观察暴雨发生时不同地区涉及程度与变化情况,发现基于提及关系反应的暴雨时空变化趋势与实际情况符合。基于1.2中方法初步得出暴雨期间用户聚集地点(图2),发现不止北京附近有用户发布微博,其它地区微博数量也较可观,如图3将城市按微博数量划分等級后,发现通州等地微博数量也较多。之后根据经纬度大致找出6座微博数量较多的城市:上海、天津、北京、重庆、武汉、深圳。

从图4可看出不同城市被提及数量变化趋势大致相同但数量差距较大,从7月21日暴雨发生开始上海、天津、北京、重庆、武汉、深圳这六座城市被提及数量剧烈增加,其中北京最早被提及且平均数量最多。城市被提及数量在7.21深夜或7.22正午达到最高,从7.23开始趋向减少,但深圳市在7.23正午至7.24凌晨出现反弹。六座城市微博数量变化与被提及情况相似,但北京与其它城市差距更大,且深圳市较为特殊,从7.23上午开始趋向增加,至傍晚到达最高点后趋于减少。

分析提及城市的微博占总微博比例(图5)可观察出上海、天津、重庆、武汉都存在提及微博占比接近或达到1.0的时间点,对应图4中可发现对应时间点城市被提及数量与总微博数量极少且相等,这种微博发布者可能有亲人朋友处于所提及城市。而北京总微博数量十倍于被提及数量,且两者几乎同步变化,故提及微博占比从暴雨发生前到暴雨发生后一直保持较稳定的变化趋势。

由于北京市是灾害发生中心,故这六座城市被提及总数和微博总数以及两者比例的变化趋势都接近北京市,但在7.21暴雨开始阶段,六座城市被提及占比发生4次大转折,突增至最高点后降回正常水平,又再次到达最高点,骤降后才与北京市情况一样趋向稳定波动。

3  结语

上述研究以灾害中用户提及关系为研究对象,从时空角度分析暴雨演变趋势且发现其与现实相符。具体表现为通过构建提及网络并利用微博提供的位置关系,详细分析微博和节点数量较多且聚集系数较大的一个组件从而发现突发事件中用户关系,并通过不同城市所涉及微博的变化差异揭示灾害进程。

本文除观察出灾害中用户提及行为的规律性之外,还发现提及关系可作为用户行为的有效表现形式、反映暴雨中亲近社交关系、实时展现暴雨相关信息并预测其发展趋势,为研究灾害动向以及其间用户动态提供新思路。

参考文献

[1] Kato S , Koide A , Fushimi T , et al. Network Analysis of Three Twitter Functions: Favorite, Follow and Mention[M]// Knowledge Management and Acquisition for Intelligent Systems. Springer Berlin Heidelberg, 2012.

[2] 陈佳,胡波,左小清,等.利用手机定位数据的用户特征挖掘[J].武汉大学学报:信息科学版,2014,39(6):734-738.

[3] Andrew Crooks, Arie Croitoru, Anthony Stefanidis and Jacek Radzikowski. #Earthquake: Twitter as a Distributed Sensor System[J]. Transactions in GIS, 2013, 17(1): 124–147.

[4] Luu M D , Thomas A C . Beyond Mere Following: Mention Network, a Better Alternative for Researching User Interaction and Behavior[J].2015.

猜你喜欢
新浪微博暴雨
“80年未遇暴雨”袭首尔
暴雨
当暴雨突临
暴雨来临(下)
社交媒体平台医患关系报道特点研究
暴雨的警示