利用社交媒体探测地震时空应急信息

2018-11-23 07:35王艳东阮诗斯
地理空间信息 2018年11期
关键词:推文时空灾害

王艳东,阮诗斯

(1.测绘遥感信息工程国家重点实验室,湖北 武汉 430079;2.地球空间信息技术协同创新中心,湖北 武汉 430079)

随着Web2.0以及相应技术的推进,社交媒体已成为人们生活中必不可少的一部分,改变了传统的信息传播模式,使得信息能在短时间内迅速扩散[1]。带有地理坐标的社交媒体数据可被认为是自发性地理信息(VGI),具有时效性强、数据量大等特点,已成为越来越多的有关地震灾害管理研究的数据来源[2-3]。

以开放式移动信息发布平台Twitter为例,带有GPS的Twitter数据包含了丰富的位置和语义信息,是近年来探测地震灾害信息领域的研究热点。参考文献[4]~[9]将Twitter视为一种混合传感器系统对地震灾害事件进行预警与监测,其中Earle P S[4]等开发了带有地理坐标的有关损害或人员伤亡等消息的推文,能帮助有关应急决策部门在地震发生时启动应急响应;Sakaki T[8-9]等建立了一个能找到事件位置中心的目标事件概率时空域模型,利用粒子滤波器来估计目标事件位置。参考文献[10]~[13]利用推文主题时空变化趋势来探索地震灾害的发展趋势和空间分布规律,从而分析灾情状况。目前,大多数研究都基于文本分析、时序分析和热点分析等方法探测地震应急信息,忽略了地震发生后短时间内社交媒体数据中所蕴含的空间分布传感价值。

本文以从Twitter上获取的数据为例,旨在探讨地震事件发生后,如何快速从社交媒体数据中探测应急信息。首先利用描述性统计法分析了数据的时序特征;然后从空间分析的角度对数据进行不同维度的可视化,探究数据的时空分布模式,从中分析地震影响范围;最后与美国地质调查局的官方数据进行对比,以评估Twitter探测灾害事件时空应急信息的能力。

1 Twitter数据的采集与处理

从Twitter中可方便获取单一来源信息,且具有传感价值[14]。若将每条带有发文时间和经纬度坐标位置信息的推文视为一个带有位置信息的传感值,事件检测就可简化为基于传感器读数的位置检测。由于智能手机将越来越密集化,且聚集在特定事件中最感兴趣的地方,因此Twitter的传感价值将越来越高。地震发生后,将带有GPS的推文视为传感器读数,从其空间属性出发,探索其中包含的时空应急信息,能为应急决策提供依据。

为了提高平台的影响力和吸纳更多的用户,Twitter对平台以及用户以外的第三方开放了数据访问接口(https://dev.twitter.com/overview/api/tweets)。使用 API采集的数据分为两种:一种是以一组关键字为话题,搜集与突发事件相关的推文;另一种是以事发地为中心,指定搜索半径,搜集事发地周围的推文。本文以“4.25尼泊尔地震”为例,通过Twitter开放平台API实时采集了距离地震中心(28.2E,84.7N)1 609.3 km范围内,北京时间2015年4月25日14时到2015年4月29日10时的包含“earthquake”关键字的18 131条JSON格式的Twitter数据,其有4 903条带有GPS位置信息。

2 数据时空分析与信息探测

2.1 数据时序特征

本节对数据量随时间变化的发展过程进行描述性统计分析,了解采集数据的情况。图1展示了搜集与地震相关Twitter数据的统计结果,可以发现,图中推文峰值出现的时间与表1中统计的该次地震发生后一系列余震发生的时间有良好的对应。表1中4月25日14时、20时以及26日7时、11时和15时尼泊尔发生地震时,图1中对应的时间点A、B、C、D、E正好是推文数量的峰值。北京时间4月27日0时发生的地震,在图1中对应F点,微博趋势线延迟1 h达到最高点,F点延迟的原因在于该次地震发生在尼泊尔当地时间4月26日23时,此时Twitter总体参与人数不多或人们反应时间较慢。整体结果可以说明,在地震发生后,推文数据流的特点能反映地震所处的不同阶段。

图1 Twitter数据量统计图

表1 “4.25尼泊尔地震”信息表

2.2 数据空间分布特征

将这些点状数据进行可视化能了解相关推文在空间上的热点分布区域和规律,从而有利于对灾害事件的时空信息进行探测。图2为采集到的4 903条带有GPS信息的地震推文在地图上的直观显示,可以发现,除了尼泊尔上方区域(中国地区,Twitter未开放)外,推文以震中为中心,向外呈发散状;且推文在震中(84°43' E,28°14' N)、尼泊尔首都加德满都(85°19'E,27°42'N)以及距震中约730 km的印度首都新德里(77°13' E,28°37' N)处较为密集,热点位置主要分布在震中、加德满都、新德里以及印度其他的一些大型城市。

图2 推文空间分布图

2.3 数据时空分布模式探索

地震发生后短时间内的推文相当于是反应地震信息的一条传感值,其中包含着有用的时空信息,因此本文对地震发生后600 s内的237条带有GPS的地震推文进行时空分析,探索其中的应急信息。

图3 600 s推文三维时空反应格局图

图3中每个点代表一条推文,颜色从蓝到红代表距离震中由近到远。X轴为经度,Y轴为纬度,Z轴为反应时间,即指推文发布时间与震中发震时间之差,是体现推文对该事件反应的一个指标。每条推文分别映射到相应的X-Y、Y-Z、X-Z三个投影面上,颜色保持不变。在推文映射的X-Y投影面上可以观察到,映射点由震中向外呈扩散状;分析X-Z和Y-Z两个投影面可以发现,推文的时空分布存在明显的聚集,在经度为76°~78°之间和纬度为28°~29°之间的位置,以及经度为88°~90°之间和纬度为22°~23°之间的位置一直有连续不断的推文产生。产生该现象的原因是印度首都新德里和印度三大城市之一的加尔各答分布在此,二者均为人口密度聚集区,也是Twitter使用密度较高的区域。相比之下,同样是人口密集分布且推文分布多的尼泊尔首都加德满就没有出现类似推文连续分布的状况,这是由于加德满都受该次地震影响十分严重,短时间内该区域的人们更多地关注实际地震情况,而不是在社交媒体上发布数据。同时,从图中也能发现反应较快的推文都分布在震中附近。

为了更加直观地了解这些数据对该次地震反应出的空间格局,图4展示了推文对该地震事件的距离—时间反应模式,横轴表示推文发文地点与震中的距离,纵轴表示推文的反应时间,每个点代表相应的推文,可以发现,距震中约950 km的红线标志阈值区域,左边推文聚集,右边推文分散。阈值区域左右推文数据流的时空模式显然不同。小于该距离时(红线左侧),推文在空间和时间有很高的聚集性,而大于该距离时(红线右侧),只有零星的推文参考数据;且在距离达到阈值前,每个距离发布最快的推文的反应时间几乎随距离的增大而呈线性增长,这种变化趋势与地震影响强度随距离增大而变弱一致,距离超过阈值后,这一趋势结束,甚至发生相反情况。本文估计距震中950 km的阈值可能与受该次地震影响的区域范围有关,该范围将与美国地质调查局(USGS)数据进行对比。

图4 600 s推文二维时空反应格局图

3 Twitter探测灾害事件应急信息能力评估

本文利用从USGS网站获取的官方数据对Twitter数据的可靠性以及探测到的地震影响区域阈值进行评估。USGS不仅提供了专业的“地震速报图”,即重大地震灾害发生后提供震动烈度可视化分布图,而且提供了以众包方式收集的官方调查数据,用以修正地震烈度图,相当于来自世界各地的传感器数据。

图5展示了Twitter数据和官方数据对比情况。图5a展示了Twitter数据核密度分布状况以及探测到的影响范围阈值(蓝色圈),图5b展示了USGS网站上的官方数据。图5b中红色矩形区域内为官方数据提供的该次地震烈度可视化分布图,显示了4级以上的烈度分布范围(加德满都周围约400 km),正对应图5a矩形区域中Twitter数据分布最密集的地方。同时,图5b中官方调查数据的热点分布位置也正是Twitter热点分布位置(红色圆圈区域),二者均集中分布在人口密度较大的城市,如新德里、勒克瑙、加尔各答等;且图5a中的阈值范围,与图5b中的官方调查数据探测到的最低震级边缘较为吻合。

图5 Twitter 数据与官方数据可视化图

综上所述,在地震发生后,通过分析Twitter数据时空分布模式能够探测到地震时空应急信息,以提高对周遭环境的敏感性以及认识与应对灾害事件的能力。

4 结 语

社交媒体正迅速成为传播地理信息的新途径,灾害发生后,社交媒体能提供及时的信息来补充数据来源,以提高人们对环境的敏感性以及认识与应对灾害事件的能力。本文主要通过对从Twitter上采集的有关“4.25尼泊尔地震”的带有GPS信息的数据进行可视化和时空分析,探索了其中包含的时空应急信息;并利用官方数据评估了获取信息的质量。结果表明,能够从Twitter信息中提取时空应急信息,从而快速识别地震影响区域,提高人们的感知能力。今后需进一步关注社交媒体数据的质量,对数据的来源、质量和价值进行人工评估。

猜你喜欢
推文时空灾害
河南郑州“7·20”特大暴雨灾害的警示及应对
跨越时空的相遇
我省汛期常见气象灾害及防御
镜中的时空穿梭
推动灾害防治工作实现新跨越
特朗普上任至今发推文1.1万条
玩一次时空大“穿越”
特朗普推文哪条最招人烦
时空之门
《灾害来临怎么办?》