突发事件信息协同超网络的构建方法研究

2023-11-01 03:48张鑫蕊张海涛栾宇张春龙
情报学报 2023年9期
关键词:突发事件协同主体

张鑫蕊,张海涛,2,3,栾宇,张春龙

(1. 吉林大学商学与管理学院,长春 130012;2. 吉林大学信息资源研究中心,长春 130012;3. 吉林大学国家发展与安全研究院,长春 130012)

0 引 言

当今世界正值百年未有之大变局,大数据、人工智能、云计算、5G、扩展现实、数字孪生、物联网等新一代数字技术的运用和集成创新在告知我们正处于人机协同、跨界融合、共融共创的数智时代。与此同时,始料未及的新冠肺炎疫情使得这个时代越发变幻莫测和充满挑战,这要求我们系统思考,洞察现状;主动求变,彰显价值;精益创新,敏捷改进;未雨绸缪,预见未来。时间、资源、公众信心是战胜疫情的关键,因此,如何通过科学决策提高应急管理效率、协调统筹应急管理工作、积极应对信息疫情[1]是目前亟须关注的问题。这不仅需要政府等相关专业部门采取紧急措施,更要发挥科技创新的关键和中坚作用,体现数智化治理的优势,以数智技术解析信息流动,从而推进全社会的协同防控。

《中华人民共和国突发事件应对法》中将突发事件定义为“突然发生,造成或可能造成严重社会危害,需要采取应急处置措施予以应对的自然灾害、事故灾害、公共卫生事件和社会安全事件”,其事发的突然性、危害的复杂性和治理的综合性等特点要求我们以全面且科学的视角去看待每个突发事件的发展脉络。2022年7月12日,世界卫生组织发布有关第12次新冠肺炎突发事件委员会会议的声明指出,新冠肺炎疫情继续构成“国际关注的突发公共卫生事件”[2],其本身所造成的信息封闭引发了国际范围内的“信息疫情”[3],且具备传播的快速性、信息的过载性、关注的大众性、涉略的广泛性、内容的动态性、空间的跨域性、媒体的社交性、污名的歧视性、真伪的难辨性以及效果的危害性等特征[4],对全球公共卫生、公共行动、社会凝聚力和整个政治格局都具有严重威胁[5],形成原因涉及宏观的社会和历史环境、中观的群体互动和微观的个体心理和个体特征[6]。数智时代新媒体环境下的信息传播打破时空界限、突破虚实融合,即时性、共享性等特征愈加显著,交互性、应用性和实践性较强的多主体协作网络[7]成为应对信息疫情的重要基础;信息是主体间协作沟通的枢纽,也正是主体间信息行为的协同交互促进了信息的高效传递,从而形成1+1>2的效应,即协同效应[8];信息流动的方式、效率、深度和广度均会影响协同效应的产生和发展。

目前信息传播相关研究主要基于SIR(suscepti‐ble, infective, recovered)、SEIR(susceptible, exposed,infective, recovered)、SIRS(susceptible, infective, re‐covered, susceptible)等传染病模型开展,在研究个体属性、个体的相关延伸要素以及局部的动态发展变化等角度存在局限性,一定程度上忽略了信息传播过程中人的行为占据主导地位[9]。与此同时,超网络研究通常结合工具计算分析网络上的流量、时间等变量来描述和表示层次网络间的作用关系与影响程度,相关实证分析主题涉及商界智库、知识服务、网络舆情、应急管理、学科交叉、科研合作、交通运输、经济管理等。例如,以新浪微博的商界智库信息作为数据源对比分析移动端与非移动端智库的信息传播网络结构特征异同[10],以超网络为基础的用户创新知识集成模型构建[11],微博舆情中关键节点的挖掘分析[12],突发事件信息传播中的网络谣言传播模型[13],突发事件救援中的区域应急调度模型[14],以异构网络提高学科交叉主题识别的准确度[15],以基于超图的算法SCRH(scientific collabo‐ration recommendation based on hypergraph)推荐科研合作[16],展示多层交通枢纽以研究潜在枢纽的连接贡献[17],有效区分初创能力水平以激励初创企业[18],基于超网络和在线评论的产品竞争力分析[19]等。可以看出,当前研究缺少面向社交媒体环境中的突发事件场景、契合突发事件特征、体现全局性的、以主体协同为基础的信息协同网络结构。因此,本研究以超网络视角探究社交媒体环境下突发事件信息协同全景,在信息主体协同合作基础上,以各子网之间的关联耦合形成以信息流动作为内在逻辑的系统性、紧密性、全面性、普适性的突发事件信息协同超网络,剖析协同过程的动态性和演化性,识别核心信息主体、关键信息链路,高效整合信息资源,掌握与分析事件现状与走向趋势,推进信息价值共创,由此提高社会凝聚力和公众信任度,增强突发事件应急处置的可操作性、科学性和实用性;应用情报智慧[20]协同突发事件决策,预防和应对信息疫情问题,从而实现常态化精准管控和科学治理,为应急管理工作数字化、智能化、智慧化献计献策。

1 突发事件信息协同超网络模型构建

(1)突发事件信息协同超网络

哲学视角下,宇宙中各事物之间以及事物内部各要素之间普遍联系且相互影响、相互制约和相互作用,突发事件的演变通常由各种要素相互耦合叠加交织而成,其背后往往遵循着一定的内在规律和运行机理[21];信息协同是所涉及信息主体在特定时间内,以信息技术为手段,通过与信息环境交互、共享信息资源,获得协同效应的过程[8];超网络作为高于而又超于现存网络的网络[22],具备以下一种或几种特征:多层性、多级性、多属性(或多准则)、流量的多维性、拥塞性、协调性、嵌套性等,能够将复杂网络中要素的相互作用和相互影响较为完整地描述和刻画出来,揭示同构网络的多重关系和异构网络的关联关系[23]。

社交媒体环境下,突发事件信息协同体现多元主体参与、信息流动性、协同效应等特征[8],是信息主体间根据自身信息需求主动展开信息交互行为的过程,在特定时间和环境下,主要涉及信息主体、信息文本、信息基因三个要素。信息主体是指在突发事件中公布和接收信息的用户主体,信息文本是信息主体在社交媒体中所发布的文本内容,信息基因是从信息主体所发布文本内容中提炼出的关键词语。与常规的同质网络相比,超网络能够恰当融合多种类型网络,体现两种及两种以上类型网络之间的复杂性,能够更好地反映突发事件信息协同中信息主体间协同关系,信息间联动关系,主体与信息文本之间、信息文本与信息基因之间的匹配关联等;在研究个体属性和掌控局部动态变化的同时,避免了因研究单一网络而忽略相关联的其他子网所涉及的关键因素,填补了超网络理论和信息协同相结合在突发事件场景中的应用空白,为目前突发事件的用户行为、态势感知[24]、情感图谱[25]、情绪演化[26]、风险预测、协同机制[27]、协同决策[28]、应急能力评价等复杂问题的后续研究提供新的思维模式。

综上,本研究以要素-关系-逻辑为基础框架,依据知识协同主题与超网络理论的有机融合[29],阐述突发事件信息协同超网络的构建方法,从“点、线、面、体”全方位剖析,认为社交媒体环境下,突发事件场景中的信息协同超网络主要是由信息主体、信息文本、信息基因三要素关联耦合的多层级网络结构,信息主体与信息文本、信息主体与信息基因、信息文本与信息基因之间均存在复杂的对应关系,正是这种纵向层级关系将三种网络有序衔接,形成了主体、文本、基因间协同关联的系统整体,由此探究子网间更深层次、应用型的问题,形成1+1>2的协同效应。

(2)突发事件信息协同超网络概念模型

社交媒体环境下,突发事件的信息协同超网络模型主要包括主体协同网络、信息文本网络、信息基因网络三类子网络,以及这三类子网络互相之间的映射关系,涉及节点、边、权重三项要素,以EICSN(information collaboration super network mod‐el for emergency)表示。定义社交媒体环境下突发事件信息协同超网络模型为

其中,P={S,T,G}为超网络的节点集合,S={s1,s2,…,sn}为社交媒体平台中事件所涉及的信息主体集合,T={t1,t2,…,tn}为信息文本集合,G={g1,g2,…,gn}为信息基因集合;E为超网络的边的集合,由所有子网络边的集合和所有子网络之间的映射关系集合构成,分别是主体协同子网络的边Es-s、信息文本子网络的边Et-t、信息基因子网络的边Eg-g,以及主体协同子网络与信息文本子网络之间的映射ES-T、信息文本子网络与信息基因子网络之间的映射ET-G、主体协同子网络与信息基因子网络之间的映射ES-G,即

W为超网络权重的集合,一方面,包括各个子网络边权重的集合,即主体协同网络边的权重为W(ES-S),信息文本网络边的权重为W(ET-T),信息基因网络边的权重为W(EG-G);另一方面,包括信息主体节点的权重W(S),信息文本的权重W(T),信息基因的权重W(G);即

综上所述,社交媒体环境下突发事件信息协同超网络模型为

如图1所示,上述概念模型可以清晰表达基于主体之间的协同交互作用的信息协同过程。通过信息主体与信息文本之间的连接,对应信息主体与文本观点;通过主体协同子网与信息基因子网的连接体现信息主体对信息基因的贡献度,以主体所涉及基因个数识别核心主体;通过信息文本子网与信息基因子网络的连接,定位信息基因的归属文本。

图1 社交媒体环境下突发事件信息协同超网络概念模型

2 突发事件信息协同子网络及关系构建

2.1 子网络建模

2.1.1 主体协同网络建模

主体协同网络主要研究社交媒体环境下多元信息主体之间协同关系演变的网络,以各个信息主体作为节点,以信息主体之间的关联关系作为边,建立主体协同网络。该子网络能够研究主体之间的协同关系和个体属性特征,如核心主体的特征分析、群体聚类分析等。主体协同网络模型表示为

其中,有限集合S={s1,s2,…,sn}是主体协同网络中的节点集合,对所涉及的信息主体根据社交媒体平台中的认证信息进行分类,信息主体的筛选是以信息的发布、主体间的协同关联为准,以是否保留有发布帖子、转发帖子等行为作为依据。

信息主体节点的权重集合为

其中,W(S)={ws1,ws2,…,wsn}表示信息主体节点权重集合,是指该话题下信息主体的核心程度,以信息主体所涉及的信息基因数量为标准。

主体协同网络中边的集合为

其中,若θ(si,sj)=0,则两个信息主体之间不存在协同关系;若θ(si,sj)=1,则两个信息主体之间存在协同关系,例如,二者在同一话题下有信息发布行为,包括评论、转发行为等。

主体协同网络中边的权重为

式(8)表示信息主体间的协同程度,例如,信息主体在同一话题下均有信息发布行为则界定为一次协同,主体之间有转发行为等也界定为一次协同。

2.1.2 信息文本网络建模

信息文本是信息主体在社交媒体中所发布的文本内容,该文本内容与信息主体之间存在对应关系,由于文本内容存在相同情况以及信息主体发布多条文本的情况,可能存在一对一、一对多、多对一等关系;同时,信息基因是基于信息文本做进一步处理提取得到的,由于存在信息基因相同的情况,信息文本和信息基因之间的匹配关系同样可能存在一对一、一对多,多对一等关系。综上,信息文本在信息主体和信息基因之间体现承上启下的关键作用。现有研究主要是对各个信息文本之间的相似度进行比较分析,该项工作对解释信息主体之间的协同演化过程助力不足,且所涉及工作复杂烦琐,因此,信息协同超网络的研究焦点不应仅限于信息文本内容,而是应以信息文本为作为桥梁重点研究信息文本这一层网络与主体协同网络、信息基因网络相互衔接的纵向关系,体现层次分明的关联关系。与此同时,该子网络还可以分析文本之间的协同关系及其延伸要素,如信息文本的聚类分析、主题提取及其情感倾向性分析等。

将信息主体发布的文本内容定义为信息文本T,则信息文本网络模型表示为

其中,有限集合T={t1,t2,…,tn}是信息文本网络中的节点,对所涉及的信息文本根据社交媒体平台中的原创帖和转发帖进行分类,信息文本的筛选以信息文本间的转发行为作为依据。

信息文本节点的权重集合为

其中,W(T)={wt1,wt2,…,wtn}表示信息文本节点权重,是指该话题下信息文本的核心程度,以点赞数、评论数和转发数的均值计算信息文本的得分。

信息文本网络中边的集合为

其中,若θ(ti,tj)=0,则两个信息文本之间不存在协同关系;若θ(ti,tj)=1,则两个信息文本之间存在协同关系,如存在帖子之间的转发行为。信息主体发布帖子,其他信息主体参与转发,产生新的信息,体现了主体协同基础上的信息协同。

信息文本网络中边的权重为

式(12)表示信息文本间的协同程度,例如,若信息文本之间有转发关系,则界定为一次协同。

2.1.3 信息基因网络建模

信息基因是从信息主体所发布的信息文本内容中所提炼出的关键性词语,包括时间、地点、人物、话题等方面的诠释。通过对信息基因的提取和凝练,可以分析得出该话题下信息主体讨论的聚焦点及话题内容的演变方向,如以时间为变量生成演化脉络来研究事件发展趋势等。这一子网络的节点由从信息文本中提取凝练并筛选得到的有效关键词组成,由于事件发生的突发性和影响力,该子网关键词语适合以出现频次和重要性程度等作为筛选条件,并以有效关键词之间的共现关系作为边,由此建立信息基因网络模型,并定义为

信息基因来源于信息文本分词集合,以G'来表示信息基因的初始集合,η(gi,tj)=1表示gi是tj的信息基因,否则,η(gi,tj)=0。信息基因出现的频次以f(gi)表示,其计算公式为

首先,根据信息基因出现频次的具体排序f(gi)对初始集合G'进行筛选,目的是将出现频率低的词语,以及出现频率较高但其信息含义较低的词语筛选去除。可得到信息基因节点的集合G,即

其中,节点集合G={g1,g2,…,gn}是指信息基因子网络中不同基因节点的集合;信息基因节点的初步筛选条件以阈值f0表示,该阈值的设定主要依据所获取数据的实际规模。

信息基因节点的权重集合为

其中,节点权重W(G)={wg1,wg2,…,wgn}是指该话题下信息基因的重要性程度,通过信息基因的出现频次f(gi)决定。

信息基因网络中边的集合为

边表示不同信息基因之间的共现关系,代表主体在信息发布中产生的信息协同情况。w(gi,gj)表示信息基因间的共现频次;w0是共现频次的阈值,当w0>2时,表示两种不同的信息基因之间存在相连的边,能够体现关联关系的强弱。

信息基因网络中边的权重为

式(18)代表信息基因间关联程度,由信息基因间共现频次w(gi,gj)决定,以边的粗细程度表示。

2.2 子网络间映射关系

2.2.1 主体协同网络与信息文本网络

主体协同网络与信息文本网络的映射关系,表示信息主体之间在社交媒体平台中协同交互基础上的信息发布和传播。根据上文子网络节点的相关表示,将信息主体与信息文本之间的映射关系集合定义为

其中,α(si,tj)=1表示信息主体si发布了信息文本tj,一般情况下,信息主体与信息文本之间可能是一对一、一对多和多对一的关系,而主体数量和文本数量之间不存在直接的比较关系。

定义信息主体到信息文本之间的映射为

式(20)表示信息主体si发布的信息文本t,数量为1,2…,n。

2.2.2 信息文本网络与信息基因网络

由于信息基因产生于信息文本中,二者之间存在包含、对应关系,信息文本的核心思想可由多个信息基因组合表达。通过信息文本子网和信息基因子网的进一步关联,可以体现出不同信息文本的基因组成,而不同信息文本可能体现相同的核心思想,同一信息基因可能出现在不同的信息文本中,体现信息基因的延续性。因此,将信息文本子网与信息基因子网之间的映射关系集合表达为

其中,β(ti,gj)=1,是指在信息文本ti中,分析提炼得到信息基因gj。

体现映射关系的边的权重为

式(22)是指在信息文本ti网络中信息基因gj出现的频次。

信息文本与信息基因之间的映射关系,可以用两种方式进行表示。其一是同一信息文本中所包含的信息基因,即

其二是某一信息基因包含在哪些信息文本中,即

2.2.3 主体协同网络与信息基因网络

信息主体是信息文本的发布主体,信息基因是信息文本中关键词语的体现。通过信息文本这一桥梁,可以将信息主体与信息基因之间的映射关系集合表示为

其中,当γ(si,gj)=1时,表示信息主体si发布的帖子中含有信息基因gj,即信息主体发布的信息文本中包含有信息基因gj。

关系权重定义为

式(26)表示在主体协同网络中,某信息主体对信息基因gj的贡献度。

信息主体与信息基因之间的映射关系可以采用两种方式进行表示。其一是某一信息主体si发布信息文本的过程中,主观进行信息组织,表达个人观点,其中包含的信息基因数量为

其二是若某一信息基因gj存在于多个信息文本中,则其对应的信息主体数量为

3 实证分析

3.1 分析逻辑

EICSN模型需要结合实际案例来展示模型的可视化效果并进行结果分析,整个实证分析过程分为以下五个步骤,具体逻辑如图2所示。

图2 实证分析逻辑

Step1.数据采集,数据内容包括文本内容、作者信息、发表时间、分类信息,以及信息的点赞、评论、转发数量等。

Step2.对数据进行整理清洗,筛选可用数据,去除无效文本,根据数据规模设定基础阈值。

Step3.数据编码与提取:对信息主体、信息文本及信息基因集合统一编码,建立信息主体集合S和信息文本集合T,进而对信息文本进行分词筛选,提取关键词,建立信息基因集合G。

Step4.子网络构建:基于信息主体间协同关系建立主体协同子网络NS,基于信息文本间信息关联关系建立信息文本子网络NT,基于信息基因间的协同共现关系建立信息基因子网络NG。

Step5.超网络构建:根据子网络间映射关系,建立社交媒体环境下突发事件信息协同超网络,并根据数据结果和可视化图谱做进一步分析,如核心主体、核心文本和核心基因的识别。

3.2 数据来源

数据来源为社交媒体微博平台,以吉林农业科技学院新冠肺炎疫情这一突发公共卫生事件为例,采集时间为2022年6月22日。由于事件的突发性和话题讨论的时间聚集性,以“吉林农业科技学院”作为话题关键词进行采集,所采集的信息文本发布的起始时间为2022年2月24日,终止时间为2022年4月23日,共计5515条。信息文本在实际数据处理过程中需进行筛选和清洗,去除不相关文本,经过筛选最终得到5264条数据,全程使用Python和Excel进行数据处理和关系构建,使用Gephi绘制图谱。

3.3 结果分析

3.3.1 超网络图谱

根据数据处理结果构建超网络图谱,如图3所示,包括信息主体节点、信息文本节点、信息基因节点,节点面积大小表示节点权重大小,边的粗细程度表示不同节点间关系强度,即边的权重。

图3 超网络图谱

为使呈现效果清晰化,对基础数据做进一步处理后,构建部分超网络图谱,如图4所示。图谱中三类节点在以着色程度进行区分的基础上,信息主体节点由编码s表示,信息文本节点由t表示,信息基因以中文文本形式表示。

图4 部分超网络图谱

3.3.2 主体-基因关联分析

信息协同超网络的构建过程中,以信息文本作为桥梁进行信息主体和信息基因之间的互联,由此得到信息主体-信息基因图谱,如图5所示。其中,编码s表示主体节点,中文文本表示基因节点,节点面积大小表示节点权重大小,边的粗细程度表示不同节点间关系强度,即边的权重。可以清晰地观测到信息主体与信息基因之间的边,即映射关系;单个主体节点可连接多个基因,单个基因节点也可以连接多个主体节点,根据二者之间的关联关系可进一步做突发事件信息协同过程中核心主体节点的识别。

图5 信息主体-信息基因图谱(部分)

3.3.3 核心信息主体识别

信息协同是事件话题下所有多元信息主体共同参与的过程,但少数核心信息主体具有较高的信息基因贡献度,在发布信息的过程中起到引领事件话题方向的作用;综合考量数据结果的精确度,选择通过对信息基因的进一步筛选来识别核心信息主体[30],以核心信息主体所涉及的信息基因个数为权重,以主体间协同关系为边,兼顾数据规模和图谱效果,仅呈现部分结果。其中节点的不同着色程度表示信息主体的认证信息,包括官方认证、个人认证、达人认证以及无认证信息。所得核心信息主体图谱(部分)如图6所示,核心信息主体列表(部分)如表1所示。分析图谱和列表的结果可以发现,此次突发事件信息协同过程中,两个官方认证的信息主体占据主导地位,个别个人认证和个别无认证信息的信息主体均可在突发事件信息协同过程中发挥作用,二者间作用区别并不显著。

表1 核心信息主体列表(部分)

图6 核心信息主体图谱(部分)

3.3.4 核心信息文本识别

信息文本网络作为信息主体和信息基因互联的纽带,在整个信息协同网络的作用举足轻重,而且信息文本内容丰富,除了本研究的关键词提取,还可以提取文本主题,分析情感倾向性,进而构建主体的情感图谱,对突发事件的舆情动态演化分析和风险预测等研究工作均有积极推进作用。因此,识别核心文本是整个结果分析中必不可少的环节,文本节点的面积体现了节点权重,以文本间的协同关系为边,兼顾数据规模和图谱效果,仅呈现部分结果。其中,节点的不同着色程度表示信息文本的分类信息,分为原创帖和转发帖,所得核心信息文本图谱(部分)如图7所示,核心信息文本列表(部分)如表2所示,根据图谱和列表结果分析得到,不仅原创帖的核心程度排名靠前,转发帖的核心程度也较强,其还可引起二次转发行为。

表2 核心信息文本列表(部分)

图7 核心信息文本图谱(部分)

3.3.5 核心信息基因识别

通过对核心信息基因的识别,可以分析得出该话题下多元信息主体高度聚焦的关键点。以关键词的出现频次为节点权重,权重的大小表现为节点面积的大小;以基因间的共现关系为边,设置共现频次阈值大于等于100,边的粗细程度表示共现程度;节点着色程度与出现频次一一对应,由此呈现的核心信息基因图谱如图8所示,核心信息基因表格列表(部分)如表3所示。

表3 核心信息基因列表(部分)

图8 核心信息基因图谱(部分)

4 结 论

突发事件的应急决策管理需兼顾时间的紧迫性和结论的精确性,与此同时,事件的突发性、危害性、广泛性,以及海量信息的依附性、时效性、传递性、共享性也给决策者带来巨大的挑战。因此,立足于数智时代,情报学研究者需要与时俱进,充分利用新一代信息技术,彰显信息的协同价值,服务于情报决策工作,提升协同治理效率。然而现有研究主要从单一层面解读突发事件信息协同中的研究问题,仅停留在“点、线、面”的阶段,并未将其看作要素-关系-逻辑三位一体的系统整体。

本研究以超网络视角深入探究突发事件中基于主体协同的信息协同过程,以主体间协同关系形成主体协同网络,以文本之间的协同演化形成信息文本网络,以关键词之间的共现关系形成信息基因网络,挖掘三类网络之间层次分明的纵向动态映射关系,明晰多要素之间相互影响、相互作用而产生的逻辑关联,进一步解析信息协同的内在规律,构建突发事件信息协同超网络模型,并以实际案例进行可视化分析验证,实现了对信息主体及其发布信息文本的深入认识,识别有协同价值的核心信息基因,进而挖掘核心主体,剖析多元主体间信息协同的动态演化过程,最终构建了深层次、全景性、贯通型的信息协同网络关系,为突发事件的应急情报决策工作提供了一种网络构建方法,从而能够更加全面、系统地解读突发事件的演变动因及机理。后续研究将重点围绕各子网络及其关联关系体现超网络的应用价值,探索和验证信息协同超网络的普适性和应用性,全面研究各层级网络及整体网络所表现的动力学机制,进一步构建以多元主体为中心,涉及多要素的需求-数据-创新-目标四位一体共同驱动的信息协同治理体系。

猜你喜欢
突发事件协同主体
论自然人破产法的适用主体
蜀道难:车与路的协同进化
“四化”协同才有出路
三医联动 协同创新
突发事件的舆论引导
关于遗产保护主体的思考
清朝三起突发事件的处置
论多元主体的生成
突发事件
协同进化