基于高传播影响力用户的舆情引导策略研究

2020-10-12 09:20王沁张扬夏玲玲袁明陈俊安范岩

现代计算机 2020年24期

王沁，张扬，夏玲玲，袁明，陈俊安，范岩

（江苏警官学院计算机信息与网络安全系，南京 210031）

0 引言

自媒体时代，随着网民数量的不断扩大以及网络等新兴媒体的蓬勃发展，越来越多的人习惯借助互联网通过微博、微信等社交媒体平台来关注热点事件、发表评论、进行价值评判。随之而来的由重大事件或突发事件引起的网络舆情也呈现出前所未有的复杂状况，例如2018 年“范冰冰偷逃税事件”、“高铁霸座”、“滴滴乘客遇害系列事件”，2019 年“重庆保时捷女车主李某怒扇男司机耳光”等事件都在网络上引起言论热潮，并随着事件不断发酵，各种无据言论铺天盖地，对社会秩序及网络环境产生极大影响。因此，及时掌握社会舆情动态，探索舆情产生特点和变化规律，识别出社交网络中具有高传播影响力的用户借以有效引导，针对性地提出相应导控策略，对于营造风清气正的网络空间，维护社会治安稳定，推动文明发展具有重要的理论意义和应用价值。

近几年，国内外学者在网络舆情方向展开了大量研究，刘建辉[1]分析了大数据时代网络舆情评估模型，提倡借鉴国外的模式，通过大量的案情、灾情将我国现阶段犯罪情况、自然灾害发生情况的“地图”描绘出来，提升日常舆情的治理水平，实现科学合理的预测犯罪、自然灾害高发地区。赵凯[2]构造了两类媒体作用下舆情传播的传染病模型，进而利用微分方程的稳定性理论对模型进行了动力学分析。随着网络舆情研究的逐渐深入，熊茵和赵振宇等人[3]根据网络舆情的传播特征揭示了“圈子”格局下的微信圈内舆情的“自组织调和”及圈群之间舆情压力逐级减少的传播规律，为研究自媒体环境下舆情传播特点提供新思路。突发事件网络舆情传播过程中，关键用户（影响力用户、意见领袖（Key Opinion Leader，KOL）或网络“大 V”等往往扮演着重要的角色，影响着事件的发展和舆论的走向，挖掘网络中影响力节点具有重要的现实意义。吕琳媛和任晓龙等人[4-5]对这方面工作做了较为详尽的综述，介绍了复杂网络领域具有代表性的多种重要节点挖掘方法，详细比较了各种方法的计算思路、应用场景和优缺点。这些算法中有几类比较主流，具有一定的代表性，包括基于结构中心性[6-8]、基于迭代优化中心性[9]等。其中基于结构中心性的方法具体又可以细分为两类：一是基于节点邻居的排序方法，如度中心性算法（社会网络分析中，“中心性”主要是指节点的重要性），Chen 等人[6]提出的基于半局部信息的节点重要性排序算法，Kitsak 等人[7]提出的 k-壳分解法（k-shell decomposition），Hirsch 提出的 H-指数算法[8]；二是基于路径的排序算法，如接近中心性、Katz 中心性、介数中心性等。在突发事件舆情应对方面，曾润喜[10]着重探索了网络舆情对群体性突发事件的影响与作用，谢耘耕等人[11]结合微博舆论的传播特点，探索出微博舆论的生成演变总体过程，并针对影响舆论演变的五大要素，提出了政府舆论引导的四点建议和对策。陈梦析[12]以天津港“8.12”瑞海公司危险品仓库特别重大火灾爆炸事故为例，研究了突发事件的网络舆情分析及应对。

当前诸多研究，大多聚焦对网络舆情传播的特点归纳、模型构建以及影响力用户的识别，对于网络舆情中权威部门及当事人这两大主体在舆情应对过程中的作用鲜少涉及。一方面因为舆情事件具有时效性，一旦消息源或原微博及其相应的用户评论被删除，就会导致舆情事件的真实数据难以被实时捕捉；另一方面网络舆情研究作为社会科学与自然科学交叉的新兴领域，涵盖了新闻学、传播学、社会学、管理学、系统科学、数学、计算机科学等多个学科，对科学工作者的跨学科研究能力提出了更高要求。事实上在网络舆情事件中，权威部门以及事件当事人吸引了大量粉丝和关注度，他们在社交媒体平台所隐藏的巨大影响力，在识别、处置网络舆情态势，引导舆论风潮等方面具有极大影响力。

本文通过分析“翟天临学术门事件”中微博舆论传播的基本模式、特征以及对比权威媒体与舆情当事人回应后的公众情绪倾向，探讨网络舆情导控的潜在规律以及该如何借助具有高传播影响力的社交用户对其进行更优化的管控与引导，改变以往舆情危机处置过程中采用的拒访、封堵、删除等“粗暴压制”方法，使舆情导控工作更加科学化和人性化，从而化解舆论危机，提高用户媒介素养，推进社会稳定和谐发展，更好地规范网络自媒体的运行[13]。

1 网络舆论危机事件多发的原因

1.1 客观方面

（1）责任部门工作职责不明确

相关责任部门在舆情导控层级工作体制上存在不足，在处置某突发舆情时，往往因危机定性困难而存在各部门相互推诿的现象。部分领导对网络舆情危机思想上不重视，对可能出现的危机后果估计不足，工作缺乏长远性，往往处于被动地位。

（2）执行部门工作方式不科学

执行部门缺乏正确处置危机的基本技巧以及应对媒体的基本常识和经验，面对危机总是采取“一捂、二堵、三拖、四拒绝、五控制”[14]的方式回避媒体，刚性堵截言论，试图垄断新闻源和话语权，但往往适得其反。现今自媒体时代，沉默等于默认，如对“打人保时捷女司机李某丈夫为某派出所所长”一言出现后迟迟得不到回应，后经调查证实，女司机李某的丈夫是渝北分局石船派出所所长。突发事件演变成舆论危机后，绝对的禁令性删帖行为会被网民视同心虚默认，只会引发更大的危机和群体性事件。

（3）工作人员处置经验不足

在舆情事件应对过程中，有些部门工作人员在尚未完全掌握舆情事件的“来龙去脉”的情况下，就急于发布消息、澄清事实，虽出发点正确，但措辞不当反而易导致事件恶化。此外，某些单位网络评论员素质不高，处置舆情危机的经验不足，不能直击重点，使得舆情引导效果不佳。

1.2 主观方面

（1）不良媒体不实报道

在当前媒体数量激增，行业竞争愈演愈烈的情况下，网络媒体往往以迅速报道社会突发事件和抢发爆炸性新闻来获取关注度作为竞争的第一标准。为追求自身经济利益的最大化，一些缺乏社会责任感的不良媒体和相关业务人员，会带着明显具有个人倾向色彩的态度进行报道，造成舆论的夸大与不实，导致舆论危机事件[15]频发。

（2）部分网民心态失衡

目前社会矛盾激剧，贫富差距极端化，现代竞争火热化，部分群众在面临生活和事业的挫折和压力之下，心态失衡，网络成为其发泄愤懑的主要场所。例如，2019 年3 月10 号的埃航客机坠毁事件中一名浙江女大学生不幸遇难，在媒体曝光后，一些“键盘侠”为了博取眼球，编撰出大量恶意的评论“攻击”女大学生，更有部分网友恶意评论臆想其系“炫耀”、“整容”，微博评论充斥着大量攻击谩骂言语，引发众怒。

同样，当名利双收的公众人物被爆料学术造假等社会不公现象时，极易引发网民的嫉妒不平心理，促使其肆意发表恶性言论，致使公众情绪负面化发展，舆论事件影响力迅速“放大”。2019 年2 月8 日翟天临在与粉丝的直播视频中回答网友：“知网是什么”，暴露其学历造假的可能性，一经传出即引发轩然大波。心存疑虑的网友开始对他的学术论文，个人履历进行细扒，事实证明造假属实。一时间，成千上万的网民发表了各种各样的看法，既有对他学霸人设的嘲讽，更有对北电院长导师潜规则的质疑，一时间引起轩然大波，影响十分恶劣。

2 互联网络舆情传播的基本特征

2.1 发展爆发性

社交媒体平台如微信、微博等在信息传播上提供了比报纸、广播、电视等传统大众传媒更为迅速、开放的信息发布渠道和意见表达机制[16]。当一条突发事件在微博上发布时，微博用户通过直接或间接的关注、评论、转发，使突发事件的相关信息迅速地在庞大的网络社交平台中以几何增长的速度传播，范围呈“水波纹”状层层往外扩散。

2.2 情绪感染性

微博舆论参与主体的情绪化和盲目性，往往带来较大的负面影响。当出现诱发事件时，网民的第一言论大多是出于感性的言论，即不理性思考事件的产生原因，只从自己的情感倾向出发表达的个人观点和意见。此外，“朋友圈”、动态空间、论坛贴吧等虚拟社交圈应用广泛，网络舆论传播迅猛，这也使得某种观点倾向在网络上快速传染。人们根据自己的兴趣、想法、价值观、社会关系、兴趣、经验等在社交媒体平台形成所谓的“关注”和“粉丝”，这实际上是在建立一个无形的“人际交往圈”[17]。网民通过建立这样的“圈子”，结识志同道合的好友，与他们在一起评论时事、分享观点、交流信息、互通有无，但这在一定程度上容易引起从众心理，造成“三人成虎”的效应，阻碍了许多网民独立思考时的理性判断。

2.3 内容复杂性[1188]

社交媒体平台内容多样、争议激烈，社会各界角色参与丰富，用户可以用匿名的方式自由发表言论观点。其中涉及的话题多元化，包括境内外政治局势、经济、社会、文化、娱乐等各方面，有些更是上述方面的综合反映。自媒体时代，普通民众由过去的信息被动接受者转变为互联网信息的创建者与传播者。社交媒体平台上的信息量激增，舆情事件一经传播之后，由于各方的见解、参与度不同，最直接的后果就是使舆情事件变得更加复杂，带来更多的争议，继而引发更大的危机事件。

3 舆情事件中权威媒体与涉事主体言论对比分析

近期网络舆情事件频频发生，本文以影响力较大的“翟天临学术门”事件为例，基于微博社交平台，使用爬虫技术对“翟天临致歉信”微博以及“人民日报转发教育部官方回应翟天临事件”的微博进行数据获取和对比统计分析，进而研究网络舆情事件的处置及应对方法。

3.1 数据获取和清洗

鉴于微博中的用户评论数据真实的反映了网民的观点和情绪倾向，本文利用网络爬虫技术手动获取“翟天临致歉信”微博相关数据。

（1）编写 URL 生成程序

第一步先分析“翟天临致歉信”微博存储数据的位置，即微博每个页面的网址，然后才能借此获取每页所存储的内容。以移动版微博为例，首先需要查看评论页的URL，但下滑刷新内容时发现URL 并无变化，这时考虑页面使用了AJAX 技术。通过Chrome 网络抓包可以过滤出xhr 包，逐包查看header 的URL 即可发现其中规律，将前几个包的URL 复制下来对比可以看出每页URL 基本格式：'https://m.weibo.cn/comments/hotflow?id=4339918362859308&mid=4339918362859308&max_id（）& max_id_ type=（）'。通过观察一个 URL 的括号处数值难以发现每个URL 之间的规律，这时可以使用Chrome 浏览器的工程模式分析header，在最下方的参数列表可以发现：每页URL 提供的max_id 与max_id_type 参数恰是下一页 URL 内 max_id 与max_id_type 的数值。这样可以编写循环函数生成每页的URL，并将其保存在数据库中便于调用。

（2）反爬机制[19]

爬虫程序虽然能够便捷地获取网页数据，但微博平台内存储有大量个人隐私数据，因而集成了强大的反爬机制，下面列出几种针对反爬机制的解决方案：

①登录验证码。验证码向来是网页防范风险的第一道关卡，微博网页版使用了随机数字字母验证，移动版微博曾经使用九宫格验证法，但最近微博将移动版验证码与网页版统一为最新的“极验”验证码，绕过该验证码有两种方法：模拟登录与Cookie 登录。使用模拟登录首先需要获取滑动验证码原图，这一步需要修改网页的CSS 代码，然后将原图与缺口图对比计算出缺口位置，接着模拟拖拽动作完成登录验证，此过程需要注意模拟拖拽必须加入变速算法，否则会被检测出机器登录导致登录失败。整个过程依赖于selenium，而该工具会降低程序运行效率，并且不便于与后续代码衔接。如果使用Cookie 登录微博，首先需要获取微博账号登录后网页的Cookie 值，然后将Cookie 值作为参数传递给爬虫程序内的request 函数，就可以跳过验证码验证步骤。

②网页繁忙。微博能够检测出在一个时间段内大量访问网页的用户，如果被认为是异常用户，网页将无法打开并提示网页繁忙，此时该用户的ID 或该主机的IP 就可能被封禁。为防止该事件的发生一种方法是降低爬取速率，但势必影响效率，另外可以使用IP 代理，通常IP 代理由专门的服务商提供，通过服务商提供的API 接口即可使用。Python 中提供的Proxy 包也可以用来实现代理IP 的更换。

（3）数据爬取[20]

解决反爬问题后便可以进行数据爬取，数据爬取主要由三部分构成：定位、获取、保存。定位即确定所需数据在网页中的位置，常用工具有beautifulsoup、正则表达式、xpath。获取过程即将定位到的数据提取到内存，这一过程主要涉及到编码解码的问题。保存可以使用多种方法，如Redis 数据库、csv 文件等。

（4）效率提升

由于需要获取的数据少则千条，多则上万条，提高爬虫效率至关重要，在爬取过程中，可以使用多线程的编写方式爬取，或者使用分布式爬虫同时爬取。但由于Python 内部机制问题，Python 的多线程并非真正意义上的多线程，仅仅是在CPU 空闲时再调用，因此效果不明显，应尽量使用多ID 多进程同时爬取。

3.2 评论数据统计分析

获取到翟天临致歉信微博相关数据后，以同样的方法获取人民日报转发教育部官方回应该事件的微博数据，进行对比统计分析。

图1“翟天临致歉信”微博用户评论数随时间的演化曲线

图1 为“翟天临致歉信”微博用户评论数随时间的演化曲线。从图1 的时间演化曲线可以看出，评论数最高峰产生于原微博发表后1 至2 小时内，随后持续下降，直至8 小时后趋于平缓。

图2“人民日报转发教育部官方回应翟天临事件”微博用户评论数随时间演化曲线

图2 为人民日报发布的教育部官方回应该事件微博相应的用户评论数随时间的演化曲线。图2 曲线表明人民日报转发教育部回应官方微博一经发表评论数迅速达到最高点，3 小时后趋于平缓，并在9 小时后再次到达小高峰。

图1 和图2 对比观察可以发现，“翟天临致歉信”和“人民日报转发教育部官方回应翟天临事件”微博用户评论数都呈现先增长后下降然后趋于平稳，继而又再次小幅增长，然后再下降趋于平稳的趋势。在“翟天临学术门”事件成为热点后，其相关微博的评论数随时间的推移最终都会趋于平稳，可能有两种原因：一种是对于不同主题的舆情事件，当对此类主题事件关心的网民数量达到饱和后，不关心此类主题舆情事件的网民不会因为该事件成为热点而选择关注；另一种是平时习惯对热点舆情事件进行转发和评论的网民数量达到饱和，无论事件如何发酵、影响力如何放大，没有转发、评论习惯的网民大部分仍不会选择公开发表言论。

通过对两图的比对分析，一个差异在于翟天临个人致歉信发表后，从舆论的产生、高潮、平息共经历近10 小时，而当人民日报转发教育部回应的官方言论发出后，仅3 小时民众的言论热潮就平息下来，鲜明的对比证明了此次事件中权威部门与官方媒体的影响力和说服力。

根据获取到的微博评论数据，通过jieba 对其进行分词，并统计每个词语的出现次数。

图3“翟天临致歉信”微博用户评论词频统计结果

图3 为“翟天临致歉信”微博用户评论词频统计结果，通过统计数据发现：前18 个高频词语中最高词频词语居然都为褒义，褒义词多于中性词和贬义词。可以看出回复该微博的用户中大多数以积极态度看待翟天临学术造假事件，由此猜想这些用户评论中不乏水军粉丝和“铁”粉的评论。

利用同样的方法可以获得“人民日报转发教育部官方回应翟天临事件”微博的词频统计结果。

图4“人民日报转发教育部官方回应翟天临事件”微博用户评论词频统计结果

图4 结果发现出现频次最高的反而是中性词，其次是贬义词。这与微博主体有着密切关系，可以肯定在官方微博下大多是围绕该学术门事件的批判性或分析性的评论，而在翟天临本人的微博内评论则比较多样化，褒义词居多，更加证实了水军和“铁”粉的存在。

4 舆情引导策略分析

根据上述统计分析结果，提出基于高传播影响力用户的舆情引导策略及具体工作步骤。

4.1 事件跟踪、数据处理

当某一突发事件在网络上引发大量舆论热潮时，首先应了解事件的真实情况。突发事件一般是重大的连续性事件或社会敏感事件，一时间不容易调查清楚前因后果，必须在第一时间做好事态发展的实时监控和数据收集工作[21]。因此，掌握事件真实情况，把握舆论主动权尤为重要。数据的分析主要依靠数据的变化规律，如随时间的演化情况等。经过分析可知微博评论数据在超过一定数量后便不再按时间顺序存储，同时如粉丝等数据超过规定数量后微博平台就不再公开，这加重了数据采集和分析的难度，若要达到即时预警、即时分析、全面收集的目的，必须以实时方式监控微博数据，做好数据实时采集和存储。

在“翟天临致歉信”微博中有些评论可能出自网络水军，这些数据的可信度无从谈起，因此数据分析中应尽量避免水军的影响。若想自主过滤水军，一个可行办法是通过分析博主多层粉丝数据来估计其为水军的可能性，但鉴于现在微博已将粉丝数据隐藏，一般用第三方服务自动过滤以减少工作量。

4.2 内容分析与研判

舆情导控内容直接决定着舆情导控的结果。分析既有数据，了解大众思想动态极为关键，通过分词系统可以清晰地反映出用户评论的总体倾向以决定导控内容。在翟天临事件中，以其“致歉信”微博为例，致歉信一出，马上就引发了公众对这一事件的二次转发评论热潮：有人表示知错就改，态度端正，希望他反思自省，重新来过，带给观众更多的优质作品；也有网友认为毫无诚意，不接受这种道歉。从某种程度上，个人回应并不能及时平息舆论事件，相反易引发二次危机，激发公众对该事件一探到底的欲望。而在该事件中，人民日报作为第三方权威媒体，转发权威部门——教育部对翟天临事件的官方回应，首先陈述近期校方等对此事采取的举措，其次以第三方的视角客观公平公正地对事件作出评价，其本身具有的影响力加之评论的说服力使众多网民信服。

此外，导控的时间同样重要，过早或过晚导控都可能严重影响效果，同样对“致歉信”微博评论时间进行分析，数据反映出在微博发布两小时内评论已达到高峰，随即快速下降，至15 日已经逐渐平息，把握这10小时的时间能够最大化优化导控效果。同时我们发现在评论数达到首次高峰后进行相应的回应能够正好顺应舆情自身演化规律，让之前评论、关注过该事件的网民能够及时了解事件真相，不会因突如其来的官方回应而去关注、深挖舆情事件。例如，“重庆保时捷女车主李某怒扇男司机耳光”事件，在网民对事件关注达到首次高峰点时，相关部门迟迟未给予及时回应，致使事件持续发酵。媒体和网友不断深挖，扒出保时捷女车主更多“猛料”。互联网上继而出现从“保时捷女车主怒扇男司机耳光”，到“保时捷女车主3 年共计29 条交通违法记录”，再到“保时捷女车主老公是所长”，再到“重庆公安彻查保时捷女车主交通违法和其丈夫相关情况，依纪依法调查处理”等一系列吸引公众眼球的标题，促使该事件被舆论推向法理的蒸笼。对于该事件的进一步发展，全国网友密切关注，舆论热潮居高不下，重庆市公安局特成立调查组对网络所反映的上述情况进行调查处理，并及时向社会公布以防止舆情进一步恶化。因此，在遇到类似涉及权威部门（如“翟天临学术门”事件涉及教育部门、“重庆保时捷女车主李某怒扇男司机耳光”事件涉及交巡警部门）的舆情事件时，应主动通过权威部门这样高影响力的用户来回应舆情危机事件，能够起到较好的舆情引导效果。

4.3 舆情引导——挖掘高传播影响力用户

在舆情事件应对过程中，除了采用政府部门等权威机构辅以新闻媒体官方回应方式来引导舆论，还可以充分发挥社交媒体平台中的高传播影响力用户的舆论影响力。例如微博中的高传播影响力用户往往具有隐秘性高，粉丝量大等特点[22]。以与翟天临学术门相关的某新闻微博为例，可以围绕该微博，利用网络爬虫爬取微博中如图5 所示为关键转发用户的转发路径图。

图5 关键用户转发路径图

图5 中明确标出了关键转发路径上的用户即为寻找的高传播影响力用户，这些用户的价值并非在于直接使其作为舆情导控的主体，而是通过二次引导挖掘其潜在价值。他们在网络虚拟社交平台中发挥着类似明星代言产品的引领作用。作为网络社交平台的活跃用户，他们在虚拟阵地上用富有煽动性的文章和言论表达个人的观点和意见。他们把自己放在与广大网民平等的地位上参与舆情讨论，更容易交流意见，并不会给其他用户一种刻意传播的感觉。用户自主选择浏览、关注和转发这些高传播影响力用户的言论文章，对于接受他们发表的观点的抵触心理大大减小。因此，可以通过将这些用户作为特殊目标对象重点关注，避免高传播影响力用户转变为谣言的制造者和传播者，引导其正面发声，从而实现微博用户群体内的谣言自净化功能。尽管这种方式并没有相应的机制保证其效果，但在舆情发展中后期可以作为有效辅助方式采纳。

5 结语

作为一把双刃剑，网络为公众自由发表言论提供了平台，但网络在舆情矛盾凸显期产生了较大的负面作用。本文结合“翟天临学术门”这一舆论热点事件，运用多ID 多进程爬虫程序，充分获取微博平台中与该事件相关的各类数据信息，并对网络舆情的几个基本问题进行了深入分析与探讨。在此基础上，通过对权威媒体与舆情当事人回应结果对比分析，得出权威部门等具有高传播影响力的用户发言在突发事件中更具说服力这一重要发现。此外，提出基于高传播影响力社交用户的舆情引导策略，以达到微博用户群体内的谣言自净化功能。该策略的提出一方面为大众网民的合理知情权给出了切实的视角，另一方面也为舆情恶化的突发事件处置提供了新方法，今后我们将在丰富的网络舆情现实中进一步验证、完善其有效性。

当前科学技术飞速发展，5G 时代即将来临，网络舆情的发展规模只会更加庞大，形态和形势更加多元复杂。针对这一社会现实，有关部门应高度重视在自媒体视角下建立网络舆情导控机制的工作，通过对具有高传播影响力的社交媒体合理科学的运用[23]，对公众舆论进行正面的引导，做好广大群众的沟通教育工作，更好推动建设社会主义和谐社会的伟大进程。