睿思战“疫”

2020-09-06 13:44吴新丽李云飞高金
中国传媒科技 2020年3期
关键词:数据可视化新冠肺炎媒体融合

吴新丽 李云飞 高金

摘  要:大数据的运用已由简单的数据积累过渡到深度开发利用数据的崭新阶段,随着新冠肺炎疫情的持续发酵,为打好这场保卫人民健康安全的防疫之战,新华网依托自身技术优势,快速推出“睿思战‘疫——大数据洞察新冠肺炎疫情动态”大数据服务和《抗击疫情·睿思这么看》系列报道,对疫情下的热点话题进行深度挖掘和数据可视化分析。从网民视角出发,用理性数据分析纾解网民情绪,引导网民正确看待疫情和疫情防控。

关键词:新华睿思;新冠肺炎;数据可视化;大数据;媒体融合

中图分类号:G237                                                                       文獻标识码:A

本文著录格式:吴新丽,李云飞,高金.睿思战“疫”——媒体大数据创新实践[J].中国传媒科技,2020,03(03):11-14.

当前,大数据和人工智能等前沿技术的创新和运用已成为推动媒体融合发展的重要引擎之一,大数据的运用已由简单的数据积累过渡到深度开发利用数据的崭新阶段。在新一轮媒体变革和技术革命中,新华网践行“数字中国”国家大数据战略,以技术为引领,主动出击,重点布局,将人工智能、大数据等新技术融入业务各环节中,积极探索数据驱动型媒体创新方向,着力自主研发并推广应用“新华睿思数据大数据产品矩阵”,助力新华网数字内容生态体系建设。

1.新华睿思大数据技术创新与应用

在DT时代,数据作为基础资源,是利用大数据、人工智能技术推动媒体融合发展的重要前提。新华网自2017年开始建设新华睿思数据资源池,资源池覆盖当前互联网上各类公开数据,累计存储数据量超过620亿条,正在以日均1亿条数据体量的速度增长。新华睿思数据资源池已成为新华网在数字内容生态发展建设工作中的重要数据矿产。

在技术深耕方面,重点发力数据挖掘分析领域,打造新一代睿思智能分析技术体系,潜心研究并实现多项人工智能算法引擎创新,包括信息分类预测、热点智能识别、情感极性预测、跨信源传播追溯、事件演化分析、网民情绪感知、中文热词提取等数款数据挖掘分析引擎,申请多项大数据和AI领域技术发明专利,让技术赋能内容生产全流程。

随着新冠肺炎疫情的持续发酵,为打好这场保卫人民健康安全的防疫之战,新华网大数据中心依托自身技术优势,快速推出“睿思战‘疫——大数据洞察新冠肺炎疫情动态”大数据服务和《抗击疫情·睿思这么看》系列报道,用大数据和人工智能技术助力疫情防控。

2.大数据在“疫情”背景下的创新应用——睿思战“疫”

“睿思战‘疫——大数据洞察新冠肺炎疫情动态”信息服务实时采集并呈现疫情相关信息,为社会公众提供多维度的大数据信息服务。睿思战“疫”信息服务包括五部分:

2.1全国疫情数据可视化分析服务

基于新华睿思独有的网民情绪感知分析模型、事件演化分析模型以及情感极性预测模型等文本挖掘分析模型,在智能汇聚互联网上全国疫情相关信息的基础上,从关注趋势变化、热议词云、网民情绪、热点话题等多角度、可视化呈现媒体和网民对全国疫情的关注情况。

全国疫情词云分析:在统计学习基础上,融合中心词特征权重、中心词位置关系、主题分布和搜索规则等多种加权计算策略,从海量新闻、微博、微信等最新疫情信息动态中智能提取最热关键词并以词云的方式呈现给用户。

网民情绪分析:采用TensorFlow的Keras深度学习框架,通过双向长短期记忆层、注意力机制等神经网络模型,从海量的互联网数据中学习网民情绪特征,从语义层面解析在全国抗疫过程中网民行为承载的真实情绪,以雷达图的形式直观呈现网民情绪的波动变化。

热点话题TOP3:采用Spark core+KMeans++大数据聚类技术,优化全局最优K值选择算法,降低算法局部最优概率,实现对新闻资讯、微信公众号文章以及长微博等长文本类疫情信息的智能热点挖掘,为用户推送疫情最热议题。

2.2基于信息自动分类算法的信息推荐服务

信息分类预测引擎基于浅层神经网络分类技术,创新融合大数据和多层Softmax& Huffman树的深度学习算法对长文本信息进行智能类别划分,结合公众关心的疫情多方面动态,提供权威发布、疫情速报、药物研发、防控科普等十大信息专栏,通过提供实时可靠的疫情信息,全方位帮助公众了解疫情发展动态和最新抗疫进展。

2.3基于地理位置信息的属地疫情动态服务

结合全国不同地区公众对疫情信息的个性化需求,根据用户所在地理位置,自动定位所在省份,分析该省份的疫情发展趋势和最新疫情动态,帮助用户从海量疫情资讯中快速获取属地疫情信息。

2.4区域风险查询服务

与联通大数据共同打造区域风险查询服务,支持全国各城市社区级疫情风险免费查询,为公众提供自身所在周边社区疫情风险级别查询以及所在区县疫情风险指数查询服务。

2.5城市动态查询服务

联通大数据联手打造城市动态查询服务,免费提供340余座城市的实时动态。通过城市返程率、出行强度、流动人口感知等信息服务,为城市管理部门应对防疫压力带来帮助,同时也为公众返程出行提供数据参考。

3.大数据赋能媒体内容生产——《抗击疫情·睿思这么看》

大数据新闻是基于大数据技术和思维发展而产生的全新报道模式。数据驱动新闻生产,代表了未来新闻发展的一种趋势,这种生产模式随着大数据技术的发展和成熟,以及与新媒体传播环境的融合,正在进入规模化生产时代。

新华网大数据中心从2019年开始尝试大数据可视化新闻生产,以新华睿思大数据平台为依托推出《睿思一刻》栏目,运行近一年成果斐然,展现了大数据在新闻领域的长线、全线优势。新冠肺炎疫情发生后,立足于国家重点新闻媒体的责任和使命,再次倾力打造《抗击疫情·睿思这么看》系列报道,对疫情下的热点话题进行深度挖掘和数据可视化分析。从网民视角出发,用理性数据分析纾解网民情绪,引导网民正确看待疫情和疫情防控。

系列报道在1月28日与读者见面,在新华网客户端首屏、PC端首页、微博、微信同步更新,截至3月9日已累计发布26期,系列报道单篇阅读量最高突破1000万次,在同类报道中遥遥领先,为新冠肺炎疫情报道添以“数据温情”。

3.1基于全网公开数据,展现真实的全民战“疫”,成为信息汪洋中网民信赖的“权威信源”

《抗击疫情·睿思这么看》系列报道基于客观数据采集和分析,将选题策划由经验驱动和情感驱动转变为数据驱动,在实现选题策划数据化、智能化的同时,也真正实现了贴近“民心”、反映“民声”。系列报道中“抗击疫情,网民在关注”版块,为读者呈现每日疫情相关的权威信息汇总。

此外,抗击疫情中,社交媒体异常活跃,致使各种未经证实的信息混杂网络,扰乱舆论场秩序,为疫情防控工作的开展造成了混乱和阻碍,公众也在信息汪洋中无所适从。《抗击疫情·睿思这么看》系列报道利用“网民关注度模型”,对公开网络数据进行多维度分析,将网民最关心、最迫切、最担忧的问题和国家联防联控形势相结合,提供丰富、客观的数据基础、事实真相和观点分析,在社会动员、凝聚共识、稳定大局、团结鼓劲方面发挥着重要作用,成为网民信赖的“权威信源”。

3.2重视用户体验,提供广度、速度和深度兼备的融合新闻服务

《抗击疫情·睿思这么看》系列报道重视用户体验和阅读习惯,在便捷性、使用感、互动感、阅读感、可视化、数据化等多个方面强化升级用户交互式体验。

从发布平台上,《抗击疫情·睿思这么看》系列报道在每天晚上9:00前后的手机阅读高峰时段在新华网客户端首屏发布,利用双技术平台(新闻资讯APP+大数据技术平台)优势,实现交互式体验“跳跃”升级。同时,作为新华网“新冠肺炎疫情”重点策划报道在新华网PC端、官方微博@新华网和官方微信同时段推送,全面提升信息送达率。

从报道形态上,大数据可视化新闻的报道形态更加灵活,以全时性数据为支撑、以动态图像设计为手段,呈现事件及话题的传播趋势、话题演变、网民情绪演化,新闻不仅在视觉效果中动起来,更在内容上动起来。

从报道深度上,大数据技术在选题策划、数据采集、数据挖掘、数据分析阶段实现全链的智能化新闻内容生产,大大提升了原创内容生产的效率,降低人力占有率,甚至完成了依靠人力无法实现的新闻初加工,全面推动了媒体生产效能的提升,為新闻服务兼具广度、速度和深度提供了可能性。同时,应对“新冠肺炎疫情”报道中不断涌现的话题和热点,大数据解读给读者呈现了全新的思维方式和方向。

3.3在政策解读和社会动员中,肩负起新闻媒体的社会责任,传播抗“疫”正能量

这是一场医疗战,更是一场信息战,亲赴一线的不只有广大医疗工作者,还有传递疫情声音的媒体工作者。疫情发展至今,主流媒体勇担使命,始终走在“抗疫防疫”第一线。《抗击疫情·睿思这么看》系列报道从不同角度,宣传党中央重大决策部署和各地有力措施,讲述防疫抗疫中的先进事迹和动人故事,作为重点新闻网站抗疫报道的一块砖石,迅速转入抗疫防疫报道“战时”状态,认真履行新闻媒体的社会责任。

系列报道以大数据技术创新助力全媒体生态和内容产业链,使主流媒体的声音更具时代特征:强信心、暖人心、聚民心,有特色、有亮点、有依据。这种新闻模型也迅速得到舆论回应,为抗疫宣传工作提供全面精准的“一手”信息反馈,这种数据服务、新闻报道与民生关切的“多向回应”是大数据优势的集中体现。

3.4自有数据库不断丰富,反哺联防联控、精准施策等领域研究

目前《抗击疫情·睿思这么看》系列报道中所积累的数据资源和研判语料,已经成为相关社会问题、经济问题研究的重要数据库,数据成果一方面推动技术平台针对性、精准度的发展,另一方面也为联防联控、精准施策提供了数据参考和成效校验。目前系列报道已正式推出“睿思数据观”栏目,对不断积累的数据资源进行进一步的挖掘和研判。

结语

疫情是个“自带流量”的话题。而当疫情遇到社交媒体高度活跃的2020,真假信息的威力都将被无限放大。从传播的角度,中国舆论场正在面临一场不亚于“新冠肺炎疫情”的“信息疫情”,但正是这场疫情,让我们看到了主流媒体价值和公信力的强势回归。以新华睿思为代表的主流媒体大数据平台将作为这场防疫抗疫战斗中的“弹药武器”,以技术手段和产业应用全面加持疫情防控和新闻宣传工作。疫情是对中国政府治理体系和治理能力现代化的一场大考,也是对主流媒体能否在其中履行自己新闻使命的一场大考。抗击疫情,媒体在行动,大数据在行动,新华睿思在行动。

[1]刘思扬.巩固内容创新优势 建设新型主流媒体[J].传媒,2020(2):13-14.

[2]彭兰.智媒趋势下内容生产中的人机关系[J].上海交通大学学报(哲学社会科学版),2020,28(1):31-40.

作者简介:吴新丽(1980-),女,河北人,新华网股份有限公司副总工程师兼大数据中心总经理,研究方向:互联网数据采集、自然语言处理及数据挖掘、舆情大数据、媒体大数据等领域大数据应用;李云飞(1988-),女,山西人,新华网股份有限公司大数据中心产品总监,研究方向:舆情大数据、媒体大数据等领域大数据应用;高金(1988-),女, 山东人,新华网股份有限公司大数据中心分析总监,研究方向:大数据分析、智库服务。

猜你喜欢
数据可视化新冠肺炎媒体融合
政府要做好公共价值的创造者和守护者
新冠肺炎疫情前期应急防控的“五情”大数据分析
科学与价值:新冠肺炎疫情背景下的风险决策机制及其优化
台陆委会正式改称“新冠肺炎”
大数据时代背景下本科教学质量动态监控系统的构建
可视化:新媒体语境下的数据、叙事与设计研究
我国数据新闻的发展困境与策略研究
基于R语言的大数据审计方法研究
地方广电媒体融合发展中的困境和出路
浅谈电视新闻的创新