数据新闻的困境和发展路径探索

2017-01-03 23:14唐小涛
新闻前哨 2016年12期
关键词:数据新闻困境可视化

唐小涛

[摘要]数据新闻的出现改变了传统新闻生产模式,但随着理论与实践的进一步深入,也遇到了关于数据来源、数据可视化等方面的发展困境。本文将以网易、搜狐、荆楚网等门户网站数据新闻为例,探究用户视野下数据新闻的发展困境和可行性路径。

[关键词]数据新闻 可视化 困境 路径

一、数据新闻的发展现状

互联网和新型传播技术的加速发展,改变了传统的新闻模式,以PC端或手机为代表的移动用户成为了新闻新的用户群体。他们对新闻时间性要求更高、更倾向于个性化定制、对内容深度追求更高、更加倾向参与体验、愿为便捷可用付费等,这些新需求推动着新闻转型升级。数据新闻作为伴随技术和需求诞生的新闻生产模式,成为业界和学界追逐的焦点。

我国数据新闻的发展现状基于业界的实践和学界的研究两个方面。从业界的实践来看。四大门户网站起步最早,搜狐、新浪、网易、腾讯分别于2011年前后开设了“数字之道”、“图解天下”、“数读”、“数据控”等栏目,均以静态化图表进行数据呈现。近年来,新京报、南方都市报、人民网、新华网和荆楚网先后开辟了数据新闻的栏目或者专题。前两者以纸媒为载体,频率较慢,数据含金量更高;人民网和新华网主要聚焦时政和社会热点,更侧重于图说或图解新闻;荆楚网数据新闻以主题宣传为主,偏向于解读数据背后的故事,从内容上更贴近于数据新闻的定义。整体上看,到2013年学界对数据新闻的研究才逐渐重视起来。根据知网搜索结果显示,我国数据新闻的研究主题大致侧重于数据新闻对传统新闻的积极作用、数据新闻的基本理念介绍、数据新闻的实际运用等方面,真正对于数据新闻的理论研究比较少,对于未来数据新闻的发展缺少指导性的建议。

二、数据新闻的发展困境

数据新闻,是指基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式,是数据技术对新闻业全面渗透的必然结果,它的出现在一定程度上改变了传统新闻生产流程,但随着发展得进一步深入,也存在一定的困境。

1.数据新闻与数据来源的“智障化”。

据统计,首届数据新闻奖的所有作品中耗时最短的都需要 8 小时。之所以要花费这么长的时间,主要是因为数据搜集得方式存在一定的局限。一方面,由于网站数据库建设不完善,数据收集很大程度上依靠数据新闻记者人工完成,而数据本身零散,搜集起来人工花费的时间和精力比较长。网易数读2015年5月27日发布“美军如何营救失踪士兵:一个都不放弃”数据新闻,主要列举了2009年6月30日、2009年7月1日等11天的救援情况,姑且不论这些数据是否完善,其整理的过程就足够繁琐。类似的数据新闻比比皆是,也是数据新闻当前的一个特征。另一方面,数据对外开放程度低,也让获取信息更加困难。受制于新闻管控,加之信息公开法律并未完善,新闻媒体能够获取信息的渠道并不多。有些数据涉及到行业机密、用户信息等方面的内容,很多行业不愿意对外公开自己建立的数据库,十分重视对数据的保护,这一定程度上形成了对数据的垄断。再加上一些行业为了获取商业利益,将搜集得到的数据以商品的形式在网上进行售卖,但是价格相对来说比较昂贵,数据的透明度并不高。如果媒体没有办法从政府的数据库获取想要的数据,也没有办法从服务商、科研单位获取数据资源,就很难完成数据的新闻的加工和处理。渠道的受限使得数据分析缺乏资料,数据新闻也就无从生产。

2.数据新闻与用户认知的“数字鸿沟”。

所谓用户认知的“数字鸿沟”,就是用户在接受数据的过程中认知能力和解读能力有所差异,而这种差异伴随着数据新闻的发展越来越大,并对现实中人们的社会地位和经济地位产生一定的影响。它具体表现在解读数据、利用数据、删除数据三个方面。不同的用户由于文化背景和实际能力的差异对同一篇数据新闻的解读能力是有差异的。文化素养高分析能力强的用户对数据新闻呈现的专业图表的解读会更加准确和深入,而文化水平相对较低分析能力较差的用户会对数据新闻产生一种距离感。如网易“数读”惯用的堆积式南丁格尔玫瑰图呈现新闻内容,许多用户就叫苦不迭,表示解读有障碍。此外,数据新闻的终极价值无非在于展现数据新闻的“可用”之上,呈现的图表和文字为用户提供一定的信息,用户在阅读数据新闻的同时也对数据新闻中数据的挖掘和使用,具有敏锐分析与判断能力的用户,能够较好地结合实际从数据新闻中提取所需得信息,为自己所用;而缺乏这种能力的用户就仅限于阅读浏览数据新闻的浅层次信息,无法更好地利用。碎片化的时代中,海量信息表现出冗杂、重复、赘余等特点,数据新闻亦是如此。选择哪一组数据新闻进行阅读,也就同时意味着放弃了另外一些数据新闻所提供的信息,这代表着用户需要在海量数据新闻中做出一定地选择,在有限的时间内准确获取自己所需要的信息,也是删除过滤掉一部分不需要的信息,而这种删除能力也并非任何用户都具备。

3.数据新闻与用户接口的“数字孤岛”。

“数字孤岛”指的是不同类型的数据信息系统,由于彼此间相对孤立封闭,难以互通互联,以至于无法进行数据信息系统间的沟通交流,形成一个个孤立的岛屿。数据新闻与用户接口的“数字孤岛”是大数据时代信息发展推进过程中逐渐产生的一种必然现象,而这种现象已经逐渐成为一块阻碍新闻与用户间顺畅交流的“绊脚石”,导致了数据信息资源的浪费和信息资料的闭塞。这主要表现在数据新闻与用户接口之间衔接上的阻滞。

从现如今的技术上来讲,数据新闻和用户客户端有效关联存在一定的困难,难以实现数据信息交流。数据新闻投放的地点更多集中于新媒体,除了视频动画,社交媒体软件成为数据新闻的必争之地。媒介融合背景下,纸媒与新媒体融合,部分纸媒下设数据新闻部,推出专门的数据新闻微信订阅号供用户订购阅读,但是仍然出现宣传不到位、用户关注度低、点击量浏览量不高的现象。数据新闻信息不能更好的到达用户,难以形成有效地数据交换,无益于数据新闻质量的提升。因此,消除数据新闻与用户接口的“数字孤岛”迫在眉睫,如何从数据新闻技术路径、运作模式、制度方法上采取综合措施,最大限度地利用起数据新闻现有资源与用户进行有效对接是现如今值得思虑的问题。

4.数据新闻与事实真相的“辛普森悖论”。

“辛普森悖论”指的是在人们尝试探究两种变量是否具有相关性的研究时,理论认为在分组比较中都占优势的一方,会在总评中反而是失势的一方。大数据时代,媒体热衷于新闻的数据化呈现,认为数据能够全面完整详实地反应报道的内容,而认为事实真相的说服力远不如数据,数据能够代替事实并可以超越事实真相,因此,比之事实真相,人们更相信数据呈现的结果。然而实际证明,没有事实真相依托的数据空洞无物。孤立的数据缺少信息关联度易给用户造成误导和困扰。揭示数据集之间复杂的关系,发现事件的本质,离不开事实真相。譬如网上热传的“机械某班一半女生嫁给了男老师”,按比例来看确实足够震撼受众,但考虑到该班的女生数量,就会发现“文不对题”。

为了避免数据新闻中“辛普森悖论”的出现,就需要斟酌数据行文中个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时还需了解该情境是否存在其他潜在要因而综合考虑,兼顾新闻直觉性和经验型的综合运用。

三、数据新闻的发展路径探究

1.生产过程智能化。

数据新闻的生产之所以耗时长、人力花费大,主要是因为数据来源、处理不够智能。这就要求数据行为团队既要做好专业团队建设,又要争取多方合作,力争获取更加丰富的数据样本。数据新闻要想获得智能化的发展,必须增加机器参与程度等智能化工具,简化搜集、制作流程,节省时间、精力,提高效率;开放的数据来源渠道,是智能化发展的必然趋势,也能够更大限度提高数据的真实性和准确度,让新闻更加真实可信。

2.新闻内容易受化。

数据新闻的本质是新闻,用户需求是从新闻中获取自己想要的信息。数据新闻想要获得长久发展,就必须使自己生产的新闻内容为受众喜欢和接受。而在大众文化占主导地位的今天,数据新闻的主要受众则是普通的受众。所以数据新闻不仅在信息呈现的方式更加新颖简单,信息量大的前提下,还要符合普通大众的接受和理解能力,新闻内容应该更加易于理解。

(1)新闻故事化。

传统的新闻生产,主要是通过单纯地使用文字和图片进行叙述,整个新闻的可读性并不强;而单纯地数据更是十分枯燥,难以引起受众兴趣。将数据与新闻结合起来,挖掘数据背后的新闻故事,通过可视化的叙事方式呈现出来,增强了可信度、趣味性,叙事性、可读性进一步增强。数据新闻通过图片、动漫等可视化创作,使受众在阅读故事的过程中接受信息,表现形式更加新颖,传递效果更加明显,使新闻的温度不断提升,新闻中也融入人情味,让数据和新闻兼具可读性和生命力。

(2)语句通俗化。

数据新闻的主要受众是普通大众,“看得懂”是最基本的要求,所以语言表达必须接近受众的信息接受能力。例如荆楚网2016年10月9日湖北省“十一黄金周”旅游情况做了题为“湖北黄金周旅游总收入年增31.75亿元 游客7年增3.5倍”,主要分为“游客增长倍数”“收入增长倍数”“人均消费数值”一张图几个板块层层深入进行分析,不仅有数字分析还有图片表现,另外还有文字讲解,进而使整个文本表现的观念通俗易懂,受众从这种表现形式上获得了有用信息。

(3)话题草根化。

社会热点、网络焦点、民生重点等这些草根化、接地气的话题,更加容易吸引受众。这就要求数据新闻需要把抽象、枯燥的数字进行再加工,通过图片、图表、漫画等方式表现出来,不仅在视觉上清晰易懂,内容表达上形象生动,而且在文字表达上尽显草根元素,从整体上加深受众对新闻的理解和接受度。荆楚网2015年4月25日解读了省考各机构招录人数、报名人数和录取比例的关系,用“县级公务员比省级好考20倍”反映了各级公务员报考的难易程度,不仅涉及的话题接地气、草根化,而且新闻标题的制作也通俗易懂,非常贴近受众的生活,符合各阶层阅读习惯。

(4)表达新闻化。

实践过程中,为了“数据”而做数据新闻,忽略了新闻本身固有的价值和定位的现象急需厘清。首先,应找准定位,认识到数据新闻只是新闻的另一种表述形式,需要满足传统新闻生产的各个要素;其次,数据仅仅作为数据新闻的内容,应挖掘其中的“新闻点”进行表达,避免成为另一种形式的报告;最后,“内容为王”依旧是新闻报道的立身之本,也是数据新闻生存发展的重要保障。

四、提高用户粘度

用户需求始终是数据新闻所有价值取向的衡量标准,满足用户需求、提高用户粘度应该成为数据新闻努力的唯一宗旨。首先,应建立用户对数据新闻的反馈渠道和交流机制,形成数据新闻主导、用户广泛参与的新局面;其次,应鼓励用户通过与数据新闻部门建立联系,主动参与到数据新闻的制作过程中,并邀请新媒体意见领袖及相关专家进行交流讨论,进行推广传播,形成数据新闻的二次传播。此外,培养数据新闻的粉丝形成粘滞度也可以尝试。四大门户的数据新闻均与腾讯、微博、微信等社交媒体建立了联系,当用户阅读到自己喜欢的作品时可以通过一键分享到相关的社交媒体供更多的用户进行阅读和分享。此外,网页设置了用户的留言板供用户及时评论交流并设置了官方微博链接。

参考文献:

[1] 王斌:《大数据与新闻理念创新——以全球首届“数据新闻奖”为例》,《编辑之友》2013年第6期

[2] 文卫华、李冰:《大数据时代的数据新闻报道——以英国《卫报》为例》,《现代传播》 2013年第5期

[3] 周婷婷、陈琳华:《数据新闻实践的前沿进展——以全球“数据新闻奖”2013年获奖作品为中心的分析》,《新闻前哨》2014年第1期

(荆楚网)

猜你喜欢
数据新闻困境可视化
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
“邻避”困境化解之策
必须正视的理论困境
我国雾霾治理的困境与出路
媒介融合时代数据新闻可视化教学探索
从“数据新闻”看当前互联网新闻信息传播生态