大数据技术背景下的新闻生产模式创新

2017-04-14 23:14王玉风
新闻论坛 2017年1期
关键词:个性化受众机器人

机器人新闻(Robot Journalism或Autom Journalism)是使用算法自动从结构性数据中生成的新闻,这种依赖数据生成新闻的程序一旦开发出来就可以高速生产出海量内容。①目前,机器人新闻在新闻生产领域的应用还仅仅局限于财经报道、体育赛事报道等方面,这些新闻报道类型的典型共同点就是其新闻产制通常涉及大量数据、图表和量化分析,新闻写作内容和结构有相对固定的标准和模式,变化的只是涨跌起伏的数字,这使基于大数据分析和自然语言模板生成技术的机器人新聞生产有巨大的发挥空间。《纽约》杂志著名的撰稿人凯文·罗斯认为,机器人新闻恰恰是人类新闻从业者疲于应付与大量数据相关的“体力活”的产物。任何数据驱动的领域,比如财经类、体育赛事类、健康咨询、民意调查、天气等报道都可以依赖机器人写作。机器人新闻付诸实践只有四五年的时间,但其技术研发者坚信它在20年或更短的时间内将获得普利策新闻奖。

从文房四宝到电脑打字、激光照排,到现在的机器人写作,传播技术不断经历着跨越式的变革,机器人新闻的出现和发展预示着新闻生产工业化时代的来临,在不久的将来,机器人生成内容(CGC)将与专业新闻记者生成内容(PGC)和用户生成内容(UGC)在数字化新闻的角逐中实现三足鼎立。本文聚焦中外财经类机器人新闻生产实践,选取该领域目前最具代表性的两家媒体的新闻机器人——美联社的“语言大师”平台和腾讯的Dreamwriter——进行生产模式的分析,总结出其生产模式依托大数据资源实现了内容自动化生成、个性化服务和智能化聚合三个方面的创新。

一、“循规蹈矩”的自动化生成

2014年,美联社率先使用“语言大师”(Wordsmith)撰写每季度的公司财报,机器人新闻进入人们的眼球。美联社将公司财报数据输入到“语言大师”内容生成平台上,软件根据预先设定的程序自动生成一条150~300单词的新闻,编辑在其发布之前预览一遍即可,这样的新闻生产模式正好适合需要定期发布但是格式僵化的财报类新闻的生产,机器人新闻这一新生事物也借助美联社这一在全球新闻生产领域颇具影响力的媒体而广为流传。2015年腾讯发布的《8月CPI同比上涨2%创12个月新高》成为国内首篇由机器人撰写的新闻稿,它出自腾讯开发的自动化新闻写作机器人Dreamwriter。它可以根据最新的数据,利用内置算法在第一时间内形成稿件,经编辑审核后上传平台,一分钟内将资讯送达用户。②

根据对“语言大师”平台和Dreamwriter财经类机器人新闻生产的流程进行观察和分析,发现其有近似的运行逻辑:机器人新闻软件依赖大量的数据来源,遵循特定报道类型的常用模式,大批量生产新闻。它具体的生产过程包括以下步骤:首先,程序软件以新闻关键词和数据指标为线索,在已有的数据库采集新闻写作所需的素材。其次,对采集到的数据进行结构化归类和多维度统计,将数据呈现的变化趋势与系统设定好的新闻点进行对比来确定报道方向。再次,利用机器人模板“遣词造句”呈现出描述性新闻。这个过程类似于完形填空,机器人只需要在设定好的语境中进行简单的填充即可。最后,在发布之前人类编辑对新闻稿内容进行审核与润色,这个环节是机器人新闻生产中唯一有人参与的环节。

机器人新闻的出现是科学技术进步的产物。机器人新闻通过设置相关的程序对数据进行挖掘分析,再对其中有价值的点进行模式化写作,这是对传统新闻生产模式的颠覆,也是高科技对于海量大数据资源的开垦和利用。但同时机器人新闻也是新闻业面对不景气的生存环境所采取的用以削减成本的无奈之举。

面对激烈的竞争,机器人新闻自动化生产的快速高效为媒体带来了“突围”的可能,未来,媒体上出现越来越多署了机器人名字的新闻绝非天方夜谭。但是,当我们欣喜于机器人新闻一触即发的自动化生成速度和数量时,也要认识到这种过于简单的生产模板带来的稿件质量不高的问题,美联社总编辑费拉拉认为,机器人新闻内容的生硬和重复直接影响了稿件的质量,稿件缺乏人性化和个人风格,不能为读者带来阅读快感。③

二、“信息小灶”的个性化服务

机器人新闻生产系统中预先设定了结构化的数据文件,它可以创建多种叙述模板,从而创建分支内容,为受众提供更加细化的服务。据了解,“语言大师”通过与美联社等的合作确定了超过3亿可使用的新闻写作模板,这一规模随着机器人新闻快速普及的趋势还将不断扩大。在对新闻机器人设定模板的时候,根据实际情况对模板进行细分,用不同的词汇、短语或段落更为贴切地描述事件本身,系统会根据具体的事件细节生产稿件,并可以根据受众信息接受习惯更新创造性的细节,使之更符合受众的个性化需求。当受众一时兴起想查询哪只冷门股票的变动情况时,总有一篇符合受众阅读习惯的报道及时呈现在眼前,这是人类记者提供不了的服务。

随着自然语言和算法技术的不断成熟,机器人新闻生产过程中出现了越来越多的新尝试,充满人情味和个性化的写作技法的探索就是其中一个典型变化。近期的机器人新闻可以做到根据报道的详略、侧重点对遣词用句进行调整,新闻呈现也有了创新,可以针对不同的受众提供不同的新闻版本。“语言大师”平台可以根据受众的群体特征选择报道角度,比如针对持某支下跌股票的用户进行报道时会避免使用负面用语。从现有的应用情况来看,机器人新闻还可以实现文风的定制。对特定读者的阅读习惯进行数据挖掘与分析,将读者喜好的语气、角度等融入新闻报道中,根据其常用的词汇和语法习惯组织语言,从而完成一篇易于为受众接受和喜爱的新闻稿。

“海量+个性化”的组合将是未来机器人新闻发展的新方向。海量内容生产是机器人新闻的显著优势,据统计,“语言大师”2015年写作的稿件总量为10亿篇,而这些文章的平均浏览量在100万次左右,除此之外,它还建立了50万则Twitter内容。④而个性化内容生产将成为机器人新闻的新优势。2015年10月,“语言大师”平台推出了面向公众的版本,用户通过在该应用上注册就可以拥有一个个人模板,之后应用会帮助用户根据最新的数据生成文章。⑤在这个过程中,用户等于拥有了个人数据处理专家,它生成的文章不再面向大众,只有一个用户的专属定制可以更好地满足用户需求。2016年,腾讯Dreamwriter开始推出“风格化”“个性化”写作,其财经报道不再是“千人一面”,而是针对不同用户的个性化需求进行写作,这很好地适应了当今人们信息需求个性化的追求。囿于技术的发展,目前该功能还较为单一,分类较为粗略,其财经类新闻生产只能简略地分为“研判版”和“民生版”两个版面,随着技术的发展,该个性化服务将越来越精细。

机器人新闻个性化能力的提高也只是相对而言的,它并不能完全满足人类读者的个性化需求,尽管机器人新闻提供个性化服务的能力越来越强,但机器毕竟是机器,它只能按照已有的数据对用户个性进行分析而不能真正具备人的情感态度,虽然会通过对数据库中的形容词的抓取来提高可读性,但是这与人类记者写作出来的饱含情感和责任的新闻稿件相比却显得冷冰冰的。

三、“术业专攻”的智能化聚合

新媒体时代,互联网中的第三方数据推送、基于社交媒体的传感新闻、信息搜索频率的数据分析等为机器人新闻的生产提供了庞大的数据库。美联社的“语言大师”内容平台每秒钟能生产2000篇财经文章,这是人力所不能及的。⑥随着机器人新闻的日渐成熟,这样的极速、海量的新闻报道将越来越多,与此同时,新媒体技术的迅猛发展带来的信息冗余成为信息社会的顽疾,过量的信息不断挑战着人脑的信息处理极限。此时,突破生物体自身局限的人工智能技术在人们追求信息需求和供给的平衡中开始发挥重要的作用,基于人工智能的机器人新闻在信息的智能化聚合中也有了独特的意义。

机器人新闻可以作为新媒体编辑对互联网上的海量信息进行筛选,从而完成优质内容的智能化聚合。首先,机器人新闻借助社交媒体进行“病毒式传播”。机器人新闻的写作基于对社交平台的大数据分析进行,对社交网站上的分享热点和关注热度进行统计,对海量内容进行价值判断与甄选,根据统计数据来预测有社交推广效应的内容,将选出来的“爆款”文章向传统媒体的版面编辑进行推荐,随即进行内容筛选、编辑排版和印刷,这样生成的内容本身带有受社交媒体用户欢迎的“病毒元素”,它会如病毒扩散般地疯狂传播。据《纽约时报》统计,经新闻机器人推荐在传统媒体版面传播的文章阅读量是非推荐文章的近40倍。而它的实质是对优质内容的聚合传播,在这个过程中,机器人新闻化身总编辑进行高效高质的内容编辑。

机器人新闻智能化聚合还可以通过提炼元数据的方式实现。通过对各类文本内容的分析,并通過与内部资料库的连接提炼出元数据,这是一种描述其他数据的数据,或者说是用于提供某种资源的有关信息的数据结构,它的使用可以实现简单高效地管理大量网络化数据的目的。机器人新闻在生产过程中可以通过对海量数据的提炼形成自身的元数据库,在生产过程中将编辑输入的内容与系统元数据库进行对比,筛选出关键词和重点内容,再对这些传播价值大的信息进行传播,这样的优质内容聚合是减少传播资源浪费、提高传播效率的好方法。

机器人新闻生产的智能化聚合为受众快速获取优质信息提供了便捷途径,但是该功能目前还处于边缘位置,只有少数媒体开发了部分浅层次功能。机器人新闻智能化聚合能使新闻突破传统的信息传递的价值,涵盖大量的与产业趋势和产品开发相关的核心价值,但是这些领域尚未被传统记者所关注。

传统的泰勒主义认为,在流水线生产中要提高生产效率就要使工人的作业方法标准化,以此追求最大的效率,它的实质就是要求人要适应机器。该理论被应用于新媒体领域发展成为数字泰勒主义,认为我们唯有“多任务执行”才能应对数字信息大爆炸,它的实质是人脑要适应机器。⑦机器人新闻的产生是人类对信息的迫切需求与技术飞速发展的产物,它有自身的优势和局限,未来最好的新闻生产模式将是一种“人机结合”的场景:通过大量的数据分析生产出来的机器人新闻提供“故事点”,即能够吸引受众关注的新闻线索,人类记者进行深入的采访和挖掘,呈现和丰富事件背后的故事和意义。

注释:

①叶韦明.机器人新闻:变革历程与社会影响[J].中国出版,2016(5).

②孙振虎、张馨亚.机器人新闻的发展与思考[J].电视研究,2016(6).

③孙瑛.机器人新闻:一种基于大数据的新闻生产模式[J].编辑之友,2016(3).

④机器人新闻占领地球!年产新闻10亿篇[EB/OL].2014-10-29http://tech.qq.com/

a/20141029/050246.htm

⑤徐曼.国外机器人新闻写手的发展与思考[J].中国报业,2015(12).

⑥黄可.机器人记者:本质、模式与意义[J].中国记者,2015(5).

⑦邓建国.机器人新闻:风险、原理和影响[J].新闻记者,2016(9).

作者简介:王玉风,中国传媒大学新闻学院新闻学专业2015级硕士研究生

编辑:孟凌霄

猜你喜欢
个性化受众机器人
坚持个性化的写作
新闻的个性化写作
用创新表达“连接”受众
上汽大通:C2B个性化定制未来
用心感动受众
媒体叙事需要受众认同
电视节目如何做才能更好地吸引受众
机器人来帮你
认识机器人
机器人来啦