人工智能在新闻出版业的应用模式与潜能分析:从选题优化、精准分发到个性化服务

2018-03-12 00:45吴方兰
新媒体研究 2018年22期
关键词:机器学习人工智能大数据

摘 要 从人工智能的核心和基石入手,分析人工智能在新闻业的应用模式,挖掘其在未来更多的应用潜能。

关键词 人工智能;大数据;机器学习;出版流程优化

中图分类号 G2 文献标识码 A 文章编号 2096-0360(2018)22-0011-05

2016年3月15日,AlphaGo以4:1战胜人类顶尖围棋手李世石,“人工智能”在全世界引起关注[1]。

在提供未来更多可能性的同时,人工智能也带来了“人类是否会被机器人取代”的恐慌。同年,专业从事智能语音技术研发的科大讯飞公司高级副总裁杜兰在出席2016广东互联网大会时表示,“在未来5~10年内,人工智能将像水和电一样无处不在,会进入每一个行业,深刻改变世界”[2]。

确如科大讯飞所预测,这两年人工智能的触手广泛地进入人类生活的种种领域,语音识别、图像识别、聊天机器人、无人驾驶汽车……人工智能在越来越广泛的场景中得到应用。而在需要创造力和情感的新闻出版领域,人工智能能否发挥作用,为新闻出版业赋能?本文将从人工智能的核心与基石入手,分析人工智能在新闻业的应用模式,挖掘其更多的应用潜能。

1 人工智能的核心与基石

1.1 人工智能的核心是学习能力

“人工智能(Artificial intelligence)”简称“AI”,是计算机科学的一个分支,其定义目前并未统一,在《人工智能及其应用》一书中,蔡自兴教授列举了多种人工智能的定义,诸如“人工智能是计算模型研究智力行为”(Charniak & McDermott 1985)、“人工智能是研究和设计具有智能行为的计算机程序,以执行人或动物所具有的智能任务”(Dean,Allen,Aloimonos 2003)等[3]。

抛开学者从不同侧重点阐释的定义,我们可以从“人工智能”这一词汇本身来揭示它最根本的内容:“智能”强调思维和学习能力,“人工”则表明机器的智能由人赋予,赋予的形式就是算法。所以从本质上来说,人工智能是一种算法程序,而算法运行需要附着在一定的硬件设备上。由程序+硬件设备构成的机器人在工业领域很早就已经得到应用,并逐步完成了对人工流水生产线的取代,但此时它们还不被视作人工智能。只有当机器设备能对人的思维过程进行模拟时——人类如何获得知识、如何运用知识,机器才真正具备智能。战胜人类顶尖围棋手的AlphaGo,在全世界范围内引起对人工智能的讨论,正是因为其在短期内对大量棋谱的学习以及在实际对战中巧妙地应用。所谓“智能”,正是机器通过自然语言处理、语义分析以及机器学习等过程获得知识,并将其应用在实际中。可以说,是否具有学习能力,是机器是否具有智能的标志。学界普遍认同的关于“学习”的观点来自人工智能大师西蒙,他认为学习是系统在不断重复的工作中对本身能力的增强或者改进,使得系统在下一次执行同样任务或类似任务时,会比现在做得更好或效率更高[3]。

2018年7月19日,来自Google AI的微信小程序“猜畫小歌”刷爆朋友圈,和传统的“你画我猜”相比,“猜画小歌”的特色在于将“人作画→设备呈现→人猜”转变为“人作画→机器猜”。机器猜图的基础来自Google AI对于大量UGC内容的学习。官方表示,“猜画小歌由来自Google AI的神经网络驱动,该网络源自全世界最大的、囊括超过5 000万个手绘素描的数据群。”[4]通过对素材数据群的学习,在大量的用户生产内容中,AI总结不同用户对同一词汇的理解,进而形成对该词语的概念,从而完成对人类思维的模拟。用户数据在不断生产,“猜画小歌”通过对同一词汇的反复认知形成并不断更新自己的知识体系,这也是机器实现智能猜图的关键。

1.2 大数据是人工智能得以实现并广泛应用的基石

人工智能需要大量的数据来完成智能的建立,机器学习便是通过对数据的学习和训练总结归纳出规律,进而形成知识。

海量的数据快速流转,价值密度也低,人工获取有效信息效率低,真正有价值的信息反而不一定能被发现。利用大数据技术,可以在类型多样、体量巨大的数据中,快速抓取,获得有价值的信息。而将大数据技术应用到人工智能,可以为人工智能建立结构化和系统化的数据库。人工智能信息抓捕速度快,并且能够高速逻辑生成有效数据,“大数据+人工智能”使得人工智能可以应用到更多的场景。例如在工业领域,将工厂信息、生产状况、市场信息等建成工业大数据,人工智能通过对数据的分析可以发现当前生产领域的需求与生产力转型升级的确切方向,进而帮助决策。

2 人工智能重塑新闻出版流程,为传统新闻出版业赋能

人工智能技术应用到新闻出版行业,对新闻出版的各方面、各环节产生深刻影响,在未来将会重塑出版流程,推动新闻出版业转型升级。

2.1 基于大数据的信息采集与分析实现选题优化与精准营销

在互联网时代,信息的获取变得越来越容易,但同时信息冗杂,也为新闻出版业带来了挑战。传统纸媒销量越来越低,新媒体数量巨大,然而碎片化信息难成体系。人工智能在信息采集与分析中适时发挥出了优势。

目前新闻出版业利用人工智能采集信息主要分为两方面:选题信息——分析市场现有内容,发掘和优化选题;营销信息——对用户信息进行采集以形成用户画像,从而进行内容个性化推荐,实现精准营销。

在传统的选题策划环节上,除了创意与灵感,媒体人大多都是将所能搜集到的市场图书信息以及社会热门事件等作为选题依据,图书的策划与出版都面临较大风险,新闻报道的时效性也大打折扣。利用人工智能,媒体人可以通过对市场图书、作者以及销量、评价等数据的分析,了解市场新动向,发掘现有市场空白领域以及用户的关注点和需求点,进行选题决策与优化。在热点事件追踪上,人工智能对热词传播更为敏感,能快速进行反馈,帮助编辑策划组稿。通过人工智能进行选题优化,可以有效降低资源的浪费情况,一方面减少同质化内容的生产,另一方面也能更精准地预测市场情况,减少预算的浪费[5]。

在营销环节,人工智能可以对用户数据进行采集与分析,形成用户画像,通过个性化推荐算法将相应内容精准推送到用户端。一方面用户可以脱离冗杂的碎片化信息的包围,获得对自己而言最有用的信息,另一方面,媒体方也可以完成自生产内容的推广,使得内容有针对性地发挥出其最大的效用。

2.2 机器人写作呈现了人工智能内容创作的可能性

人工智能的学习能力远超人类,在语言学习与处理上,也迅速超越了人们的想象。在极富创造力的新闻出版业,人工智能早就打破大众的认知偏见,实现了机器人写作。

以国内为例,2015年9月,腾讯财经发布了机器人“Dream Writer”编写的稿子《8月CPI涨2.0%创12个月新高》;2015年11月,新华社发布机器人记者“快笔小新”,从事财经、体育方面的报道撰写;2016年里约奥运期间,由北京大学和今日头条联合研发的机器人记者“小明(Xiao Ming Bot)”发稿450多篇;2017年5月,微软和湛庐文化推出机器人小冰创作的现代诗集《阳光失了玻璃窗》……

目前机器人写作更多地还是应用在一些相对简单的事实新闻报道中(以新闻体裁中的消息为代表)[5],或是需要呈现大量数据分析和可视化的内容(以财经新闻为代表)。机器天生的理性容易呈现更为客观的报道,同时对数据的处理能力和速率也是人类所无法企及。短时间内高效率处理信息,并以简明的文字呈现出来,机器人写作在新闻写作上更好地实现了时效性和客观性的特征。在文学创作上,小冰的试水行为也为我们呈现了智能内容创作的更多可能性。

2.3 信息的高效处理,为新闻提供更多呈现形式

人工智能在语音识别与图像识别上已经相当成熟,文字和音频的转化正确率基本都已经达到90%以上,语音输入、文字与语音的转化都成为可能,图片识别技术也为内容的转化提供了更多形式。

科大讯飞的“讯飞语记”是一款语音转文字输入软件,将其应用到新闻出版领域,它可以在录音的同时进行语音识别,将录音速记转化为文字,在采访的同时生成文字稿件,能够更高效地将内容呈现在读者面前。讯飞语记还可上传外部音频进行识别,系统支持普通话、粤语及英语等10多种语言,准确率高达98%,新闻采访的大量的音频信息可以高效地转化成文字形式,方便选取利用,大大降低了人工的工作负担。除了语音识别,讯飞语记还支持图片转文字,不管是手写体还是印刷体,通过图像识别技术,图片上的字都可以以文字形式呈现出来。

人工智能进行高效地信息处理,实现了文字、语音以及图片信息之间的转换,为新闻提供了更多的呈现形式:第一时间将采访视频呈现的同时,还可以迅速整合出采访文字稿。文字、音频和视频、图片等多种形式均可同时进行呈现。语音识别、图像识别等技术使得传统的编辑工作中耗时又费力的文字转换工作由人工智能取代,媒体从业者工作重心能够放在深度分析与思考上,为用户呈现更深度更精彩的内容。

2.4 智能筛选,有效规避虚假与低俗信息传播

互联网在为我们提供海量信息的同时,也带了问题:信息的发布主体不再受限,UGC内容越来越多。和PGC相比,UGC主体所承担的信息传播风险较小,于是大量的虚假信息在互联网传播,信息的真实性变得难以掌控。除此之外,各种低俗信息也在网络环境的发酵中违法传播。

要改善网络虚假信息和低俗信息传播状况,除了利用法律法规加强个人和平台的责任意识、提高公众素养之外,还可以利用技术手段对已发布的信息进行筛选排查。

依靠人工智能技术,通过语义识别、图像识别、关键词设置等方式,信息平台可自动对用户上传的信息进行审核,比如今日头条在人工智能技术的识别下,能有效拦截低俗图片,相较于纯人工,拦截率提高了73.71%[6]。人工智能的自动筛选,能有效规避虚假和低俗信息的传播。

3 人工智能在新闻出版业表现出的问题及对策

3.1 人工智能在新闻出版业表现出的问题

人工智能在新闻出版行业各领域应用的同时,重塑出版流程,为新闻出版提供了更多的可能性。然而在新技术与传统行业的碰撞中,同样也产生了各种问题。

3.1.1 个性订阅与智能推荐造成新型信息孤岛——信息茧房

“信息茧房”的是指人们的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”中的现象。

互联网为我们提供了联通一切的可能性,海量的信息可以轻松获取,通过订阅,我们可以关注自己最感兴趣的信息,而同时,系统也会向我们推荐各种可能感兴趣的内容。但是在这样一个全开放的时代,不管是个人订阅还是基于算法的个性化推荐,我们所接受的多是基于阅读习惯和个人喜好的同质信息,看起来可获得的信息越来越多,实际获得的信息却只是极小的一个范畴,互联网让信息孤岛不再存在,但我们又仿佛进入了另一种信息孤岛——“信息茧房”。我们接受的都是经过自己筛选的内容,对于异质化信息的接受度越来越低,局限在自己的小空间内,最终变得越来越狭隘[7]。

3.1.2 机器人写作可实现范围受限,大众接受度低

机器人写作目前应用并不十分广泛,且主要应用在新闻报道上,以消息居多,通讯、特写、评论等新聞类型人工智能无法进行,因为情感、创意等能力方面的不足,人工智能很难完成深度的报道。而浅层的报道,因计算机程序的特性和数据的相似性,又可能出现同质化的现象。

以小冰为代表的机器人文学创作,目前的适用性并不太高。“人类史上首部人工智能诗集”的噱头虽然为《阳光失了玻璃房》带来了一定的流量和购买力——从当当、京东的销量与评论可见一斑,但豆瓣仅有77人参与评分,分数为5.8,这也意味着机器人所进行的文学创作目前并不被大众认可。

3.1.3 人工智能获取信息没有标准边界,道德伦理随时面临争议

在社交网络发达的大数据时代,用户的信息极易获取,人工智能在分析用户习惯形成用户画像的过程中,因为人工智能对数据的使用没有固定标准,容易丧失边界,侵犯用户个人隐私[8]。

3.2 人工智能发展对策

人工智能在出版业领域应用所出现的问题,主要要从法规制度完善和技术优化中寻求解决。在法规制度上,需要不断完善对版权等问题的建设,明确信息边界;在技术上,技术人员需要不断进行技术的优化与提升。以科大讯飞为例,其语音识别技术仍在不断改进,一方面对环境的容纳度越来越高,另一方面识别的正确率也在不断提升。针对“信息茧房”问题,除了从技术角度改善智能推荐机制之外,我们自身应该主动去接收更多领域的信息,形成自己的知识内核,而这一点也需要依赖政策对文化环境的建设引导,这将是一个长期的工程。

4 人工智能在新闻出版业的应用潜能

人工智能目前在新闻出版业的应用虽然存在一定问题,但在对问题的反思与总结中,在法规制度的建设与完善中,在人工智能技术的提升与优化中,未来也将呈现更多的应用潜能。

4.1 优化新闻出版流程,节省人力资源

虽然人工智能已经在新闻出版业的各领域得到应用,但在整个行业内并不算普及,依旧没有完成新闻出版流程再造,在一些重复性高、创造性低的环节,还依赖大量的人力资源投入。从创作、编辑、校对到发行销售,未来人工智能可以得到更广泛的应用。

在内容创作环节,前文已经提到,基础性的信息搜集和整合可以由人工智能完成,创作者可以节省前期的大量时间,将重心放在内容的深度挖掘上,既可以缩短创作周期,又能够提高输出的内容质量。市场整体的内容质量提高,对于大众而言,所接触到的信息更有价值,更能引发思考,好的文化环境对于大众思维能力、对于全民文化素养的提高有百利而无一害。

在编译校对环节,人工智能的语音文字转换、机器翻译、智能校对等功能目前已经拥有相当水平,未来在研发人员的努力下,其能力也会继续得到提高,在提高准确性的同时,还可以进行智能改写,使得文章更为流畅通顺。编校环节的人力投入可以大幅度减省,转而从事更有创造力的工作。

在销售环节,传统书店的书店员对图书信息的掌握是有限的,而人工智能可以存储大量图书数据信息,同时可以对语义进行识别。用户输入相关内容——未来将不再局限于关键词,人工智能对语义理解的进步必定能够实现更模糊化信息的检索——人工智能便可以迅速找到用户所需要的图书信息,协助用户完成购买。

从创作到编校到发行,未来人工智能将会对出版流程进行重塑,完成新闻出版业的转型升级。

4.2 推荐算法从迎合喜好变成培养习惯,打破信息茧房

现有的推荐算法都是基于用户的阅读习惯,推荐相同主题或者相似主旨的内容,也即所接受的信息大多都是同质化的,最终导致用户所接触的内容越来越狭隘。要改善这种信息茧房的现状,媒体从业者不能一味根据迎合用户的喜好,可以反过来利用算法培养用户习惯。

以各种内容平台为例,用户在注册时选择了感兴趣的方向以后,主页所推荐的内容都是与兴趣相关的文章,但如果推荐逻辑变成“两篇根据用户习惯推荐的同主题文章+一篇其他主题的文章”,在推荐内容里加入拓展用户阅读范畴的文章,用户可能会习惯性点进去,此时内容质量就成为了留存用户的关键。上文提到,人工智能时代,基础性的信息收集与整合可以由人工智能来完成,媒体人可以将重心放在内容深度挖掘上,内容质量提高了,用户可以留存下来,久而久之,阅读习惯也将逐渐被培养起来。

当然,这种推荐算法的基础还是用户画像,只是改变推荐逻辑,适当加入其他主题的内容。除了基于用户的推荐算法,未来的新媒体平台还可以同时运用基于内容生产者的推荐算法,开辟出专门的区域推荐优质内容。一方面激励内容生产者之间的良性竞争,另一方面也可以使得优质内容获得更多人的关注与阅读。

对用户而言,在两种推荐逻辑的共同作用下,所获得的信息既有个性化推荐的内容,以满足自己的喜好和信息需求,又有共性化的推送内容,以拓展自己的阅读面,获得更多异质信息。挖掘人工智能在推荐算法上的改进空间,提升其应用价值,未来的新闻出版行业将从迎合市场逐步转变为培养用户习惯,在打破信息茧房的同时,提高全民的文化素养。

4.3 从个性化内容到个性化服务,人工智能助力用户留存

近些年来,个性化在市场上越来越得到重视,在新闻出版领域,定制日历、定制图书封面或扉页都已经在实际中得到应用,这也表明,用户对于个性化的需求在逐步拓展到文化领域。人工智能时代,内容平台纷纷利用算法工具为用户提供个性化内容,而在未来,内容平台可以将重心从个性化内容转向个性化服务,以服务理念获得用户留存。

个性化的基础是用户的信息,随着用户画像技术升级,未来人工智能能够收集更多用户数据,包括用户的基本信息、习惯、爱好甚至是消费能力。在传统的人工进行的个性化服务中,对于企业来说,一方面对于用户信息的掌握相对有限,另一方面需要耗费大量的人力资源,增加了服务成本和管理难度,而利用人工智能技术,企业可以对用户形成更清晰的画像,有针对性地为用户提供服务。

比如在知识付费产业中,由于个体的差异性,用户需求的知识与消费能力也存在着差异。利用人工智能技术,将知识付费产品进行拆分与重组,以最大限度地满足用户对知识的需求,同时也能将知识付费产品的效用发挥到最大化。

除此之外,个性化服务也可在社群维护上发挥作用。为了留存用户,内容产业现在很多都致力于做社群。社群人数众多,管理员也需要耗费较多心力,并且很难对每一个用户的问题提供解决方案,长此以往很容易影响用户体验。随着聊天机器人技术研發,未来新闻出版业可以利用人工智能在社群维护中提供个性化服务。机器人能够准确掌握每一位用户的信息,同时可以更高效地解决用户疑问,进而大大提升用户的体验感。对于用户发布的不合适言论,智能技术也可随时监测并及时予以处理,维护社群的和谐。

新闻出版业是极富智慧和创造性的行业,在人工智能技术日趋成熟、行业法规日趋完善的前提下,将人工智能技术合理地应用到业内各领域,可以协助完成新闻出版业流程再造,发挥出内容行业的最大价值。技术变革必定要经历一个漫长的过程,在人工智能给出版行业带来的颠覆性变革中,企业应该正视行业变化,从传统的经营思维中跳脱出来,将技术与内容产业结合,最大限度地发挥内容行业的社会价值。

参考文献

[1]罗园.人机大战最终局 AlphaGO胜李世石完美收官[EB/OL].[2016-03-15].http://it.sohu.com/20160315/n440516324.shtml.

[2]艾媒网.科大讯飞出席2016广东互联网大会:“人工智能+”,未来已来[EB/OL].[2016-11-25].http://www.iimedia.cn/46469.html.

[3]蔡自兴,刘丽珏,蔡竞峰,等.人工智能及其应用[M].北京:清华大学出版社,2016(7):3,251.

[4]太平洋电脑网.谷歌“猜画小歌”小程序被吐槽:这AI是个傻子[EB/OL].[2018-07-23].http://tech.ifeng.com/a/20180723/45076212_0.shtml.

[5]匡文波.人工智能时代出版业的变革之道[J].出版广角,2018(1):6-8.

[6]凤凰科技.人民日报:人工智能是虚假新闻的“克星”[EB/OL].[2017-03-23].http://tech.ifeng.com/a/20170323/44560059_0.shtml.

[7]彭兰.更好的新闻业,还是更坏的新闻业?——人工智能时代传媒业的新挑战[J].中国出版,2017(24):3-8.

[8]王晓震.人工智能环境下新闻业的发展思考[J].今传媒,2018(6):16-17.

作者简介:吴方兰,南京大学信息管理学院。

猜你喜欢
机器学习人工智能大数据
2019:人工智能
人工智能与就业
数读人工智能
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
基于大数据背景下的智慧城市建设研究
下一幕,人工智能!