MGC机器生产内容+AI人工智能的化学反应
——“媒体大脑”在新闻智能生产领域的迭代探索

2018-08-10 01:17傅丕毅,陈毅华
中国记者 2018年7期
关键词:进球世界杯智能

内容提要 以MAGIC智能生产平台为核心的2.0版“媒体大脑”以大数据处理技术、智能算法技术以及人机协作技术为核心,包含智能数据工坊、智能媒资平台、智能生产引擎、智能主题集市四大智能系统,自动产出成品视频内容,以及文字,图片内容。MAGIC的目标是让内容生产者更多地获取新闻资源、更好地处理新闻资源、更快地传播新闻资源。

俄罗斯世界杯前夕,由新华智云自主研发的国内首个媒体人工智能平台MAGIC首次惊艳亮相。从6月14日俄罗斯世界杯开赛至6月28日11时,通过MAGIC平台生产的世界杯短视频达到28919条,占主要视频网站世界杯中文短视频总产量的69%。其中,最快的一条短视频《进球了!秘鲁VS丹麦》,在丹麦队进球后16秒内,就自动合成并发布在视频网站上。

一、“媒体大脑”1.0升级为以MAGIC智能生产平台为核心的2.0版

2017年12月26日,新华社面向全球发布了中国第一个媒体人工智能平台——“媒体大脑”1.0。

“媒体大脑”(www.shuwen.com)是由新华智云自主研发的国内首个媒体人工智能平台,融合云计算、物联网、大数据、人工智能等多项技术,为媒体机构提供线索发现、素材采集、编辑生产、分发传播、反馈监测等服务,使新闻场景下的应用和服务更加智能化。

“媒体大脑”1.0包含八大功能:自动采集生产新闻的2410智能媒体生产平台;实时语音识别及自动转写的工具“采蜜”,帮助记者提高采访及新闻生产效能;从图片、视频中识别特定人物身份,特殊标识的图片识别工具;监测新闻信息内容在接近全网300万个网站及头部自媒体的传播、版权行为状况;面向未来的新闻信息传播场景的新闻分发,以及基于用户阅读偏好的新闻分发系统;为媒体机构描绘自身用户群体特征、偏好的用户画像服务等。

2018年6月13日发布的 “MAGIC”智能生产平台则可以被看作是“媒体大脑”的2.0版,MAGIC这一名字是“MGC”(机器生产内容)和“AI”(人工智能)的结合。

二、数据+算法、人机协作的MAGIC智能生产平台

MAGIC智能生产平台以大数据处理技术、智能算法技术以及人机协作技术为核心,包含智能数据工坊、智能媒资平台、智能生产引擎、智能主题集市四大智能系统,自动产出成品视频内容,以及文字、图片内容。MAGIC的目标是要让内容生产者更多地获取新闻资源、更好地处理新闻资源、更快地传播新闻资源。

(一)四大智能系统构成MAGIC

智能数据工坊是数据采集中心、数据加工中心和数据产出中心,通过爬虫等算法挖掘各类视频、图片、文本中的数据,随后将数据进行处理从而得到结构化的数据;智能媒资平台是内容资源的“仓储中心”和“算法中心”,包含各类新闻信息、图片、视频等素材,记者可以在智能媒资平台中搜寻需要的素材;智能生产引擎,顾名思义,具体负责自动生成内容,通过分析时间、地点、人物等信息,调度相应的素材,渲染后自动剪辑合成一条视频新闻;智能主题集市则更像是内容产品创意中心,为内容生产者提供选题和写作思路。

MAGIC智能生产平台如同零部件生产组装流水线,智能数据工坊和智能媒资平台的任务,就是将新闻内容自动拆解为一个个颗粒化的零部件。智能生产引擎则是负责把这些零部件重新组装。经过机器的拆解和组装,更多新的内容就产生了。

(二)数据+算法是MAGIC的核心

MAGIC的核心是数据+算法,可以概括为一个“业务数据化——数据业务化”的闭环反馈过程:一是让传统的业务资料成为数据,让线下的数据走向线上,和计算相接,这个过程对应的就是业务数据化;二是让数据形成闭环,回到业务的使用场景中,对业务进行改善并让人工智能不断自我进化,这个过程对应的就是数据业务 化。

(三)人机协作在MAGIC必不可少

人工参与和观察的角色依然存在,MAGIC的本质是“人的智慧+机器的智能”,这是一种“全量数据+人机协同”的工作模式。首先,“媒体大脑”产出的内容以及质量在一定程度上依赖于人工的经验和反馈。其次,在判断黄色、暴力、敏感等内容方面,现有的智能技术可以进行初步筛选和校对,但最终还是需要人的再校对。相信随着人工智能技术和计算资源量的提高,人工审核的依赖度会逐渐下降。

MAGIC通过机器辅助,海量的历史和实时内容将被精细化地自动拆解,并以颗粒的形式存储在云端,一旦有最新的事件发生,机器会自动调用云端的数据颗粒,实时生成视频新闻,内容经过数据化后,会产生新的内容,这就是MAGIC的魔法。

通过对所有内容数据化后,在未来计划中,MAGIC还能够帮助内容生产者找到新闻角度。

三、MAGIC智能生产平台的应用——实时自动生产俄罗斯世界杯视频稿件

世界杯四年一届,是全球瞩目的焦点,也是媒体角逐的热点,同时,体育新闻事实性强、较为结构化,MAGIC的实战运用选择了世界杯报道,实时自动生产世界杯成品视频稿件。

截至2018年6月28日11时,通过“MAGIC”平台生产世界杯短视频达到28919条,占主要视频网站世界杯中文短视频总产量的69%。通过MAGIC平台分发到视频站点的短视频达17000条,据不完全统计,视频播放量将近4400万次。其中《凌波微步再现江湖!梅西状态来了!阿根廷率先破门!》播放量达279万次,《阿根廷VS克罗地亚比赛集锦》播放量达219万次,《C罗点球被扑出?这一刻仿佛被梅西附体,也开始慌的》播放量达187万次。

随着世界杯赛事的进行,相关数据资源越来越丰富,智能生产平台的内容产出量直线上升,在优酷、UC等渠道的播放量也同步直线上升。

MAGIC智能生产的最大特点是时效快。比赛进球后,MAGIC智能生产平台AI进球视频链路非常高效,全链路自动完成画面分析、捕获、制作、配乐、加标题、合成、发送到优酷等视频站点,整个过程不超过30秒。用户在视频网站可以看到《球进了!塞尔维亚0:1落后巴西 比赛第35分钟》《球进了!韩国2:0领先德国 比赛第97分钟》等世界杯所有进球视频。通过对比发现,人工剪辑、合成并发布的同类进球视频,最快需要4分钟,算法和机器自动化的优势非常明显。

MAGIC智能生产的特点还在于内容全和可学习性。基于视频和图片资源,生产全量内容。如在韩国和墨西哥的比赛中,韩国队被判罚点球,MAGIC智能生产平台第一时间生产《2018俄罗斯世界杯:14个点球全回顾 本届点球数已超2014整届》,将14个点球的进球视频一一呈现。每场比赛,MAGIC都会依据设定的模板,自动生产赛事相关进球、射门、角球、任意球、精彩过人、红黄牌、犯规、球迷表情、半场和全场集锦,全部球员比赛表现等视频,时间不晚于比赛结束的3分钟。每天自动生产射手榜、进球榜等盘点类集锦。MAGIC还对所有球员,尤其是明星球员、对位进行PK分析,产生PK类视频集锦,关联球员所在球队、俱乐部,场外花絮,分析比对,挖掘价值点,生产视频新闻。基本上,人工能找到的角度,能想到的选题,MAGIC智能生产平台都能及时生产。人工定义的选题,机器通过算法学习后,可以复用到全部的比赛中。

除了比赛集锦,MAGIC算法还生成了不少有意思的短视频,其智能程度让人大呼意想不到。MAGIC精准抓取了马拉多纳多场观看不同比赛时的夸张表情和肢体动作,生成了《戏真多!马拉多纳:看台上一只行走的表情包》(时长82秒)、《马拉多纳激情“作法”!梅西能为阿根廷逆天改命吗?》(时长27秒)、《阿根廷惨败,马拉多纳难掩失落》(时长23秒)、《紧张到吃手指,失球后马拉多纳很捉急》(时长6秒)、《你的好友【马拉多纳】进入了直播间》(时长17秒)等视频。

如果按照传统的编辑部模式生产制作高时效、海量的世界杯短视频,需要调动大量的人力物力。MAGIC提供了一条数据+AI+计算资源的解决路 径。

MAGIC将帮助内容生产者更多地获取新闻资源,更好地处理新闻资源和更快地传播新闻资源,在未来计划中,它还要成为一个发现新闻的平台,机器通过数据之间的联系比对,将会发现人发现不了的角度和新闻 点。

机器不是来取代人的,而是来帮助人的。新华智云最大的价值和核心目标就是在MGC的领域有所突破。新华智云将自己定位为“内容生产者的帮助者”。“媒体大脑”这些功能的本质是机器帮助内容生产者更多地占有新闻资源,所有技术能力的释放都围绕着帮助记者占有更多新闻资源来做。

以M A G I C为核心的“媒体大脑”2.0可以看作是“机器的智能+人的智能”的双赢和重生,这将开启一个全新的AI内容生态系统。“媒体大脑”不是要取代记者和编辑,而是要在更高层面上,把人与物的延伸连接起来,更快、更准、更智能地获得新闻线索和新闻素材,赋能记者和编辑,帮助媒体提高生产力。

猜你喜欢
进球世界杯智能
644球,梅西打破贝利纪录
智能前沿
智能前沿
智能前沿
智能前沿
Goal Trail进球路线 等
多彩世界杯
走迷宫
100%的进球率
世界杯搞笑来袭