30分钟,打造撤贝宁的“孪生”AI主持人

2019-10-20 17:28华凌闫欣
中学生阅读·高中·读写 2019年8期
关键词:贝宁原型主持人

华凌 闫欣

在央视2019年网络春晚舞台上,观众欣喜地看到,撒贝宁有了个虚拟孪生兄弟“小小撒”,这是AI虚拟主持人首次上岗与原型同台秀技,这让小撒很是感慨——正在直面自己未来的职业危机。

据透露,打造这样一个AI孪生主播,仅需约30分钟。那么,其中究竟有何奥妙之处?

如同原型孪生般逼真

你是否见过让撒贝宁“无话可说”的主持对手?

只见,“小小撒”一出场,小撒就忍不住说:“我的天,感觉像照镜子一样。”甚至从外貌上看,简直就是“失散多年的孪生兄弟”。

而“小小撒”也并非花瓶摆设,很能掌控现场,妙语连珠,以至于一旁的小撒“委屈”地插话:“能让我说一句吗?”

显然,与以前僵硬、机械形象的虚拟人技术相比,引入人工智能,按真人原型架构出的虚拟主持人,在技术上有了相当大的提升。

“为了与真实的主持人有所区分,技术团队在形象设计上做了一定程度的改变。比如,这个可爱的‘小小撒个头要高一点,更健谈些。”美国人工智能公司偶邦联合创始人郑毅说。

当然,“小小撒”也并不孤独,因为节目中除了虚拟孪生撒贝宁,其他主持人朱迅、高博、龙洋的孪生AI主持人也都纷纷亮相。

本世纪初,英国广播公司发布第一个虚拟主持人Anaova之后,虚拟主持人成了一个科技研究热点。“能闻其声,也见其人”,今年网络春晚可谓是这一技术在国内的首次大规模应用。

用数据“喂养”长大

常言道,“台上一分钟,台下十年功”。而此次培养虚拟主持人的过程却大大提速。

据了解,打造这样一个AI虚拟孪生主播的技术叫作PAI(Personal AI)。在20多项专利技术的支撑下,只需对撒贝宁等主持人进行面部扫描,以及输入半小时的录音数据,即可生成形象和声音模型。

“在AI语音技术的基础上,无须主持人录入大量文本建立语音数据库,只需其较短的几十句标准原声,通过特征参数提取,利用迁移学习算法即可建立其独特发声模型。由此,任何输入的文字都可用主持人的声音读或唱出来,甚至能运用中、日、英、韩四种语言。”郑毅说。

据介绍,随着越来越多的数据“喂养”,“小小撒”在成长中会掌握更多技能,甚至包括小撒的喜好、说话方式等,在另一层面上与其更为相似。再加上动作捕捉训练,以及传感器及运动跟踪设备,更突显原型主持人的个性化特色,大大增强辨识度。

“现在的深度学习和机器学习,是在原有自动化规则上多了学习能力——自己发现规律。换言之,由于人类很难发现规律中的细节,而AI可通过大量训练让自己去发现内在规律及细节。”华为人工智能算法工程师张侗冬说。在某种意义上,正如主持人朱迅所言:“通过数据载体的形式,跟真实世界亲密互动,我们实现了‘永生。”

从数字世界到人类世界的鸿沟

未来的世界是平行的数据世界,社会的主角是人,数据世界的主角是数字化的人。那么,在人工智能时代,虚拟主持人有什么发展瓶颈?

郑毅指出,“情感”是人类的专利。从语音模拟到语意模拟,虚拟主持人面临从数字世界到人类世界的鸿沟,尽管其在模仿音色、语速、停顿时都没问题,但是仅仅知道意思,知道怎么回答,却不理解感情内涵,要做到抑扬顿挫目前还很难。

据介绍,语意学习方面,虽然也有“兴奋”“悲伤”“着急”等情感模型,但在模拟过程中,虚拟主持人不能及时调动,需要人工参与。虚拟人仍然像个嗷嗷待哺的婴儿,人类如何孕育它成长,为其构筑怎样的世界观,将是未来深入探索的方向。

郑毅表示,相信AI虚拟主持人的研发不仅是一个技术产生到技术落地的过程,也是一个信任交接的过程。当初攻关虚拟主持人技术的一大初衷,是想通过主持人这样有一定公信力人物的带动,增加人们对人工智能的信任。因为我们还处于技术成长阶段,而未来人与人工智能的相处也应从信任开始,例如公务繁杂的职场人,如果拥有数字化的另一个自己,模拟自身意愿,成为贴心助手,打理日常琐事,是不是会让生活省心很多?相信人工智能可以给我们带来更多生活便利,创造更好的生活。

有业内人士评价说,今年网络春晚中AI应用的一小步,可能会带来开启虚拟主持人时代的一大步。“当然,若虚拟人上岗,工资依然发给我们人类就好。”有人戏称。

(选自2019年2月11日《科技日報》,有改动)

猜你喜欢
贝宁原型主持人
撒贝宁:敏思善问,问出精彩
一起来探案
包裹的一切
贝宁的摩托车
NPC潜逃计划
人人敬爱的圣人成为了 传说人物的原型
阳原县第四实验小学
愚人节里的意外温暖
语法总结:祈使句
小蛇圈圈绕的答疑会