午夜过后人工智能主播上线:一公司生成四十万个虚拟主播

2023-12-25 13:26综合整理
海外星云 2023年12期
关键词:黄伟硅基小冰

凌晨4点,如果你在淘宝上观看直播,你会发现那里是个繁忙的不眠夜。虽然大多数人都睡得很熟,但仍有许多勤奋的“主播”在凌晨对着摄像机展示产品并卖力地宣传折扣。

但如果你仔细观察,你可能会注意到这些主播似乎是机器人。他们嘴唇的动作在很大程度上与他们所说的一致,但总有一些时候看起来不自然。

它们确实不是真人,而是人工智能生成的真实主播的复制体。随着创造逼真化身、声音和动作的技术变得越来越复杂和廉价,这些“深度伪造主播”在中国电子商务直播平台上愈发受欢迎。

如今,直播已成为中国传统品牌和数字品牌的主要营销渠道。淘宝、抖音和快手等直播平台上的网红可以在几个小时内完成夸张的交易额。顶级网红可以在一个晚上卖出价值超过10亿美元的商品,并获得巨额佣金。

但与此同时,培训主播并留住他们,以及了解直播的技术细节,对较小的品牌来说是不可忽视的巨大成本。将这些工作自动化要便宜得多。

自2022年以来,一批中国初创公司和大型科技公司一直在为电子商务直播提供创建虚拟主播的服务。只需几分钟的视频片段和8000元左右的成本,品牌就可以以一个真人为蓝本制作一个能24小时直播的克隆体。

从深度伪造到电子商务

自2010年代末以来,合成媒体一直是头条新闻,尤其是当一位名为“deepfake”的Reddit用户将色情作品中的人脸置换成别人时。从那时起,这项技术开始不断发展,但核心想法是一样的:通过一些技术工具,可以生成或篡改人脸,使其看起来像某个真人,并做出真人从未做过的事情。

这项技术主要以其在报复性色情活动、身份欺诈和政治误导信息中使用而臭名昭著。虽然有人试图以更无害的方式将其商业化,但它一直是一种新奇事物。现在,一些人工智能公司发现了一个新的用例,似乎进展顺利。

总部位于南京的初创公司硅基智能成立于2017年,专门从事自然语言处理,尤其是机器人拨号工具等文本到语音技术。但其创始人兼首席执行官司马华鹏表示,他的公司在2020年开始看到了人工智能作为直播工具的潜力。

当时,硅基智能公司需要30分钟的训练视频来生成一个可以像人类一样说话和行动的数字克隆。次年是10分钟的视频,然后是3分钟,现在只需要一分钟的视频。

随着技术的进步,这项服务也变得越来越便宜。现在,生成一个普通版人工智能克隆的成本约为8000元人民币。如果客户想创建一个更复杂、功能更强大的克隆,价格可能高达数万元。除了生成虚拟主播,这笔费用还包括一年的维护费。

一旦虚拟化身生成,它的嘴和身体就会随着脚本音频一起活动。这些脚本曾经是由人类预先编写好的,但公司现在也在使用大型语言模型来生成它们。

现在,人类所要做的就是输入基本信息,如销售产品的名称和价格,校对生成的脚本,并观看数字主播的直播。

更高级的虚拟主播(软件)可以浏览实时评论,并在其数据库中找到匹配的答案来实时回答,因此看起来人工智能主播似乎在积极与观众交流和互动。它甚至可以根据观众数量调整营销策略。

中国人工智能公司小冰的虚拟网红直播业务主管黄伟(音)表示,这些直播人工智能克隆是根据电子商务视频中常见的脚本和手势进行训练的。该公司的数据库中有近百个预先设计好的动作。

黄伟(音)说:“例如,当人类主播说‘欢迎来到我的直播间,大家动动手指,点点关注’时,他们经常会向上指,因为大多数直播应用程序的屏幕上方都有‘关注’按钮。”

同样,当主播介绍一款新产品时,他们会指向购物车,观众可以在那里找到所有产品。小冰的人工智能虚拟主播复制了所有这些常见的技巧。黄伟(音)说:“我们想确保说出来的话和肢体语言相匹配。你不希望它边拍手边说‘点点关注’,这看起来很奇怪。”

小冰于2020年从微软亚洲软件技术中心孵化而来,一直致力于创造更人性化的人工智能,尤其是能够显示情感的虚拟化身。

“对大多数顾客来说,传统的电子商务网站就像一个货架,冷冰冰的。在直播中,主持人和观众之间有更多的情感联系,他们可以更好地介绍产品。” 黄伟(音)说。

在2022年与一些客户进行试点后,小冰在2023年正式推出了数字克隆生成服务。和硅基智能公司一样,小冰只需要人类主播提供一分钟的视频。

和竞争对手一样,小冰的客户可以花更多的钱来微调细节。例如,中国体育播音员刘建宏在2022年国际足联世界杯期间制作了一个精致的数字孪生人,在抖音上宣读比赛结果和其他相关新闻。

一种廉价的人类主播替代品

黄伟(音)说,这些人工智能生成的主播无法击败顶级主播,但它们足以取代中端人类主播。人类创作者,包括那些用视频训练人工智能克隆人的人,在某种程度上已经感受到了来自数字竞争对手的挤压。

根据分析公司iiMedia Research的数据,电商主播的工作在2023 年更难找了,与2022年相比,中国电商主播的平均工资下降了20%。

与此同时,在观看人数较少的时间段,公司还可以通过虚拟主播来持续直播。这意味着,对于公司而言,很难证明雇佣真人主播的成本是合理的。

这种情况已经发生了。午夜过后,淘宝和京东等热门电子商务平台上的许多直播间都会由这些人工智能生成的主播主持。

之前的例子表明,深度伪造技术不需要做到十全十美就能欺骗观众。2020年,一名骗子借助粗糙的换脸工具冒充中国著名演员,从粉丝那里骗了数千打赏。

量子行星智能公司是一家包装小冰等技术并将其销售给企业客户的公司,量子行星的首席执行官陈丹表示:“如果一家公司雇佣10名主播,他们的技能水平会有所不同。也许水平最高的两、三名主播会带来总销售额的70%~80%。一个虚拟主播可以取代其余的六到七个贡献较小、投资回报率较低的主播,而且成本会大幅下降。”

陈丹现在有100多个客户使用小冰的服务,这些虚拟主播已经促成了数千万元的销售额。一个小冰主播曾在短短一小时内带来了超过10000元人民币的销售额。

不过这项技术仍然存在不足。例如,他的许多客户都是家具品牌,尽管人工智能足够聪明,可以说话和使用手势,但它不能真正坐在沙发上或躺在床上,因此这些缺乏测试的产品难以吸引用户。

除了硅基智能公司和小冰等规模较小的初创公司外,主要科技公司也在测试人工智能生成的主播。阿里巴巴、腾讯、百度和京东今年都推出了一些类似的服务,允许品牌在其平台上生成自己的人工智能主播。

雇佣大量人力主播的营销公司也注意到了这一趋势。顶级直播营销机构之一的佛山遥望科技公司宣布与小冰进行战略合作;硅基智能公司也开展了类似的合作。

人工智能生成的直播越来越受欢迎,也引起了抖音等视频平台的注意,但它采取了与其他科技巨头不同的态度。

抖音似乎更关心透明度,并在2023年5月份的一份文件中表示,人工智能生成的所有视频都应该在平台上明确标注,虚拟主播需要由真人操作。

该平台一直禁止将录制的视频用作直播。人工智能生成的直播,没有录制的镜头,也几乎没有实时的人工操作,跨越了这条规则。

对于硅基智能公司来说,下一步是在人工智能主播上添加“情商”,司马华鹏说:“如果有辱骂性的评论,它将是悲伤的;如果产品卖得好,那它将是快乐的。”该公司还致力于让人工智能主播互动并相互学习。

该公司从一开始就有一个野心勃勃的目标:到2025年,它希望创造“1亿个虚拟主播”。司马华鹏说,目前,该公司已经产生了40万个,还有很长的路要走。

猜你喜欢
黄伟硅基小冰
编委风采
——黄伟教授
汽车制动抖动分析研究
Effect of modified Qing Long Bai Wei needling on the levels of IL-1β, IL-6 and INF-α in synovial fluid of knee osteoarthritis patients
第六代微软“小冰”正式发布
第六代微软小冰正式发布
降落伞最小弹射分离速度的计算方法
小冰在“浙江24 小时”干了些什么活
钱江晚报来了“小冰”——一张都市报在“Al+新闻”上的探索和突破
基于硅基液晶拼接的高对比度动态星模拟器光学系统
硅基互联时代文化在商业空间景观设计中的构建