算法赋能: 人工智能艺术创作力的“生成图谱”及意义

2023-06-11 21:45孙婧
当代美术家 2023年3期
关键词:算法

摘要:人工智能艺术是一个新的艺术场域,它遵守的艺术创作原则与传统艺术原则不同。以人工智能算法为代表,展现出多元创作能力的复杂性。本文对人工智能艺术进行梳理和辨析,尝试从以下三个方面展开:一、人工智能艺术在媒介实践中的出场;二、人工智能艺术对技术与艺术的双重拓展;三、人工智能如何生成艺术创作力。以此为基础,人工智能艺术直接将算法转化为创作功能,开启了人类新型的审美判断,这不仅标志着人工智能艺术独特的美学运作方式的转向,更重要的是,它意味着媒介实践为算法技术赋予了艺术形态、文化品格。

关键词:算法,人工智能艺术,艺术创作力,生成图谱

Abstract: Artificial intelligence art is a new art field, it complies with the principles of artistic creation and traditional principles of art. Represented by artificial intelligence algorithm, it shows the complexity of multiple creative abilities. This paper combs and distinguishes the art of artificial intelligence, and tries to expand it from the following three aspects: first, the appearance of artificial intelligence art in media practice; sceond, the double expansion of artificial intelligence art to technology and art; third, how artificial intelligence generates artistic creativity. Based on this, artificial intelligence art directly transforms algorithms into creative functions, which opens a new type of aesthetic judgment of human beings. This not only marks the turn of the unique aesthetic operation mode of artificial intelligence art, but more importantly, it means that media practice gives artistic form and cultural character to algorithm technology.

Keywords: algorithm, the art of artificial intelligence, artistic creativity, generation map

自現代派艺术兴起,关于艺术的定义就不断游移。在各种对艺术进行鉴别、界定和理论争斗的过程中可以发现,技术与艺术之间存在着难以分割的关系。图灵(Turing, A. M.)早在《计算机器与智能》的开篇就提出过“机器能否思考?”的问题,也宣布了人工智能(AI)时代的到来。大数据、芯片和算法成为人工智能应用的三大背景。应用智能学习算法,人工智能通过大数据剖析和机器学习来改善系统自身的性能,企图理解智能的本质,并创造出一种新的能够对人类智能做出类似反应的智能机器,处理包括言语辨认、图像识别和专家处置等智慧“容器”信息。人工智能算法的不断进化,呈现出更深入的认识论层面的思考——人工智能是否能够进行艺术创作?成为人类场景下的质询,并日渐显露出艺术的实践本性。人工智能算法首先必须是“做”——文化技术实践,而非“是”——艺术界定。与传统的认识论相比,人工智能算法典型地呈现了认识论上的“存在论化”。智能算法的技术实践是信息作为艺术和审美感受性关系的进一步融合和深化。它正以“本体化”的典型方式,更新人类的认识视域和创造认识活动。它以创造出的各种“先锋”艺术观念,证明并让我们相信:人工智能能够进行艺术创造,具有创造性,并挑战了人类艺术的创造性。无疑,在艺术的范围内,人工智能艺术创造的藩篱,颠覆了传统的艺术创作方式,使艺术创作不再只是艺术家的专利。这不仅强烈地冲击了传统艺术,也引发了人类对艺术定义的震荡。而现在,人工智能算法在不断的试错与发展中正展现出其独特的艺术创作能力。面对这种新的艺术形式,需要我们从认识论的维度重新审视技术对艺术的作用。

一、人工智能艺术在媒介实践中的出场

媒介实践是技术实践的领域。媒介依赖于一定的物质基础,决定物质特性的具体特点,也决定媒介特性的客观性。但是怎样去把握和发挥这些特性,属于人类实践活动的创造性领域。艺术实践推动技术成为艺术媒介的过程是怎样发生的?技术提供的可能性是如何产生的?艺术的影响如何经由一些经典的里程碑式的作品带来了文化的冲击?这个过程显然不是一个自发发生的过程,而是一个由艺术活动、艺术实践来推动的过程。麦克卢汉曾经提到“两种媒介杂交或者交汇的时刻,是发现真理和给人启示的时刻,也是新的媒介形式诞生的时刻”[1]。人类追求技术的不断进步,期望通过制造和使用工具代替繁重的体力劳动和脑力劳动,最终实现人的解放,而人工智能则是人类历史上第一个对人类大脑进行模仿的技术。众所周知,艺术是融合人类经验、思想与情感的创造性产物。作为人类大脑外化物的“智能大脑”——人工智能成为自动的艺术“创造者”。它借助庞大的数据库,通过对人类思维的学习,并借助计算机算法不断优化系统,创造出更多符合大众审美的艺术作品。

人工智能艺术的发展可以分为三个阶段。“初创期”可以追溯到1805年,雅克德罗(Jaquet Droz)公司的机械师美拉德特制作出一部利用发条驱动,使用英语、法语自动写作的机器。20世纪70年代,伦敦大学斯莱德美术学院成立首个人工智能艺术开发机构。随后,1973年科恩(Harold Cohen)开发自动绘画程序AARON ,利用由算法定义的想象及审美标准进行绘图。人工智能艺术早期的发展较为缓慢,大众对机器人自动进行艺术创作的方式抱有怀疑的态度。

2001年,林鸿程成功开发古典诗歌创作软件。2003年,曼扎诺·莫拉于设计并制造名为 Artsbot 的群体绘画机器人以及之后的机械动作画家RAP。这些机器人可以与其他机器人协作完成绘画。2006年,科幻小说家刘欣慈开发出每秒200行的写作软件。2009年,美国职业棒球大赛联盟季后,“StatsMonkey”完成了世界上第一篇新闻稿。这是人工智能艺术的“上升期”,也是人工智能作为艺术生产工具运用到艺术创作中的较为成熟阶段。

2010年以降,人工智能进入“繁荣期”。2015年腾讯财经的机器人写手“Dream writer”撰写了一篇名为《8月CPI涨2%创12月新高》的文章,这篇文章开启了人工智能机器人写作的热潮。2016年人工智能创造的小说《电脑写小说的那一天》,参加日本“新星一奖”的比赛;俄罗斯开发者开发的软件Prisma,利用人工神经网络技术,学习大师的绘画风格,对照片进行处理,使其看起来极具名画风格。在美国,《华盛顿邮报》上发表了 850 篇出自机器人Heliograf之手的报道。同时,在影视创作领域,IBM旗下的人工智能系统Watson,完成了一部电影预告片《摩根》的剪辑。2017年,微软小冰创作的诗集《阳光失了玻璃窗》发布。这一年还出现了根据观众反映决定剧情的互动影院,打破了观众与银幕的界限,实现了电影空间互动。2018年,人工智能绘画作品《贝拉米家族的埃德蒙德·贝拉米》(根据GAN损失函数制作)在纽约佳士得拍卖会首次拍卖。

同年,央视纪录片《创新中国》使用人工智能模拟去世配音员李易的声音。2019年,经过纽约艺术家本·斯内尔训练的人工智能Dio,学习了上千件雕塑作品,并最终设计出人形雕塑。与此同时,“非人类设计师”——深兰科技 DeepVogue服饰辅助设计系统在中国国际服装设计创新大赛中,杀出重围,夺得了亚军,并获得最受大众欢迎奖。

計算机技术最初产生的目的是立足数据研究、经济活动数据管理,而在使用过程中逐渐被改造成个人通讯的媒介。用户使用推动了计算机技术发展的方向,不仅改变了媒介的用途,也改变了媒介的实践过程。

二、人工智能艺术对技术与艺术的双重拓展

人工智能艺术推动技术本身的扩展,也扩大了艺术本身的范围。数字技术的文化生态,由人类社会对技术的态度和具体运用构成,而不是通过背后的科学原理。人类通过感受这种技术带来的文化变革,主动参与实现人的创造性,展现人的创造能力,产生新的文化成果。这一过程恰恰是人的属性的展现,使得技术本身具有了艺术的力量、伦理的维度、思想的含量。传统艺术分类标准大多从艺术语言、艺术作品的内容等进行分类,这样分类的出发点是艺术品本身的存在形态。人工智能艺术最大的突破就是消除艺术与受众的界限,实现艺术创作本体与接受客体的双向互动。从人工智能艺术的创作主体与接受客体的关系出发,可以大致分为三种类型:技术生成态的艺术、主体间交互的艺术、全感知艺术。

(一)技术生成态的艺术

图灵认为“人不过就是脑袋上顶了个计算机的肉机器而已”[2],而人工智能机器人的发展正是对人类思维的复刻与学习。这一类科技行为生成态的艺术,最初产生是作为衡量技术进步的指标。其创作的产品有艺术性,但却不是艺术行为,而是科技行为。各种算法平台,把人类的作品输入进去,通过学习,很快就能够推出很多艺术作品。虽然从人类的作品看,人工智能艺术作品与其相差无几,但其同样不是一种艺术创作行为,而是由商业行为推动的艺术创作。依照目前的技术水平,人工智能在艺术创作中还有很大的局限性,但不可否认的是,人工智能技术对艺术的参与,彻底打破了人类创造艺术的专利。智能机器人利用计算机强大的信息运算能力,通过人工输入的程序对大量数据进行筛选、运算,最后输出艺术品。其创造的初衷是模仿人类的思维,帮助人类完成大量繁琐的工作。

作为技术生成态的艺术,技术对艺术的介入是全方位的。

在绘画、音乐、文学和影视制作等艺术领域,智能机器人都可以充当艺术“创作者”。譬如,智能机器人技术在文学领域的发展可谓硕果累累,写新闻的“Dream writer”、创作小说《电脑写小说的那一天》的“星新先生”以及写诗的“小冰”,成为文学领域的佼佼者。2017年微软推出人工智能“小冰”,实验的过程是输入一张图片,通过复杂的算法,便可以输出一首与图片适配的诗歌。在绘画领域,机械手臂机器人学习某一画家的绘画风格,通过不断的学习和修正,人工智能机器人可以无限接近该艺术家的创作风格。2019年,人工智能机器人小冰学习了236位画家的绘画作品,在中央美院展出了大量与名家风格神似的绘画作品。这些作品无论从绘画风格还是色彩,都让人难以相信是人工智能技术的产物。2020年,艺术家钟愫君(Sougwen chuang)创造了自己的AI机器人道格(Doug),这款机器人可以与艺术家的脑电波数据链接起来,当艺术家和机器人绘画时,它们通过共享的知识库,以及实时的视觉和运动提示联系在一起,并与钟愫君完成团队合作的绘画创作。[3]美国工程师品达范阿曼设计的人工智能绘画机器手臂“云画家”,其通过抽象绘画方式的学习,不断提高绘画水平。在纽约还有一个“梦境”艺术体验馆,工程师将纽约几千万张图片导入数据库,让机器学习这些风景和建筑,让人工智能机器创作出自己幻想的纽约市。这些毫无逻辑的图片展示,给观众造成一种仿佛在梦幻中的错觉。音乐领域,莫扎特、巴赫等艺术家的作品一直都是人工智能学习模仿的经典之作。柯普公司曾进行过一个名为“音乐智能”(experiments in musical intelligence)的实验,在这个实验中诞生了人工智能作曲家“艾米”,它是学习巴赫作曲风格最成功的“创作者”,甚至听众很难区分出这是人工智能机器的“巴赫”音乐。人工智能将音符转化为数学符号,通过对庞大数据的分析与学习,发现隐藏在艺术作品背后的规律。帕切特的“续作者”实验就很好地证明了这一点。“续作者”通过对艺术家带有强烈个人特色的作品的学习,把握艺术家的创作世界。除此之外,虾米音乐、网易云音乐,通过收集用于个人偏好,向用户推荐适合的音乐内容,还有通过照片的上传,人工智能会根据照片的环境,定制适合该环境的歌曲。伊朗作曲家艾什·库萨(Ash Koosha)成功创作了AI创作型歌手Yona,这个AI机器人可以创造歌词、旋律、声音,并将其组合成一首原创歌曲。它的声音和歌曲具有自身独特的风格,受到广大网友的关注。它还曾在虚拟现实中开过演唱会,可以说这是艺术家利用科技创造艺术的一次成功实验。影视领域,人工智能为电影的宣传和营销提供了强大的支撑。《星际穿越》预告片投入市场之时,通过对雎书(Facebook)和照片墙(Instagram)等用户对预告片观看信息的反馈和兴趣点的收集,片方利用人工智能的数据分析定制个性化营销方案,为第二部预告片的制作提供了数据分析。IBM利用人工智能系统沃森(Watson)完成了《摩根》电影预告片的剪辑。这是人工智能技术在影视领域的初次尝试,也可以说是未来影视艺术制作工业化、大众化的初探。

对比传统的艺术创作需要艺术家结合自身经验和情感进行创作,同时艺术家的创作需要大量的精力和时间,技术生成态的人工智能艺术以科技行为进行艺术生产,对人类的审美认知发起挑战。

(二)主体间交互的艺术

主体间交互的艺术,并不是艺术的自发选择,而是可以根据人的动作和姿态做出一种反应,是重塑人机交互的过程。这类艺术形式与上文所述的“始终处于技术生成态的艺术”,在艺术创作方式上有本质的不同。它是作品和观众之间的交互,更注重艺术的互动协作。虽然在传统的艺术中,观众也可以实现心灵和经验的互动,但这种互动仅仅发生在意识层面,而人工智能艺术是直接性的、具身性的。

早在1920年,杜尚《旋转的饰版》中就应用了艺术“互动”这一想法,即观众需要站在特定的位置才能看到特定的图像。这一尝试是艺术品与观众互动的开始,之后随着媒介技术的不断演进,艺术作品的创作致力于与观众的互联、协作。以超文本艺术来看,交互与协作是其艺术生产的重要方式。“超文本就是非序列性( non-sequential) 的写作——文本相互交叉并允许读者自由选择,最好是在交互性的屏幕上进行阅读。根据一般的构想,这是一系列通过链接而联系在一起的文本块,这些链接为读者提供了不同的路径。”[4]它的合作模式主要有:续写,修改,碎片集成,以上三者的集合。[5]相较于传统写作方式,超文本写作让读者获得了更大的选择权和主动权。以目前最具代表性的超文本写作生产平台“scp维基平台”为例,这一平台创造了一种集体协作和超文本叙事的独特文学生产平台,提供了一个虚拟的艺术创作空间,为用户在写作和阅读上提供了极大的自由度。在写作方面,超文本写作又简称“超写作”(hyperwriting),用户从不同视角以及超链接的方式讲述故事,可以在其中自由地添加想要表达的内容。“SCP维基平台”,让世界各地的用户在同一主题下接力写作,在用户的不断创作中形成自身独特的艺术风格。大众的“角色”从被动的接收者转为艺术创作的主体,并将自身情感放置到艺术实践当中。这里的艺术实践需要技术人员 、平台、用户等共同协作,传统艺术家的主体地位被颠覆。在阅读方面,超文本阅读又简称“超阅读”(hyperreading),超文本阅读使用超链接将文字、图片、声音、影像、代码等与文本相连,最终通过作者的创作编织成一个庞大复杂的网络,读者在进入这个网络之后,可以从任意节点进入,自由选择不同的故事走向。譬如一部实验性的超文本小说《下午:一个故事》,不同界面的链接随意放置,这些没有逻辑的材料让读者利用自己的主观思维将其融合建构,而这部作品并没有提供一个明确的结局走向,而是将这一权力交给读者。超文本阅读将读者推向了艺术创作的主体地位,带给读者沉浸式的艺术体验。在人工智能这一技术背景下,超文本艺术构建了全新的艺术创作方式:利用超文本系统,增强观众与艺术创作的关系,将碎片化文本,交由读者创造组合,进而形成一种个人化的文本艺术。由此,主体间交互的艺术将真实和虚拟的边界完全打开,使创作者和接受者完全融为一体。人工智能艺术作品与环境也是交融的,呈现一种艺术的新的走向——艺术不是环境的装饰品、陈列品,而就是人生活的环境本身。

(三)全感知艺术

全感知艺术,即以具身性沉浸的方式将被传统艺术媒介分割的感性复归,并最大限度地释放感性。欣赏这一类艺术,各种感官是综合调动的,完全沉浸在影像提供的作品当中,同时要使用视觉、听觉、触觉等。这和传统的艺术门类比较起来可以看出不同:传统艺术是对应于某一单一感官,比如绘画对应视觉、音乐对应听觉,对感性起到一种分割;以交互沉浸式的全感知艺术,重新调动我们的综合体验,使得原来被分割的感性得以复归。

电影作为一种时空综合艺术,以艺术空间不断拓展真实物理空间。海利希曾对未来电影发展有过这样的期望“如果将电影扩展到不只是涉及味、触与闻等感觉通道,便可以消除电影与戏剧的第四堵墙,使观众迁移到一个可居的虚拟世界。”[6]“数字演员”的诞生,使很多已故演员再次出现在银幕上,为电影提供完整叙事,同时“数字演员”还可以实现大量现实演员难以完成的动作。2019年百度AI与上海电影制片产业合作,举办了童年英雄AI幻象展。这场展览的超越性在于与影片角色实时互动,体验者可以化身哪吒与龙王进行一场酣畅淋漓的对决,还可以成为各式各样的经典卡通人物,与影片中的角色互动。这个展览让观众进入虚拟世界,实现了与虚拟空间的实时互动。对比传统电影与观众之间单向传播的艺术形式,AI电影将观众置身其中,为观众提供了沉浸式的观影体验。在艺术设计领域,人工智能技术在现代展馆中有大量的运用。2011年日本东京大学広瀬谷川研究小组发明了一款展示盒,用于对文物的虚拟化展示。通过这款盒子,观众可以实现缩小、放大、旋转、全方位地观看展品。2018年,Asian Art Works 与交互艺术实验室 AMLAB 共同推出了智能体感交互艺术设计作品《水妖》。这个作品突破传统艺术设计单一的艺术感知模式,运用“视觉”“听觉”和“触觉”的联动,将观众带入充满污染的海洋深处,每一次的点击触摸,都会改变艺术自身的形态,甚至随着眼神的意动呈现出不同的状况,让观众全方位地体验海底污染的严重性。在某种程度上,“全感知艺术”最大限度地解放了感性。这种艺术始终处于流动的、不断生成的过程,永远不是固定的。它致力于观众的参与、互动,所以其作品是持续的涌现、不断的变化,每一刹那都是艺术的瞬间,但不是全部。显然,这是此前的艺术所不具有的。

从上述三种类型看,人工智能艺术的技术底层是一样的,但是人类的行为决定了艺术不同的走向,也决定了最终产生出来的作品,以及作品所带来的文化影响和冲击。人类行为构成了艺术发展的方向,也构成了在其中生存演化的生态环境。前两种类型符合基于技术原理的定义,第三种类型則是艺术对技术的赋能。这种全新的艺术门类,其基本的形态是一种沉浸式的、交互的艺术作品。这样产生出来的作品不仅在艺术上有创造性,也扩大了艺术所能产生的文化影响的范围。

三、人工智能生成艺术创作力

对人工智能艺术的研究当中,我们需要去吸收和辨析来自技术批判的理论资源,首先就是涉及对人工智能艺术的基本定义。玛格丽特·博登对人工智能有这样的界定——即“人工智能就是让人类计算机完成人类心智(mind)能做的任何事情。”[7]换言之,人工智能艺术是基于数字技术而发展出来的一种艺术形式。受到人工智能艺术独特媒介特性的影响,面对这样一个研究对象,我们需要探讨技术在其中扮演的角色,人在其中扮演的角色。尤其是技术提供的可能性,人提供的创造性,它们形成了怎样的关系?这些问题都是研究人工智能艺术必须要考虑的核心问题。技术、媒介、社会文化三者之间的关系链条不是单向的,而是一种共生关系。

以虚拟数字人的艺术创作为例,“其本质是在线社交媒体中的计算机算法,通过整合代码的方式来模拟真实人思维并生产内容。”[8]

(一)模拟人像图像数据库构建

在非结构化环境中,虚拟数字人需要完成的任务通常依靠视觉和触觉反馈。但是,人工设计融合各个不同模态的机器人控制器并非易事。尽管深度强化学习已经成功地应用于针对高维输入的控制策略学习,但由于样本复杂性,这些算法通常难以部署在实际的虚拟数字人上。米歇尔提出使用自监督来学习感官输入的紧凑和多模态表示,以用来提高策略学习的样本效率。[9]在艺术生成过程中,机器人将操作任务建模为一个有限时间的离散马尔科夫决策过程M,状态空间S,动作空间A,状态转移动力学T: S×A → S,初始状态分布ρ0,回报函数r:S×A→ R,时间T,折扣系数γ∈(0,1],为了确定最优随机策略π:S → P(A),自监督多模态表示学习的神经网络结构如图4所示:

该网络将来自三个不同传感器的数据作为输入:RGB 图像、32ms 窗口上的 F/T 读数以及末端执行器的位置和速度。它将这些数据编码并融合到一个多模态表示中,基于此,可以学习包含接触操作的控制器。这种表示学习网络是通过自监督形式进行端到训练端的。一旦经过训练,当用作用于强化学习的浅层神经网络策略的输入时,该表示就保持固定。通过自我监督来训练表示模型,从而无需手动标注。实验表明,接触的任务需要视觉和触觉的多模式反馈,此外,还进一步证明了多模态可以很好地迁移到其他新任务中。

2018年,在《英雄联盟》职业联赛(LPL)总决赛上,现场直播由虚拟数字人组成的K/DA虚拟偶像女团完成。这些数字偶像以面部动作编码系统(FACS)模拟人脸近似的表情。“如果新的后人类仍然存于象征界,那么肯定会有‘一种新的逻辑僵局,一种新的真实界”。[11]

人类的面部表情是人的情感表达媒介,因此人脸图像识别也是虚拟数字人情感识别的重要构成部分。鉴于此,可以实现“有意义的人类控制”[12]。通常情况下,人脸表情识别主要有4个基本步骤:图像获取、图像预处理、特征提取、表情分类。

首先,传感器获取人脸图像信息,并满足虚拟数字人艺术产品的人脸“跟踪”[13]条件。艺术创作者根据人类的道德、情感因素及特定的运行环境下的相关事实,提出具体的设计方式;其次,根据人脸图像的头部姿态进行矫正和图像分割的图像预处理,然后进行人脸面部特征提取。主要方法有:提取几何特征、统计特征、频率域特征以及运动特征等;最后,根据表情特征进行分类。主要的方法包括隐马尔可夫模型(HMM模型)、人工神经网络、支持向量机分类算法等。深度学习可以打破先特征提取再表情分类的传统方法,实现特征提取与表情分类的同时进行。

《CryptoPunks》(Larva Labs创建,2017)是一个加密朋克NFT收藏品系列的实验项目。该项目开发的灵感来源于二十世纪七十年代的伦敦朋克文化、威廉·吉布森的小說神经漫游者、刀锋战士、捍卫机密、以及电子音乐艺术家Daft Punk。他们试图将代码转化为形象塑造中的反建制精神符号,并用以太坊区块链的所有权证明建立一种带有专属性的存储介质,这在一定程度上激发了现代加密艺术的兴起。

这一项目是10000个像素化头像的集合,包括由24x24像素的类似人类、僵尸、朋克、猿和外星人等的艺术图像组成。每一个图像都有专有的个人资料页面,并由算法赋予发型、肤色、胡子、口红、眼镜、帽子等不同图像的组合。图像资料也会显示其属性以及所有权或出售状态。正因为这样的独一无二模拟人像图像数据库,“加密朋克”成为全球最早的NFT——可收藏的数字货币艺术品之一。不依常规、特立独行的审美观,得益于算法数据库赋予的假定个性和随机生成的特征。

(二)艺术人像的情感特征提取

为实现高效并且可靠的人机交互,一个高智能化的虚拟数字人必须具备对外界环境的感知能力,从而对后续的情感分析建模提供基础。在进行交互过程中,人的姿态一般会伴随着过程的变化而发生变化,在传达情感方面,身体的表达像面部表情一样强大。因此让机器人“读懂”人类姿态所表达的内涵对机器人准确地判断人类的情感状态也有一定的辅助作用。尽管“模仿艺术与真理相隔极远”[14],以AI技术驱动的虚拟男性和女性,在人类情感层面仍然被赋予了和人类对话的能力,获得人类的“伴侣”主体地位。人工智能框架——“小冰”,即通过手机个性化设置为其定制性格、喜好甚至三观,从而在云计算空间里与用户建立亲密情感关系。其中,满足用户需求的姿态表情识别通过对人脸面部表情以外的动作进行识别,进而来辅助判断人类的情感信息,实现互动生成。从人工智能驱动型虚拟数字人的技术研究来看,除了集成自然图像模拟以外,大多关注于语义表情和表情细节动作的生成[15]。

目前的常见方法主要是识别人们日常行为动作情感信息和姿态动作幅度、力度、节奏等时空特性的情感信息。

人工情感研究的基础是情感建模。当情感被识别之后,计算机算法对识别的信号进行分析与处理,构建情感模型并将情感进行量化,将人类的情绪模型化。目前人工情感模型的分类大致分为两类:基于设计的模型;基于任务的模型。基于设计的模型主要是模拟情感的自然发生过程,注重导致情感发生变化的内部原因。基于任务的模型主要是为了实现具体的任务,注重对自然情绪所产生的行为、表现进行模型。

人工情感模型还可细分为以下几种模型:

OCC模型:这种模型是第一个以计算机实现为目的,应用最为广泛的情感模型。它以认知评价为基础,将评价变量分为事件、主体、对象三组,再将每组变量评价为满意的和不满意的,然后将评价结果与情感生成规则进行匹配,确定当前的情感状态。

HMM模型:这种模型中有三种情绪状态(快乐、兴趣和悲伤),但可以扩充为多个。HMM模型将情绪状态认为是不可直接通过观察得到,但可以通过观察当时状态的特征来推测可能的情感状态。因此HMM模型适合观察有不同情感组合起来的混合情感。

PEACTIDM情感模型:该模型的情感产生过程基于8个抽象的功能算子(接受、编码、关注、理解、规划、意图、译码、行动)。每一次的情感生成,依次完成8个功能的循环,再通过算法结果生成相应的情感。PEACTIDM情感模型的特点即利用算法进行复杂的逻辑推理生成情感。

(三)艺术风格的图像、声音拼接算法

虚拟数字人与人进行人机交互的时候,除了要识别和理解人的情感之外,同时还需要及时进行情感的反馈,在特定的操作环境中,这样一种目标驱动,实际上以算法构建了“合作式交互”[16]。虚拟数字人通过一系列的算法技术,使用一堆冷冰冰的零部件将看不见摸不着的情感表达出来,使得人们获得类似于与人进行交互的体验。交互体验的好坏,会对人的感知造成很大的影响。如果交互体验更接近真人,且情感表达丰富,那么人们的交互意愿自然也会更强,人们会觉得这不是一个冷冰冰的机器,会有意愿与这类智能体进一步交互。虚拟数字人的情感表达方式与人类的方式相似,可以分为面部表情合成、情感语音合成以及姿态表情合成。

在虚拟数字人的开发过程中,计算机算法需要根据人面部的微几何形状、人眼模型、嘴唇及肌肉运动进行高精度的三维捕捉,同时对皮肤、头发、牙齿等人类外观进行图像建模。这些三维图像的运动对面部表情合成有重要的影响,为了避免数字人类面部表情的虚假感,还需要添加声音。“人类细微的情感包括眼神传达、凝视方向和注意焦点必须与角色的言语完全一致,人体的一切结构才呈现连贯。”[17]语音识别就好似人类的听觉系统,通过计算机语音信号的转换,虚拟数字人能够识别和理解其所提供的文本内容或者命令。一般情况下,语音识别系统由三部分组成,即语音特征提取、声学模型与模型匹配、语音模型与语言处理。

以美国爆火的虚拟偶像歌手选秀节目《ALTER EGO》为例,自2021年9月22日在福克斯电视台首播,有近285万观众观看。

与传统选秀比赛不同,选手均为算法设定的虚拟形象。在节目中,动作捕捉技术展示虚拟歌手独特的表演风格。这种表演风格对于游戏玩家来说并不陌生,KDA的英雄联盟开场秀、Travis Scot和Ariana Grande堡垒之夜的演唱表演,都是虚拟偶像的表演。节目中的虚拟人物在身体和外部空间的感知之间建立了一个拼接融合的身体图式系统。节目中人类与生俱来的肉身感知系统被重构。人类的身体、骨骼被数字虚拟等因素重新定义和改造。在这一实践过程中,计算机图形技术基于对身体的设计进行了更高层次的思考,即算法能够能动地调节和控制身体不同的姿态和运动,实现感知反射层、骨骼控制层和蒙皮驱动层的拼接协调。节目中的虚拟人通过感知环境信息来驱动身体运动和对外界的反馈,建立数字化的表演镜像。

当然,上文中提到虚拟数字人其实并没有人的主观意识和情感的参与,只是进行艺术劳动的机器人。如果用发展的眼光看人工智能艺术的发展,假设人工智能发展到强人工智能阶段,人工智能开始拥有像人类一样的意识和情感时,虚拟数字人就有能力成为艺术的创作者,艺术家的定义也将会被再一次扩展。

结语

马克思曾在《共产党宣言》中写道:“一切坚固的东西都烟消云散了”[18]这句话表达的含义,即我们生活在一个崭新的、日异月殊、不断变革的现代社会。人工智能为艺术领域带来的改变,让我们不仅看到“机器”创作者,还看到艺术的“参与者”。人类基于人工智能艺术所提供的媒介,正在进行一种全新的艺术范式的创作。具身性的沉浸和人与人之间的交互体验,亦正在引发我们对艺术、媒介、人与世界、人与万物的关系的全新思考。正如美国科普作家断言“如果能够从人脑中取得足够的信息并把它在别处精心复制,你就能创造出人们的记忆以及他们内心深处的想法和感情,等等。你将能够除血肉之躯重新塑造一个人,甚至把人的整个大脑变成计算机,这样做意味着什么现在尚难以下定论,但至少有一点是肯定的,即我们关于人类为何物的概念将永远地改变”[19]因此,基于技術媒介的人工智能艺术创作力的生成是技术实践的重要内容,是构建新的艺术形态和审美经验的重要力量,正是算法赋能实现、发展了技术中人的属性,使技术具有了艺术的高光时刻。

本文系国家社科基金一般项目“数字时代公共艺术生产研究”(21BZW074);成都理工大学“双一流”建设哲学社会科学重点建设项目“川剧脸谱艺术的数字化传播研究”(ZDJS202215);“李冰文化的影像化及世界性表达研究”(LBYJ2022-002);成都市哲学社会科学规划项目“四川网络文学中的古蜀神话重述现象研究”(2021CZ003);成都市哲学社会科学重点研究基地成都历史与成都文献研究中心一般项目“四川网络文学中古蜀神话书写的ip化研究”(CLWX21012); 成都理工大学年度哲学社会科学研究基金项目一般项目“数字时代新媒介文艺理论话语建构研究”(YJ2022-YB013)阶段性成果。

作者简介:孙婧,文学博士、博士后,成都理工大学传播科学与艺术学院副教授、硕士生导师,研究方向:数字公共艺术、文艺传媒。

注释:

[1] 马歇尔·麦克卢汉:《理解媒介—论人的延伸》,何道宽译,商务印书馆,2000年。

[2] 转引自尼克:《人工智能简史》,人民邮电出版社,2017年,第195页。

[3] https://www.xianjichina.com/special/detail_461479.html.

[4] 莱恩·考斯基马:《数字文学: 从文本到超文本及其超越》.单小曦、陈后亮,等译,广西师范大学出版社,2011年,第13页。

[5] Landow ,George P. and paul Delany,“Hypertext ,Hypermedia ,and Literary Studies : The State of the Art”, Hypermedia and literary studies,eds. Paul Delany and George P.Landow, Combridge ,Masschustts and London ,England:The MIT Press ,1991, Fourth printing ,1994.

[6] 黄鸣奋:《新媒体与西方艺术学理论》,学林出版社,2009年。

[7] 玛格丽特·博登:《AI:人工智能的本质与未来》,孙诗惠译,北京:中国人民大学出版社,2017年。

[8] 孙婧:《人工智能艺术的历史生成与“参与”美学》,《当代文坛》, 2022年第6期,第183-189页。

[9] Michelle A. Lee, Making Sense of Vision and Touch: Self-Supervised Learning of Multimodal Representations for Contact-Rich Tasks, IEEE International Conference on Robotics and Automation,2019.

[10] 此部分解釋参见清华大学、中国人工智能学会《2019人工智能发展报告》。

[11] Slavoj I ek,Disparity,London,NewYork: Bloomsbury Publishing,2016, p.362.

[12] Santoni de Sio F, Van den Hoven J., Meaningful Human Control Over Autonomous Systems: A Philosophical Account, Frontiers in Robotics and AI, No.5, 2018,p.15.

[13] Crootof R., A Meaningful Floor for Meaningful Human Control,Temp. Int'l & Comp. LJ, No.30, 2016, p.53.

[14] Plato, The RepublicⅡ, Cambridge: Harvard University Press, 1942, p.431.

[15] 张申、贾珈、王晓慧等:《基于语义维度的人脸表情生成》,清华大学学报(自然科学版),2011年第1期,第80—84页。

[16] 许为、葛列众、高在峰:《人-AI交互: 实现“以人为中心AI”理念的跨学科新领域》,《智能系统学报》,2021年第1期,第1—18页。

[17] 孙婧:《人工智能艺术的历史生成与“参与”美学》,《当代文坛》, 2022年第6期,第183—189页。

[18]中共中央马克思恩格斯列宁斯大林著作编译局译:《马克思恩格斯全集》(第四卷),北京人民出版社,1958年。

[19] 里吉斯:《科学也疯狂》,张明德、刘青青译,北京:中国对外翻译出版社,1994年。

猜你喜欢
算法
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
基于CC2530的改进TPSN算法
基于BCH和HOG的Mean Shift跟踪算法
算法初步两点追踪
基于增强随机搜索的OECI-ELM算法
一种改进的整周模糊度去相关算法
一种抗CPS控制层欺骗攻击的算法
Wiener核的快速提取算法