基于CiteSpace 的国内虚拟数字人研究领域知识图谱分析

2023-08-25 05:00
中阿科技论坛(中英文) 2023年8期
关键词:偶像宇宙聚类

靖 秋

(四川传媒学院,四川 成都 611745)

虚拟数字人是指存在于虚拟世界中,基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术打造的,具有外貌特征、表演能力、交互能力等人类特征的复合体[1]。1984年全球第一个虚拟偶像林明美诞生,2007年日本推出现象级虚拟歌姬初音未来,2016年虚拟主播“绊爱”首次在YouTube上直播。2018年新华社发布全球首个“AI合成主播”,开创了新闻行业实时音频和图像合成的先例。2021年元宇宙概念席卷全球,作为元宇宙的重要组成要素,虚拟数字人也开始受到了更多人的关注。国内虚拟数字人相关的学术论文始发表于2018年,随着市场的火热,更多的科研工作者对此开展了研究工作,产出了一些学术成果。本文以2018—2023年北大中文核心期刊、CSSCI来源期刊的110篇虚拟数字人相关论文为样本,利用科学计量法,分析国内虚拟数字人研究领域的现状与热点。

1 数据来源和分析方法

样本文献以中国知网数据库为数据的遴选平台,对北大中文核心、CSSCI来源期刊中关键词或者篇名中含有“虚拟偶像”“虚拟数字人”词汇的论文进行统计,共得到相关研究论文182篇。为了确保分析结果更为准确,经过人工识别、筛选后,共得到有效样本文献共计110篇。文献集数据截止时间为2023年5月1日。

研究使用CiteSpace6.2.R2可视化分析软件,通过科学计量方法对国内虚拟数字人研究的文献进行知识图谱解读,由于第一篇有关虚拟数字人的学术论文出现在2018年,研究中将时区跨度分割设定在2018—2023年,单个时间分区为1年。

CiteSpace是一款可视化科学文献趋势动态分析软件,可对学科发展轨迹和前沿进行系统性汇总分析[2],能够通过绘制关键词共现词网络图、聚类分析图和关键词时区图等客观地呈现出某个研究领域的热点和发展趋势[3]。

2 数据统计与分析

2.1 文献发布整体分析

图1 发文数量图

在收集的110篇有效样本中,最早的一篇论文发表于2018年,该年共有3篇相关文章问世,此后的论文数量呈现逐年上升的趋势。2019年发表了5篇,2020年增至8篇,2021年数据急剧增长为15篇,是上一年的近两倍,2022年更是达到了53篇的高峰,同比增长了253%。论文数量的变化与虚拟数字人产业的发展密切相关,艾媒咨询发布的《2022年中国虚拟人产业商业化研究报告》数据显示,2018年虚拟数字人引起市场关注,虚拟人行业的投融资金额和数量均大幅提升[4];2021年元宇宙概念火爆,虚拟数字人作为元宇宙的重要组成部分,在各大平台的曝光度飙升,同年10月虚拟偶像柳夜熙在抖音一亮相就走红全网,半年内粉丝突破800万。2022年国家政策支持文化与科技产业深度融合,鼓励虚拟人产业发展,同年1月《“十四五”数字经济发展规划》明确提出,要加强类人智能、自然交互与虚拟现实、光子与光电子等技术的研发和应用;同年2月国内知名虚拟偶像洛天依登上春晚舞台;3月播出的《“冠”察两会》节目中,“AI王冠”作为主持人与财经评论员王冠同框,为两会报道增添了科技感。

通过对2018—2023年虚拟数字人相关文献的期刊分布情况进行分析(见表1),发表3篇或以上论文的期刊共有6种,其中,《青年记者》以14篇论文的数量遥遥领先,其次是《新闻与写作》,总计发表4篇论文。其余4种期刊《人民论坛》《现代传播》《中国青年研究》《新闻爱好者》各自发表了3篇论文。通过这些数据不难发现,《青年记者》期刊对于虚拟数字人的研究投入度相较于其他期刊最为突出,发表的论文占总量(110篇)的13%。值得注意的是,该期刊专门于2023年04期中设立了针对虚拟数字人研究的专题,并且在前沿报告栏目中频繁刊登元宇宙等相关话题研究的文章。

表1 发文刊物分析

2.2 作者与研究机构分析

对文献集的分析如表2所示,2018年至今我国虚拟数字人的高水平研究作者最大发文量为6篇,有4人成果产出了3篇以上,其中喻国明6篇(北京师范大学新闻传播学院)、杨名宜3篇(广西大学新闻与传播学院)、夏翠娟3篇(中国人民大学信息资源管理学院、上海图书馆)、郭全中3篇(中央民族大学新闻与传播学院)。

表2 发文作者分析

从作者共现图谱(见图2)可以看出,虚拟数字人作为新兴研究领域,对其进行深入研究的学者并不多,发表2篇及以上相关文章的学者只有11位。该研究领域已经形成了“喻国明-杨名宜”“夏翠娟-黄维-铁钟”等研究团队,虚拟数字人研究已经初步形成有效研究团队关系,但跨学科的合作研究仍然较少,对虚拟数字人研究领域的融合发展有一定影响。

图2 作者共现图谱

对文献的研究机构共现图谱进行分析,如图3、表3所示,全国有133个研究机构对虚拟数字人展开研究,仅生成60条连线,且连线较细,网络密度为0.006 8,网络结构疏松,说明此领域研究机构仍处于较为分散的状态,研究机构间深度交流合作还较少,暂未形成较稳定的跨校、跨区域学术合作关系网络。成果产出2篇以上的机构中,绝大部分为高校的新闻、传媒、艺术类学院,排名第一的北京师范大学新闻传播学院,喻国明老师作为学术带头人,不仅在虚拟数字人方面有所建树,而且在元宇宙的研究板块也有显著的成就。

表3 高产出研究机构

图3 研究机构共现图谱

2.3 关键词分析

关键词是对论文研究内容的高度凝练和概括。通过构建虚拟数字人研究领域的关键词共现图谱,对高频关键词以及中心中介度高的关键词进行分析,能够得到虚拟数字人研究领域研究方向。在CiteSpace中,将Node Types设置为Keyword,时间切片为1年,g指数的k值为25,节点的大小按Frequency排序,节点标签显示的阈值为100,得到该研究的关键词共现图。根据图中的关键词统计发现,自2018年第1篇虚拟数字人研究文章问世以来,国内虚拟数字人研究围绕着元宇宙、人工智能、粉丝文化、数字人、虚拟现实、媒体融合、二次元、洛天依等关键词进行深入探讨与分析。关键词词频在3次及以上的关键词如表4所示。

表4 高频关键词

此外,中心中介度能够反映一个关键词在整个共现网络中的“媒介”能力[5]。关键词的中心中介度越高,表明该关键词在整个关键词共现网络中位置越重要,其对共现网络的影响也越大[6]。由表4关键词对应中心中介度数值可知,除去检索词“虚拟偶像”外,元宇宙是该知识图谱中具有强关联性的关键节点,可在后续研究中重点关注。

使用对数似然比(LLR)算法对关键词进行聚类,图4显示了关键词聚类的结果,将聚类生成的10个标签详细信息列为表5。聚类结果是否可信需要以来模块值Q(Modularity Q)和平均轮廓值S(Mean Silhouette)两个指标来进行检验,Q值大于0.3且S值大于0.5的聚类结果被认为是合理的,S值大于0.7的聚类结果被认为是十分可信且高效的。此次聚类显示,Modularity Q值为0.701 2,网络聚类结构显著,Mean Silhouette值为0.972 1,聚类可信度非常高。结果显示,聚类前10名的关键词分别为元宇宙、消费主义、数字人、人工智能、身体、设计策略、虚拟身体、赛博格演员、CG技术。

表5 关键词聚类前10

图4 关键词聚类图

通过对比分析研究文献的关键词共现与聚类分析,全面深入地梳理了2018年以来我国虚拟数字人的研究内容,并将其归纳为以下六大类:

(1)虚拟数字人与各类业态的融合发展。随着元宇宙概念的兴起,作为率先落地的应用场景之一,虚拟数字人正在各个细分赛道加速渗透,不断破圈,重塑产业格局[7],此类研究介绍了虚拟数字人在文旅、图书出版、各类媒体、综艺节目、影视短剧等业态中的应用与发展。

(2)虚拟数字人的文化探讨。学者从二次元文化、数字亚文化尤其是青年文化等角度,探讨了虚拟偶像对其的影响。虚拟偶像折射出当代青年独特的文化心态和“意义世界”,是青年群体心理、精神需求、生活方式、行为模式及价值观念的复合体[8]。作为一种由数字技术、二次元文化和粉丝文化交互催生的抽象文化产品,虚拟偶像为青年群体的自我表达与文化姿态构建出一个创造自由空间、保存和建立自身意义储备的场域[9]。

(3)虚拟数字人的发展历程、未来趋势与方向。代表性的文章有《虚拟数字人发展的现状、关键与未来》《虚拟数字人的进化历程及成长困境——以“双重宇宙”为场域的分析》《何以为人?——AI兴起与数字化人类》等。

(4)虚拟数字人的政治、经济、法律、社会伦理问题。此类研究探讨与厘清了虚拟数字人的法律性质、“表演”著作权、广告代言规制、产业资本逻辑、数智领导力等问题。

(5)虚拟数字人的设计与技术。此类研究从设计与技术角度,探讨了虚拟数字人的审美特征、设计思路、表现形式以及手势生成模型、人机交互技术等在虚拟数字人中的应用。

(6)虚拟数字人的消费主义粉丝文化。人工智能虚拟偶像以虚拟表演形式满足着受众的文化消费需求[10],在后现代消费主义粉丝文化狂潮下,偶像粉丝生态呈现拟象化趋势,为虚拟偶像的兴起提供了文化土壤[11],此类研究着眼于虚拟偶像与粉丝的互动关系、粉丝群体的身份认同、虚拟偶像的粉丝经济等方面。

2.4 研究前沿突现分析

CiteSpace软件可以通过关键词突现识别某个领域的研究前沿,主要原理是以关键词出现频率为基础,根据关键词出现频次的增长率来确定热点词汇,从而以热点词汇与时间之间的关联特点来确定研究前沿[3]。如图5所示,从2018年至今,国内虚拟数字人领域研究共有4个突现词,分别为二次元、粉丝文化、消费主义和洛天依,首次出现年份为2019年、2020年,结束年份是2020年、2021年。进一步结合关键词的研究时间线(见图6),可将国内数字虚拟人的研究分为两个阶段:

图5 2018—2023年最强突现词示意图

图6 关键词时间线

第一个阶段为2018—2021年。《2022年中国虚拟人产业商业化研究报告》将虚拟数字人分为3种类型:虚拟主播类、数字员工类、虚拟偶像类。本阶段的研究对象主要为虚拟偶像,研究方向围绕粉丝文化、二次元文化、消费主义、粉丝经济等方面展开。

第二个阶段为2022年至今。2021年9月北京师范大学新闻传播学院教授喻国明发表了《未来媒介的进化逻辑:“人的连接”的迭代、重组与升维——从“场景时代”到“元宇宙”再到“心世界”的未来》,从此元宇宙正式开始被国内新传、图情、教育等各大领域研究者关注并展开了系列研究[12]。作为元宇宙核心组成要素的虚拟数字人是技术集合体,得益于多项基础技术的快速发展,虚拟数字人及其产业进入加速期[1]。此阶段学者将研究对象从虚拟偶像扩展到包含虚拟主持人等更广义的虚拟数字人,研究重心也变为在元宇宙这一背景下,探讨数字虚拟人在游戏、品牌营销、媒体融合转型等场景的应用。

3 研究结论

本研究以CiteSpace为研究分析工具,基于知识图谱可视化分析方法对国内虚拟数字人研究进行分析。研究结果表明,国内虚拟数字人研究领域从2018年开始,文献发文总量呈上升趋势,2022年爆发性增长。目前研究团队初步形成但数量较少,研究成果分布不太均衡,高校对该领域研究重视程度相对较高。2018—2021年学界以虚拟偶像研究为主要研究对象,2022年开始更倾向于在元宇宙的背景下对数字虚拟人进行探讨。研究内容围绕虚拟数字人的文化探讨,虚拟数字人的发展历程、未来趋势与方向,虚拟数字人的政治、经济、法律、社会伦理问题,虚拟数字人的设计与技术,虚拟数字人的消费主义粉丝文化等方面展开。

猜你喜欢
偶像宇宙聚类
偶像报
宇宙第一群
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
这宇宙
我的偶像
出卖偶像
一种层次初始的聚类个数自适应的聚类方法研究
偶像们都恋爱了
自适应确定K-means算法的聚类数:以遥感图像聚类为例