论Stable Diffusion算法对插画市场与审美环境的影响

2023-07-30 14:19黎雩蓉

艺术科技 2023年15期

摘要：2022年下半年，AI生成作画在中外互联网上引起热议，在年中时人工智能生成的图像还比较诡异生涩，而2022年末，运作原理高度相似的AI图像生成软件如雨后春笋般冒出，这些软件绝大多数是使用了名为Stable Diffusion的图像处理算法，这种算法接入了海量商业插画作为数据集，对数据集中插画风格的模仿能力非常惊人，该算法的功能使许多美术从业者与学习者陷入恐慌，担忧人类的美工行业可能被AI图像生成系统代替。一方面，插画师与某AI算法的支持者在版权问题上争论不休，另一方面，诸多互联网公司大量开除美工类艺术从业者，并将其美术作品输入算法中，将生产的图片应用于项目中。在商业化可能性的讨论之下，隐藏着人工智能图像生成系统的本质问题，也是美术从业者抵触AI绘画的根本原因——抄袭、剽窃这些在艺术界被唾弃的卑劣行为，在AI绘画出现后披上了璀璨的遮羞布，散发着“科技”和“未来”的光辉。近年来，AI图像生成系统在互联网快速发展，这些软件也对美术市场造成巨大的冲击，在海量系统生成图像的快消冲击下，不仅是艺术创作者的生存空间被挤占，互联的美术审美环境也受到了空前的挑战。文章从图像版权、艺术审美、生成原理等方面入手，探讨Stable Diffusion算法相较于人类创作的优劣，以及算法滥用对互联网插画审美环境的影响。

关键词：人工智能；版权问题；数字绘画；创作主体

中图分类号：J205；TP18 文献标识码：A 文章编号：1004-9436（2023）15-0-03

0 引言

从2022年8月起，在互联网插画师间引起高讨论度的NovelAI系统与先前的Medjourney成为AI图像生成争论的导火索，高完成度的画面乍一看很唬人，但都存在共同的逻辑问题。随后诸多操作原理与运行原理高度相似的软件如雨后春笋般出现，软件使用者、商业艺术家和美术学习者们所持的观点各不相同。通过实验、采访程序使用者和对消费者进行调研后，大致能从一个更理性客观的角度了解以上AI图像生成系统共同使用的算法Stable Diffusion，并且总结这个新事物目前应用存在的问题和未来发展趋势。

1 算法起源：开发初衷与原理

AI图像生成系统是人工智能话题的一个热点，目前最盛行的是Stable Diffusion（下文简称SD算法）。SD算法是Stability AI开发的一款从文本到图像的潜在扩散模型程序，它会将素材库的图片拆解后重组出新的图像。Stability AI在SD算法的发布上使用开源经营模式并获得大量的用户，目前市面上的AI图像生成软件也大多使用该算法，使用者需要遵守开源协议。开发团队的初衷是希望数码艺术工作者能使用该算法代替艺术创作前期大量的重复劳动，成为艺术创作者的新工具。

2022年，互联网上名为Midjourney的图像生成软件已经有一定的讨论度，当时它还被视为一种娱乐工具，当时艺术家们对SD算法的态度还较为乐观，生成的图像也有很高的辨识度，很多人认为AI生成的图像存在明显上限。直到更多图片作为模仿对象被输入SD算法的素材库中，人们才开始重视其中的问题。

2 优劣对比：人类艺术与算法

2022年9月，NovelAI的出现成为有关AI图像生成系统的话题导火索，在商业插画行业引起激烈讨论，该软件能模仿近5年大火的日式商业动漫风格插画，一时以假乱真，“AI绘画要代替画师了”的说法开始在网络上流传。之后，类似软件相继推出，都使用开源版SD算法作为核心程序，其中不同的图像训练集整合后被使用者们称为“模型”。生成图像仔细甄别后依然存在许多画面共性，无论开发公司Stability AI运营的Stable Diffusion软件还是个人用户线下制作模型，这些共同点广泛存在于所有SD算法生成的图像中。

2.1 SD算法的优劣

SD算法的优势是能将数据集中的已有内容拆解后重组成新的图像。使用文生图、图生图等功能时，程序会将数据集中的图片的要素拆解再生成，生成速度受硬件水平影响。同时因为设置随机值不同，虽然内容都源自数据集，但是搭配形式会多至几乎无限。尽管其中有很多图像依然存在混沌与错误，但从诸多生成品中仍能挑选出效果相对较好的图片。正如引起争议的使用者艾森，他使用SD算法生成的图像获得艺术比赛头奖这件事已广为人知，他花费了近一个月不断修改Mejourney的指令，使图像尽可能接近自己的要求，再从上百张图像中挑选出3张稍作修改后参加比赛。若在数据集中单独输入某艺术家的作品，算法也能对画家的塑造手法和风格进行简略模仿。

但SD算法也存在劣势，其与DALL-E 2等其他生成算法是完全不同的逻辑模式，尚处于类似搜索引擎的弱人工智能阶段。首先，该算法的核心劣势是不能凭空产生图片——该算法必须有庞大的图像数据集，需要人类提供数据集作为模仿的对象与素材，而大多数据集都非法爬取自互联网，无数绘画和摄影作品在作者不知情时被收集，艺术创作者們认为这是侵权剽窃的行为，这也是目前SD算法和人类艺术创作者最大的矛盾。其次，生成的随机经常导致画面的混沌，使用者需要不断优化文字指令使生成的图像贴近需要的效果，除了输入的指令之外，还要输入反指令来避免不要的东西。SD算法还常出现逻辑错误，比如扭曲畸形的手与肢体，这些错误常使图像陷入恐怖谷中。再次，该算法对图像内容无主观判断意识，生成的图像看起来精致，却没有对图像的实际理解能力，生成的图像没有思想与情感意义，没有人脑的理解与赋予。因此，生成的产物再华丽也不具有艺术品的形象性、主体性和审美性这三大特征。最后，数据集中未经人工过滤的网络数据给算法带入了人类现有的偏见，由于互联网上存在诸多带有刻板印象、性别偏见与种族主义的图像，因此这些图像在被制成数据集时，算法也会反映出这些偏见，这种情况在前文提到的NovelAI中表现得非常明显。

2.2 人类绘画的优劣

艺术家是在SD算法的普及中受影响很大的人群，很多艺术家不满自己的图像作品被用于SD算法的拼贴素材，因为其导致大众对华丽的生成品大为赞叹，而真正的作品却被淹没在华丽的电子垃圾中。具有一定审美水平的人看到生成的图像经常会认为SD算法生成的图像缺少“灵魂”，审美优势是人类独有且无法代替的能力［1］。首先是人类的绘画逻辑，画面内容的处理是仅有在物质世界有过生活经验的人才能理解的实践逻辑，比如头发与服装的区分、手指的数量和吃面的方法等，这些实践经验构成的人类绘画基础都仅属于人类。其次是形式美法则，比如画面节奏、构图美感等，都是人类主观意识中才具有的对美的理解［2］。再次，人类创意是真正的无限，SD算法的构图会更保守、更同质化，下限高上限低；而艺术家构图则更加大胆，敢于尝试，下限低上限高。最后，只有人类才有通过美术表达情感的能力和意识，无论是画面的故事性表达还是情感表达，都是人类所独有且无法复制的。

但是，使用SD算法的AI图像生成系统已经无疑对美术市场产生了冲击，而且最先受到冲击的便是数字媒体等领域。随着数字技术的进步和普及，很多年轻的艺术家更加倾向于使用更高效、精准和便捷的数字工具进行创作，而随着商业市场的扩大和从业者的增加，电子游戏等新兴美术行业对插画的需求呈爆炸性增长，但也存在从业者会迎合委托方审美而有意模仿已有风格的同质化，这种工作环境使数码插画从艺术创作逐渐转向重复性劳动，从业者们在同质化的作品中寻找不同的元素搭配，前期头脑风暴时会消耗大量的时间和精力，如果从业者在头脑风暴和概念设计阶段使用SD算法，则能省去很多重复劳动［3］。

3 现状反思：商业市场与混乱

3.1 洗稿的深入

2022年9月，一款名为NovelAI的AI图像生成软件在互联网上引起热议。作为当时热度最高的软件，却使用了侵权的图像来源和违反开源协议的收费模式，该网站运营方直言使用SD算法接入了非法图像网站Danbooru，该网站使用网络爬虫从诸多国内外社交平台上爬取免费与收费图像并上载至网站数据库。运营方的做法激怒了众多数字艺术家，其反对自己的绘画作品被用于SD算法的模仿，最终愤怒的人群破解了该网站并且提取出算法与数据集，该网站程序也被迫开源。与此同时，一些人使SD算法继续向洗稿的方向发展。2023年2月13日，斯坦福博士生张吕敏发布了SD算法使用的Controlnet插件，该插件使用者的洗稿行为变得更加直接，其整合了图像处理领域已有的景深提取、动作提取等功能，使生成图像的抄袭行为变得更加赤裸直白。

3.2 侵权的事实

2023年1月末，盖蒂图片社起诉了SD算法的开发公司，称该公司算法的训练集大多来自网上未授权的图片。大数据生成的算法必须有一个庞大的素材数据库，有研究团队提出需要注意系统是否用这些素材在生成时进行了“抄袭”或者复制，若一张生成的图片和数据库里任何图都不像，但图像却是SD算法根据其中千亿个训练参数生成，则该算法会记住并在生成时使用这些数据，就会泄漏图片隐私，同时造成侵权。SD算法自诞生起便是图像拆解重组机器，构图抄袭在美术界早已充满争议，若换成AI就合理，那对版权保护的法律将名存实亡。

不仅是插画界，许多模特也对SD算法感到不满，有模型制作人爬取了他们的写真照片并与情色图片一起投入数据集中进行训练，而生成的面容正是自己的脸，虽然图像细节存在SD算法生成的痕迹，但是这些图像对大众来说依然真假难辨，完成训练的程序普及后必会降低制作谣言的成本，形成“眼见不为实”的情况。

4 走向何方：人类创作与审美

为什么绘画从业者会抵抗生成类AI？这不是单纯的行业问题，而是这类算法的滥用会消解人的价值性，践踏尊严，切断社群信任链。国内语境经常将人工智能图像生成系统翻译为“AI绘画”，这是个不好的习惯，使用者仅是在输入指令后算法将训练库中海量图像进行组合，本质就是复制和机械拼接，生成过程不构成真正的艺术创作过程。而该算法给人类带来的最大影响是消解图像的价值性，它会使初学者陷入审美价值瓦解的茫然中。当创作的价值性被生成图瓦解，观众审美要求和精神消费价值观也会一并瓦解。猜疑链的存在使绘画市场出现鉴定AI的赛博猎巫行为，欣赏美术的欲望也会被猜疑链瓦解。若任其滥用，则视觉图像终会变成一种观众心中司空见惯且不值得琢磨的背景。

无论是绘画还是摄影，快速生成类AI的滥用都会给创作者群体和整个互联网带来严重的审美危机。很多画师表示自己在社交平台上发布作品时有很多陌生人对他们恶语相向说不如自己画的，结果这些人使用的是SD算法，这些算法支持者总以共享的名义将算法滥用对社会的危害一笔带过，在他们眼中，艺术家的画作与任何人的照片都必须被“开源共享”。有一些不懂美术的人使用AI生成的图像来鄙视攻击真正的艺术家，否定别人的劳动成果。SD算法助长了大量心存恶意的使用者，他们的目的已不仅在于取代某一行业，而是有目的地诋毁人的价值。大量难辨真假的声音、图像和难以追踪的虚假信息将严重污染整个互联网，造假犯罪都变得轻而易举。在生成图像爆炸式增加时，真正的艺术创作将淹没在信息的浪潮中，使人找不到真实有用的信息。

在由诸多对艺术创作心存恶意的人组成的社群中，“AI绘画”成为他们博人眼球与释放恶意的工具，将数据洗稿套上高科技皮囊后又在贩卖“你连机器都不如”的焦虑，该算法自从接入了非法行为起，便成了掠夺与剥削的工具。芝加哥大学开发的图像保护程序问世后，这些人又拼命诋毁该程序，在恶人眼中，有助他们偷窃肆虐即值得赞颂的好技术，阻止他们并保护知识产权的则是科技发展的阻碍。SD算法创始人Emad Mostaque称艺术从业人员在视觉传达层面建立技能隔离来垄断美术行业，声称该算法“让创作变得轻而易举”。但其滥用又提高了真正美术创作的门槛，虚假繁复的生成图像在干扰大众审美的同时会使得真正的初学者退缩，美术初学者们会为自己苦苦练习几个月却不如算法生成的图像而痛苦，仅剩对人类艺术抱有真挚追求的艺术家还在坚持。

5 结语

在生产力飞速发展且信息爆炸的时代，SD算法的出现是对数字美术行业的一次巨大沖击，在相关法律处于空白的时间，它野蛮生长并处于非常大的争议中，反对者称支持者为“强盗”，而后者称前者为“卢德主义”，这使AI生成图像成了美术界最敏感的话题之一。算法本身没有任何立场或者思想，却是锋利的双刃剑，它可以像照相机或PS软件一样成为艺术家的工具，也能成为心术不正者攻击他人的武器，它像镜子一样反映出了社交网络上存在的问题。随着数据集扩大，它相较人脑无法跨越的审美意识鸿沟也逐渐清晰，华丽的模仿与拼贴惊艳没有意义，人类的创造力和对美的追求永远是无限且自由的。

参考文献：

［1］欧文·琼斯.世界纹样［M］.周思成，译.北京：商务印书馆，2019：1-3.

［2］邢庆华.类型学视阈下的现代图案设计［M］.南京：东南大学出版社，2017：148-150.

［3］雷吉斯·德布雷，黄迅余.图像的生与死：西方观图史［M］.黄建华，译.上海：华东师范大学出版社，2014：237-243.

作者简介：黎雩蓉（1997—），女，陕西西安人，硕士在读，研究方向：数字媒体。