“深度伪造”技术的法律风险及其协同治理研究

2021-01-03 19:42王惠敏蔡士林

科技管理研究 2021年11期

关键词：深度

王惠敏，蔡士林

（1.江苏师范大学法学院；2.中国矿业大学人文与艺术学院，江苏徐州 221116）

1 问题的提出

习近平在世界人工智能大会上指出：“在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术驱动下，人工智能呈现深度学习、跨界融合、人机协同、群智开放、自主操控等新特征，正在对经济发展、社会进步、全球治理等方面产生重大而深远的影响［1］。”“深度伪造”技术便是人工智能社会进化过程中的缩影。“深度伪造”（Deep fake）是“深度学习”和“伪造”两个词的合成语，主要指对图像、视频和音频进行超现实的数字伪造［2］。“深度伪造”通过操纵先前存在的视频片段或图片可以描述从未发生过的事情。例如乔丹·皮尔在短片《奥巴马的“深度伪造”》中利用了过去链接地址的真实视频进行剪辑而创建了一个全新视频，将自己想说的话借助奥巴马表达出来。又如2019 年，脸书上流出美国现任总统特朗普批判比利时气候问题的假视频［3］。之前德国的研究团队就曾因为制作多国领导人的虚假视频而被控诉［4］。针对此种情形，美国国会就“深度伪造”可能带来的国家安全和个人隐私问题曾举行过多场听证会。无独有偶，我国近期出现的“杨幂换脸”事件首次将“深度伪造”拉入国人的视野中来，后来在APPStore 中出现了包括“ZAO”“AI 换脸”“FaceApp”等多款应用程序则是将“深伪”变成舆论的焦点。

随着“深度伪造”技术被广泛运用，其犯罪边界问题逐渐成为互联网讨论的热门话题，尤其在大数据时代，个人信息的价值日益凸显，此类纠纷必然也会越来越多［5］。遗憾的是，当前理论界就法律与“深度伪造”技术的关系议题投入了一部分的精力，并取得相应的研究成果，但基本上都以宏大叙事的方式展开，并未准确理清二者的内在联系。随着当下时代从“技术就是生产力”到“知识就是生产力”再到“信息就是生产力”的转化，以及云计算、物联网和大数据的应用与发展，个人信息成为大数据时代的重要财富［6］，“深度伪造”的技术风险也日益凸显，因此，探究该技术的治理路径，不仅有利于“深度伪造”行为法律规制问题的研究更具有情景化效应，而且也益于公民和国家法益的针对性保护。本文拟从“深度伪造”的技术原理出发，分析其法律风险，并在此基础上探寻治理路径。

2 “深度伪造”的技术原理与主要类型

在回应“深度伪造”技术治理路径这一命题时，首先需要我们清晰勾勒出其技术原理和特征，因为这些技术关键点不仅直接影响甚至是决定未来法律发展的走向，而且还为法律变革提供了技术参数。诚如周佑勇［7］教授所言：“智能时代到来，我们必须深刻领悟其背后的技术载体和基础，否则一切的法律变革都会成为自说自话的文字游戏。”

2.1 “深度伪造”的技术原理

本世纪初，图像和音频识别迎来了大数据时代和复杂模型时代。一方面，计算机的运算能力继续提高，研究人员能够尝试计算更大的复杂模型；另一方面，数字化摄影技术深入改变了人脸图像的获取手段，极大降低了人脸图像的获取成本，使得大数据的识别算法成为可能。自摄影技术诞生，人类便致力于寻找操作或控制媒体介质的方法，最早可以追溯至19 世纪60 年代。典型例子便是拉罕·林肯的肖像，这张照片实际上是林肯头部和约翰·卡尔霍恩身体的照片的结合［8］。由此可见，利用诸如多次曝光和组合印刷等技术对图像进行修改早已不再是“独门秘籍”，而后来Photoshop 软件甚至可以改变图像实质结构，实现摄影艺术家的夙愿。“深度伪造”技术的关键是使用“神经网络”（Neural Network）进行机器学习。神经网络初期以节点网络为特征，而节点网络是由一组随机设定的数值标准控制。正如经验可以细化大脑的神经节点，实例可以训练神经网络系统一样，如果网络处理大量的样本，它就可以创建越来越精确的模型。例如，华盛顿大学的研究人员曾用前总统巴拉克·奥巴马的一段视频来演示这项技术，使人觉得他说了一些无法理解的话［9］。就其本身而言，借助神经网络方法的机器学习将预示着创建假图像、视频和音频的能力的升级。

“深度伪造”技术的兴起主要得益于“生成式对抗网络”（GAN）和“卷积神经网络”（CNN）。GAN 同时使用了两个神经网络，一个称为“生成器”的神经网络利用数据集生成一个模拟数据集的样本，主要负责基于底层图像数据集生成样本输出（例如图像）；而另一个称之为“鉴别器”的神经网络主要负责基于真实的目标图像对“生成器”生成的伪造图像进行验证和评估［10］。这两个神经网络以迭代的方式生成逼真的“作品”，逐渐接近原始数据集中的图像。“深度伪造”中算法之间进行对抗式训练，提升彼此的速度以便生成高度仿真的虚假图像或视频。GAN 技术的日益优化，无疑会出现一系列极具说服力且难以揭穿“产品”。而CNN 是一种专门处理具有类似网格结构的数据的神经网络，例如时间序列的数据（可以视为在时间轴上有规律地采样形成的一堆网络）和图像数据（可以视为二维的像素网络）。这是第一个通过自动学习卷积核的人工神经网络系统，具备CNN 最基础的性质。此种卷积网络结构共分为七层，一个输入层、两个卷积层、两个子采样层、一个全连接层和一个输入层［11］。

2.2 “深度伪造”技术的主要类型

2.2.1 视频伪造：AI 换脸技术

应当说，视频伪造是“深度伪造”的代表，同时也是社会治理上的重灾区。视频伪造也被称之为“AI 换脸技术”（AI Face Swap），该技术的运行原理是通过GAN 抑或者CNN 等算法将目标对象的面部“缝合”到被模仿的对象上［12］。人工智能、机器学习和生成式对抗网络都是用户创建“深度伪造”的工具。例如，红迪网匿名用户使用“张量流图”（Tensor Flow，简称TF）将盖尔·加朵的脸和其他名人的脸移到色情视频中色情明星的身体上［13］，而关联性的图片皆是由Google、YouTube 等开源数据库中获取。这种转换（面部替换）的实现都得益于“深度学习”，由相互连接的节点组成的网络，这些节点会自动对输入数据进行自主计算，因此受害者的脸及其各种角度和位置都跟随着视频中的身体。详言之，将模仿人物的视频逐帧转化成大量图片，然后将模仿对象面部替换成目标对象面部，最后将替换的图片借助深度学习技术自动完成伪造视频替换。

2.2.2 音频伪造

过去音频伪造的主要方法是创建一个大型数据库，其中包含来自源的声音片段，然后将这些片段组合并重新排序，以生成模拟语音。为了降低制作门槛和成本，满足艺术尤其是电影业的发展需求，众多科技公司将“深度伪造”技术的研发提上日程，诸如谷歌的“深层思维”部门（DeepMind）“Wavenet”模型、百度的DeepVoice 模型和GAN 模型。蓝鸟公司（Lyre bird）曾发布了一些简短的音频剪辑，用以模拟巴拉克·奥巴马、唐纳德·特朗普和希拉里·克林顿对“深度伪造”技术的讨论。就音频而言，GANs 使用神经网络学习并再现源的属性，并以毫秒为单位对语音进行模型构建。当这个经过处理的音频与一个由GAN 创建的视频结合在一起时，其结果是此视频的外观和声音都与另一个视频高度相似。但实际上这一“深度伪造”行为是用机器学习算法创建的，使用容易获取的材料和开源代码，任何具有深度学习算法工作知识的人都可以把它们放在一起［14］。人工智能时代，民众获取信息和数据的门槛被各种应用程序拉低，各种傻瓜式的操作备受追捧，故而只要相关材料对公众开放，任何一个拥有相关技术知识或使用应用程序的人都可以利用它们来创作任何他或她想要的东西。这也从侧面解释了“深度伪造”技术可能异化为危险源的缘由。

3 “深度伪造”技术的法律风险

“深度伪造”技术在形塑创新型社会的同时，也携带着内在的法律风险因子。事实上，对法律风险给予必要关注，既是有效保护人类法益的需要，也是确保新技术良性发展的要求。

3.1 个人数据风险系数骤增

随着信息技术的发展，数据处理（传输、共享、储存、计算等）成本快速下降，数据开始从简单的信息代码演变为一种资源［15］。特别是在数据挖掘和网络爬虫的技术加持下［16］，大规模处理个人信息正逐渐成为一种广泛存在的经济现象，这推动了经济的发展和社会的进步，但是也给公民自身带来了不可避免的麻烦［17］。具体原因可以分为以下两个方面。

第一，个人信息（自决）权形同虚设。个人信息权是指信息主体依法对其个人信息所享有的支配、控制并排除他人侵害的权利［18］。无论是理论界还是实务界、国内抑或域外几乎都异口同声地强调大数据语境下法律应当着力维护信息主体的权益。尽管在权利属性上可能存在分歧（“隐私权”“财产权”“新型权利”等），但绝大多数学者都认为数据或信息国内和跨境流通需要事先征得信息主体的同意，这被认为是个人信息权的基础。从形式上看，这种“同意”机制似乎为防止个人数据的滥用提供了保护罩，如此一来“深度伪造”的不正当性概率就会降低。事实上，将事前同意作为个人信息自决权的关键既不现实也不科学。一方面，虽然各个网络平台都相继设置了使用前的“用户协议”或“提示条款”，但其内容繁杂，且字体较小，短时间内用户难以理解内容的真实含义，而若要继续就必须选择“同意”。另一方面，信息主体对于个人信息的控制力也相当薄弱。以“深度伪造”中的“换脸视频”为例，换脸需要A和B两组数据模型，而模型的构建有必须以彼此真实的视频和音频作为“深度学习”和计算的对象［19］。如果信息主体对于个人信息真实的强控制力存在，那么“深度伪造”的作品应该是主体所许可或同意的，自然不会出现是所谓的“色情产品”。实际上，个人信息名义上归属于个人，但是其依赖的存储路径是服务器和终端设备，信息主体的占有权大打折扣。概言之，信息主体对于个人信息控制和决定权的虚化为“深度伪造”的蔓延提供了条件。

第二，并未划定数据控制者和管理者的责任。大规模数据的共性分析不仅给信息控制者带来可观的商业利益，也直接改善了消费者（信息主体）的生活和工作环境，带来了快速迭代创新等便利［20］。获得信息红利的互联网数据控制者内在隐藏着一种抵牾情绪，不情愿在数据或信息审查上投入过多的成本。一方面，我国的互联网发展处于上升期，单纯依靠数据控制者去消解内部和外部风险超出了企业的心理预期。不可否认，近年来我国积极推进个人信息保护法的立法进程，例如《刑法修正案九》增设了“侵犯公民个人信息罪”，但是依旧缺乏系统和全面的个人信息保护规范。此种背景下，既存条文对于数据控制者的责任规定过于原则，且注重追究刑事责任，这无疑为互联网企业规避行政和民事责任塑造了侥幸心理［21］。另一方面，我国法律对于个人数据管理者的权责界定不明，容易出现互相推诿的情形，这给风险的出现预留了机会窗口。作为互联网管理的专门性机构，国家互联网信息办公室在制度安排上强调网络信息内容生态治理需要政府、企业、社会、网民等多方主体参与，共同构建良好的网络生态［22］。但是在具体的内容设计上却更多论证互联网平台、网络信息内容生产者以及使用者的义务和责任，例如2020 年施行的《网络信息内容生态治理规定》第3 条规定：“国家网信部门负责统筹协调全国网络信息内容生态治理和相关监督管理工作，各有关主管部门依据各自职责做好网络信息内容生态治理工作。”对于监管的内容、方式等具体细节并未详加说明，且其他主体的责任规定占整个条文内容的60%以上。

3.2 女性名誉和财产权备受冲击

在科技人士畅谈深度伪造可能带来的技术“红利”时，我们更应该谨慎对待可能由此引发的法律风险。“深度伪造”的学习功能和算法特征的叠加提升了女性权益的受侵害风险，而自媒体时代则进一步促成了不可控局面的形成。

第一，侵害女性的名誉权。客观层面而言，名誉就是他人对自己的看法；主观层面而言，则是自身对于他人看法的顾忌［23］。女性名誉体现为一种间接性的关系价值，也即当他人的观点或者看法足以影响自己生活时，这种评价才会被重视［24］。人是社会性的动物，女性在一个分工精细化的文明社会中，其大部分事情的完成都需要他人的协助，而在这种关系链中，他人对自己的评价就变得异常重要。女性名誉受到侵害不仅使其自身遭受精神痛苦，而且还会蔓延至工作、教育等多个环节，最终摧毁原有的良好社交关系。

第一次真正意义的“深度伪造”出现在Reddit的R/CelebFakes 版块，该版块“主要致力于将名人ps 成裸照。”例如2017 年9 月30 日，用户“deepfakes”发布了一张女演员麦茜·威廉姆斯的虚拟脸，并制作了相关的性爱视频。用户开始根据彼此的数据集建立更有说服力的面部表情交换模型。尽管后来麦茜·威廉姆斯向该网站成功提出索赔，但仍未阻止相关伪造视频的传播，并且因此患上抑郁症。诚如有学者所言：“人工智能技术的推进，使得不被遗忘成为一种新常态，女性名誉的受损风险指数上升［25］。”“深度伪造”的设计初衷与色情密切相关，许多伪造者会选择制作女性的色情视频。加之该技术操作简单，使用者迅速增多，伪造的内容自然也是千奇百怪，而相应的受害对象也从最初的女明星发展为普通女性。例如诺埃尔·马丁多年来一直是深度伪造的受害者，匿名者把她的脸ps 到其他人的色情照片上。后来攻击升级，伪造者把(她)修改成色情视频，似乎显示(她)进行了多次性行为［26］。此种语境下的“深度伪造”俨然已经成为对女性名誉攻击的工具。实际上，只需要“一两个他们想要伪造的面孔的高质量视频”，任何人都可以利用Fake APP 制作女性性爱视频。上述侵害形式与我国《民法典·人格权编》中关于名誉权构成要件相吻合，此外《妇女权益保障法》第39 条也规定：“妇女的名誉权和人格尊严受法律保护。禁止用侮辱、诽谤、宣扬隐私等方式损害妇女的名誉和人格。”

第二，危及女性的财产权。由于“深度伪造”背后的算法技术日渐成熟，它对于女性权益的侵害就变得简单和不易识别，“色情报复”便是典型代表。色情复仇，也被称为“非自愿色情”或“非经双方同意的色情”，指“在女性不同意或不知情的情况下，传播其的色情照片或视频，目的主要在于以此向对方勒索财物［27］。”“深度伪造”的兴起，使得图片和视频都有可能被“ps 成性爱”，女性自然成为大部分虚假性爱视频的受害者。事实上，一些社交媒体用户已经表示有兴趣在自己的生活中与各种各样的女性进行“深度伪造”。例如澳大利亚的高中生艾娃喜欢将自拍照片上传到Instagram 去记录和分享生活，然而却被他人通过“网络爬虫”的方式窃取并伪造成性爱视频发送给她。伪造者向其索要财物并声称，如果不支付足够的财物，就将视频公之于众。遗憾的是，在她向司法机关求助无望的情况下自杀身亡［28］。

由于技术的通用性，“深度伪造”得以在任何常规视频的环境中使用，而这对于女性来说无疑是一场灾难。有统计数据显示，“深度伪造”出现以来，针对女性的敲诈、勒索、恐吓等数字显著攀升［29］。本文认为可以归结为3 个方面的原因。其一，现实生活中女性仍然属于弱势群体，当无法证明视频实际上是伪造的，她们会处于恐惧状态且多数情形下会选择沉默，故而容易成为受侵害的对象。其二，“深度伪造”技术的盛行会导致真实视频的价值就会降低。正如有学者指出，试想如果伪造视频不能被信任，那么就需要一个确证的视频来揭穿另一个“深度伪造”是被篡改，而这无疑使本应得到证实的证据得到认可的成本变高［30］。时至今日，视频一直是一个相对可靠的信息来源，但是，一旦“深度伪造”变得更受欢迎，任何视频的价值——无论是真的还是假的——都必然会下降，因为没有可靠的方法来确定视频是否被操纵。其三，对于女性权益保护的法律途径并不畅通。法学界认为，“深度伪造”行为的女性受害者几乎没有法律追索权，因为法律对受害者可起诉的对象进行了限制。由于互联网上普遍存在匿名性，如果一位女士受到“深度伪造”的伤害，却找不到视频的创作者，那么她可能就没有可识别的起诉对象。例如美国《通信规范法》授予网站对第三方内容的索赔豁免权，我国《民法典》也并未强化互联网运营商的注意和监管义务。故而，法律并不支持受害女性起诉一家社交媒体网站所上传“深度伪造”视频或音频的行为。

3.3 大众知情权和表达自由受限

自20 世纪40 年代提出知情权概念后,知情权很快成为新闻传播学中的核心问题,也成为法学研究的重大课题［31］。所谓知情权其基本含义是公民有权知道他应该知道的事情，国家应最大限度地确认和保障公民知悉、获取信息、尤其是政务信息的权利［32］。在信息成为生产要素的信息时代，网络知情权意味着国家应最大限度地确认和保障公民知悉、获取政务和本人真实信息的权利。表达自由亦称“言论自由”，指公民依法享有的，以合法方式发表、公开、传播客观事实信息或个人主观意见的自由权利［33］。“深度伪造”技术的运行逻辑仿佛一台谎言机器，加之网络介质的传输特性，顷刻间赝品便被传递到世界的每个角落［34］。

大众知情权和表达自由从立法规范转化为具体权利的内核是什么，这直接关系到两项权利能否落地的关键。本文认为，知情权和表达自由都是将民众纳入政治主体作为终极目标，完成监督公民身份的形塑。一方面，民主制度的历次变革和推进都将民众权利义务嵌入其中进行建构，无论是英国的“光荣革命”所创立的君主立宪制抑或是我国的“辛亥革命”建立的共和政体都佐证了这一点。另一方面公民从现代国家主权下的法律身份向积极参与政治、公共领域的对话和对共同体的一部分渐变和进化。显然，“深度伪造”技术堵塞甚至摧毁了现代国家公民间、公民与国家的对话通道，遮蔽了民主前行的“眼睛”。

具体而言，“深度伪造”借助于“网络爬虫”等技术将零散的图片或视频从网络中抓取并筛选出来，然后进行剪辑和拼装，最后在自动编码器和卷积神经网络的加持下，制造出以假乱真的“产品”。在既存甄别技术条件下，民众不可能精准辨识，伪造的事实也基本上是博人眼球为原动力，而一个信息越是被关注，谣言就越有可有能会产生。因此，特殊的环境会提升公众对相关信息的关注度。如果一个群体处境危险，或处境困难，群体中的许多成员可能比较易怒，并且容易责备他人。当危机出现，或可怕的事情发生，“深度伪造”就不可避免了［35］。例如新型冠状病毒疫情期间，就有网络用户利用该技术伪造出子虚乌有的事实。此种语境下民众的知情权便被削弱甚至剥夺，信息流动的路径会被新伪造的通道置换，出现所谓的信息障碍和信息不对称现象。由于源头的信息错误，民众接受和二次传播的信息必然也存在重大瑕疵，而在此基础上产生的评价性观点以及社会舆论也随之偏向，可能形成民意与司法的对抗或撕裂［36］。

4 “深度伪造”技术的协同治理

越来越多的国家跳出了传统以技术维度为主解决“深度伪造”技术的问题框架，开始将其纳入社会治理的范畴以实现综合治理，例如美国通过自上而下的审慎规则，欧盟选择主动出击的形式应对危机。本文认为，立足国情，我国应当选择协同治理模式，构建“三位一体”的治理路径，将包括法律、技术、平台义务等在内的三个方面纳入其中。

4.1 法律层面：不宜扩大既存的违法犯罪圈

面对以“深度伪造”技术的代表的生物特征识别技术的渗透式发展，有学者认为其已经触及到公民个人信息权的内核，而现存的评价体系存在两种缺陷和不足：其一，对深度伪造的规制仅旁敲侧击，是一种“两头重、中间轻”的模式；其二，无法完美应对生物识别信息的滥用，主要原因在于并未深刻领悟“深度伪造”技术独立的危害性后果，而习惯于与其他犯罪现象绑定规制［37］。应当说，这是一种较为激进的观点。

一方面，对于“深度伪造”技术的规制，既存的法律体系同样具有层次性和梯度性。之所以认为我国对于“深度伪造”的规制不足，主要理由是域外国家和地区都进行了相关立法。例如美国2019 年的《深度伪造报告法案》《关于制作虚假视频意图影响选举结果的刑事犯罪法案》等都通过立法直接表明了惩治的立场。就立法层面而言，不可否认美国和欧盟都通过不同的立法方向去规范“深度伪造”技术的发展，但这并非意味我国的出路就是“照搬照抄”。我国近年来颁行的《关于办理利用信息网络实施诽谤等刑事案件适用法律若干问题的解释》《App 违法违规收集使用个人信息行为认定方法》《网络信息内容生态治理规定》《网络视频信息服务管理规定》《民法典》《数据安全法》等已经可以实现对于类如“深度伪造”的人工智能技术规制的理论供给。有学者认为，从黑色产业链的角度来看，我国对于“深度伪造”技术的法律规制缺乏中游（中端）行为的考量。实际上，就“深度伪造”技术本身而言，可以分为：信息的获取（上游行为）、算法的加工（中游行为）、伪造音频或视频的发布（下游行为）。如果但就中游行为而言，我们无法准确判定其动机或意图，故而不能直接法律介入。当然这并不意味着前端行为的于法无据，上述法律及司法解释对非法获取信息或数据的行为同样可以规制。与此同时，我国在向技术创新型国家转变的过程中，需要给予新技术以正确的引导，而非一味地推崇“技术未动，惩罚先行”的思路。

另一方面，“深度伪造”本质上是中立性技术，需要其他危害结果来充足构成要件。有学者从全面和从严保护个人生物特征识别信息的角度出发，认为既存的法律无法解决“合法获取+非法使用”类型的“深度伪造”，因此倡导修改招摇撞骗罪和增加专属性罪名两个途径［38］。通常刑法以实害结果作为行为规制的主要对象，而针对重大法益的则通过具体危险和抽象危险予以，这在本质上属于预防性刑法。事实上，预防性犯罪化的立法应当受到“重大风险”“预防风险”“完成危害”与“可归责性”等四项要件的限制，否则会造成严重的过罪化［39］。而我国学者提出的招摇撞骗罪或者盗窃罪都属于传统的罪名，所以不能犯罪迁移，仍然需要维系构成要件的完整性和充足性。概言之，无论民事、行政抑或是刑事领域，既存的法律体系都有能力实现对“深度伪造”技术的引导和规制，满足基本的理论供给。

4.2 技术层面：“自证”+“它证”结合

4.2.1 要求“深度伪造”制作者标识作品属性

一方面，由于“深度伪造”技术操作日益简单化，譬如通过FakeApp、ZaoApp 以及FaceApp 等便可完成伪造，所以使用者迅速增多。例如2019 年iOS 商店向中国用户推出一款名为ZaoApp 的面部交换应用程序，通过使用手机上的自拍照可以逼真地更改角色脸部，结果3 天之内占据应用程序下载量榜首［40］。另一方面，伪造的内容自然也是千奇百怪，而相应的受害对象也从最初的明星发展为政客，甚至是普通民众。例如一段假视频中显示倡导控枪活动人士艾玛·冈萨雷斯撕毁了一份宪法。实际上，在最初的视频中，冈萨雷斯撕毁一张大纸，上面画着普尔塞夫的靶子，但有人为了煽动性的目的篡改了图像。申言之，“深度伪造”技术的滥用呈现出一种分散、随机和难以主动监管的特征。如此一来，就需要构建一种全新的作者声明义务体系，将其与真实作品进行有效区隔。为了不阻碍“深度伪造”技术创造社会效益，不宜对制作者设置过高的义务，故而只需要遵循两项基本要求：其一，伪造者在图片或视频的醒目位置以水印方式标注作品系“深度伪造”，同时在伪造音频的开头和结束部分特别说明作品属性；其二，伪造者在作品的传输、共享等过程中向他人或平台履行提示义务。要求制作者标识作品属性，为减少“深度伪造”内生性风险提供了支持。

4.2.2 合作研发检测性时间戳工具

“深度伪造”是人工智能技术与视频、音频处理技术的完美结合，它不是第一个，也必定不是最后一个。我们现在需要一种技术对其进行反制，以便在失控的情形下可以减小危害。互联网时代的信息扩散呈指数级增长，故而一种快速发现“深度伪造”和普遍有效的方法将有助于解决这一紧迫的公共政策问题。应当说，这种破解技术需要紧跟深度伪造技术的创新才可能实现目标。倘若这种技术存在并可以通过社交媒体平台部署，上述系统性危害将会减少。最近有科技公司力图创建验证伪造内容的证据系统进而快速确认信息源的可靠性。但是需要说明的是这些系统一般是针对特定的伪造产品，无法惠及整个视频或音频，其适用范围自然极其有限。

本文认为，此种情形下应该考虑开发低成本的时间戳工具，而不必期望内容具有内部认证。时间戳是指在服务器为每一个区块加上的时间序列，记录了该区块的产生时间，采用了Unix 的时间计数方式，一般会精确到秒。时间戳的存在，使得区块上的信息得以保存，而且可以作为交易证明的一个很重要的信息。因为时间戳是写入到区块中的，同时在计算哈希值的过程中会将父区块的时间戳纳入进行哈希散列，从而形成了对前一个时间戳的“增强”，而区块一旦被链接上区块链，就会成为全网所有节点的“公共账本”，很难被篡改［41］。目前，部分生成内容的语音和视频记录设备的制造商已经开始尝试使用各种时间戳工具，这些时间戳工具将元数据附加到特定设备创建的图像和视频上。该元数据可用于检测某个文件是否已随时间修改。

“深度伪造”技术滥用的受害者是信息主体，不是信息控制者，故而信息控制者很难有充分的激励与能力保护个人数据，只是被动的应付法律要求［42］。加之，时间戳工具的研发成本高昂且技术复杂，所以无论国有还是民营企业都不情愿加入这场技术和资金的角力中来。为了提高民营科技公司和高校的参与积极性，可以给予适当的税收优惠或者成果利用上的补贴［43］，考虑吸引可靠且具备相当科技实力的民营企业和高校加入共同研发队伍。例如我国的华为公司，在移动通信、芯片研发等多个领域都享有盛名，国家完全可以邀请其共同参与研发时间戳技术。公私合作共同研发检测性软件，为辨识“深度伪造”技术的生成物提供了可能。

4.3 平台层面：阶段化管理常态化

“用数据说话、用数据决策、用数据管理、用数据创新”俨然成为实现国家治理现代化的新路径。互联网平台对于信息或数据的报送逐渐成为政府重要的数据源［44］。“深度伪造”技术之所以会迅速崛起除了得益于背后有着广阔的新媒体市场和利润空间，互联网平台的推手作用同样不容小觑。作为“深度伪造”的发源地，并逐渐成为其“逐鹿天下”的主战场——互联网平台——并不仅局限于做一个旁观者，而应承担比报送义务更为广泛的责任。易言之，既然网络平台作为利益的获得方，便应该承担相应的监督义务，将这种负面影响降到最低或扼杀在萌芽阶段。正如有学者所言：“虽然深度伪造技术的规制尚不明晰，但在关涉信息安全问题上，平台至少要遵循技术正当程序方可免责”［45］。笔者认为，平台应当承担的监管义务可以具化为以下3个方面。

第一，在上传阶段，网络平台应该尽到一定的提醒或通知义务。传统的视频或者音频播放政策中并未过分强调用户所上传内容的真实性，因为只要不触及相关的法律都被默认为言论自由的另一种表现。故而，平台的网络审查和监管义务便形同虚设。而“深度伪造”行为的出现，尤其是当所涉内容为国家安全事务，则应该设置警告条款（禁止上传），旨在提醒上传者将伪造的作品上传到互联网上的法律后果，以免误导民众。例如，美国在“深度伪造”技术出现之后迅速做出回应，修改相关网站的视频及音频播放政策，以确保用户知悉。

第二，在审查环节，网络平台在发现可能存在“深度伪造”的内容，应当及时报送相关部门。提醒或通知义务只是平台预防“深度伪造”行为的前置性方案。当网络平台认为“深度伪造”的作品可能已经在网上播放时，但仅靠平台已有技术无法确定内容的真实性，此时应当立即报告互联网管理部门，例如国家互联网信息办公室。期间可以先屏蔽或者撤下该视频，以防止事态扩大。当证明确系深度伪造的作品，且尚不构成犯罪的，平台可以对于上传者予以封号并通知其他互联网运营商。当证明并非伪造作品时，则应该立即解封原作品，恢复播放。

第三，在观察用户反馈报告后，倘若发现“深度伪造”内容应当及时移除。近期Discord、Gyfcat和Twitter，已经开始从其网站上移除“深度伪造”作品，并明确禁止交换面部色情内容。不可否认，服务器的容量和运行压力使得网络运行商不可能全天候关注平台上的视频内容真实情况，所以需要平台与用户间的协作。针对用户及受害者所提供的报告，就“深度伪造”的视频内容进行审查，如果视频或音频有涉及侵害公民或国家法益的内容，则应当予以移除。尽管各大视频分享和播放视频网站都设置了投诉和举报程序，但实际效果并不理想，因此可以考虑给予举报内容真实的用户一定的奖励或者采用有奖填写调查报告的形式来展开。

5 结语

诚然，“深度伪造”内生性的技术风险可能异化为危及个人、社会甚至是国家权益的秘密武器，但它也推进了计算机成像技术进程和社会的发展，并在艺术、医疗、教育等领域显现出独特的魅力，因此不可过分强调立法或司法的过度干预。本文认为通过法律、技术以及平台三方共同参与和发力可以将“深度伪造”技术的威胁降到最低，进而维系科技和法律之间的生态平衡。当然，未来应当在意识层面，强化公民数据主体身份的认同感，使民众实现从围观者向参与者的角色转变。