生成式人工智能的版权风险及其应对

2023-11-20 13:36王瑶李胜利

海南金融 2023年10期

王瑶李胜利

收稿日期：2023-08-07

作者简介：王瑶（1998-），女，安徽太湖人，安徽大学法学院硕士研究生。

李胜利（1972-），男，安徽颍上人，经济法学博士，安徽大学法学院教授、博士生导师。

摘要：以ChatGPT为代表的生成式人工智能一经问世便空前火爆，给社会带来巨大便利的同时，也存在隐藏的版权风险。针对数据挖掘可能面临版权侵权风险，我国可以参照国外确立文本数据挖掘的版权例外规定，将人工智能创作利用数据纳入合理使用范围。针对版权权属争议风险，从思想表现形式和人格主义要素两个方面认定ChatGPT生成内容的独创性，证明生成式人工智能生成内容的可版权性。此外，建议建构“作者—著作权人”二元权利主体结构，明确生成作品著作权归属于使用者，从而鼓励生成式人工智能创作、促进人工智能产业的发展。

关鍵词：ChatGPT；生成式人工智能；版权风险；可版权性；数据挖掘；合理使用

DOI：10.3969/j.issn.1003-9031.2023.10.004

中图分类号：D923.41；TP18 文献标识码：A 文章编号：1003－9031（2023）10－0049－10

一、引言

生成式人工智能（Generative AI）是通过各种既定的机器学习方法从广大的数据资源中有针对性地进行学习，从而生成符合人类偏好的、完全原创的内容的人工智能。2022年11月30日ChatGPT的问世，带来了更加简便的接入方式以及较低的操作门槛，受到广大群众的追捧，进而迅速地融入到人类生活的各个方面，成为人类生活领域、工作领域、学习领域的重要应用工具。ChatGPT可以按照人类的指令编写代码，撰写符合人类要求的高质量论文。这不仅让人类体验到科技创新带来的成果，而且也激发了人工智能领域研究者对ChatGPT技术改造升级的积极性。2023年OpenAI公司推出了更新换代的AI新模型GPT-4，此模型的最大特点是能够识别抽象化的表达以及处理高达两万多字数的文本。微软公司对外宣称，不久将合理利用ChatGPT相关技术对Office系列办公软件进行改造升级，并将GPT-4技术应用到其开发的必应（Bing）搜索引擎当中，以此提升企业的核心竞争力。

在公众惊喜于新技术带来的益处时，也有不少专家、学者对生成式人工智能的诞生表示深深担忧。有学者认为，人工智能的大量普及势必会使公众遭遇个人隐私数据泄露风险，甚至可能会被不法分子利用并实施违法犯罪行为。还有学者认为，生成式人工智能在兴起过程中掌握了大量公众数据，增强了企业的竞争力，这大大加强了科技巨头公司的垄断地位，很有可能实施滥用市场支配地位的行为，造成市场不公平竞争的现象。本文着眼于ChatGPT的诞生给我国现行著作权法带来的剧烈冲击，一方面，生成式人工智能输入阶段的数据获取问题是否违反我国著作权法的规定尚不确定。另一方面，针对生成式人工智能生成内容是否具有可版权性存在争议，这无疑加大了以ChatGPT为代表的生成式人工智能的版权保护难度。为了推动生成式人工智能产业的发展，应当合理规范数据挖掘行为、厘清生成内容的法律性质、明确相关主体的法律权利与义务。

二、生成式人工智能运作原理及其引发的版权风险

（一）ChatGPT的运作原理

ChatGPT作为生成式人工智能的典型，不同于以往的人工智能，而是以深度学习和人类反馈强化学习等技术为基础，挖掘数量庞大的互联网信息，反复自我训练数据库中保存的丰富数据，从而根据使用者在输入端发出的特定指令，生成内容颇为精彩、语言风格与人类相似等符合使用者内心偏好的自然语言文本。ChatGPT的形成不是一蹴而就的，而是经历了纷繁复杂的训练过程。首先，研究人员通过比较分析选定一款较为成熟的大型语言模型作为训练的初始模型，用户端输入一个提示词（Prompt），模型输出端通常能够输出一个令人较为满意的文本。其次，研究人员需要设定相关条件来建立人类偏好数据。针对输入端的问题随机选择进行精准回答，以此提高模型回答的精准度，形成标注数据，并将其反馈至初始模型再次进行学习与训练。研究人员根据标准数据训练反馈模型（Feedback Model），对初始模型中输出的内容按照回答的相关性、质量的高低标准等进行排序。最后，研究人员需要根据初始模型输出的内容训练打分模型（Reward Model）。此阶段的目的主要是判断模型生成的文本是否符合人类偏好。基于RM（Reward Model）模型中设立的打分函数，可以对初始模型输出的内容赋予分值，以此判断输出文本是否优质，然后按照分值的高低进行分流。当模型输出的文本分值较低时，初始模型将自动进行原始的学习流程。通过打分优化算法更新模型参数，经过循环往复的训练，使得输出文本更加符合人类的需求和认知，这便产生了ChatGPT。从技术层面来看，ChatGPT建构了大型语言模型LLM（Large Language Model）和强化学习微调训练模型，采用了Transformer神经网络架构（目前为 GPT-4 架构），综合利用神经网络、人类反馈强化学习、深度学习等AI技术，综合用户输入的文本深入理解人类思维，着重分析用户输入指令的特定内涵，根据数据库中已经存储的文本语料，生成按数字序列形式排列的内容，最后将其转换为文本输出，从而生成符合人类偏好的作品。

（二）ChatGPT引发的版权风险

生成式人工智能的兴起推动了教育领域、生产领域、科研领域等方面的变革，给人类生活带来极大便利的同时，不可避免地给版权领域带来极大的挑战。部分人基于利益的驱使，可能会借助ChatGPT的便利实施版权侵权行为并加大版权侵权力度。

第一，生成式人工智能在学习阶段可能存在数据侵权风险。ChatGPT作为生成式人工智能，在进行创作之前，需要将已经存在的大量作品通过一定形式转化为人工智能可以识别的数据，并将其导入生成式人工智能系统中，以此形成一个可供ChatGPT学习的巨大数据库，经过强化学习与微调训练，使ChatGPT自主生成具有独创性的作品。由此可见，数据输入是ChatGPT创作的前提。由于ChatGPT仍属于算法黑箱，其所属公司OpenAI并未向外公布ChatGPT创作使用的数据来源，训练的数据库资源是否获取他人的授权也存在合理怀疑。根据《中国人民共和国著作权法》（以下简称《著作权法》）规定，除合理使用、法定许可外，未经过他人授权或者未支付相关费用使用他人处于保护期内的作品，构成版权侵害行为。因此，ChatGPT在创作过程中获取数据时可能遭遇版权侵权风险，ChatGPT在人类指导下创作的作品可能一经生成就背上版权侵权的“原罪”，这不仅影响其创作作品的传播安全与效率，而且还会挫伤人工智能技术研发者的积极性，影响人工智能产业的发展。

第二，生成式人工智能在生成阶段存在版权权属争议风险。相较于分析式人工智能，生成式人工智能的智能化程度更高，处理和分析数据的能力更强，因此在运算时对于版权的归属产生了争议。ChatGPT创作作品的模式主要是挖掘人类日常交流的文本，并进行统计分析，甚至在对已有的数据库进行爬取行为后组合得出全新的作品，因此这类作品中的“原创性”存在争议，而这也是ChatGPT产生版权争议的来源。ChatGPT的创作者中部分蕴含了自然人的创作因素（思想、情感），在一定程度上符合作品构成要件的要求，但对于这类由生成式人工智能创作的作品能否赋权尚存争议，而且具体的赋权认定标准也仍属空白。如何理解作品的独创性、对ChatGPT创作作品是否应该赋权以及如何确定ChatGPT作品的版权归属者，是当前亟需解决的版权问题。

三、生成式人工智能在学习阶段中的数据挖掘风险及其合规处置

（一）ChatGPT存在数据挖掘风险

数据获取与利用几乎贯穿ChatGPT创作全过程。ChatGPT的认知能力是在学习人类现有知识的基础之上产生的，拥有海量的创作素材是ChatGPT进行创作的前提，但与自然人作者创作不同的是，ChatGPT所需的创作素材是以数据集表现的数字化作品。因此，ChatGPT创作的第一步是访问和获取海量的知识和信息，进行文本与数据挖掘，这也是数据输入的过程，然后将这些内容予以数字化并建立数据库以供ChatGPT进行学习。ChatGPT创作的第二步是深度学习，即利用算法从数据库中提取相关内容并自动构建，然后通过自我优化与分析处理，最终在输出端得出结果。从创作的流程来看，ChatGPT创作利用数据可能存在以下几种版权侵权风险。

第一，复制权侵权风险。从ChatGPT的运作原理来看，ChatGPT在进行深度自主学习之前，需要对知识与信息内容进行数字化处理，然后转化为数据格式进行储存。ChatGPT主要通过以下两种方式完成数字化处理：一是将非数字格式的知识与信息内容（创作素材）转化为人工智能可以阅读的数字格式。例如，谷歌数字图书馆扫描各类图书建立一个数据库，其目的是让人工智能进行深度学习。二是对他人已经转化的数据格式，通过API等接口访问和获取相关数据。例如，李飞飞教授通过网络爬虫技术在互联网上抓取各类图片数以亿计，以此建立计算机图像识别的图片数据库并免费提供给有需要的科研人員使用。以上两种方式均是在不改变内容的情况下对作品进行复制，并且会永久地存储在ChatGPT自身系统中。根据《著作权法》第十条第（五）项规定，数字化复制行为涵盖在复制权的范围内。从著作权法意义上来说，ChatGPT的数据挖掘行为属于著作权法上的“复制”行为，该行为存在侵犯复制权的风险。若ChatGPT经过创作过程最终输出的内容与其先前使用的作品相比存在实质性相似，那么基于“接触+实质性相似”的版权侵权规则，可能会侵犯著作权法规定的复制权。

第二，改编权侵权风险。我国《著作权法》规定，改编权是指权利人有权许可他人改变作品，创作出具有独创性的新作品的权利。以ChatGPT为代表的生成式人工智能在数据挖掘过程中需要对挖掘对象进行智能识别以及转码，通过改变对象的表达形式，纳入自身数据库，成为新的创作研究样本，为自身创作提供基础。由此可见，转码行为与改编行为具有同质性，数据挖掘行为有可能会侵犯著作权人的改编权。改编作品具体有两个构成要件，一是利用了原作品的表达，二是进行了再创作，具有独创性，并且已经形成新的作品。当ChatGPT创作的内容不同于数据库内的原作品，而是创作全新作品时，符合版权法规定的鼓励创新的立法目的，这当然不会产生改编权侵权的风险。若ChatGPT生成内容利用了数据库内原作品的基本表达，即使该生成内容具有独创性，但ChatGPT利用该作品进行创作时未获得原作品著作权人许可并支付相应报酬，此时也可能会构成版权法上规定的改编权侵权行为。

第三，数据库使用产生的侵权风险。针对不具有独创性的数据库，其保护方式在不同的国家规定也不尽相同。欧盟颁布的《数据库保护指令》中规定了数据库权，即制作者有权禁止任何人通过任何方式抽取和再利用数据库的全部或实质性部分。所以，生成式人工智能未获得权利人的授权或者无其他豁免事由，在某些国家和地区挖掘数据库的行为也存在版权侵权风险。同时，当ChatGPT对数据挖掘分析结果通过网络进行传播时，还可能会侵犯原作品的信息网络传播权。

（二）将ChatGPT创作利用数据纳入合理使用范围

ChatGPT学习阶段中关于训练数据获取和使用的合法性问题，决定了ChatGPT等生成式人工智能创作等后续行为是否正当。由于单个作品对ChatGPT生成内容的贡献极小，所以只有大批量、规模化地使用数据对于ChatGPT创作才有意义。因此，传统授权许可模式难以满足ChatGPT数据规模化利用方式的需求，要求ChatGPT使用者为了实施创作向不同的作者获得对不同作品的许可几乎无法实现。采用法定许可制度解决ChatGPT创作使用数据作品问题将会面临巨额使用费问题，投资者可能会因为资金不足而不得不放弃对人工智能创作相关技术的研发与更迭，或者部分企业、个人可能因降低经营成本、追求高经济效益而不顾版权法的规定仍然使用他人作品，这不仅不能避免版权侵权行为的发生，反而加剧了该行为的产生。美国学者戈登认为著作权使用规则配置数据资源可能是实现社会公共利益最大化的最佳选择。所以，欧美发达国家为了顺应人工智能时代的新发展，率先通过成文法或者判例法的形式规定了相关领域数据挖掘行为的版权例外，但是考虑到不同国家的国情，对该例外规定的适用范围以及合理使用条件均存在差异。

美国采取“转换性使用例外”模式。美国通过判例法的方式引入“转换性使用”理论，将文本数据挖掘行为纳入合理使用范围。根据“转化性使用”理论，当使用者对作品进行利用时采用了不同的表达方式，或者表达出了新意义，又或者在新作品中阐释了新功能，那么均可认为是对原作品的转化性使用，属于合理使用行为。在“作家协会诉Google”案件中，法院认为具有商业利益不能成为构成否定合理使用的绝对标准，“Google Books项目”具有转化性目的，属于合理使用。在“作家协会诉Hathitrust图书馆”案件中，初审法院以及第二巡回法院均认为Hathitrust图书馆所提供的检索服务是一种衍生出的学术研究方法与路径，属于一种新功能，因此具有较强的“转化性目的”。通过以上案例不难发现，美国法院对“转化性使用”理论采取了宽泛解读的全面适用，以适应生成式人工智能时代的发展需要。

日本采取“计算机分析例外”模式。日本著作权法在2018年修订时，将“提供新的知识和信息”规定为使用他人作品进行创作的目的。日本立法者借鉴了美国关于数据挖掘行为规定的“转换性使用”理论，对于正在进行人工智能研究的开发者，可以准许其合理地复制他人的作品并且有权利就此作品的具体内容向公众公开使用。同时，日本著作权法弹性规定了科研领域特别是商业领域对作品的数字化使用，不以商业性目的与否作为判断标准。日本对于企业使用数据的规定，不仅扩大了计算机信息分析范畴，还适应了关于人工智能产业的发展趋势。

欧盟采取“科研目的例外”模式。2016年欧盟《数字化单一市场版权指令》草案中规定了社会公共机构以及科研组织文本数据挖掘的著作权例外。从适用主体的规定可以发现，该例外主要适用于非商业性目的（主要用于科研目的）。2019年欧盟出台的《单一数字市场版权指令》中，将私人主体规定为著作权例外的另一适用主体，由此扩大了版权例外规定的主体适用范围。此规定是一种“有限开放”条款，当作品的权利主体没有以明确方式保留自身权利内容的使用，使用者则默认可以对合法获取的内容进行复制，用于非科研目的的文本数据分析，更好地鼓励私人企业进行创新。

为适应生成式人工智能的发展，我国《著作权法》应对数据挖掘行为这一问题做出回应。我国《著作权法实施条例》第21条规定了“三步检测法”的判断顺序①，但是我国司法机关在运用此规则时只是将其作为辅助性的考虑因素。当出现《著作权法》规定法定情形之外的情况时，则很难运用该规则。针对数据挖掘行为，我国现行《著作权法》并没有将其纳入合理使用情形之一，对于合理性使用的认定存在争议。生成式人工智能创作离不开数据的支持，数据质量的优劣决定了人工智能创作成果质量的高低。人工智能企业在不能获得作品著作权人的授权情况下，为了避免侵权纠纷，往往选择公共领域的作品来进行人工智能的学习，由于公共领域的作品质量参差不齐，人工智能输出的内容不仅存在同质化和低质化的现象，还导致输出作品存在隐形的偏见。笔者认为，我国应在引入“三步检测法”之外，将人工智能创作利用数据纳入我国著作权法规定的合理使用情形之一。考虑到一些大型互聯网企业进行人工智能研究需要大量的数据，我国对该项条款的适用主体不应该仅限于大学、研究所等科研机构，此时不限定适用主体的做法更加符合我国的国情。此条款的增设不仅能解决生成式人工智能作品输入阶段的难题，扩大学习数据的范围，还能化解作品利用侵权风险、避免算法隐形偏见，收获更加优质的人工智能作品，从而推动人工智能产业的发展。

四、生成式人工智能在生成阶段中的权属争议风险及其化解路径

（一）ChatGPT生成内容的版权权属争议风险及其可版权性证成

1.版权权属争议风险

关于ChatGPT生成内容是否属于我国《著作权法》规定的“作品”存在争议，学术界观点不一。人工智能版权否定者认为，人工智能生成内容不能认定为版权法意义上的作品。有学者认为作品应当是作者人格精神的彰显，ChatGPT生成内容只是具备人类作品的形式要件，而在创作过程中缺乏主体意识，不具有内在人格基础，因此不符合作品的构成要件（李俊，2019）。还有学者认为它们只是数据算法的结果，不具有智力财产的属性，无法成为版权的客体，应当归属于公有领域（曹博，2019）。人工智能版权肯定者认为，人工智能生成内容属于著作权法上规定的版权作品。他们认为ChatGPT输出内容是按照其设计者意志创作的产物，人类充分参与了ChatGPT内在的算法创作，因而具备作品的人格要素。而关于ChatGPT生成作品独创性的认定，主要是根据已经生成的表达结果进行推定。ChatGPT曾模仿某位小说作家的写作风格创作新作品，这使得机器算法创作与人类独立思考之间的边界模糊不清。在技术迭代升级的背景下，理论必因社会发展变化而更新。ChatGPT生成内容是否属于作品以及版权权利如何归属，成为现阶段亟需解决的难题。

2.可版权性证成

人类作者创作作品过程主要分为思想内容和思想表达两个方面，思想内容主要集中存储在作者的脑海里，而思想表达则是作品的最终完成形态，如文学作品、绘画作品等。ChatGPT创作作品过程中数据的挖掘与深度学习，属于作品的思想内容方面；而ChatGPT在生成阶段输出的结果，则属于作品的思想表达方面。ChatGPT创作作品的过程不是“无限猴子定理”①的随机计算，也不同于早期人工智能“输入不同的数据得出相同的结果”的机械计算。可以说，ChatGPT创作与自然人创作具有异曲同工之妙，从内容构思到作品创作的过程本质相同。版权法所保护的作品，需要满足独创性与可复制性两个基础要件，学界对ChatGPT作品可复制性的认同基本一致，但对于独创性存在分歧。笔者认为，“算法创作”生成内容不是一种技术上的机械反映，而是一定思想内容的表达。ChatGPT创作的内容只要符合独创性的条件，则具备“可版权性”的要求。独创性主要从思想表现形式与人格主义要素两个方面为着手点进行认定。

第一，ChatGPT能够做出独立表达。一方面，类脑技术的改造升级推动生成式人工智能可以进行类人化行为，如ChatGPT能够发现输入端的内容与自身数据库内资源之间的关联性，自行选择所需素材，通过深度学习，进而突破设计者既定的算法预设而输出符合使用者需求的内容。另一方面，即使算法程序完全相同，而供深度学习的数据不同，则会做出不同的独立表达，生成符合人类偏好的作品。

第二，ChatGPT生成内容具有人格主义要素。ChatGPT生成内容离不开人类的指导，其接收端必然需要人类意志的参与。在ChatGPT学习阶段，研究人员需要对输入数据按照一定的价值评判标准进行取舍，然后按照符合人类思想表达的方式对ChatGPT输出的内容进行微调训练。在ChatGPT训练过程中，研究人员通过植入代码的方式将人类的取舍标准植入其中。ChatGPT按照一定的算法规则，经过循环往复的自我训练，从海量数据中分析数据之间的关联性，提炼最准确的内容与表达方式，完成人类所需的目标。这都体现了ChatGPT创作的人格主义要素，也满足《人工智能生成物的版权问题决议》中的规定。正如刘艳红教授（2023）所说“算法模型内部也存在“人工标准”所附随的个人意志，具有一定的可解释性，因此其生成物具有创新性与独创性，满足赋予其知识产权的实质要求。

（二）明确ChatGPT生成内容的权利归属

1.建立“作者—著作权人”二元权利主体结构

生成式人工智能虽然基于深度学习而生成具有作品外观的思想表达，这似为某种意义上的创作，由于其没有意志能力和独立的责任能力，根据我国现行《著作权法》规定是无法获得主体资格的。主体资格的取得与是否具有行为能力和责任能力息息相关。在我国《著作权法》当中，主体资格仅为自然人作者与法人作者，前者基于事实行为而取得，后者基于法律的拟制而取得。因此，笔者认为，需要对生成式人工智能创作提出新的构想，区分创作主体资格与权利主体资格。

在我国《著作权法》中，合作作品通常是两个以上的人共同合作创作的作品，合作者之间不仅有创作的合意，还有共同的创作行为。ChatGPT生成作品本质上是“机器作者”与人类作者（ChatGPT的开发者或使用者）合作创作的作品，是生成式人工智能时代合作作品的特殊类型。首先，对于人工智能与人类共同创作的作品，应确立“机器作者”与人类作者的二元创作主体结构，前者是基于人工智能创作事实而“视为”作者；后者是基于法律规定而当然成为作者。主要有以下两个方面的原因：一是ChatGPT基于深度学习能力自行分析数据，然后脱离限定的算法预设，输出符合人类需求的内容，这是“人工智能作者”类人化的智力创作；二是ChatGPT的使用者进行数据输入，对结果输入设立特定的要求，这是生成作品的决定性因素。ChatGPT整个运行过程都体现了使用者参与的创作意志，所以这应当认定为自然人作者与生成式人工智能作者所完成的合作作品。其次，对人工智能与人类共同完成的作品，应建构“作者—著作权人”二元权利主体结构。由于人工智能作者不能像自然人作者一样去拥有并行使权利、履行义务，对行为的后果承担责任，笔者建议将作者与著作权人相区别，将人工智能“视为”作者，

五、结语

ChatGPT的诞生拉开了强人工智能时代的序幕。人类在享受ChatGPT带来便利生活的同时，也应正视人工智能进步背后潜在的法律风险，并研究相应对策，使人工智能可以更好地为人类服务。人类通过深入了解生成式人工智能的工作机理以及充分利用其特有的优势，通过人机协作充分展现人类智力成果，真正实现为民所用。本文主要阐述以ChatGPT为代表的生成式人工智能存在的版权风险以及化解路径，以ChatGPT的运作原理为起点，剖析其运作过程中可能存在的版权风险，如数据挖掘风险以及ChatGPT生成内容的版权权属争议风险。数据输入是ChatGPT创作的前提，未经过他人授权或者未支付相关费用使用他人处于保护期内的作品，可能构成版权侵害行为。为此，我国可以参照国外确立文本数据挖掘的版权例外规定，将生成式人工智能创作利用数据纳入合理使用范围。生成式人工智能承担着部分的创作性工作，不能简单地将其认定为人类创作作品的辅助性工具。面对ChatGPT生成内容的版权权属争议风险，基于ChatGPT思想表现形式与人格主义要素两个方面的论证，我国应承认ChatGPT生成内容的可版权性。由于我国现行著作权法并未规定人工智能的创作主体资格，以及生成式人工智能不具有我国民事理论上的意志能力、行为能力以及责任能力，所以生成式人工智能不易获得著作权人的法律地位。对此，建议建构“作者—著作权人”二元权利主体结构，明确生成作品著作权归属于ChatGPT使用者，平衡参与创作各主体之间的利益。

（责任编辑：夏凡）

参考文献：

[1]蒲清平，向往.生成式人工智能——ChatGPT的变革影响、风险挑战及应对策略[J].重庆大学学报（社会科学版），2023，29（3）：102-114.

[2]令小雄，王鼎民，袁健.ChatGPT爆火后关于科技伦理及学术伦理的冷思考[J].新疆师范大学学报（哲学社会科学版），2023，44（4）：123-136.

[3]朱光辉，王喜文.ChatGPT的运行模式、关键技术及未来图景[J].新疆师范大学学报（哲学社会科学版），2023（4）：113-122.

[4]谢永江，杨永兴.ChatGPT法律风险及其规制[J/OL].南京邮电大学学报（社会科学版）：1-9[2023-09-04].DOI：10.14132/j.cnki.nysk.20230601.005.

[5]焦和平.人工智能创作中数据获取与利用的著作权风险及化解路径[J].当代法学，2022（4）：128-140.

[6]邓建鹏，朱怿成.ChatGPT模型的法律风险及应对之策[J].新疆师范大学学报（哲学社会科学版），2023（5）：91-101+2.

[7]韩丹东，王意天.ChatGPT火爆背后有何法律风险？[N].法治日报，2023-02-13.

[8]方卿，丁靖佳.人工智能生成内容（AIGC）的三个出版学议题[J].出版科学，2023（2）：5-10.

[9]张金平.人工智能作品合理使用困境及其解决[J].环球法律评论，2019（3）：120-132.

[10]吴汉东.人工智能生成作品的著作权法之问[J].中外法学，2020（3）：653-673.

[11]吴高，黄晓斌.人工智能时代文本与数据挖掘合理使用规则设计研究[J].图书情报工作，2021（22）：3-13.

[12]董凡，关永红.论文本与数字挖掘技术应用的版权例外规则构建[J].河北法学，2019（9）：148-160.

[13]Wendy J Gordon.Fair Use as Market Failure：A Structural and Economic Analysis of the Betamax Case and its Predecessors[J].Columbia Law Review，1982，1600：1675-58.

[14]Casetext.Authors Guild v.Google， Inc.[EB/OL].[2015-10-16].https：//casetext.com/case/guild-v-google-inc-1.

[15]杨和义.日本知识产权法[M].北京：北京大学出版社，2014.

[16]李俊.论人工智能生成内容的著作权法保护[J].甘肃政法学院学报，2019（4）：77-85.

[17]曹博.人工智能生成物的智力财产属性辨析[J].比较法研究，2019（4）：138-150.

[18]孙山.人工智能生成内容著作权法保护的困境与出路[J].知识产权，2018（11）：60-65.

[19]熊琦.人工智能生成内容的著作权认定[J].知识产权，2017（3）：3-8.

[20]周佑勇.中国行政法学学术体系的构造[J].中国社会科学，2022（5）：103-121+206-207.

[21]郭萬明.人工智能生成成果的法律性质及著作权保护[J].出版发行研究，2022（5）：58-64.

[22]梅傲，郑宇豪.人工智能作品的困境及求解——以人工智能写作领域第一案为考察中心[J].出版发行研究，2020（12）：50-56.

[23]刘艳红.生成式人工智能的三大安全风险及法律规制——以ChatGPT为例[J].东方法学，2023（4）：29-43.

[24]孟磊，段妍宇，李华.人工智能创作物版权保护机制研究[J].牡丹江大学学报，2023（3）：39-46.

[25]Open AI.Sharing&publication-policy[EB/OL].[2022-11-14].https：//openai.com/policies/sharing-publication-policy.

[26]Open AI.Terms of use[EB/OL].[2023-03-14].https：//openai.com/policies/terms-of-use.

[27]蔡镇疆，车宇璐.ChatGPT的法律人格认定与生成内容性质探讨[J/OL].新疆师范大学学报（哲学社会科学版）：1-8[2023-09-04].DOI：10.14100/j.cnki.65-1039/g4.20230628.001.

①三步检测法：具体来说，首先判断版权作品利用情形是否属于《著作权法》规定的12种法定合理使用情形之一，其次作品的利用不得影响作品的正常使用，最后不得以不合理方式损害作品著作权人的合法利益。

①无限猴子定理：有无限只猴子用无限的时间会产生特定的文章。实际上并不需要出现两个无限的事物，一只猴子打字无限次已经足够打出任何文章，而无限只猴子则能即时产生所有可能的文章。博雷尔原意强调有些物理事件虽然就统计上来说，发生的机率并非等于零。