李青文 | 算法训练使用作品的著作权法规制路径

学术 2024-08-07 17:01 天津

点击蓝字关注

了解更多精彩

ABOUT

（点击查看思维导图）

GB/T 7714-2015

CITE

李青文.算法训练使用作品的著作权法规制路径[J].科技与出版，2024（7）：16-27.

摘要

生成式人工智能运行的核心是算法，而算法一般需要用户根据自己的需求使用相关数据进行训练。从机器学习原理及人工智能商业化应用模式来看，用户使用受著作权保护的作品进行算法训练既不符合合理使用制度的目的，也不符合“三步检验法”标准，难以构成合理使用。用户使用作品进行算法训练具有使用数量巨大、主体众多、涉及作品类型多样、强调时效性和作品质量等特点，这使得在现行著作权法框架下通过改良法定许可制度来规制此类行为更具有科学性和可行性。应将用户训练算法使用作品的行为纳入法定许可范围，并设立专门的集体管理组织负责著作权许可使用费的收取、转付及维权等事宜，建立和完善相应配套制度，辅以先进技术措施，从而规范人工智能时代的作品使用秩序，维护著作权人的经济利益。

关键词

算法训练；用户；著作权法；法定许可；集体管理组织

在人工智能语境下，算法是一系列解决问题的清晰指令。^[1] 算法训练和云存储是机器学习的两个最重要维度。其中，云存储是人工智能 “大脑”的容量，而算法训练则类似于“大脑” 的智商。生成式人工智能运行的机理在于，开发算法并使用大量的数据对算法进行训练，让机器学习并记忆相应的知识，然后再根据用户指令生成绘画、视频、技术方案、文字片段等内容。著作权法是通过规制作品使用行为和传播行为来平衡作品创作者、传播者与社会公众之间利益的基本法律。机器学习是机器具有“智能”的重要标志，也是机器获取知识的根本途径。^[2]通过机器学习，人工智能的智能水平急速上升。算法训练是机器学习的核心环节。算法开发者研发并训练出算法基础模型后，用户通过让人工智能深度学习特定的数据进一步训练和优化算法，进而生成符合自己预期的内容。然而，与传统的个人学习和研究行为相比，算法训练使用作品的直接目的既非满足个人的精神文化需求，亦非提高个人的知识水平。那么，在现行著作权法框架下，算法训练使用作品行为能否构成合理使用？应当对其如何规制？针对传统理论与新兴技术之间的矛盾与冲突，如何通过调适现行制度才能够充分发挥著作权法为人工智能技术发展保驾护航的作用？

算法训练使用作品的特点

通过人工智能机器学习的基本方式，分析算法训练使用作品的特点，掌握其与传统个人使用作品的区别，是在著作权法层面科学定性及规制该类行为的前提。

1.1 使用作品数量巨大

与使用普通算法的传统软件不同，以 ChatGPT为代表的生成式人工智能往往需要训练并创建不同类型的神经网络算法。^[3]比如，当用户仅向ChatGPT中导入法学论文数据，却突然让其执行一个金融学指令，那么因其从未学习过金融学相关知识，故生成的内容可能缺乏逻辑，甚至存在常识性错误。数据是机器学习的“燃料”，只有向人工智能“投喂”大量的数据，训练算法模型，人工智能才会越来越智能，才能够像一个知识丰富的“专家”一样，迅速而又专业地解决用户的问题。诚然，算法开发者并不十分了解用户的具体需求，其主要负责设计、开发及向用户提供基础算法模型，并定期进行更新；虽然其开发出某种算法后会通过爬虫技术进行基础训练，但一般不会使用特定的作品数据有针对性地训练算法，这使得人工智能所有者推出的算法模型可能无法满足用户的个性化、多样化需求。因此，用户在实践中往往会根据自己的实际需要，让人工智能通过爬虫、API接口对接等自动化抓取方式捕获、存储公开数据，进一步训练和优化算法模型。目前，文字、绘画、摄影、音乐等内容均可实现无纸化传播，而该类内容又大都构成作品，在人人都可以通过输入指令、导入文件等方式对人工智能进行算法训练的技术背景下，机器学习使用作品的数量之巨可想而知。

1.2 使用主体众多

算法训练使用作品既涉及算法初始模型训练者和人工智能所有者，也涉及作为用户的社会公众。首先，算法初始模型训练者是使用数据进行算法训练的最原始主体。开发者设计出特定算法之后，需要使用作品或非作品数据训练算法，形成基础算法模型。其次，社会公众是使用作品进行算法训练的主要主体。在市场需求的催动下，许多人工智能公司应运而生，它们规模不一，算法各异，应用领域也不完全相同，由此满足用户的多样化、层次化需求。广大用户根据自己的需求，通过输入指令或者直接导入数据的方式，让机器学习输入的数据，训练人工智能算法。在人人都可以使用人工智能的时代，创作作品、发明技术方案等并非难事，只要会使用人工智能，就可以获得符合自己预期的“智力成果”。如今，高校教师和学生、企事业单位员工、政府机关工作人员及其他社会公众都在使用人工智能帮助自己分担沉重又烦琐的体力劳动和部分脑力劳动。可以预见，在不久的将来，使用人工智能将是社会公众的一项必备技能。最后，人工智能所有者虽然不直接训练算法，但却拥有了用户算法训练的成果。用户与生成式人工智能之间是一种双向互动关系。在用户使用人工智能的过程中，人工智能不仅通过执行用户的指令生成特定内容，还通过学习用户输入的数据不断提高自己的 “智商”，每一次学习痕迹和算法训练结果都会被存储下来，并被人工智能所有者用来优化整个算法模型。从去年至今，很多人工智能公司就自己的产品陆续推出3.0、3.5、4.0版本，新版本比旧版本要“聪明”得多，其中就包含算法训练的结果。

1.3 涉及作品类型多样

不同公司提供的生成式人工智能擅长的领域并不完全相同。目前，市场上已经存在专门用于生成文字、绘画和视频的人工智能。随着技术的发展，人工智能的应用领域还会进一步细分，将来还可能出现主要用于生成音乐、戏剧、舞蹈、摄影、计算机软件等内容的人工智能。应用于不同领域的人工智能虽然算法模型存在显著差异，但用户需要首先使用特定类型的作品数据对其进行算法训练，让它尽可能多地学习现有相关知识，成为本领域的“专家”，然后再通过输入指令的方式让人工智能生成符合自己预期的内容。当然，即使是对于应用于同一领域的人工智能，用户也需要使用不同类型的数据对其进行算法训练。以AI绘画软件为例，用户不仅要导入大量的美术作品，让人工智能学习绘画制作步骤、色彩搭配等方面的知识，还需要使用文字作品对其进行训练，让其能够理解非结构化语言。再比如文生视频类人工智能，不仅需要学习视听作品和文字作品，还需要学习摄影作品、音乐作品、录像制品等。因此，人工智能算法训练所涉及的作品类型多种多样。

1.4 强调时效性

人工智能生成的内容与算法训练密切相关。在算法模型相同的情况下，使用不同数据对其进行训练，即使执行相同指令，人工智能生成的内容也不完全相同。对于公开发表的论文、出版的图书及网络资料等已有数据，每个人工智能用户均可以获得，在法律没有禁止的情况下用户使用这些数据训练算法，特别是在使用相同公司提供的相同版本的人工智能的情况下，所得到的结果可能差别不大。当然，算法本身的复杂程度和算力对人工智能的学习能力和输出结果亦具有重要影响，这促使所有者致力于提高人工智能的计算能力和算法水平。但对于用户而言，在使用相同人工智能的情况下，为了获得与众不同的、高质量的生成内容，就需要使用一些新的、他人未使用过的数据来训练算法，让机器学习本领域最前沿的研究成果或者最新资料。因此，随着人工智能应用的普及，用户训练算法时会更加强调所使用数据的新颖性和时效性，从而提高人工智能生成内容的竞争力。

1.5 未来更加注重作品的质量

从目前生成式人工智能的商业化应用实践来看，用户或借助爬虫技术让人工智能抓取公开数据，或通过导入特定的文字作品、美术作品等，让其学习现有知识，对人工智能进行算法训练。随着时间的推移，人工智能学习的数据量越来越多；并且，所有被人工智能学习过的数据均会被存储下来，人工智能所有者也会通过定期更新算法模型的方式提高人工智能的智能水平。这使得用户使用更高级版本的人工智能时，就不需要让其重新学习那些陈旧的、低质量的数据了。未来，用户训练算法可能不再需要通过爬虫技术抓取公开数据，而更需要向人工智能系统导入一些高质量的、受著作权保护的数据，包括电影、电视剧等视听作品以及摄影作品、音乐作品、学术论文、已出版的专著等，从而有针对性地训练算法，以提高生成内容的质量。

算法训练需要使用大量的数据，这些数据中的部分内容属于受著作权保护的作品。与传统的个人使用作品情形相比，算法训练使用作品的数量巨大，涉及主体和作品类型众多，未来更加强调作品的时效性和作品质量。

算法训练使用作品不构成合理使用

依托大语言模型强大的内容生成与“涌现” 能力，生成式人工智能将重塑内容创作范式。^[4]在人工智能时代，虽然并非人人都是画家，但人人都可以通过使用生成式人工智能的方式成为 “画家”。未来，人工智能会逐渐成为人们工作和生活的一部分。与个人为学习、研究或欣赏目的而使用他人作品一样，使用作品进行算法训练涉及不特定的多数主体。那么，用户使用他人已经发表的作品对人工智能进行算法训练是否属于著作权法中的合理使用？对此，笔者持否定态度。

2.1 不符合著作权合理使用制度的立法目的

合理使用是第一个也是最普遍的限制著作权人专有权利的制度^[5]，在该情形下使用他人作品，既不需要经过权利人许可，也不必向其支付报酬。合理使用制度起源于18世纪的英国判例法，《伯尔尼公约》第9条规定了合理使用的“三步检验法”（three-step test），并被Trips协议第13 条吸收。我国现行《著作权法》第24条规定了合理使用的判定标准和具体情形。

合理使用制度的价值目标在于平衡作品创作者、传播者与使用者之间的利益，促进科学文化事业的繁荣发展。^[6]任何作品都不是凭空产生的，而是创作者在学习、研究已有作品等知识的基础上进行的思考或总结，故任何人创作的作品都应当为后人的学习、研究提供便利，以此促进文学、艺术和科学文化的进步，实现人的全面发展。^[7]著作权法通过赋予作者专有权利的方式保障其对作品的利用和传播。一般而言，只要行为人未经允许使用作品的行为落入著作权人专有权利范围之内就构成侵权，需要承担侵权责任；但合理使用制度为公众学习、研究他人已经发表的作品提供了侵权豁免。值得注意的是，著作权合理使用制度的本质是对著作权专有权利的限制，是侵权的抗辩事由之一，而非著作权法赋予公众的一种公平获取权（fair access rights）。^[8] 有学者将合理使用视为“使用者享有利用自由，他人负有不得干预甚至积极协助义务”的使用者权，^[9]还有学者从著作权法的政策属性出发将其界定为 “使用者集体权利”^[10] 或“一种社会共享的公共权利”^[11]。但就合理使用制度的历史演变和内在机理而言，任何作者都没有主动提供其作品以方便公众学习、欣赏的义务，公众也没有要求作者以适当方式向其提供作品的权利，仅仅是对于公众为个人学习、欣赏等目的使用已经发表作品的行为，著作权人才必须容忍。因此，合理使用并不是一项“权利”，而是一种“特权”，它意味着使用者可以依法不经权利人许可，以特定方式利用作品或其他受保护的客体，而权利人对此必须予以容忍。^[12]

为了提高自己的知识水平而学习、研究他人已经发表的作品，这种使用行为所产生的结果兼具“私人性”和“公共性”，其私人属性体现为能够提高使用者个人的知识水平和素养，其公共属性体现为使用者学习他人作品后能够创作出更加优秀的作品，从而成为后人学习的思想原料。正因如此，著作权法对权利人就为个人目的的合理使用行为的侵权救济作出严格限制。另外，对于作者而言，由于公众在合理使用制度下学习了其作品，其蕴含在作品中的思想和观点被公众知悉，作者的知名度和影响力也随之提高，作者创作作品的精神价值得以真正实现。反之，如果没有合理使用制度，公众可能因需要获得著作权人许可并支付费用而放弃学习他人作品，这可能阻碍作品价值的实现。

著作权合理使用制度以保护人的自然权利、创作自由、个性表达等人格要素为基础，建立保障人的发展与促进社会文化发展的共生关系，实现知识产权保护与知识共享平衡。^[13]与自然人学习、研究或欣赏作品不同，使用作品进行算法训练既不可能提高自然人的知识水平，也难以实质性地促进文学、艺术和科学文化的繁荣发展。第一，使用作品进行算法训练提高的是机器而非人的知识水平。在用户通过导入作品等方式对人工智能算法进行训练的过程中，机器人的知识储备和思考问题的能力得到提升，而人工智能用户、算法开发者和人工智能所有人等自然人主体实际上并未学习用于训练的作品，无论使用多少作品对人工智能算法进行训练，也不可能增强任何自然人对此类作品的理解和认识。概言之，算法训练使用作品没有促进人的知识水平的提高和人的全面发展。第二，机器学习作品后难以生成包含新观点、新方法、新思想、新理念的内容。自然人学习现有作品后，或将所学知识直接用于解决实际问题，或通过反思传统知识进而提出新的观点或方法，促进知识创新和文学艺术的发展。但人工智能却不同，机器学习后，按照用户的指令生成绘画、视频、文字等内容，实际上是机器以确定权重（或概率）的方式“捕捉”输入内容后，以另外一种形式输出。一般而言，生成式人工智能很难有思想、观点、理念、方法等方面的革新，其生成的内容更多情况下是对现有内容的重新组合。

2.2 不符合合理使用的标准

显而易见，并非任何使用作品的行为都属于合理使用，著作权合理使用的判定具有一定的标准。我国《著作权法》借鉴《伯尔尼公约》的规定，采用“三步检验法”来判断某一行为是否构成合理使用。根据机器学习的特点和生成式人工智能的工作原理，算法训练使用作品不符合“三步检验法”标准，不构成合理使用。

2.2.1 不属于特殊情况下的使用

“三步检验法”的第一步是判断使用作品的行为是否属于特殊情况下的使用。对于何为“特殊情况”，《伯尔尼公约》并未明确规定。根据 WIPO专家组的解释，“特殊情况”具有质和量的双重含义：在质上限制和例外应当被明确确定，在量上其范围必须受到限制。^[14]¹⁰⁰我国《著作权法》第24条列举了12种具体的“特殊情况”，包括为个人目的的合理使用、学校课堂教学或者科学研究、国家机关执行公务等。从中可以看出，这些合理使用的“特殊情况”在使用主体、使用目的等方面似乎并无规律可循。

那么，使用作品进行算法训练是否属于“特殊情况”？答案是否定的。首先，现行《著作权法》第24条并未明确规定算法训练使用作品构成合理使用，其他法律、行政法规也没有类似规定。其次，现行《著作权法》规定的合理使用特殊情形无法涵盖用户使用作品进行算法训练的行为。与算法训练使用作品行为联系最为紧密的合理使用情形是“个人使用”。就法律文本而言，个人使用型的合理使用是为“个人”学习、研究或者欣赏目的，这里的“个人”仅限于自然人，并不包括法人和非法人组织，更不包含人工智能机器人。更重要的是，将个人使用纳入合理使用范围的目的是提高公众的知识水平，促进科学文化的发展；但使用作品进行算法训练并不能够通过提高公众知识水平的方式实现促进科学文化发展的目标。最后，算法训练使用作品的行为也不具备足够的特殊性而应当被纳入合理使用范围。“特殊”意味着版权限制或例外在量和质上都应当控制在狭窄的范围内，并且应同时符合某种独特目的。^[15]如前所述，用户训练算法使用作品的数量巨大，涉及的作品类型众多；并且，用户使用作品训练算法的目的是提高机器的智能水平，从而让人工智能生成符合自己需求的内容，以此减轻烦琐的体力劳动和脑力劳动，而不是为了教学目的、公共利益或国家利益，或者是为了特殊群体的利益。因此，无论是从法律体系，还是从合理使用制度的立法目的来看，算法训练都不属于使用作品的“特殊情况”。

2.2.2 没有影响著作权人对作品的正常使用

合理使用“三步检验法”的第二步是判断使用行为有没有影响著作权人对作品的正常使用，如果答案是肯定的，那么使用行为就不再“合理”。该要件是我国《著作权法》从《伯尔尼公约》中翻译而来，但鲜有论著将何为“有没有影响著作权人对作品的正常使用”，以及该要件与 “有没有不合理地损害了著作权人的合法权益” 要件之间的关系阐释清楚。对于该要件，WIPO专家组分别对“作品”“使用”和“正常”作了解释。从中可以看出，有没有影响著作权人对作品的正常使用主要看使用行为有没有构成对版权人作品的“市场替代”，或者是否对作者以同样的方式使用作品产生妨碍、限制或者其他影响。如果一种使用方式与作者通常利用作品获得利益的方式形成竞争，那么该使用方式就与正常利用相冲突。^[14]102

就用户使用已发表作品进行算法训练而言，虽然作者使用其作品进行算法训练也可能产生同样的结果，但在当前环境下并非作者利用作品的通常的方式。另外，使用的人工智能不同、机器学习的其他数据不同、输入的指令不同，人工智能自动生成的内容也不同。因此，用户使用作品进行算法训练没有影响作者使用该作品进行算法训练，也没有影响作者对作品的其他正常使用情形。^[16]102

2.2.3 不合理地损害了著作权人的合法权益

根据机器学习的特点可知，用户使用他人已发表作品进行算法训练可能会侵犯著作权人的复制权、翻译权、改编权和信息网络传播权等权利。更重要的是，该行为不合理地限制和减少了著作权人通过使用作品获得经济收益的途径，对作品的价值及潜在市场利益产生了负面影响。^[17]

有学者主张，随着人工智能对使用大量数据的普遍需要以及人机创作模式下“作者中心主义”的袪魅与式微，应当允许为了机器学习使用版权作品。^[18]合理使用是免费使用他人作品的情形。在人人均可使用人工智能的时代，将用户使用作品进行算法训练纳入合理使用势必会不合理地限缩作者利用作品获取经济收益的途径。因合理使用制度是通过剥夺权利人私人权益的方式来维护和促进公共利益，故其只适用于非营利性使用作品的行为。然而，用户使用作品进行算法训练具有营利性。首先，对于用户而言，在使用他人作品进行算法训练的过程中，用户本身并非通过利用所学知识从事生产经营等，而是让机器学习知识，并拿机器学习后生成的结果直接从事生产经营。其次，对于人工智能所有人而言，其通过使用作品训练算法模型获得利润，或者通过存储用户使用作品训练的算法和作品数据，定期优化算法模型，进而获得更高的利润。最后，对于作者而言，其在人工智能时代通过创作作品获得经济收益的手段被不合理地限缩。市场主体对自身利益最大化的追求，是著作权法立法目的实现的必要途径。从制度运作机理来看，著作权法以保护财产利益为手段，激发人类的创造力。^[19]在传统环境下，公众为学习知识需要购买图书、期刊数据库阅读账号等，或者为了欣赏视听作品而充值会员、购买门票等；但在人工智能时代，人们学习知识的需求减少，如果人工智能学习作品不需要向著作权人支付费用，那么作者可能无法参与数据许可市场利益的分配。^[20]

综上所述，算法训练使用作品的利益平衡问题与合理使用的基本原理相违背，^[21]单纯从促进人工智能技术及算法发展的角度出发，主张设置技术性合理使用（technological fair uses）之著作权限制与例外的观点，^[22] 不仅会导致合理使用制度在人工智能时代发生“异化”，还可能加大作品创作者与使用者之间的矛盾和冲突。法律制度的修订应当让所有主体分享科学技术发展带来的红利。如今，人工智能技术的发展打破了著作权法原有的利益平衡，使得作品创作者的利益受到严重侵蚀，这不仅会降低人们创作作品的积极性，从长远来看，还不利于文学、艺术和科学文化的发展繁荣。这就需要我们适时、适当地调整现有法律制度，以应对和解决科学技术发展与应用带来的新问题。

建立算法训练使用作品的法定许可制度

平衡各方利益主体关系是完善版权制度的重要手段。^[23]用户使用作品进行算法训练的行为难以构成合理使用，但如果要求算法开发者和人工智能使用者就所需使用的作品逐一向著作权人获得授权，则不具有现实可行性。根据算法训练使用作品的特点，结合著作权基本原理和制度架构，可以通过法定许可制度使得用户使用作品进行算法训练的行为合法化。

3.1 将算法训练使用作品纳入法定许可范畴的正当性

3.1.1 符合数字时代法定许可制度扩张的趋势

效率是知识产权法追求的重要目标之一。^[24] 针对某些主体使用作品不仅需求量大，而且特别强调时效性和紧迫性的特点，为了保证其使用作品时不增加一些不必要的成本，且不损害著作权人合法利益，我国《著作权法》规定了法定许可制度。^[25] 在法定许可情形下，使用人可以不经著作权人许可，只需按照规定支付报酬就可以使用著作权人享有著作权的作品。现行《著作权法》规定的法定许可主要包括编写出版教科书、报刊转载等五种情形。著作权法定许可制度既减轻了使用者获得著作权许可的烦琐程序，畅通了公众获得作品的渠道，又最大限度地保障了作品创作者的经济利益。有学者以法定许可制度导致著作权的排他性被弱化 ^[26]、其反垄断目的在版权产业中难以找到充分的支持证据 ^[27] 等为由，主张不应当继续对著作人实施权利上的“剥夺”^[28]，而应当废除该制度。尽管法定许可制度存在诸多缺陷，但其在补充完善著作权许可制度体系方面依然具有不可替代的作用。^[29] 法定许可制度具有降低交易成本与预防垄断的制度价值，实质上增加了作品利用与传播的机会。^[30]该制度有利于保障公众的信息获取权，增进言论自由和文化繁荣 ^[31]，保障著作权人获得合理的报酬，维护著作权多元利益平衡。^[32] 正因如此，我们不仅应当在著作权法框架下保留法定许可制度，还应当根据社会经济的发展及科学技术的变革，逐步拓展其适用范围。^[33-35]

在数字时代，作品的创作模式和使用方式均发生了重大变化。公众由原来的直接学习、研究他人作品以获取知识，而后利用所储备的知识创作作品等智力成果，转变为将他人已发表作品输入到人工智能系统，在算法的基础上生成相应内容。并且，网页信息收集爬取技术以及信息处理系统的更新迭代，会使公众对作品使用方式的变化呈现数量巨大化、利用方式多样化、作品处理自动化的趋势。大数据背景下，作品经常作为数据而被不同主体以不同方式加以处理利用，这既包括各式各样的营利场景，也包括公益或者行政行为。如果将此类情形直接认定为侵权行为，要求使用者和数据处理平台必须获得作者授权才能够使用其作品，不仅可能波及现有的市场交易秩序和交易模式，还可能危及公共利益以及社会福祉。为了提高版权交易效率，维护著作权人、作品使用者和社会公众之间的利益平衡，有必要根据作品使用方式的变化和特点调整法定许可的适用范围，结合数字技术发展和运用情况扩充法定许可的类型。人工智能技术作为21世纪最具有代表性的颠覆性技术之一，目前正处于快速发展时期。如果要求用户必须获得作者授权才能够使用其作品训练算法，不仅可能导致人工智能技术“夭折”，还会造成公众擅自使用他人享有著作权的作品进行算法训练却难以被发现和规制的乱象。因此，扩张法定许可类型，将用户使用作品进行算法训练纳入进来，是数字环境下化解算法训练使用作品行为的合法性难题、迎合人工智能技术发展、保障作品创作者利益的应然路径选择。

3.1.2 符合著作权法定许可制度设立的初衷

著作权是一种专有权，但给予著作权人绝对的排他性权利可能会损害社会对作品的重要使用，若把某些行为纳入合理使用，又会损害著作权人本应该获得的经济利益。^[36] 法定许可就是处于保护作者排他性权利与公众合理使用之间的一种中间制度。^[37] 随着创作者数量的上升，著作权频繁、广泛的流转使得著作权的权属复杂化、分散化，海量的作品使用行为导致使用者获得著作权许可的成本过高。^[38]为了提高使用者使用作品的效率，我国著作权法规定了法定许可制度。有学者以运行成本高、许可费难以确定为由反对引入算法训练使用作品的法定许可机制。^[39]然而，如果由用户就算法训练使用的每一件作品逐一获得著作权人授权，则效率更低；如果不获得授权而直接使用则会导致大规模侵权现象的发生。将此类情形纳入法定许可之内，在著作权法中规定用户无须获得许可就可以使用他人已发表作品进行算法训练，但应当按照规定支付报酬，可以极大地提高作品使用许可授权效率。需要指出的是，作品使用主体范围不应当成为法定许可的限制。某些特定主体存在大量使用作品的需求，而在人工智能背景下，不特定主体也存在该需求，并且特别强调作品的时效性，未来可能更加注重使用作品的质量。因此，扩张法定许可的适用范围，将算法训练使用作品纳入法定许可之内，与著作权法定许可制度的立法目的相吻合。

3.1.3 有利于最大化实现作品的价值，保障著作权人的经济利益

利益平衡是著作权制度的基石。作品创作、传播、利用的效率和程度决定著作权保护的社会需求水平与支持力度。^[40]作者获酬权的实现与法定许可的现实需求之间存在特定联系。^[41] 在人工智能环境下，作品的经济价值越来越重要，作者更加关注对作品的经济性使用。多数情况下作者创作音乐、美术、视听等作品，不仅希望表达某种思想情感，更希望通过他人使用或者传播获得经济收益。因此，作者创作出来的作品一般并非绝对禁止用户用于算法训练，而是更希望从用户训练算法、人工智能所有者优化算法模型中分享一部分经济利益，以弥补创作作品所消耗的金钱、技术、时间等方面的损失。毋庸置疑，人工智能用户使用作品进行算法训练本质上属于应受著作权人控制的作品利用行为，但如果按照普通授权的方式由用户就其使用的作品逐个与著作权人协商，则效率过于低下。在这种背景下，不妨考虑扩张法定许可制度的适用范围，将用户使用作品训练算法的行为纳入进来，一方面以限制著作权人专有权利的方式换取一定的经济收益，并将算法训练使用作品的公共行为合法化，可以最大限度实现作品的经济价值和社会价值；另一方面，将现代新兴技术与著作权法律制度原理和功能相结合，丰富和发展法定许可制度的内涵，使得法定许可制度在当前技术环境下具有更强的可适性。

3.2 构建方案——设立专门的集体管理组织

法定许可是一种需要支付费用的著作权许可方式，但如果直接由用户向著作权人支付许可费不具有现实可行性，并且对于某些用户使用了著作权人作品来训练算法而实际并未支付报酬的行为，作者很难发现并维权。著作权实现经济利益的重要途径是集体管理制度，^[38] 在现行法律框架下，著作权集体管理制度不失为解决用户使用作品进行算法训练付费问题的一种可行性方案。著作权集体管理制度“一站式”许可的方式，不仅降低了著作权交易成本，^[42]还消除了单个权利人自行协商收费的不正当竞争。^[43]

3.2.1 突破作品类型，针对算法训练使用作品建立专门的集体管理组织

著作权集体管理组织可以接受著作权人的委托，集中向作品使用者许可自己管理的作品，并将有关收益分发给著作权人。它是一种非营利性组织。集体管理组织的职能主要包括与使用者订立许可使用合同、收取并向权利人转付使用费、进行诉讼和仲裁等。著作权人大都为单个自然人，而被许可人多为法人或者非法人组织，在著作权许可、侵权诉讼和仲裁过程中，著作权人往往处于劣势地位，加入集体管理组织，由该组织处理相关事宜，有利于维护著作权人的合法利益。目前，我国现有的著作权集体管理组织包括音乐著作权协会、文字著作权协会等5家。由于 KTV、唱片制作公司等大规模使用作品的市场主体一般仅使用一类作品，同时，特定的作者所创作的作品类型也基本相同，故中国现有的著作权集体管理组织均按照作品类型创设。然而，算法训练可能涉及多种类型的作品。一方面，同一用户可能使用不同类型的作品训练人工智能算法；另一方面，针对不同的人工智能，用户训练算法重点使用的作品类型也不一样。并且，在学科交叉与融合背景下，一个自然人可能创作出不同类型的高质量作品。如果人们使用人工智能进行文学、艺术创作，所创作的成果更是可能涵盖所有的作品类型。目前，对于人工智能生成内容的著作权归属问题还没有定论，实践中多数使用者将自己标注为生成内容的“作者”。在这种背景下，如果仍然按照作品类型由不同管理组织分管算法训练使用作品行为的传统模式，可能会使得一个自然人作者需要成为多个集体管理组织的成员，人工智能所有者亦需要向多个集体管理组织交纳作品使用费，不同集体管理组织之间使用费的收取标准、分配方式等方面的差异会阻碍该机制的良性运作。为了避免授权许可的烦琐程序，提高集体管理组织的运行效率，可以考虑突破主体和作品类型的限制，按照作品使用方式，针对算法训练使用作品行为设立专门的著作权集体管理组织，统一收费标准和分配标准，并不断提高集体管理组织的技术水平和管理能力，以更好地推动作品大规模市场利用授权行为的规范化和效率化。

3.2.2 规定该集体管理组织的权利和义务，明确使用费收取和分配方式等事项

目前，我国现有的著作权集体管理组织运作模式已经较为成熟，虽然其存在诸多困境，但在保护著作权人合法权益方面发挥着重要作用。因此，针对算法训练使用作品建立专门集体管理组织并非难事，重点是厘清该组织的权利和义务，明确许可使用费的收取模式、收取标准和分配方式等问题。首先，与其他集体管理组织一样，该集体管理组织也应当享有并承担向使用者收取使用费、向权利人转付使用费、进行诉讼和仲裁等权利和义务。但应当强调，该集体管理组织应积极研发与使用作品进行算法训练相关的科学技术，采用先进的技术手段监测所管理作品的使用情况，及时发现未支付使用费擅自使用作品进行算法训练的著作权侵权行为，积极维护权利人的利益。其次，集体管理组织作为作品法定许可使用费收转机构能够为著作权人权利的实现提供便利。^[44] 考虑到算法训练使用作品行为可能涉及不特定的多数主体，故应当允许相关市场主体先使用后付酬。^[45] 如前所述，所有者既是生成式人工智能的提供者和算法开发者（或雇佣者），也是用户使用作品训练算法成果的最终拥有者，由集体管理组织向人工智能所有者收取使用费，然后由所有者通过合同的方式按照作品使用数量、次数等指标转嫁给人工智能用户，更具有合理性和可操作性。再次，使用费的收取标准应当考虑作品使用次数、作品的数量和质量等因素。关于用户为训练算法所使用作品的次数和数量可以通过人工智能后台程序获得，只需要在法律上要求人工智能所有者如实向集体管理组织提供真实作品使用数据即可。关于作品的质量，显然不能够完全按照作者的主张来认定，但可以通过作品使用次数进行量化。用户使用某作品进行算法训练的次数越多，在一定程度上说明该作品的质量越高，或者反映了作者创作的该作品更符合用户的市场需求。最后，使用费的分配方式需要充分考虑作品质量指标，为此，可以按照用户使用作品的次数制定使用费分配区间标准。

3.2.3 完善相关配套法律制度

在人工智能时代设立专门的集体管理组织负责用户使用作品进行算法训练的著作权使用费收取、转付及权利保护等事宜，在运作中难免会存在一些具体问题，这些问题或为集体管理组织本身存在的症结，或为算法训练使用作品的新兴方式所产生的特殊问题。前者比如集体管理组织职能定位不够清晰、管理不够规范，^[46]以及在运行中存在行政化程度高、收益分配不透明等问题，^[47]需要重新反思著作权集体管理组织的性质和定位，通过建立付酬协商机制和争议裁决机制、加强监管等措施来化解。^[48] 后者比如使用技术手段进行侵权判定时的证据采信标准、人工智能所有者不提供真实作品使用数据的法律责任、作者恶意使用自己作品进行算法训练的惩罚机制等。这些问题的解决既需要我国逐步完善相关配套制度和法律规则，也需要通过司法审判实践总结相关经验。

结语

生成式人工智能作为一种新兴技术，在为人们的工作和生活带来极大便利的同时，也颠覆了传统的作品使用和创作方式，给著作权基本理论和具体制度带来严峻挑战。我们应当以此为契机，丰富和发展著作权传统理论，适时、适当地调整现有制度和规则，以解决人工智能技术运用所带来的新问题。按照机器学习原理和人工智能商业运作模式，如果纯粹为了促进科学技术发展而将用户使用作品进行算法训练的行为纳入合理使用范畴之内，则会损害著作权人的合法利益，降低公众创作作品的积极性，不利于文学艺术的发展和繁荣。在目前人工智能技术发展初级阶段和现行著作权法框架下，可以考虑通过改良法定许可制度来使得用户使用作品进行算法训练的行为合法化，并设立专门的集体管理组织，专职负责使用费的收取、转付及维权等事宜，以此保护著作权人的合法利益。当然，对于用户使用作品进行算法训练的法定许可制度构建和具体运作中还会存在其他困境和障碍，甚至会触及著作权法传统制度的顽疾，这需要在理论支撑和实践探索的基础上寻找最佳解决方案。

参考文献

（上滑查看）

[1] 阿米尔·侯赛因. 终极智能：感知机器与人工智能的未来[M]. 赛迪研究院专家组，译. 北京：中信出版集团，2018：21.

[2] 鲁斌，刘丽，李继荣，等. 人工智能及应用[M]. 北京：清华大学出版社，2017：20.

[ 3 ] 陈晨. 论人工智能生成内容的可版权性问题：以ChatGPT生成内容为例[J]. 科技与出版，2023（6）： 98-106.

[4] 余俊缘，陈俊凯. 群体智能创作场景中AIGC权属规则的构建[J]. 科技与出版，2023（11）：158-167.

[5] CARROL M W. Fixing Fair Use [J]. North Carolina Law Review，2007，85（4）：1087-1154.

[6] 吴汉东. 著作权合理使用制度研究：第3版[M]. 北京：中国人民大学出版社，2013：2.

[7] 姜亦周. 中国著作权合理使用制度之演变与完善研究：从1991年《著作权法》到2014年《著作权法（修订草案送审稿）》[J]. 出版科学，2019，27（3）： 45-52.

[8] PICKER R C. Fair Use v. Fair Access [J]. Columbia Journal of Law & the Arts，2008，31（4）：603-616.

[9] 刁佳星. 算法时代合理使用制度的困境与纾解[J]. 中国出版，2023（3）：33-38.

[10] 鄂昱州. 著作权合理使用制度法律性质探究[J]. 学习与探索，2015（5）：81-85.

[11] 阳东辉，张晓. 合理使用的性质重解和制度完善[J]. 知识产权，2015（5）：62-66.

[12] 王迁. 版权法对技术措施的保护与规制研究[M]. 北京：中国人民大学出版社，2018：240.

[13] 高莉. 数字时代著作权合理使用制度的检视与重构：基于技术中立的理论分析[J]. 苏州大学学报（法学版），2023，10（3）：41-52.

[14] 朱理. 著作权的边界：信息社会著作权的限制与例外研究[M]. 北京：北京大学出版社，2011：100，102.

[15] 李宗辉. 论人工智能应用中的版权合理使用制度[J]. 科技与法律，2020（4）：44-48.

[16] 梅术文，宋歌. 论人工智能编创应适用版权合理使用制度[J]. 中国编辑，2019（4）：78-82.

[17] 华劼. 合理使用制度运用于人工智能创作的两难及出路[J]. 电子知识产权，2019（4）：29-39.

[18] 林秀芹. 人工智能时代著作权合理使用制度的重塑[J]. 法学研究，2021，43（6）：170-185.

[19] 孙山. 数字技术时代作品“过度保护”现象的治理逻辑[J]. 科技与出版，2024（2）：101-112.

[20] 卢炳宏. 表达型人工智能版权合理使用制度研究[J]. 现代出版，2019（4）：60-63.

[21] 高阳，胡丹阳. 机器学习对著作权合理使用制度的挑战与应对[J]. 电子知识产权，2020（10）：13-25.

[22] LEE E. Technological Fair Use [J]. Southern California Law Review，2010，83（4）：797-874.

[23] 唐伶俐. 技术进步与版权制度变迁[M]. 北京：国家图书馆出版社，2019：103.

[24] 罗伯特·P. 莫杰思. 知识产权正当性解释[M]. 金海军，史兆欢，寇海侠，译. 北京：商务印书馆，2023：21.

[25] 吴汉东. 知识产权法学：第8版[M]. 北京：北京大学出版社，2022：107.

[26] 熊琦. 著作权法定许可的正当性解构与制度替代[J]. 知识产权，2011（6）：38-43.

[27] 刘家瑞. 论著作权法修改的市场经济导向：兼论集体管理、法定许可与孤儿作品[J]. 知识产权，2016（5）：40-51.

[28] WAKOLBINGER J A. Compositions Are Being Sold for a Song: Proposed Legislation and New Licensing Opportunities Demonstrate the Unfairness of Compulsory Licensing to Owners of Musical Compositions[J]. University of Illinois Law Review，2008（2）： 803-832.

[29] 蒋一可. 数字音乐著作权许可模式探究：兼议法定许可的必要性及其制度构建[J]. 东方法学，2019（1）：147-160.

[30] 刘铁光，向静洁. 基于创作目的实现的法定许可制度调适：兼评2020年《著作权法》相关制度调整[J]. 江西社会科学，2021，41（7）：136-144，255-256.

[31] 张曼. 论著作权法定许可的正当性基础[J]. 知识产权，2013（1）：48-53.

[32] 胡开忠. 广播电台电视台播放作品法定许可问题研究：兼论我国《著作权法》的修改[J]. 知识产权，2013（3）：3-11.

[33] 王爱霞，白苏红，王慧莹. 数字信息资源长期保存法定许可使用制度的设计与构建[J]. 国家图书馆学刊，2020，29（5）：3-10.

[34] 何蓉. 数字图书馆扶助贫困法定许可制度研究[J]. 图书馆建设，2021（1）：66-73.

[35] ACKERSON T. It's Time for the Copyright Act to Patch-in a Statutory License for Video Game Streaming [J]. AIPLA Quarterly Journal，2020，48（2）： 325-362.

[36] PAUL G. International copyright principles law and practice[M]. Oxford：Oxford University Press， 2001：309.

[37] 李永明，曹兴龙. 中美著作权法定许可制度比较研究[J]. 浙江大学学报（人文社会科学版），2005（4）：29-36.

[38] 刘劭君. 权利限制与数字技术：著作权合理使用制度的变革[M]. 北京：知识产权出版社，2019：125-126.

[39] 刘禹. 机器利用数据行为构成著作权合理使用的经济分析[J]. 知识产权，2024（3）：107-126.

[40] 崔波. 论我国《著作权法》中的法定许可制度[J]. 情报科学，2005（1）：55-60.

[41] 付继存. 著作权法定许可的立法论证原则[J]. 学术交流，2017（9）：157-164.

[42] 熊琦. 著作权法中的私人自治原理[M]. 北京：法律出版社，2021：175-176.

[43] 丹尼尔·热尔韦. 著作权和相关权的集体管理[M]. 马继超，郑向荣，张松，译. 北京：商务印书馆，2018：383.

[44] 刘洁. 我国著作权集体管理制度研究[M]. 北京：中国政法大学出版社，2014：157-158.

[45] 周勇. 深度学习的著作权法规制[J]. 编辑学刊，2022（2）：31-36.

[46] 段海风. 权利与义务的平衡配置：我国著作权集体管理制度的完善方向[J]. 科技与出版，2018（11）： 78-83.

[47] 初萌. “知网模式”的版权问题及应对之策：以图书馆在线提供学术期刊论文为切入点[J]. 科技与出版，2023（1）：96-107.

[48] LU H J. Chinese Collective Management of Copyright：The Need for Extensive Changes[J]. Queen Mary Journal of Intellectual Property，2016，6（2）： 175-206.

AUTHOR

李青文

华东政法大学知识产权学院

END

http://mp.weixin.qq.com/s?__biz=MzA4MjE0MDYyNg==&mid=2694695346&idx=1&sn=3d7dff54cc3d818525c0df6d816e4bd9

科技与出版

《科技与出版》旨在搭科技进步与出版创新之桥，传编辑出版与文化传播之经。是CSSCI来源期刊、中文核心期刊、“复印报刊资料”重要转载来源期刊。由清华大学主管，清华大学出版社有限公司主办，中国版协科技出版工作委员会指导。