来源:The Docker
简评:法官只是认为OpenAI移除版权管理信息本身不构成实质损害,但也暗示在原告修改诉状后重新考虑诉请。
裁判要旨
纽约的一位联邦法官驳回了新闻网站Raw Story和AlterNet对OpenAI提起的诉讼,裁定原告未能证明使用他们的文章作为AI训练数据造成了足够的损害。
法官认可OpenAI的合理使用论点,指出ChatGPT基于训练内容合成AI回应,文章被完全复制的可能性很低。即使这种情况确实发生,也被视为错误而非功能,并且事实不受版权保护。
这一决定可能会影响其他针对AI公司的正在进行的诉讼,例如《纽约时报》与OpenAI之间的法律争端,以及音乐公司针对AI音乐生成器提起的诉讼。
一、主要内容
纽约的一位联邦法官驳回了新闻网站Raw Story和AlterNet针对OpenAI使用他们的文章训练AI系统的诉讼。这一裁决可能影响类似的正在进行的案件。
法官科琳·麦克马洪在发现原告未能展示OpenAI使用他们的内容作为训练数据造成的具体伤害后,驳回了此案。与其他针对AI公司的诉讼不同,这个案件关注的是版权管理信息的移除,而不是直接的版权侵权——尽管麦克马洪法官指出,背后的问题仍然是相同的。
法官的决定支持了OpenAI和其他AI公司的合理使用辩护,指出ChatGPT是根据其训练创建合成回应,而不是直接复制内容。她强调ChatGPT复制文章的确切副本的可能性是微乎其微的,并指出文章中的事实信息反正不受版权保护。
裁决还涉及了ChatGPT过去曾逐字复制文本的情况,指出这些情况无法在当前版本中复制——支持OpenAI的立场,即这种复制,当它发生时,是罕见的错误,而不是预期的功能。
在驳回当前案件的同时,麦克马洪法官为原告留下机会,允许他们提交修改后的诉状。然而,她对原告能否“声称一个可识别的伤害”表示怀疑,据路透社报道。“是否有另一个法规或法律理论能够提升这种伤害的等级,还有待观察,”麦克马洪说。
Raw Story的律师马特·托皮克表示,有信心法院的担忧将在修订后的诉状中得到解决。OpenAI尚未对这一决定发表评论。
AI版权之战的更广泛影响
麦克马洪的裁决可能为针对AI公司的进一步版权诉讼定下基调,特别是《纽约时报》对OpenAI的诉讼以及音乐公司针对AI音乐生成器提起的案件。《纽约时报》的案件特别挑战了OpenAI未经授权使用其文章来创建它认为的竞品。
这一裁决加强了OpenAI的立场,支持其论点,即AI生成的内容是训练数据的综合,而不是直接复制,这一区别可能在未来关于AI训练实践的法律战中证明至关重要。
二、裁判文书原文
美国联邦南区纽约地方法院
X ------ ----------
原告:
Raw Story Media, Inc.,
AlterNet Media, Inc.
VS.
被告:
OPENAI, INC.,
OPENAI GP, LLC,
OPENAI, LLC,
OPENAI OPCO LLC,
OPENAI GLOBAL LLC,
和 OPENAI HOLDINGS, LLC
-----------------X
决定和命令
麦克马洪,J:
背景
法律标准
I. DMCA的第1202(b)(i)条
任何人在未经版权所有者或法律授权的情况下,不得故意移除或更改任何[版权管理信息(CMI)],明知或在第1203节规定的民事救济方面,有合理理由知道这样做会诱导、使能、便利或掩盖对本法案下任何权利的侵犯。
II. 宪法第三条诉讼资格
被告寻求完全驳回原告的投诉。被告认为原告缺乏第三条的诉讼资格来主张他们的索赔,因此法院根据联邦民事诉讼规则12(b)(1)缺乏对本案的主管权。作为替代方案,被告认为原告未能陈述一个可以授予救济的索赔,根据联邦民事诉讼规则12(b)(6)。
索赔者是否有立场是每个联邦案件的门槛问题,决定法院受理诉讼的权力。因此,我从这里开始我的调查。
原告认为他们有资格寻求两种形式的救济。首先,原告认为他们有资格寻求损害赔偿,因为非法移除版权作品中的版权管理信息(CMI)是一种具体的伤害。其次,原告认为他们有资格寻求禁令救济,因为他们声称存在相当大的风险,被告的程序将“向用户提供包含原告版权保护作品材料的回应,或者逐字或几乎逐字地重复版权保护作品。”被告回应称,这两种伤害理论都没有确定足够的具体事实伤害来建立立场。
我同意被告的观点。由于原告缺乏宪法第三条立场,原告对损害赔偿和禁令救济的索赔均被驳回。因此,我不需要考虑根据联邦民事诉讼规则12(b)(6)的替代动议。
让我们考虑原告关于他们损害赔偿索赔的主张:未经授权从他们的版权作品中移除版权管理信息(CMI)构成了实际的具体伤害,即使他们没有声称被移除CMI的作品副本被ChatGPT传播给任何人以回应任何特定查询。原告主张他们的伤害与版权侵权行为有“密切关系”,因为“防止移除或更改CMI的保护,类似于复制作品和准备衍生作品的权利,在这两者都授予版权所有者决定作品的未来版本如何与所有者发布的版本不同的唯一特权。原告认为,这反过来,符合普通法,普通法认为干涉财产,无需更多,就是一种具体的伤害。
我不信服原告所声称的因干涉财产而产生的伤害,提供了与原告所声称的伤害所必需的紧密的历史或普通法类比。首先,原告错误地认为第1202条“赋予版权所有者唯一特权,以决定作品的未来版本与所有者发布版本的差异。”版权法的其他条款提供了此类保护,但第1202条并非如此。第1202条保护版权所有者免受对作品版权管理信息(CMI)完整性的特定干涉。换句话说,只要被告保持原告的CMI完整,被告可以在未经许可的情况下复制甚至创作原告作品的衍生作品,而不会根据第1202条承担法律责任。实际上,DMCA的立法历史表明,该法案的目的并非保护基于财产的伤害。相反,它的目的是通过防止欺诈和误导来确保电子市场的完整性,并使美国符合其在世界知识产权组织(WIPO)版权条约第12条(“关于权利管理信息的义务”)和WIPO表演和录音条约第19条下的义务。
此外,我并不信服,在没有传播行为的情况下,仅仅从版权作品中移除识别信息,会构成任何历史上或普通法上认可的侵权行为。
因此,我们转向原告关于禁令救济的索赔。原告寻求一项禁令,要求被告从训练集和任何其他存储库中移除所有删除了作者、标题、版权和使用条款信息的原告版权作品的副本。 救济请求。
原告主张他们有权获得这样的禁令,因为无论ChatGPT是否已经在没有附加所需版权管理信息(CMI)的情况下复制了他们的版权作品,都存在一个实质性的风险,即ChatGPT将来会这样做。一个面临未来伤害风险的人可以寻求前瞻性的禁令救济,以防止伤害发生,至少在伤害风险足够迫近和重大的情况下。如果所威胁的伤害是肯定即将发生的,或者存在重大风险伤害将会发生,则对未来伤害的指控可能就足够了。” 重大风险意味着存在“遭受直接伤害的现实危险。”
被告承认,对于这种类型的伤害,有明显的历史和普通法类比。然而,被告认为原告缺乏寻求禁令救济的诉讼资格,因为他们未能陈述事实,以表明ChatGPT在没有所需CMI的情况下复制原告作品的全部或部分的风险是“重大的。
我同意被告的观点。原告声称ChatGPT已经被训练在大部分互联网的内容抓取上,这包括来自无数来源的大量信息,几乎涵盖了任何给定主题的信息。原告没有在任何地方声称他们文章中的信息是受版权保护的,他们也无法这样做。当用户向ChatGPT输入问题时,ChatGPT会将其知识库中的相关信息综合成一个答案。鉴于知识库中包含的信息量,ChatGPT输出剽窃自原告文章的内容的可能性似乎很小。虽然原告提供了第三方统计数据,表明ChatGPT的早期版本生成的回应包含大量剽窃内容,但原告并没有合理地声称存在一个重大风险,即当前版本的ChatGPT将生成剽窃原告文章的回应。
因此,原告缺乏根据第三条寻求对其所谓伤害的禁令救济的诉讼资格。
让我们明确这里真正利害攸关的是什么。原告真正寻求补救的所谓伤害,并不是被告的训练集中排除了版权管理信息(CMI),而是被告未经补偿使用原告的文章来开发ChatGPT。OpenAI被告已经承认,使用受版权保护的作品来训练ChatGPT需要获得该内容的许可,在某些情况下,已经与大型版权所有者签订了许可协议,他们还在与新闻行业的其他版权所有者进行许可谈判,但没有向原告提供任何补偿。无论这种伤害是否满足实际伤害的要求,它不是DMCA第1202(b)(i)条所“提升”的伤害类型。国会可能将实际上在法律上不充分的损害提升到法律上可认知的损害地位。是否有另一个法规或法律理论确实提升了这种伤害类型,还有待观察。但这个问题不是法院今天面前的问题。
如果案件被驳回,原告寻求允许提交修改后的诉状。如果不看到拟议的修改诉状,我无法确定修改是否会是徒劳的。我对原告能否声称一个可认定的伤害持怀疑态度,但至少在禁令救济方面,我愿意考虑修改后的诉状。
基于上述理由,被告的驳回动议被完全批准。原告重新起诉的动议被拒绝,但不影响在适当记录下重新提起的权利——这意味着提交一个附有拟议修正诉状的通知,以及解释为什么拟议的修正不会是徒劳的。这构成了书面意见。书记员被指示从法院未决动议列表中移除文档编号68的动议。
2024年11月7日