关键合理使用裁决明确书籍何时可用于AI训练
在具有里程碑意义的裁决中,法官将AI训练比作小学生学习写作。
Ashley Belanger – 2025年6月24日 下午3:56 | 151
图片来源: CookiesForDevo | iStock / Getty Images Plus
人工智能公司无需获得作者许可即可使用合法获取的书籍训练其大型语言模型(LLMs),美国地区法官威廉·阿尔斯普(William Alsup)周一裁定。
这项开创性的裁决将AI训练视为合理使用,预计将被视为对AI公司的重大胜利,但同时也明确提醒所有预期相同推理适用于盗版书籍训练的AI公司——这一问题仍存争议。
在阿尔斯普审理的具体案件中,书籍作者与Anthropic公司对簿公堂,阿尔斯普认为“使用受版权保护作品训练LLMs以生成新文本的目的是本质上的转化性”且“必要”以构建世界级AI模型。
值得注意的是,此案与其他作者声称AI模型可能复制和分发其作品的诉讼不同。由于起诉Anthropic的作者并未声称其输出复制了他们的作品或表达风格,阿尔斯普认为没有威胁表明Anthropic的文本生成器Claude可能取代作者在市场中的地位。缺乏这一论点使合理使用分析倾向于Anthropic。
“如同任何希望成为作家的读者一样,Anthropic的LLMs训练于作品并非为了超越并复制或取代它们,而是为了转变方向并创造不同的内容,”阿尔斯普写道。
阿尔斯普的裁决无疑让作者感到失望,他们认为Claude依赖其文本可能生成竞争性摘要或故事的替代版本。法官称这些投诉类似于“训练小学生写作会引发大量竞争作品”的论调。
“这不是《版权法》所关注的竞争或创造性取代,”阿尔斯普写道。“该法旨在促进原创作品,而非保护作者免受竞争。”
阿尔斯普指出,如果作者发现Claude输出存在侵权行为,他们可以提出新主张。这可能改变合理使用的计算方式,如同最近一位法官暗示Meta的AI产品可能“彻底摧毁”作者市场。
“作者承认训练LLMs并未导致任何精确复制或甚至侵权的仿制品提供给公众,”阿尔斯普写道。“如果不是这样,此案将有所不同。作者仍可在未来提出此类主张,如果出现相关事实。”
Anthropic必须面对书籍盗版诉讼
Anthropic对裁决表示“满意”,发表声明赞扬法院“认识到使用作品训练LLMs是极具转化性的。”
但Anthropic并未完全脱责,尽管法院已就AI训练的合理使用作出总结性裁定,但其仍需面对盗版诉讼,阿尔斯普裁定这不构成合理使用。
在Anthropic案件中,该公司被指控下载了700万本盗版书籍以构建一个研究图书馆,这些书籍将“永远”保存,无论是否用于AI训练。
似乎意识到盗版可能引发法律挑战,Anthropic后来尝试用合法购买的书籍替换盗版书籍。但该公司还辩称,即使最初复制这些盗版书籍也是“中介步骤”,必要以推进AI训练的转化性使用。此外,Anthropic还声称,由于其可以借阅这些被盗书籍,单纯的盗窃不应“阻碍”合理使用分析。
但阿尔斯普并未被这些论点说服,指出从盗版网站复制书籍是版权侵权,“无条件”。他拒绝“Anthropic假设使用副本构建中心图书馆可因部分副本最终用于训练LLMs而被豁免为合理使用”,并对其他讨论盗版的AI诉讼是否能避免赔偿表示怀疑。
“本裁决质疑任何被指控侵权者能否解释为何从可合法购买或获取的盗版网站下载源副本本身是合理使用所必需的,”阿尔斯普写道。“即使盗版副本立即用于转化性使用并立即丢弃,这种盗版行为本质上是不可挽回的侵权。”
但阿尔斯普指出,Anthropic案件可能无需决定这一点,因为其保留盗版书籍用于研究图书馆本身并不具有转化性。阿尔斯普写道,Anthropic声称保留可能用于AI训练的盗版材料是为了“快速滑过薄冰”。
此外,阿尔斯普指出,Anthropic早期寻求获得训练作者作品许可的努力失败,内部消息显示公司得出结论认为盗窃书籍是更有效的创新途径,“以避免‘法律/实践/商业障碍’,正如联合创始人兼首席执行官Dario Amodei所言。”
“Anthropic错误地认为,只要创造令人兴奋的最终产品,每一步‘后台步骤,公众不可见’都可被豁免,”阿尔斯普写道。“在这里,盗版本身就是目的:构建一个可以付费购买的中心图书馆,正如Anthropic后来所做的那样,但无需付费。”
为避免败诉后的最大赔偿,Anthropic可能会继续辩称用购买书籍替换盗版书籍会削弱作者的抗争,阿尔斯普的裁决建议。