书籍作者在Meta AI训练案中提出错误论点,法官裁定
法官们就“学童”类比在关键AI训练裁决中的争议展开争论。
书籍作者和出版专业人士在Meta英国总部国王十字车站外抗议Facebook母公司使用受版权保护的书籍训练人工智能。 信用: SOPA Images / 贡献者 | LightRocket
在一项裁定具有里程碑意义的裁决认定当Anthropic复制书籍训练人工智能模型时属于“转化性”合理使用后,另一名法官在书籍作者与Meta的案件中得出相同结论。
但这意味着法官们并不完全一致,这可能很快成为不仅对Meta,而且对其他庆祝本周双胜的大型AI公司的难题。
周三,法官文斯·奇哈利亚解释表示,尽管他更倾向于支持Meta,但因为作者在反对Meta的案件中提出了所有错误的论点,所以他最终还是站在了Meta一边。
“这项裁决并不意味着Meta使用受版权保护材料训练其语言模型是合法的,”奇哈利亚写道。“它仅意味着这些原告提出了错误的论点,并未能建立支持正确论点的记录。”
作者们本应主张Meta的Llama AI模型可能迅速涌入市场,制造竞争性AI生成书籍,间接损害销售,但作者们却只提出“Llama用户可以复制其书籍中的文本,且Meta的复制损害了向公司许可受版权保护材料用于AI训练的市场”的论点。
由于奇哈利亚认为这两种理论“存在缺陷”——前者因为Llama即使使用对抗性提示也无法生成长篇引文,后者因为作者无权垄断向公司许可书籍用于AI训练的市场——他表示他别无选择只能批准Meta的简易判决请求。
最终,由于作者们未提供任何证据证明Meta的AI威胁要稀释其市场,奇哈利亚裁定Meta仅通过提供“其专家证词解释Llama 3的发布对原告销售没有明显影响”就足以克服作者们关于潜在损害的其他论点。
奇哈利亚似乎批评作者们对作品提出的“半心半意”的辩护,指出他的意见“可能与现实存在显著矛盾”,其中似乎“可能甚至很可能Llama会损害书籍销售市场”。
对于其他书籍作者而言,这项裁决或许有其积极的一面,奇哈利亚暗示。由于Meta的简易判决请求是在诉讼中的类别认证之前提出的,因此他的裁决仅适用于本案中起诉Meta的13位作者。这意味着其他可能提出更有力市场损害主张的作者仍有机会在未来的Meta诉讼中获胜,奇哈利亚写道。
“在涉及像Meta这样的使用案例中,原告通常会获胜,至少在那些对被告使用市场影响有更好记录的案件中,”奇哈利亚写道。“无论AI训练多么转化性,很难想象将其受版权保护书籍用于开发一个能创造数十亿美元甚至数万亿美元利润的工具,同时使无限数量的竞争作品得以创建,这些作品可能显著损害书籍市场是合理使用。”
此外,奇哈利亚认为“某些案件可能提出更有力的反对合理使用的论点”——例如新闻机构起诉OpenAI,指控其ChatGPT输出可能间接与他们的网站竞争。庆祝这项裁决,代表《纽约时报》的律师伊恩·克罗斯比告诉Ars,奇哈利亚和阿尔普的裁决被视为加强了《纽约时报》的案件。
“这两项决定显示了我们长期以来主张的观点:生成式AI开发者可能不能通过复制被盗新闻内容来构建产品,特别是当这些内容是通过不正当手段获取且其产品输出替代性内容威胁原创人类新闻市场的时侯,”克罗斯比说。
另一方面,奇哈利亚写道,如果害怕的市场稀释是换取明确的公共利益(如推进非商业研究以提高国家安全或医学),AI公司可能更容易击败版权主张。
奇哈利亚表示,如果作者们提供了任何市场稀释的证据,Meta在本案的这一阶段就不会获胜,并且可能面临更广泛的发现程序,由陪审团裁决的集体诉讼。
相反,本案中唯一幸存的主张涉及Meta争议性地通过 torrents 分发书籍训练Llama,作者们迄今成功指控该行为可能通过分发其作品作为torrenting的一部分违反版权法。
训练AI不等同于教导“学童”
根据奇哈利亚的说法,如果权利持有者提供市场稀释的证据,这可能提出最有力的反对AI版权诉讼的论点。因此,尽管Meta在与这些书籍作者的技术斗争中获胜,但这项裁决并不一定对Meta有利,也不为任何AI公司提供充分的安全保障。
奇哈利亚表示,不应认为AI公司可以通过其产品是“转化性使用”作者作品的美德来击败版权主张,案件的胜负取决于市场损害的指控。
他声称,他裁决的“结果”是,他并未创造任何明确规则为AI公司划出例外。相反,他认为他的裁决清楚表明“在许多情况下,未经许可复制受版权保护作品训练生成式AI模型是非法的。这意味着公司为了避免版权侵权责任,通常需要向版权持有者支付使用其材料的费用。”
在他的命令中,奇哈利亚批评了法官威廉·阿尔普本周在Anthropic案件中裁定时“过分强调生成式AI的转化性,而忽视了它对训练作品市场可能造成的损害”。
奇哈利亚特别不赞同阿尔普将作者对Anthropic的Claude可能涌入书籍市场造成市场损害的投诉比作“教导学童写作”的荒谬想法,认为这会导致“竞争性或创造性替代品的爆炸”。
“根据法官阿尔普的说法,这不是《版权法》所关注的竞争或创造性替代,”奇哈利亚写道。“但就市场影响而言,用书籍教孩子写作与用书籍创造一个个人可以生成无数竞争作品的产品完全不同。”
“这种不恰当的类比不是忽视合理使用分析中最重要的因素的基础,”奇哈利亚警告道。
此外,奇哈利亚写道,Meta声称授予作者胜利会“使AI创新停步”是“荒谬的”,并指出如果权利持有者在任何针对AI公司的诉讼中获胜,唯一的后果就是AI公司必须支付作者费用,否则只能依赖公共领域的材料并证明无需使用受版权保护作品进行AI训练。
“这些产品预计会为开发它们的公司带来数十亿美元甚至数万亿美元的收入,”奇哈利亚写道。“如果使用受版权保护作品训练模型是像公司所说的那样必要,他们将找到一种方式来补偿版权持有者。”
作者有三种方式可以继续对抗AI训练
本周的裁决表明,AI训练是否属于转化性使用的问题已经基本解决。
但随着作者继续起诉AI公司,包括本周针对微软的最新诉讼,奇哈利亚建议“原告击败合理使用的唯一机会是赢得第四项合理使用分析因素的决定性胜利,即法官和陪审团权衡‘使用对受版权保护作品的市场或价值的影响’。”
奇哈利亚建议作者至少有三种方式可以基于市场损害对抗AI训练。首先,他们可以声称AI输出“重复其作品”。其次,他们可以“指出其作品用于AI训练的市场,并主张未经授权的复制训练损害该市场(或阻止该市场的开发)”。第三,他们可以主张AI输出可能“间接替代”其作品,通过生成“高度相似”的作品。
由于前两种论点在Meta案中失败,奇哈利亚认为“第三种论点对有意接替本案13位作者的作者来说更具前景”。
一个有趣的转折点可能是阻止作者在Meta案中援引市场稀释作为威胁的原因,奇哈利亚指出Meta曾主张“市场稀释不适用于第四因素”。
但奇哈利亚澄清“这不可能正确”。
“间接替代仍然是替代,”奇哈利亚写道。“如果有人购买了一本由[大型语言模型(LLM)]写的浪漫小说,而不是由人类作者写的浪漫小说,那么LLM生成的小说就替代了人类写的那本。”他似乎认为AI生成的非虚构书籍也是如此。
因此,虽然“在许多版权案件中,市场稀释或间接替代的概念并不特别重要”,但AI案件可能改变版权格局,因为它“涉及一种可以生成数百万次二次作品的技术,其所需的时间和创造力仅为训练其作品的原始作品的一小部分”,奇哈利亚写道。
这是前所未有的,奇哈利亚建议,因为没有任何其他用途“具有近似于LLM训练那样可能淹没市场的潜力。因此,市场稀释的概念变得高度相关……法院不能对新技术可能严重损害创作激励的明显方式视而不见,仅仅因为这个问题之前没有出现过。”
在某种程度上,奇哈利亚的裁决为希望在先例性裁决中推进诉讼的权利持有者提供了一条路线图。