Meta 面临出版商的重大版权诉讼

五家图书出版商和作家 Scott Turow 起诉 Meta,指控其未经许可使用受版权保护的材料来训练 Llama AI 模型。
Meta 正面临重大法律挑战,五家著名图书出版商和一位著名作家对这家科技巨头发起了集体诉讼。该诉讼的核心指控是,Meta 在其 Llama 人工智能模型的开发和训练过程中参与了原告所说的“历史上最大规模的版权材料侵权行为之一”。据《纽约时报》报道,这一法律行动代表了关于科技公司如何利用受版权保护的内容用于机器学习目的的持续争论的分水岭。
这起诉讼涉及主要出版商,包括麦克米伦 (Macmillan)、麦格劳-希尔 (McGraw-Hill)、爱思唯尔 (Elsevier)、阿歇特 (Hachette) 和圣吉 (Cengage),以及以法律惊悚小说闻名的著名作家斯科特·图罗 (Scott Turow)。这些内容创作者在投诉中声称,Meta 在未获得任何形式的许可或补偿的情况下“反复复制”他们的文学作品和学术期刊文章。涉嫌侵权的范围似乎很全面,影响了从商业小说到同行评审的科学期刊等多个类型和学科的众多出版物。
此案特别值得注意的是对 Meta 采购方法的指控。根据诉讼文件,Meta 被指控故意从该诉讼所称的“臭名昭著的盗版网站”获取受版权保护的材料,这些网站包括 LibGen、Anna's Archive、Sci-Hub、Sci-Mag 等。据称,Meta 并未通过既定的出版渠道合法授权内容,而是从这些未经授权的来源提取了大量受版权保护的书籍和文章,随后将其纳入其 Llama AI 模型的训练数据集中。
这项法律诉讼是在针对主要人工智能公司的更广泛的版权相关诉讼浪潮中提出的。出版商和作者越来越担心未经授权使用其知识产权来训练大型语言模型和其他人工智能系统。出版业认为,他们的创意作品代表着宝贵的资产,当用于人工智能开发等商业目的时,需要适当的许可协议和公平的补偿安排。
这起诉讼的影响远远超出了 Meta 本身。该案提出了有关技术部门应如何在人工智能培训和开发中使用受版权保护的材料的基本问题。如果成功,原告的法律论点可能会开创先例,影响所有科技公司在构建和训练机器学习系统时如何处理知识产权。其结果可能会重塑人工智能开发的经济状况,并要求公司在与内容创作者签订许可协议方面投入更多资金。
Meta 的 Llama 模型在人工智能领域的影响力越来越大,该公司将其定位为 OpenAI 和 Google 等公司开发的其他大型语言模型的竞争替代品。涉嫌未经授权使用受版权保护的材料引发了人们的疑问:Meta 的竞争优势是否部分建立在非合法获得的材料之上。本案的这一方面对于确定法院可能施加的潜在损害和补救措施的范围可能特别重要。
出版商决定采取集体法律诉讼,表明出版业对于未经授权使用受版权保护的内容所采取的统一立场。作者和出版商越来越强烈地呼吁科技公司尊重知识产权并建立公平的补偿机制。该诉讼是出版界为保护其利益免受他们认为的系统性侵权而采取的最重要的协调行动之一。
除了具体指控之外,本案还触及有关数字时代版权法性质的更深层次问题。随着人工智能的不断发展和机器学习在各行业中越来越普遍,创新与知识产权保护之间的紧张关系日益加剧。法院需要解决当前的版权框架是否足以解决人工智能目的大规模数据收集所带来的挑战,以及是否有必要制定新的法律标准来保护创作者,同时允许有益的技术发展继续下去。
Meta 尚未对这些指控做出正式详细回应,但该公司无疑将采取强有力的辩护。科技行业观察人士预计 Meta 会辩称,其对公开材料的使用符合出于研究和开发目的合理使用的可接受范围。该公司还可能认为,人工智能模型的训练代表了版权法允许的对源材料的变革性使用。
这起诉讼很可能成为最受关注的涉及人工智能的版权侵权案件之一。对于出版业和技术行业来说,风险都是巨大的。对出版商有利的裁决可能需要对 Meta 等公司处理人工智能模型开发和数据源的方式进行重大改变。相反,如果 Meta 成功捍卫自己,它可能会开创先例,为科技公司提供更大的自由度,将受版权保护的材料用于人工智能培训目的。
此案还反映出,权利人为打击他们认为对其经济利益构成威胁的行为而采用的法律策略日益复杂。协调集体诉讼的方式不是追求个人索赔,而是最大限度地增加被告的压力,并增加侵权的潜在经济后果。这是出版商精心策划的努力,旨在确保科技公司认真履行尊重知识产权的义务。
随着诉讼的进展,它可能会引起行业观察家、法律学者和政策制定者的高度关注。这一结果可能会影响国会如何考虑版权法的潜在立法改革以及监管机构如何处理人工智能发展的治理。该案是决定版权法如何发展以应对人工智能技术和机器学习能力快速发展带来的挑战和机遇的关键时刻。
来源: The Verge


