微软删除使用盗版《哈利·波特》的人工智能指南

在面临社区强烈反对后,微软删除了一篇有争议的博客文章,该文章指导开发人员如何使用盗版《哈利·波特》书籍训练人工智能模型。
科技巨头微软删除了一篇有争议的博客文章,该文章似乎鼓励开发人员使用盗版哈利波特书籍来训练人工智能模型。此次删除是在开发者社区强烈批评之后进行的,特别是在流行的黑客新闻论坛帖子上的讨论强调了该指南的问题性质之后。这一事件引发了有关企业在人工智能培训实践中的责任以及快速发展的人工智能领域中的知识产权的重大问题。
这篇现已删除的博客文章由已在该公司工作十多年的微软高级产品经理 Pooja Kamath 撰写,但仍可通过网络档案访问。该文章于 2024 年 11 月发布,旨在展示 Microsoft 与 LangChain 和大型语言模型集成的新 Azure SQL DB 功能。根据她的职业简介,尽管围绕她的博文存在争议,Kamath 仍继续在 Microsoft 工作,该公司专门选择她来推广这种新的生成式 AI 功能集成。
该博文将自己定位为演示开发人员如何使用 Microsoft 的云基础设施轻松地将生成式 AI 功能集成到他们的应用程序中。这项有争议的指南表明,开发人员可以用最少的编码工作来完成这种集成,只需要几行代码即可将 Azure SQL DB 与流行的 AI 框架连接起来。这种简化的方法被认为是让 AI 开发更容易被更广泛的开发者和组织所接受的重大进步。

最引发关注的内容该博客建议使用哈利波特书籍作为人工智能模型的训练数据,遭到了强烈的批评。该帖子将这种方法描述为利用“众所周知的数据集”,该数据集将提供能够引起广泛受众共鸣的“引人入胜且相关的示例”。批评者认为,该指南实际上鼓励开发人员在未经适当授权的情况下使用受版权保护的材料,这可能违反知识产权法,并为整个行业的人工智能培训实践树立危险的先例。
当 Hacker News 社区的成员发现该博文并开始讨论其影响时,强烈反对情绪加剧。随着开发人员、法律专家和人工智能研究人员对微软指南的问题本质进行了权衡,该论坛帖子很快就获得了关注。许多与会者表示担心,一家大型科技公司似乎支持将盗版内容用于商业人工智能开发目的,特别是考虑到围绕人工智能训练数据和版权侵权的法律斗争正在进行。
行业观察家指出,这一事件发生的背景是人工智能公司在其训练数据实践方面面临着众多备受瞩目的法律挑战。出版商、作者和内容创作者越来越多地对科技巨头采取法律行动,这些科技巨头涉嫌未经许可使用受版权保护的材料来训练其大型语言模型。哈利·波特系列由华纳兄弟公司和作者 J.K.罗琳的遗产正是权利持有人通过诉讼积极保护的宝贵知识产权类型。

法律专家指出,该博文的建议可能会让 Microsoft 及其客户承担重大责任。遵循该指南并使用盗版《哈利·波特》内容进行人工智能培训的公司可能会面临版权所有者的版权侵权诉讼。在这种情况下,潜在的损害可能是巨大的,特别是如果经过训练的人工智能模型被用于商业目的或生成与官方哈利波特产品竞争的内容。
该事件还引发了人们对微软人工智能开发团队内部更广泛的文化及其对知识产权法的理解的质疑。事实上,由一位在该公司拥有十多年经验的高级产品经理撰写了此类指南,这表明法律意识和培训存在潜在的系统性问题。这促使人们呼吁加强组织内部的教育和监督机制,以防止未来发生类似事件。
行业分析师指出,这场争议可能会损害微软在优先考虑法律合规和风险管理的潜在企业客户中的声誉。许多大型组织对于采用可能面临版权侵权索赔的人工智能解决方案犹豫不决,此类事件可能会增加他们对使用微软人工智能平台和服务的担忧。
来源: Ars Technica


