Anthropic 的 Mythos AI 模型泄露给未经授权的用户

Anthropic 严密保护的 Claude Mythos AI 模型据称尽管有安全限制,仍被未经授权的用户访问。有关违规的详细信息。
Anthropic 发现自己处于重大安全尴尬的中心,该尴尬事件涉及其未发布的 Claude Mythos AI 模型,这对其精心管理的产品战略造成了重大打击。该公司花费了大量时间和资源来严格控制对这一先进人工智能系统的访问,并将网络安全风险作为其有限推出的主要理由。然而,最近的报告表明,尽管采取了这些预防措施,未经授权的个人仍然可以访问该模型,从而破坏了该组织的安全叙述,并引发了对其运营安全实践的严重质疑。
根据彭博社的报道,自从 Anthropic 首次公开宣布计划通过受控渠道提供该模型以来,一小群未经授权的用户显然已经获得了 Mythos 的访问权限。这一消息的披露是在一个特别尴尬的时刻,因为该公司一直公开强调该模型的网络安全功能有多么强大和潜在危险,并以此为理由来解释为什么在现阶段不建议更广泛的公众访问。
Mythos 漏洞代表了 Anthropic 安全基础设施和信息管理中的一系列级联故障。该模型的存在之前是通过该公司所描述的安全漏洞而被揭露的,这表明围绕敏感产品信息的内部控制已受到严重损害。当一家专门致力于开发安全可靠的人工智能系统的公司遭遇涉及其旗舰产品的多次违规时,它所造成的信誉危机远远超出了当前事件的范围。
这一事件发生的时机对 Anthropic 关于人工智能安全和负责任的开发实践的更广泛的叙述尤其有害。该公司将自己定位为其他人工智能组织的深思熟虑的替代品,强调其对强大系统的安全性和受控部署的承诺。当未经授权的用户访问该公司声称太危险而无法公开发布的系统时,就会造成逻辑上的不一致,批评者很快就会利用这一点。当未知的外部方同时可以访问该模型时,该公司关于 Mythos 必须保持受限的论点就失去了可信度。
行业观察家注意到了这种情况固有的讽刺意味。 Anthropic 花了数周时间详细阐述了为什么 Mythos 中嵌入的网络安全功能会导致公共可用性出现问题。该公司表示,不良行为者可能会滥用此类先进功能来达到有害目的,因此需要对用户进行严格审查的受限测试计划。然而,此次违规事件表明,Anthropic 自身的安全措施不足以保护其向公众发出警告的系统。
未经授权的访问事件还引发了有关违规行为的范围和性质的问题。有多少未经授权的用户获得了访问权限?他们的访问持续了多长时间?是否有安全措施或使用日志可以识别这些用户对该模型的尝试?这些操作细节仍不清楚,但其重要性怎么强调也不为过,因为它们决定了此安全故障所造成的实际风险暴露。
从竞争的角度来看,这一事件可能会为 Anthropic 在生成人工智能领域的竞争对手带来优势。虽然 Anthropic 一直在谨慎地控制访问并围绕 Mythos 建立预期,但开发竞争模型的其他组织已经避免了安全漏洞带来的负面宣传。违规叙述本身可能会掩盖该模型的实际功能,在未经授权的访问事件发生之前,独立审查员显然发现该模型确实令人印象深刻。
通过媒体报道而不是通过公司官方渠道披露这一违规行为表明,Anthropic 可能并未对该事件完全透明,至少没有立即公开。当安全漏洞通过新闻而不是官方披露而成为公众所知时,就会损害公司在安全实践方面的可信度,并引发人们的疑问:管理层是否优先考虑声誉管理,而不是与利益相关者进行快速、诚实的沟通。
展望未来,这一事件可能会促使 Anthropic 对访问控制、信息安全协议和事件响应程序进行重大内部审查。该公司将需要实施更强大的系统来保护未发布的产品及其相关信息。此外,该组织可能需要重新考虑其关于为什么某些人工智能功能必须受到限制的公开声明,因为公共消息与实际安全结果之间的差距已经暴露出来。
人为安全事件对于其他从事先进系统的人工智能开发组织来说是一个警示。随着太空领域的公司竞相开发和部署能力越来越强的模型,安全性必须仍然是首要关注的问题,不仅在外部通信中,而且在实际操作实践中。任何宣传自己以安全为中心的组织的可信度完全取决于其实际实施和维护强有力的安全措施的能力。
对于 Anthropic 产品的用户和潜在客户来说,此次泄露引发了重要问题:高级人工智能系统可以实际维持什么级别的访问控制和安全性。如果尽管有明确的安全措施,未经授权的用户仍可以访问受到精心保护的模型,这对于长期维持受限访问的可行性意味着什么?随着系统变得更强大、更有价值,这些都是人工智能行业需要解决的难题。
这一事件的更广泛影响延伸到了围绕人工智能治理和安全的监管讨论。政策制定者和监管机构一直在寻求成熟的人工智能公司来证明强大的安全实践是可行且可维护的。当像 Anthropic 这样将自己定位为负责任的人工智能开发领导者的公司遭遇引人注目的违规事件时,它为那些认为必须进行全面监管和政府监督以确保人工智能安全的人提供了论据。
随着事态的发展,观察家将密切关注 Anthropic 如何应对这一挑战。该公司在未来几周和几个月的行动——包括如何透明地解决漏洞问题、采取哪些具体措施来提高安全性,以及如何调整有关人工智能安全的公共信息——可能会在未来几年影响该公司在更广泛的人工智能社区中的声誉和地位。该事件表明,在先进人工智能开发的高风险世界中,安全故障所造成的后果远远超出了眼前的技术问题。
来源: The Verge


