英国 AISI 对 Anthropic 的 Mythos AI 进行网络安全测试

英国政府的人工智能安全研究所评估了 Anthropic 的新 Mythos AI 模型,评估其网络攻击模拟和渗透测试的能力。
Anthropic 最近宣布限制发布其 Mythos Preview 模型,宣传其在计算机安全任务方面令人印象深刻的功能。现在,英国政府的人工智能安全研究所 (AISI) 发布了对该模型网络攻击能力的初步评估,为 Anthropic 的说法提供了独立的公开验证。
AISI 的研究结果表明,虽然在单独的网络安全相关任务方面,Mythos 可能与其他最新前沿模型没有显着差异,但它可以通过有效地将这些任务链接在一起形成完全渗透某些系统所需的多步骤系列攻击的能力而使其与众不同。
自 2023 年初以来,该研究所一直在通过专门设计的夺旗挑战来测试各种人工智能模型,当时 GPT-3.5 Turbo 难以完成该组织任何相对简单的测试。
相比之下,Mythos展现了更加全面的能力,无论是在单独的网络安全任务还是全面系统渗透所需的链式多步攻击方面都表现出了强劲的性能。这表明该模型可能是人工智能驱动的网络安全领域向前迈出的重要一步。
随着网络攻击威胁的复杂性和严重性持续增长,AISI对神话的评估正值关键时刻。凭借该模型模拟和执行这些攻击的能力,它在帮助安全专业人员和组织更好地理解和防御新出现的威胁方面具有不可估量的价值。
随着 Anthropic 不断完善和扩展 Mythos 的功能,AISI 的研究结果可能会成为该模型开发及其对网络安全格局潜在影响的重要基准。
Anthropic 与英国政府人工智能安全研究所之间的合作凸显了公私合作伙伴关系在应对网络安全的复杂挑战方面日益重要的重要性。通过结合两个部门的专业知识和资源,研究人员和政策制定者可以共同开发创新解决方案,以跟上不断变化的威胁形势。
来源: Ars Technica


