GPT-5.5 在网络安全测试中与神话竞争

在英国人工智能安全研究所进行的高级网络安全评估中,OpenAI 的 GPT-5.5 与 Anthropic 大肆宣传的 Mythos Preview 相匹配。
上个月,Anthropic 推出了Mythos Preview 模型,引起了广泛关注,将其定位为网络安全 AI 功能的重大飞跃。该公告强调了先进语言模型落入坏人之手所带来的潜在严重安全威胁,促使该公司采取谨慎态度,将初始访问仅限于“关键行业合作伙伴”。这种谨慎的推出反映了对该模型在网络安全领域的攻击潜力的真正担忧。
但是,英国人工智能安全研究所 (AISI) 最新发布的研究正在挑战有关 Mythos Preview 卓越功能的一些假设。分析表明,与 Anthropic 的受限模型直接比较时,OpenAI 最近推出的 GPT-5.5 模型“在我们的网络评估中取得了相似的性能水平”。这一发现表明,领先的人工智能系统之间的网络安全能力差距可能比最初想象的要窄,这引发了关于不同前沿人工智能模型相对进步的重要问题。
自 2023 年建立评估框架以来,AISI 已使用 95 种不同的评估挑战来系统地评估各种前沿人工智能模型,这些挑战旨在测试现实世界的网络安全能力。这些评估采用夺旗 (CTF) 方法,这是网络安全社区中一种行之有效的方法,为参赛者提供了要实现的特定安全目标。这些挑战跨越多个关键网络安全领域,包括编译代码的逆向工程、Web 应用程序利用技术、加密漏洞和网络安全评估。
评估方法特别严格,任务分为难度等级,反映网络安全问题的复杂性和现实世界的相关性。在指定为“专家”级任务的最高难度级别上,GPT-5.5 表现出了令人印象深刻的性能,平均通过了 71.4% 的挑战。这一结果使 OpenAI 的模型与 Mythos Preview 的竞争非常激烈,后者在同等专家级评估中取得了 68.6% 的成功率。虽然 GPT-5.5 显示出 2.8 个百分点的数值优势,但研究人员指出,这种差异在可接受的统计误差范围内,使得这两个模型在性能上实际上相当。
这些发现对于一直密切关注能力日益增强的人工智能系统发展的人工智能安全研究社区和行业利益相关者来说意义重大。这两个模型在特别具有挑战性的任务上所展示的技术深度引发了对敏感领域人工智能能力轨迹的重要考虑。事实上,公开可用的模型正在接近或匹配故意限制的系统的性能,这表明围绕先进人工智能模型的安全格局的发展速度比一些观察家预期的要快。
AISI 的研究方法为不同的人工智能系统如何解决复杂的网络安全问题提供了宝贵的见解。该评估框架不是简单地测量原始性能,而是评估每个模型所采用的推理过程和解决问题的策略。 GPT-5.5 和 Mythos Preview 都展示了对网络安全概念的深入理解、识别漏洞的能力以及开发实际利用策略的能力。这种定性维度的评估除了简单的成功率比较之外还增加了细微差别。
一个特别复杂的挑战被证明具有启发性,涉及多层安全目标,需要根据中间结果连续解决问题和适应。两种模型在此类细致入微的任务上的性能差异仍然很小,这表明高级语言模型已经开发出了真正的网络安全推理能力,其范围超出了模式匹配或简单的启发式应用程序。这两个系统都表现出了根据反馈调整方法的能力,以及识别初始策略何时不足的能力。
AISI 公开发布详细评估结果的决定反映了对人工智能安全研究透明度的承诺。通过公开其方法和研究结果,该研究所为有关管理与强大的人工智能系统相关的风险的更广泛的对话提供了宝贵的数据。研究人员和政策制定者现在可以利用有关前沿人工智能能力的具体证据,而不是依赖营销主张或猜测。这种透明度还可以实现独立验证,并鼓励其他研究人员以研究结果为基础或提出质疑。
GPT-5.5 和 Mythos Preview 之间的比较还阐明了有关模型规模、训练方法和特定能力开发之间关系的重要问题。虽然 Mythos Preview 是专门针对网络安全应用程序进行设计和训练的,但 GPT-5.5 代表了一种通用语言模型,在该领域没有专门的培训重点。然而,这两个系统在专门的网络安全评估方面的表现相当,这表明广泛的语言理解和推理能力可能越来越足以发展复杂技术领域的专业知识。
行业观察家指出,这些评估结果对于组织应如何进行人工智能安全治理和风险管理具有重要意义。鉴于多个组织可以通过不同方法开发类似功能的模型,限制对潜在危险系统的访问的传统模型可能需要修订。这表明,仅依靠访问限制作为全面的安全策略可能是不够的,随着能力越来越广泛地分布在不同的系统和组织中,可能需要更广泛的系统方法来管理人工智能风险。
展望未来,AISI 计划继续其评估计划,测试新模型版本并探索 AI 网络安全功能的其他方面。即将到来的评估可能会在新的前沿模型可用时对其进行探索,创建一个纵向数据集,显示网络安全领域的人工智能功能如何随着时间的推移而发展。这项正在进行的研究为政策制定者和行业领导者做出有关人工智能部署和治理策略的决策提供了重要的基线数据。
AISI 评估的结果强调了维持稳健、客观的评估框架对于评估新兴人工智能能力的重要性。随着语言模型的不断发展并在敏感领域找到应用,拥有可靠、标准化的评估方法变得越来越重要。网络安全行业和更广泛的人工智能安全社区都受益于这种严格、透明的评估,这种评估超越了营销叙述,提供了对这些系统能做什么和不能做什么的真正见解。
来源: Ars Technica


