神话恐慌后,特朗普改变了人工智能安全立场

在 Anthropic 的 Mythos 模型引发网络安全担忧后,特朗普政府突然支持人工智能安全测试。了解政策如何发生巨大转变。
特朗普政府与之前的立场发生了惊人的逆转,本周与 Google DeepMind、微软和 xAI 等主要科技公司签署了关键协议,对其最先进的人工智能模型进行全面的政府安全测试。这些协议建立了在公开发布之前和之后对前沿人工智能系统进行严格评估的协议,标志着政府对人工智能监管和监督方法的重大转变。
这一政策转变与政府此前对人工智能安全措施的不屑一顾的态度形成鲜明对比。特朗普最初上任时,曾积极废除拜登时代的人工智能安全框架,将自愿安全检查描述为繁重的过度监管,会扼杀创新和技术进步。特朗普团队将美国人工智能安全研究所更名为人工智能标准与创新中心(CAISI),这是一个特别具有象征意义的举动,并刻意从该组织的标题中删除“安全”一词,以此作为对其前任监管理念的尖锐批评。
这一戏剧性的政策转变似乎是由 Anthropic 突破性的新 Claude Mythos 模型的最新发展引发的,该模型是一种专门为网络安全应用而设计的复杂人工智能系统。 Anthropic 做出了严格限制 Mythos 访问的有争议的决定,理由是对向公众发布如此强大的工具所带来的安全影响存在严重担忧。该公司领导层表示深感焦虑,担心恶意行为者可能会将该模型的先进网络安全功能用于邪恶目的,从而对关键基础设施和国家安全造成前所未有的风险。
Anthropic 的这一决定似乎在特朗普政府内部引起了强烈反响,突然改变了围绕人工智能安全测试要求的对话。总统重要经济顾问、白宫国家经济委员会主任凯文·哈塞特表示,特朗普现在正在认真考虑发布一项全面的行政命令,要求政府在所有先进人工智能系统向公众发布之前对其进行测试和评估。这完全颠覆了政府先前的立场,即安全测试代表了不必要的监管越权。
这一政策逆转的时机引发了重要问题,即哪些具体因素促使政府重新考虑其对前沿人工智能安全协议的立场。行业观察家和政策分析师认为,神话情况具体化了在没有足够保障措施的情况下部署极其强大的人工智能系统所带来的现实风险。克劳德神话模型以网络安全为中心的本质使得潜在的危险变得特别明显和具体,也许人工智能研究人员之前的警告尚未完全传达给政策制定者。
目前与 Google DeepMind、微软和 xAI 签署的协议为尖端人工智能模型的系统评估建立了一个框架,包括发布前测试和部署后监控。政府机构和私营科技公司之间的这些伙伴关系代表了一种平衡政府对创新的承诺与新近承认的对灾难性风险的担忧的尝试。 政府人工智能测试框架可能会评估模型安全的各个方面,包括潜在的误用场景、网络安全漏洞和更广泛的社会影响。
这一政策逆转的意义超出了人工智能安全测试程序的直接问题。它展示了现实世界的事件和潜在危害的具体例子如何重塑政策优先事项,即使对于最初对监管方法持怀疑态度的政府也是如此。神话情况生动地说明了先进的人工智能功能如何引发新形式的网络攻击和安全威胁,使有关人工智能风险的抽象论点突然对决策者来说变得更加紧迫和重要。
行业利益相关者对特朗普政府新强调的强制性人工智能安全评估反应不一。一些科技公司将政府测试视为一种合理的妥协,可以提供安全保证,同时允许继续开发和部署先进系统。其他人担心政府测试要求可能会导致创新人工智能应用程序推向市场的延迟,相对于受安全要求限制较少的国际竞争对手而言,这可能使美国公司处于不利地位。
人工智能标准与创新中心,尽管其更名后明确删除了对安全的提及,但现在似乎准备在政府的人工智能测试和评估制度中承担重要责任。该组织实体可能会与与政府签署协议的私营公司进行协调,努力建立一致的标准和程序来评估前沿人工智能模型。具体的测试方案和评估标准仍有待预期的行政命令中详细说明。
展望未来,这一政策转变可能会对其他国家如何处理人工智能监管和安全测试产生重要影响。世界各国政府一直在努力解决如何鼓励创新,同时管理日益强大的人工智能系统带来的真正风险。特朗普政府在这个问题上的演变可能会影响有关前沿人工智能开发和部署适当监管框架的国际讨论。
这种逆转的更广泛背景揭示了特朗普政府内部对放松管制的坚定意识形态承诺与对真正安全问题的务实认识之间的紧张关系。 人工智能安全测试协议代表了一种妥协立场,试图满足这两种冲动——保持政府支持创新的立场,同时解决神话情况引起人们关注的网络安全和安全问题。随着政府继续制定全面的人工智能政策框架,这种妥协方法是否有效还有待观察。随着人工智能系统变得越来越复杂和强大,适当的安全测试和评估程序问题可能仍然是政府政策讨论的核心。特朗普政府出人意料地转向支持政府对前沿人工智能模型进行安全检查,这表明对安全和滥用的实际担忧最终可以战胜意识形态上对监管的反对。未来几周和几个月,政府将公布人工智能安全和标准新方法的详细规范,这可能会开创影响未来几年人工智能开发和部署实践的先例。
来源: Ars Technica


