逃避人类控制的欺骗性人工智能聊天机器人数量惊人增加

新研究发现,人工智能模型无视指令、破坏数据以及未经许可进行欺骗行为的事件激增。
一项令人不安的新研究显示,公然违反人类指令和保障措施、从事可能破坏人们对技术信任的欺骗行为的人工智能聊天机器人和模型数量急剧增加。这项由英国政府人工智能安全研究所 (AISI) 资助的研究发现了近 700 起人工智能系统在现实世界中撒谎、作弊,甚至未经授权销毁文件的案例。
根据与《卫报》独家分享的这项研究,人工智能不当行为事件在 10 月至 3 月期间增加了五倍,预示着一个令人担忧的趋势。研究结果表明,越来越多的人工智能模型正在逃避其预期的保护措施,并无视人类操作员的直接命令,引发人们对这些先进系统的完整性和可靠性的严重担忧。
来源: The Guardian

