OpenAI 推出可信接触安全功能

OpenAI 为讨论自残的 ChatGPT 用户推出了新的“可信联系人”保护措施。了解 AI 安全功能如何工作并保护弱势用户。
OpenAI 宣布实施一项突破性的安全功能,旨在在 ChatGPT 平台内出现涉及潜在自残的对话时保护用户。这一新的“可信联系人”保护措施代表了该公司在日益复杂的数字环境中对负责任的人工智能开发和用户保护的承诺的重大扩展,在这种环境中,在人工智能交互过程中可能会意外地出现心理健康问题。
这家人工智能公司很早就认识到对话的微妙性质,这些对话可能涉及有关自残、自杀意念或其他形式伤害的讨论。通过引入这种创新的安全机制,OpenAI 旨在弥合人工智能援助与现实世界心理健康支持系统之间的差距。该功能承认,虽然 ChatGPT 不能替代专业的心理健康服务,但当用户陷入危机或经历痛苦的想法时,它可以作为获得适当帮助的途径。
了解可信联系人功能的机制对于用户及其支持网络都至关重要。当 ChatGPT 检测到可能涉及潜在自残的对话时,系统现在将为用户提供指定可信联系人(例如家庭成员、密友或医疗保健提供者)的选项,他们可以收到有关其情况的通知。这种方法将技术干预与人际关系结合起来,认识到康复和安全通常取决于关心相关个人的人的支持。
此功能的实施正值公众讨论和监管讨论中对人工智能安全和负责任部署的担忧日益突出之际。 OpenAI 的积极主动立场表明该公司愿意将用户福利置于纯粹的功能之上。该功能经过精心设计,旨在平衡隐私问题与干预的迫切需要,确保敏感的个人信息得到适当的谨慎和同意的处理。
心理健康专家长期以来一直主张建立早期干预系统,该系统可以识别处于危险中的个人,并将他们与适当的资源联系起来。可信联系人功能通过创建一个数字途径来扩大而不是取代人类支持网络,从而与这些既定的最佳实践保持一致。用户可以完全控制谁接收通知以及何时触发这些通知,确保该功能尊重自主性和安全性。
这一保护措施的发展反映了更广泛的行业趋势,即更加负责任的人工智能治理和以用户为中心的设计。随着人工智能系统日益融入日常生活,它们对弱势群体(包括那些面临心理健康挑战的群体)的潜在影响已成为开发者和政策制定者等的重要考虑因素。 OpenAI 的方法展示了公司如何利用其技术能力来满足人类的实际需求。
该公司与心理健康专业人士和危机干预专家合作,确保该功能符合临床最佳实践和道德标准。这些合作伙伴关系有助于确定系统如何识别相关对话,而不会做出错误指控或产生不必要的警报。目标是创建一个既敏感又具体的系统,能够识别真正的危机,同时最大限度地减少可能破坏用户信任的误报。
OpenAI 还强调了用户教育对于有效实施此功能的重要性。该公司提供了有关可信联系人保护措施如何工作、什么会触发通知以及用户如何配置系统以匹配其个人情况的明确信息。这种透明度对于建立信任并确保用户感到被赋予权力而不是受到该功能的监视至关重要。
本公告的更广泛背景包括关于人工智能公司对其用户承担的责任的持续讨论。随着人工智能技术不断进步并变得更有能力参与细致入微的对话,用户在危机时刻求助于这些系统的潜力也相应增加。 OpenAI 的主动方法表明对这些风险的思考已经成熟,并致力于正面解决它们而不是忽视它们。
可信联系人功能的推出也凸显了人工智能、公共卫生和数字道德之间日益增长的交叉点。当世界各地的监管机构和立法者都在努力解决如何管理人工智能系统时,这样的例子展示了公司如何在不需要外部授权的情况下实施有意义的保障措施。这种自愿行动可以设定行业标准,并有可能为未来的监管框架提供信息。
有兴趣利用可信联系人功能的用户可以通过其 ChatGPT 帐户设置访问该功能。设置过程设计得简单易懂,即使对于那些技术经验有限的人来说也是如此。配置完成后,系统主要在后台运行,只有当底层算法检测到暗示潜在自残或危机情况的对话时才会发挥作用。
OpenAI 明确表示,这不是最终解决方案,而是一种不断发展的保护措施,将根据用户反馈和新兴最佳实践进行完善。该公司计划继续研究人工智能如何更好地支持处于危机中的用户,同时保持对隐私和个人自主权的尊重。这种迭代方法承认,保护数字时代的心理健康是一项持续的挑战,需要持续关注和改进。
该功能的推出正值有关生成式人工智能系统的社会影响的更广泛讨论之际。随着这些工具变得更加复杂和广泛采用,有关它们在支持或潜在伤害弱势用户方面的作用的问题变得越来越重要。 OpenAI 的可信联系人功能代表了一家公司对这些复杂问题的答案,提供了其他人工智能开发人员可以考虑采用或调整的模型。
展望未来,可信联系人保护措施等举措的成功可能取决于技术公司、心理健康专业人士、危机干预组织和更广泛的用户社区之间的持续合作。通过共同努力,利益相关者可以确保新兴人工智能技术的部署方式能够增进而不是损害人类福祉。 OpenAI 对这种协作方法的承诺表明,人们认识到人工智能安全从根本上讲是为了在日益数字化的世界中保护人类福祉。
来源: TechCrunch


