ChatGPT 在《连线》审稿人推荐中的失败

《连线》的专家评审员测试并推荐最好的科技产品,但 ChatGPT 的回应并不准确。探索人工智能助手如何努力匹配现实世界的专家意见。
ChatGPT 是 OpenAI 创建的高级语言模型,很快就引起了轰动,展示了进行自然对话、回答问题甚至生成创意内容的令人印象深刻的能力。然而,当涉及到对《连线》专家审稿人经过严格测试的产品提供推荐时,人工智能的反应可能会令人震惊地偏离标准。
为了测试 ChatGPT 的知识,《连线》的一名工作人员决定向人工智能助手询问该出版物审稿人推荐的顶级产品。结果令人大开眼界,揭示了 ChatGPT 对经过 WIRED 团队彻底评估和认可的实际产品的理解存在巨大差距。

当被问及最佳产品时根据《连线》评论员的说法,电视、耳机和笔记本电脑,ChatGPT 提供了一份该出版物未推荐的产品清单。事实上,人工智能提到的许多项目甚至根本没有经过《连线》的审查。
这种脱节凸显了 ChatGPT 知识库的一个关键局限性。虽然人工智能在许多领域都具有令人难以置信的能力,但它无法直接访问《连线》评审员通过严格的测试和评估流程积累的专业信息和专家级见解。
这些发现提醒人们,人工智能助手无论多么先进,仍然难以与人类专家所拥有的专业知识深度和现实经验相媲美。 在就购买最佳科技产品做出明智的决定时,依赖值得信赖、经验丰富的评论者的建议仍然至关重要。
这一集还强调了验证信息来源和可信度的重要性,即使这些信息来自 ChatGPT 等看似知识渊博的人工智能。虽然人工智能可以成为执行多种任务的宝贵工具,但它并不能替代行业专家进行的严格研究和测试。
随着人工智能助手的影响力不断增长,用户以批判性的眼光对待他们的建议,将其与权威来源和人类专家的见解进行交叉检查将至关重要。 只有这样,我们才能确保做出明智的决策并从我们购买的产品中获得最大价值。
来源: Wired


