谷歌的人工智能搜索无法回答基本查询

谷歌的人工智能概述在搜索简单术语时会出现故障,会用聊天机器人短语而不是相关信息进行响应。
Google 的人工智能概述功能是该公司将人工智能直接集成到搜索结果中的雄心勃勃的尝试,但它遇到了重大的技术挑战,引发了人们对该技术是否准备好广泛部署的疑问。随着用户报告系统似乎从根本上误解或完全忽视用户搜索查询,用与用户实际寻求的内容无关的通用聊天机器人响应替换实质性信息,这些问题变得越来越明显。
这些问题已经在多个搜索场景中出现,尤其是当用户输入简单的单字查询时,会出现特别明显的失败。例如,当搜索“disregard”一词时,我们发现 Google 的人工智能搜索系统生成的响应看起来更像是传统会话聊天机器人的输出,而不是用户期望的汇总搜索结果。系统不会从与搜索查询匹配的网页中提供合成信息,而是简单地返回模糊的确认信息,例如“明白了!如果您需要其他帮助,请告诉我”,从而使用户没有与其搜索相关的实际信息。
不同用户帐户和搜索会话中已记录了多个此类故障实例,这表明这不是一个孤立的故障,而是 Google AI Overviews 实施中的一个系统性问题。一位搜索“disregard”的 Verge 同事收到了同样的通用响应,结果页面的 AI 概述部分中没有出现任何其他内容。当其他用户尝试进行相同的搜索时,他们会遇到类似的无用输出,例如“完全没问题!今天我能为您提供什么帮助吗?” – 与搜索意图完全无关的响应。
这些失败的令人担忧的方面是,它们代表了人工智能搜索功能在基本操作层面上的根本性故障。搜索与“忽视”一词相关的定义、信息或任何实质性内容的用户会收到确认,表明人工智能系统认为它已经理解了对话请求而不是搜索查询。这种区别至关重要 - 搜索引擎应将查询解释为需要事实响应的信息请求,而不是需要社会认可的对话轮流。
这些失败之所以特别引人注目,是因为它们突显了 Google 在将人工智能集成到搜索中方面所面临的挑战,而没有引入新问题。该公司一直在积极推广人工智能概述,将其视为搜索技术的一项重大进步,将其定位为一种为用户提供快速、综合答案的方式,而无需他们访问多个网页。然而,这些故障表明理解搜索意图的底层机制仍然存在缺陷。
该事件引起了社交媒体的关注,X 等平台上的用户记录并讨论了他们对损坏的 AI 概述的体验。屏幕截图和第一手资料已经流传,让科技界意识到 Google 最新的人工智能搜索功能的可靠性问题。此次公开曝光增加了 Google 迅速解决问题的压力,因为这些明显的故障可能会削弱用户对新搜索功能的信心。
<图片src =“https://platform.theverge.com/wp-content/uploads/sites/2/2026/05/Screenshot-2026-05-22-a t-8.44.28AM.png?quality=90&strip=all&crop=0%2C3.0141843971631%2C100%2C93.971631205674&w=2400" alt="有关 Google AI 概述失败和用户体验的社交媒体讨论" />这些失败的根本原因尚不清楚,尽管它们可能源于 Google 的搜索 AI 系统处理和解释用户查询的方式问题。一种可能性是,某些关键字或搜索词会触发人工智能内的特定路径,这些路径默认为对话响应而不是信息合成。另一种解释可能涉及系统如何区分搜索查询和对话输入的问题,导致系统将事实信息请求视为聊天交互。
从技术角度来看,这些失败凸显了在 Google 运营规模上部署大型语言模型的难度。该公司人工智能驱动的搜索功能必须每天处理数十亿次查询,同时保持准确性和相关性。当系统在基本查询解释上失败时,这表明可能存在超出简单错误或边缘情况的更深层次的架构问题。
自首次推出以来,Google 一直在迭代其 AI 概述功能,并根据反馈和观察到的性能问题进行调整。然而,这些问题的持续存在表明该功能如何处理信息的一些基本方面可能需要重新考虑。该公司尚未公开解决这些具体故障或解释可能导致这些故障的原因。
这些故障的影响不仅仅是给个人用户带来不便。他们对在技术发展的现阶段将人工智能纳入搜索结果的可靠性和实用性提出了更广泛的问题。如果用户不能相信人工智能概述能够为简单的搜索提供相关信息,他们可能会质疑该功能的价值并恢复到传统的搜索方法。
对于 Google 来说,快速解决这些问题对于维持用户对其搜索平台的信任至关重要。该公司在人工智能能力方面投入巨资,并将人工智能定位为其未来产品路线图的核心。此类失败,尤其是当它们成为公众所知时,可能会破坏战略定位并产生可能需要时间才能克服的负面看法。
随着 Google 不断完善和扩展其 AI 搜索功能,这些记录在案的失败事件提醒人们,大规模部署尖端技术所固有的挑战。这些事件表明,尽管Google 的人工智能搜索雄心非常巨大,但实际执行仍需要大量改进,才能认为该功能完全可靠。
来源: The Verge


