ChatGPT от OpenAI становится умнее: новая модель вдвое сокращает количество галлюцинаций

OpenAI представляет GPT-5.5 Instant со значительным улучшением точности. Новая модель ChatGPT по умолчанию снижает галлюцинации на 52,5% в таких важных областях, как медицина и право.
OpenAI объявила о значительном прорыве в решении одной из самых постоянных проблем искусственного интеллекта: склонности моделей ИИ генерировать ложную или вводящую в заблуждение информацию. Новейшая модель ChatGPT по умолчанию, получившая обозначение GPT-5.5 Instant, представляет собой существенный шаг вперед в плане фактической точности и надежности. Согласно внутренним оценкам OpenAI, эта усовершенствованная итерация демонстрирует значительные улучшения в сокращении количества неточных или сфабрикованных заявлений в широком спектре приложений и вариантов использования.
Галлюцинации в системах искусственного интеллекта уже давно преследуют отрасль: языковые модели часто выдают правдоподобно звучащую, но полностью сфабрикованную информацию. Эта проблема вызвала серьезную обеспокоенность среди исследователей, политиков и конечных пользователей, которые полагаются на эти инструменты для решения важнейших задач. От медицинских диагнозов до юридических толкований и финансовых консультаций — последствия дезинформации, создаваемой ИИ, могут быть серьезными и потенциально вредными. Постоянный характер этой проблемы побудил OpenAI и конкурентов вложить значительные средства в исследования, направленные на фундаментальное повышение фактической точности и надежности их моделей.
Улучшения, продемонстрированные GPT-5.5 Instant, особенно впечатляют в доменах с высокими ставками. OpenAI сообщает, что, согласно строгим внутренним оценкам, новая модель вызвала примерно на 52,5% меньше галлюцинаторных заявлений по сравнению со своей предшественницей, моделью GPT-5.3 Instant. Это резкое сокращение было измерено конкретно по тому, что OpenAI называет «подсказками с высокими ставками», которые охватывают критические области, включая медицину, право и финансы. Эти три сектора представляют собой одни из наиболее чувствительных приложений, где точность не просто предпочтительна, но абсолютно необходима для безопасности и доверия пользователей.
Помимо показателей улучшения важных подсказок, OpenAI выделила дополнительные преимущества в устранении проблемных шаблонов разговоров. Анализ компании показывает, что GPT-5.5 Instant сократил количество неточных заявлений на 37,3 % в особенно сложных разговорах, которые пользователи ранее отмечали как содержащие фактические ошибки. Этот показатель особенно значим, поскольку он отражает реальные модели использования, когда пользователи-люди уже выявили и сообщили о случаях неточности. Тот факт, что новая модель демонстрирует существенные улучшения в этих ранее проблемных запросах, говорит о том, что OpenAI добился реального прогресса в понимании и исправлении основных механизмов, генерирующих ложную информацию.
Разработка GPT-5.5 Instant происходит в связи с тем, что галлюцинации ИИ становятся все более признанной проблемой как в академических, так и в коммерческих сообществах ИИ. Многие исследовательские институты и компании, занимающиеся искусственным интеллектом, задокументировали распространенность этой проблемы. Исследования показали, что даже высокоэффективные языковые модели могут уверенно утверждать ложную информацию с впечатляюще звучащими, но полностью сфабрикованными деталями. Эта проблема связана с фундаментальной природой того, как работают большие языковые модели, поскольку они прогнозируют статистически вероятные следующие токены на основе данных обучения, а не обращаются к реальным базам знаний или проверяют факты в режиме реального времени.
<изображение src="https://platform.theverge.com/wp-content/uploads/sites/2/2026/02/STK155_OPEN_AI_4_CVir ginia_A.png?quality=90&strip=all&crop=0%2C0.011761938367442%2C100%2C99.976476123265&w=2400" alt="Сравнительная диаграмма, показывающая степень снижения галлюцинаций в моделях ИИ до и после улучшений" />Подход OpenAI к борьбе с галлюцинациями включает в себя множество технических стратегий, наложенных на архитектуру модели и процесс обучения. Компания внедрила усовершенствованные механизмы для повышения правдивости результатов ИИ, которые, судя по всему, основаны на передовых методах обучения, усовершенствованных методологиях оценки и, возможно, улучшенном хранении данных. Конкретные улучшения в медицине, праве и финансах позволяют предположить, что OpenAI уделяет особое внимание этим критически важным областям, где точность имеет серьезные последствия в реальном мире. Такой целенаправленный подход признает, что разные области создают уникальные проблемы, когда речь идет о фактической точности и надежности.
Доступность GPT-5.5 Instant в качестве новой модели ChatGPT по умолчанию представляет собой важную веху в области специальных возможностей. Сделав эту улучшенную модель моделью по умолчанию для пользователей, OpenAI гарантирует, что подавляющее большинство пользователей ChatGPT сразу же получат выгоду от этих улучшений точности, не требуя каких-либо действий с их стороны. Это решение отражает уверенность OpenAI в улучшениях модели и ее стремление уделять приоритетное внимание безопасности и надежности пользователей. Этот переход также сигнализирует широкому рынку и исследовательскому сообществу о том, что возможен значительный прогресс в решении проблемы галлюцинаций, от которой страдают системы искусственного интеллекта.
Особое внимание заслуживает акцент на производительности в таких специализированных областях, как медицина, право и финансы, поскольку в этих отраслях предъявляются самые строгие требования к точности и надежности. В медицине галлюцинации ИИ могут привести к неправильным диагностическим предложениям или опасным рекомендациям по лечению. С юридической точки зрения сфабрикованные цитаты из дел или правовые принципы могут подорвать качество юридических исследований и анализа. В финансах ложная информация может привести к дорогостоящим инвестиционным решениям или нарушениям нормативных требований. Сосредоточив усилия по оценке на этих областях с высокими ставками, OpenAI демонстрирует понимание того, где последствия ошибок ИИ наиболее серьезны и где улучшения необходимы наиболее срочно.
Заглядывая в будущее, можно сказать, что успех OpenAI в уменьшении галлюцинаций в GPT-5.5 Instant устанавливает важные ориентиры для всей индустрии искусственного интеллекта. Опубликованные компанией показатели улучшения дают конкретные доказательства того, что проблема галлюцинаций, хотя и остается серьезной, не является непреодолимой. Другие компании, занимающиеся искусственным интеллектом, разрабатывающие конкурирующие модели, вероятно, почувствуют необходимость соответствовать этим улучшениям точности или превосходить их, что потенциально ускоряет общеотраслевой прогресс в направлении более надежных систем искусственного интеллекта. Постоянное совершенствование методов повышения достоверности результатов ИИ будет оставаться решающим, поскольку эти системы играют все более важную роль в профессиональных и критически важных приложениях.
Источник: The Verge


