ChatGPT від OpenAI стає розумнішим: нова модель скорочує галюцинації вдвічі

OpenAI представляє GPT-5.5 Instant із суттєвими покращеннями точності. Нова стандартна модель ChatGPT зменшує галюцинації на 52,5% у таких критичних сферах, як медицина та право.
OpenAI оголосив про значний прорив у вирішенні однієї з найбільш постійних проблем штучного інтелекту: тенденції моделей ШІ генерувати неправдиву або оманливу інформацію. Найновіша модель ChatGPT за замовчуванням компанії, позначена як GPT-5.5 Instant, являє собою значний стрибок у фактичній точності та надійності. Згідно з внутрішніми оцінками OpenAI, ця розширена ітерація демонструє значні покращення у зменшенні кількості неточних або сфабрикованих заяв у широкому спектрі програм і випадків використання.
Галюцинації в системах штучного інтелекту вже давно мучать індустрію, коли мовні моделі часто створюють правдоподібну, але повністю сфабриковану інформацію. Ця проблема викликала серйозне занепокоєння серед дослідників, політиків і кінцевих користувачів, які покладаються на ці інструменти для критичних завдань. Від медичних діагнозів до юридичних інтерпретацій і фінансових консультацій, наслідки дезінформації, створеної ШІ, можуть бути серйозними та потенційно шкідливими. Постійний характер цієї проблеми змусив OpenAI та конкурентів інвестувати значні кошти в дослідження, спрямовані на фундаментальне покращення фактичної точності та надійності їхніх моделей.
Покращення, продемонстровані GPT-5.5 Instant, особливо вражають у доменах із високими ставками. OpenAI повідомляє, що на основі ретельних внутрішніх оцінок нова модель створила приблизно на 52,5% менше галюцинованих претензій порівняно з її попередницею, моделлю GPT-5.3 Instant. Це різке скорочення було виміряно саме на тому, що OpenAI описує як «підказки з високими ставками», які охоплюють важливі сфери, зокрема медицину, право та фінанси. Ці три сектори представляють одні з найбільш чутливих додатків, де точність не просто бажана, але абсолютно необхідна для безпеки та довіри користувачів.
Окрім показників покращення підказок із високими ставками, OpenAI висвітлив додаткові переваги у вирішенні проблемних моделей розмов. Аналіз компанії показує, що GPT-5.5 Instant зменшив кількість неточних претензій на 37,3% щодо особливо складних розмов, які користувачі раніше позначали як такі, що містять фактичні помилки. Цей показник особливо важливий, оскільки він відображає моделі використання в реальному світі, коли користувачі вже виявили та повідомили про випадки неточності. Той факт, що нова модель демонструє суттєві покращення щодо цих раніше проблемних запитів, свідчить про те, що OpenAI досяг справжнього прогресу в розумінні та виправленні основних механізмів, які генерують неправдиву інформацію.
Розробка GPT-5.5 Instant відбувається в той момент, коли галюцинації штучного інтелекту дедалі більше визнають занепокоєння в академічних і комерційних спільнотах ШІ. Кілька дослідницьких установ і компаній, що займаються штучним інтелектом, задокументували поширеність цієї проблеми. Дослідження показали, що навіть дуже потужні мовні моделі можуть впевнено стверджувати неправдиву інформацію з вражаючим звучанням, але повністю сфабрикованими деталями. Ця проблема виникає через фундаментальну природу роботи великих мовних моделей, оскільки вони прогнозують статистично ймовірні наступні лексеми на основі своїх навчальних даних, а не звертаються до фактичних баз знань чи перевіряють факти в реальному часі.
<зображення src="https://platform.theverge.com/wp-content/uploads/sites/2/2026/02/STK155_OPEN_AI_4_CVir ginia_A.png?quality=90&strip=all&crop=0%2C0.011761938367442%2C100%2C99.976476123265&w=2400" alt="Порівняльна діаграма, що показує рівень зменшення галюцинацій у моделях ШІ до та після покращень" />Підхід OpenAI до боротьби з галюцинаціями включає в себе кілька технічних стратегій, складених у архітектурі моделі та процесі навчання. Компанія запровадила розширені механізми для покращення фактичності результатів штучного інтелекту, які, здається, базуються на вдосконалених методах навчання, удосконалених методологіях оцінювання та, можливо, покращеному контролі даних. Конкретні вдосконалення в медицині, законодавстві та фінансах свідчать про те, що OpenAI приділяє особливу увагу цим критичним сферам, де точність має значні наслідки в реальному світі. Цей цілеспрямований підхід визнає, що різні домени представляють унікальні проблеми, коли йдеться про фактичну точність і достовірність.
Доступність GPT-5.5 Instant як нової моделі ChatGPT за умовчанням є важливою віхою в доступності. Зробивши цю вдосконалену модель стандартною для користувачів, OpenAI гарантує, що переважна більшість користувачів ChatGPT одразу скористаються цими покращеннями точності, не вимагаючи жодних дій з їхнього боку. Це рішення відображає впевненість OpenAI у вдосконаленнях моделі та її прагнення віддавати пріоритет безпеці та надійності користувачів. Перехід також сигналізує ширшому ринку та дослідницькому співтовариству, що можливий значний прогрес у вирішенні проблеми галюцинацій, яка мучила системи ШІ.
Наголос на ефективності в таких спеціалізованих галузях, як медицина, право та фінанси, заслуговує особливої уваги, оскільки ці галузі мають найсуворіші вимоги до точності та надійності. У медицині галюцинації штучного інтелекту можуть призвести до неправильних діагностичних пропозицій або рекомендацій щодо небезпечного лікування. У праві сфабриковані цитати з справ або правові принципи можуть підірвати якість юридичних досліджень і аналізу. У фінансах неправдива інформація може призвести до дорогих інвестиційних рішень або порушення нормативних актів. Зосереджуючи зусилля з оцінювання на цих високих сферах, OpenAI демонструє обізнаність про те, де наслідки помилок штучного інтелекту є найсерйознішими, а де вдосконалення потрібні найбільш терміново.
Заглядаючи вперед, успіх OpenAI у зменшенні галюцинацій у GPT-5.5 Instant встановлює важливі стандарти для всієї галузі ШІ. Опубліковані компанією показники покращення надають конкретні докази того, що проблема галюцинацій, хоча й залишається значною, не є непереборною. Інші компанії штучного інтелекту, які розробляють конкуруючі моделі, ймовірно, відчуватимуть тиск, щоб відповідати або перевищувати ці покращення точності, потенційно прискорюючи прогрес у галузі до більш надійних систем штучного інтелекту. Постійне удосконалення методів підвищення фактичності результатів штучного інтелекту залишатиметься вирішальним, оскільки ці системи відіграватимуть дедалі важливішу роль у професійних і критичних програмах.
Джерело: The Verge


