Новий генератор зображень OpenAI використовує веб-дані

OpenAI запускає ChatGPT Images 2.0 із можливостями перегляду веб-сторінок і розширеними функціями мислення для створення більш складних зображень.
OpenAI оприлюднив значне оновлення своєї технології генерації зображень за допомогою штучного інтелекту, представляючи ChatGPT Images 2.0 із новаторськими можливостями, які докорінно змінюють спосіб створення візуального вмісту платформою. Нова ітерація містить інтегровані можливості мислення, які дозволяють системі здійснювати пошук в Інтернеті в режимі реального часу, збираючи відповідну інформацію для інформування та вдосконалення процесу створення зображень. Цей прогрес є значним кроком вперед у зусиллях компанії зробити зображення, створені за допомогою штучного інтелекту, більш контекстно точними, візуально складнішими та чутливими до специфікацій користувача.
Покращений генератор зображень тепер демонструє значно покращені можливості в кількох вимірах, які запитували користувачі. Згідно з офіційним оголошенням OpenAI, оновлена система чудово справляється зі створенням складніших і детальніших зображень, зберігаючи чудові можливості виконання інструкцій. Платформа тепер може краще зберігати конкретні деталі, які користувачі наголошують у своїх підказках, забезпечуючи точне відображення нюансів запитів у кінцевому результаті. Крім того, нова версія показує помітно покращену продуктивність у створенні текстових елементів у зображеннях, усуваючи раніше складні обмеження, з якими користувачі часто стикалися.
В основі цього оновлення лежить нещодавно розроблена OpenAI модель GPT Image 2, яка включає передові механізми міркування, які дозволяють підходити до створення зображень з більшою глибиною та розумінням. Можливості мислення, вбудовані в цю модель, дозволяють використовувати більш продуманий, багатошаровий підхід до інтерпретації запитів користувачів і їх перекладу у візуальні представлення. Це являє собою фундаментальний перехід від попередніх версій, які покладалися насамперед на зіставлення шаблонів і статистичні кореляції, до більш складної системи, яка може міркувати про контекст, композицію та візуальні принципи перед створенням зображень.
Джерело: The Verge


