Новый генератор изображений OpenAI использует веб-данные

OpenAI запускает ChatGPT Images 2.0 с возможностями просмотра веб-страниц и расширенными функциями мышления для более сложного создания изображений.
OpenAI представила значительное обновление своей технологии создания изображений с помощью искусственного интеллекта, представив ChatGPT Images 2.0 с революционными возможностями, которые фундаментально меняют способ создания визуального контента платформой. Новая итерация включает в себя интегрированные возможности мышления, которые позволяют системе выполнять поиск в Интернете в режиме реального времени, собирая необходимую информацию для информирования и улучшения процесса создания изображений. Это достижение представляет собой большой шаг вперед в усилиях компании по созданию изображений, созданных с помощью искусственного интеллекта, более контекстуально точными, визуально сложными и отвечающими требованиям пользователя.
Усовершенствованный генератор изображений теперь демонстрирует значительно улучшенные возможности по нескольким параметрам, которые запросили пользователи. Согласно официальному заявлению OpenAI, обновленная система превосходно генерирует более сложные и подробные изображения, сохраняя при этом превосходные возможности выполнения инструкций. Платформа теперь может лучше сохранять конкретные детали, которые пользователи подчеркивают в своих подсказках, гарантируя, что нюансы запросов будут точно отражены в конечном результате. Кроме того, в новой версии заметно улучшена производительность при создании текстовых элементов внутри изображений, что устраняет ранее существовавшее ограничение, с которым часто сталкивались пользователи.
В основе этого обновления лежит недавно разработанная OpenAI модель GPT Image 2, которая включает в себя усовершенствованные механизмы рассуждения, которые позволяют подходить к созданию изображений с большей глубиной и пониманием. Возможности мышления, заложенные в эту модель, позволяют использовать более продуманный и многоуровневый подход к интерпретации запросов пользователей и их переводу в визуальные представления. Это представляет собой фундаментальный переход от предыдущих версий, которые в основном полагались на сопоставление с образцом и статистические корреляции, к более сложной системе, которая может анализировать контекст, композицию и визуальные принципы перед созданием изображений.
Источник: The Verge


