OpenAI'nin Yeni Görüntü Oluşturucusu Web Verilerinden Yararlanıyor

OpenAI, daha karmaşık görüntü oluşturmaya yönelik web tarama yetenekleri ve gelişmiş düşünme özellikleriyle ChatGPT Images 2.0'ı piyasaya sürüyor.
OpenAI, platformun görsel içerik oluşturma biçimini temelden değiştiren çığır açıcı yeteneklere sahip ChatGPT Images 2.0'ı sunarak yapay zeka görüntü oluşturma teknolojisinde önemli bir yükseltme yaptığını duyurdu. Yeni yineleme, sistemin web'de gerçek zamanlı arama yapmasını, görüntü oluşturma sürecini bilgilendirmek ve geliştirmek için ilgili bilgileri toplamasını sağlayan entegre düşünme yeteneklerine sahiptir. Bu ilerleme, şirketin yapay zeka tarafından oluşturulan görüntüleri bağlamsal olarak daha doğru, görsel olarak daha gelişmiş ve kullanıcı özelliklerine duyarlı hale getirme çabalarında ileriye doğru büyük bir atılımı temsil ediyor.
Geliştirilmiş görüntü oluşturucu artık kullanıcıların talep ettiği birden çok boyutta önemli ölçüde geliştirilmiş yetenekler sunuyor. OpenAI'nin resmi duyurusuna göre, güncellenen sistem, üstün talimat takip yeteneklerini korurken, daha karmaşık ve ayrıntılı görüntüler oluşturma konusunda öne çıkıyor. Platform artık kullanıcıların istemlerinde vurguladığı belirli ayrıntıları daha iyi koruyabiliyor ve incelikli isteklerin nihai çıktıya doğru şekilde yansıtılmasını sağlıyor. Ayrıca yeni sürüm, görsellerin içinde metin öğeleri oluşturma konusunda önemli ölçüde iyileştirilmiş performans göstererek, kullanıcıların sıklıkla karşılaştığı daha önce zorlayıcı bir sınırlamayı ortadan kaldırıyor.
Bu yükseltmenin kalbinde, OpenAI'nin yeni geliştirdiği GPT Image 2 modeli yer alıyor; bu model, görüntü oluşturmaya daha fazla derinlik ve anlayışla yaklaşmasına olanak tanıyan gelişmiş akıl yürütme mekanizmalarını içeriyor. Bu modelin içine yerleştirilmiş düşünme yetenekleri, kullanıcı isteklerinin yorumlanması ve görsel temsillere dönüştürülmesi konusunda daha bilinçli, katmanlı bir yaklaşıma olanak tanır. Bu, öncelikle desen eşleştirmeye ve istatistiksel korelasyonlara dayanan önceki sürümlerden, görselleri oluşturmadan önce bağlam, kompozisyon ve görsel ilkeler hakkında akıl yürütebilen daha karmaşık bir sisteme doğru köklü bir değişimi temsil ediyor.
Kaynak: The Verge


