Il nuovo generatore di immagini di OpenAI sfrutta i dati web

OpenAI lancia ChatGPT Images 2.0 con funzionalità di navigazione web e funzionalità avanzate per la generazione di immagini più sofisticate.
OpenAI ha svelato un aggiornamento significativo alla sua tecnologia di generazione di immagini di intelligenza artificiale, introducendo ChatGPT Images 2.0 con funzionalità rivoluzionarie che cambiano radicalmente il modo in cui la piattaforma crea contenuti visivi. La nuova iterazione presenta capacità di pensiero integrate che consentono al sistema di effettuare ricerche sul Web in tempo reale, raccogliendo informazioni pertinenti per informare e migliorare il processo di creazione delle immagini. Questo progresso rappresenta un grande passo avanti negli sforzi dell'azienda per rendere le immagini generate dall'intelligenza artificiale più accurate dal punto di vista contestuale, visivamente sofisticate e rispondenti alle specifiche dell'utente.
Il generatore di immagini migliorato ora dimostra funzionalità notevolmente migliorate in più dimensioni richieste dagli utenti. Secondo l'annuncio ufficiale di OpenAI, il sistema aggiornato eccelle nel generare immagini più sofisticate e dettagliate pur mantenendo capacità superiori di seguire le istruzioni. La piattaforma ora può preservare meglio i dettagli specifici che gli utenti enfatizzano nelle loro richieste, garantendo che le richieste sfumate si riflettano accuratamente nell'output finale. Inoltre, la nuova versione mostra prestazioni notevolmente migliorate nella generazione di elementi di testo all'interno delle immagini, risolvendo una limitazione precedentemente impegnativa che gli utenti incontravano spesso.
Al centro di questo aggiornamento si trova il nuovo modello GPT Image 2 di OpenAI, che incorpora meccanismi di ragionamento avanzati che gli consentono di affrontare la generazione di immagini con maggiore profondità e comprensione. Le capacità di pensiero integrate in questo modello consentono un approccio più deliberato e stratificato per interpretare le richieste degli utenti e tradurle in rappresentazioni visive. Ciò rappresenta un passaggio fondamentale rispetto alle versioni precedenti, che si basavano principalmente sulla corrispondenza di modelli e sulle correlazioni statistiche, verso un sistema più sofisticato in grado di ragionare su contesto, composizione e principi visivi prima di generare immagini.
Fonte: The Verge


