OpenAI 的新图像生成器利用网络数据

OpenAI 推出 ChatGPT Images 2.0,具有网络浏览功能和高级思维功能,可生成更复杂的图像。
OpenAI 推出了对其人工智能图像生成技术的重大升级,推出了具有突破性功能的 ChatGPT Images 2.0,从根本上改变了平台创建视觉内容的方式。新的迭代具有集成的思维能力,使系统能够实时搜索网络,收集相关信息以通知和增强图像创建过程。这一进步代表了该公司在使人工智能生成的图像更加上下文准确、视觉效果更加复杂以及对用户规格的响应方面取得的重大飞跃。
增强的图像生成器现在展示了用户要求的跨多个维度的显着改进的功能。根据OpenAI的官方公告,更新后的系统擅长生成更复杂、更详细的图像,同时保持卓越的指令跟踪能力。该平台现在可以更好地保留用户在提示中强调的具体细节,确保细微的请求在最终输出中准确反映。此外,新版本在图像中生成文本元素方面的性能显着提高,解决了用户以前经常遇到的具有挑战性的限制。
此次升级的核心在于 OpenAI 新开发的 GPT Image 2 模型,该模型采用了先进的推理机制,使其能够更深入地理解图像生成。该模型中嵌入的思维能力可以采用更加深思熟虑的分层方法来解释用户请求并将其转换为视觉表示。这代表了从主要依赖于模式匹配和统计相关性的先前版本到可以在生成图像之前推理上下文、构图和视觉原理的更复杂的系统的根本转变。
来源: The Verge


