La generación de imágenes mediante IA está cambiando con ChatGPT Images 2.0

OpenAI ha anunciado el lanzamiento de la nueva versión de su herramienta de generación de imágenes basada en IA. Esta actualización, denominada ChatGPT Images 2.0, incluye nuevas características definidas como «capacidades de razonamiento» y permite al sistema crear imágenes más completas al extraer información de la web. Estas capacidades, disponibles inicialmente para los suscriptores de los planes Plus, Pro, Business y Enterprise, permiten obtener resultados más coherentes y detallados en el proceso de generación de imágenes.

La nueva versión se basa en el modelo GPT Image 2 de OpenAI. Este modelo es capaz de analizar la estructura de la escena antes de la generación visual y crear el resultado en consecuencia. Además, permite a los usuarios preparar descripciones visuales a partir de los archivos que suben. Por otra parte, el sistema tiene la capacidad de extraer información de Internet cuando sea necesario para producir contenidos más precisos. Este enfoque ayuda a obtener resultados más acertados, especialmente en solicitudes visuales complejas o que requieren contexto.

Una de las novedades más destacadas de ChatGPT Images 2.0 es la capacidad de generar varias imágenes al mismo tiempo. Mientras el modo de reflexión está activo, se pueden generar hasta ocho imágenes, y se mantiene la coherencia en cuanto a personajes, objetos y estilo entre ellas. Esta característica ofrece ventajas prácticas en escenarios de uso como la creación de páginas de manga, la preparación de series de contenido para redes sociales o la visualización de planos de diseño de las diferentes habitaciones de una casa.

Innovaciones técnicas y ámbitos de aplicación de ChatGPT Images 2.0

Todos los usuarios de ChatGPT pueden beneficiarse, con la nueva versión, de una infraestructura de generación que refleja con mayor precisión las características básicas de las imágenes. Se pueden obtener resultados más satisfactorios en diferentes tipos de imágenes, como el arte pixelado, los dibujos de manga y las imágenes cinematográficas. Además, se ofrece compatibilidad con una resolución máxima de 2K y diferentes relaciones de aspecto que varían entre 3:1 y 1:3. Esta flexibilidad facilita la creación de contenido adecuado para diferentes plataformas.

También se han introducido mejoras notables en la generación de texto. El sistema ya no se limita únicamente al inglés y al alfabeto latino; ofrece resultados más satisfactorios a la hora de generar imágenes con texto en idiomas como el japonés, el coreano, el chino, el hindi y el bengalí. Este avance abre un campo de aplicación más amplio, especialmente para los creadores de contenido a nivel mundial.

OpenAI presentó por primera vez la herramienta ChatGPT Images el año pasado y, en diciembre, lanzó una actualización que incluía una generación más rápida y herramientas de edición avanzadas. A pesar de ello, la competencia en el ámbito de la generación de imágenes asistida por IA se ha intensificado. Herramientas como Nano Banana Pro de Google y MAI-Image-2 de Microsoft se presentan ante los usuarios con capacidades similares. Por ello, la nueva actualización de OpenAI destaca como un paso centrado en mejorar la experiencia actual del usuario.

ChatGPT Images 2.0 ya está disponible para todos los usuarios de ChatGPT y Codex a partir de hoy. La nueva versión ofrece mejoras significativas, especialmente para los usuarios que desean generar imágenes más coherentes, al tiempo que permite obtener resultados más contextuales y ricos gracias a su enfoque de generación basado en la web.

Innovaciones técnicas y ámbitos de aplicación de ChatGPT Images 2.0

Comparte esto: