Las imágenes generadas por IA son cada vez más difíciles de detectar. Por supuesto, existen los indicadores habituales, pero esos indicadores se minimizan con cada nuevo modelo de imagen de IA. Se podría contar con manos generadas por IA que incluyan demasiados o muy pocos dedos en las personas, por ejemplo; hoy en día, ese no es necesariamente el caso.
Un área particular de debilidad de los modelos de imágenes de IA ha sido la generación de texto. La imagen en sí puede parecer convincente, pero si observas de cerca las palabras, a menudo notarás que no lo son. en realidad bien. Quizás algunos sean precisos, mientras que otros se acerquen bastante, pero, en muchos casos, notarás muchas inconsistencias: demasiadas letras repetidas, letras que en realidad no son letras, caracteres que se mezclan y se entrelazan entre sí. Muchas de estas peculiaridades me recuerdan cómo se ve el lenguaje de Star Wars, al menos cuando la IA intenta replicar el inglés americano.
Images 2.0 de OpenAI es capaz de generar imágenes de IA altamente realistas
Pero los últimos modelos de IA están mejorando mucho con la generación de texto. De hecho, el último modelo de OpenAI para ChatGPT, Images 2.0, puede representar texto muy realista y una lote de ello, hasta el punto en que no estoy seguro de que muchos de nosotros (o cualquier de nosotros) podremos detectarlo. Según OpenAI, Images 2.0 es el primer modelo de imagen de la compañía con capacidades de pensamiento: eso significa que el modelo puede tomarse su tiempo para desglosar cada paso de una solicitud, lo que puede generar imágenes más detalladas o precisas, así como la capacidad de generar hasta ocho imágenes a partir de un mensaje (aunque esto solo está disponible para suscriptores pagos). Los usuarios gratuitos aún pueden aprovechar las ventajas de Images 2.0, como la forma en que busca información en la web y verifica su trabajo. La compañía dice que «los resultados parecen menos generados por IA y más diseñados intencionalmente», lo que esencialmente significa que las imágenes generadas con ChatGPT serán mucho más difíciles de detectar en el futuro.
La empresa parece tener mucha confianza en este último modelo. Destaca la cantidad de diferentes tipos de imágenes que puede crear: no solo imágenes fotorrealistas, sino capturas de pantalla de la interfaz de usuario de una computadora, un collage de revista, un montículo de arroz (eso es mucho que generar), una página de revista y un ensayo escrito a mano. También quieren decir escrito a mano, hasta una mancha de café en el papel. Puede desplazarse por estos ejemplos en la publicación del anuncio oficial de OpenAI para ver cuán sorprendentemente realistas son. La publicación incluye otros ejemplos, como fotografías muy realistas, páginas de novelas gráficas, carteles de películas e imágenes con diferentes relaciones de aspecto, hasta la vista panorámica del iPhone.
¿Qué opinas hasta ahora?
Todos estos desarrollos son tan impresionantes como inquietantes, pero para mí, son las mejoras en el texto las que realmente llevan esto a otro nivel. Muchos modelos se están volviendo bastante buenos generando imágenes que engañan a los usuarios haciéndoles creer que son reales, pero el nivel de detalle en el texto y la escritura en estos ejemplos es algo que aún no he visto. Le pedí a ChatGPT que me generara un menú para un restaurante italiano, destacando cinco platos de cena y dos postres; dejé los platos específicos a discreción de la IA. Se las arregló para generar algo realista, con entradas para la cena y el postre sin errores, hasta donde yo sé. Luego le pedí que generara una entrada en el periódico anunciando que los Medias Rojas y los Yankees cambiarían de ciudad. Lo mismo hizo también, de nuevo sin errores evidentes.
Crédito: hacker
No estoy diciendo que estas imágenes sean perfecto: Todavía tienen un «brillo» de IA, que un ojo entrenado o un observador cercano podría notar. OpenAI dice que Images 2.0 tiene dificultades con ciertas tareas complejas, como rompecabezas, así como con detalles que se encuentran en áreas ocultas o ubicadas de manera extraña, como superficies invertidas. Pero nada de eso realmente importa cuando las imágenes que produce este modelo son lo suficientemente impresionantes como para engañar a la mayoría de las personas que las pasan por alto. Infografías, fotografías, mapas, cómics, carteles de películas, lo que sea: la gente usará esta herramienta y usted comenzará a ver muchas más imágenes de IA en su vida, a menudo sin siquiera saberlo.
