Nuevo modelo de vídeo que rivaliza con Sora de Google DeepMind: Veo 2

Google DeepMind en el campo de la producción de vídeo apoyada por inteligencia artificial Competirá con el modelo Sora de OpenAI anunció el modelo de creación de video de nueva generación Veo 2. Veo 2 ofrece vídeos más realistas, clips más largos y mayor resolución.

¿Qué es Veo 2 y qué ofrece?

Veo 2 es un modelo de vídeo que puede crear vídeos de más de dos minutos en calidad 4K. Con estas características, se basa en el modelo Sora de OpenAI. Puede producir vídeos con una resolución 4 veces mayor y una duración 6 veces mayor. Sin embargo, esto es actualmente una ventaja teórica; porque Veo 2 está limitado a sólo una resolución de 720p y vídeos de hasta 8 segundos en la herramienta de vídeo experimental de Google, VideoFX.

Plataforma VideoFXestá gestionado por Google Labs y los usuarios pueden registrarse en una lista de espera y recibir una invitación para acceder. Google afirma que más usuarios accederán a la plataforma esta semana.

Veo 2 puede crear vídeos utilizando un texto introductorio o un texto y una imagen de referencia. Sin embargo, el nuevo modelo ofrece importantes mejoras respecto al anterior:

Realismo físico: Veo 2, desarrollado para dinámica de movimiento y fluidos, modela detalles como el café servido en una taza con mayor precisión.

Controles de cámara: El modelo tiene la capacidad de grabar objetos desde diferentes ángulos posicionando la cámara virtual con mayor precisión. Los usuarios pueden determinar las funciones de disparo en detalle.

Claridad y movimiento: La textura y la imagen se vuelven más claras, especialmente en escenas en movimiento. Puede crear una amplia gama de vídeos, desde animaciones al estilo Pixar hasta escenas cinematográficas enriquecidas con efectos visuales.

En los vídeos de muestra compartidos por DeepMind se notan importantes avances, especialmente en reflejos, fluidos y movimientos complejos. Sin embargo, también se acepta que el modelo tiene problemas de realismo en algunos casos.

El enfoque de Veo 2 hacia la seguridad y los derechos de autor

Veo 2 fue entrenado con grandes cantidades de contenido de video. Aunque Google no revela exactamente dónde se recopilaron estos vídeos, dice que YouTube es una posible fuente. La base jurídica de Google a este respecto es el principio de uso gratuito. Para reducir las preocupaciones sobre derechos de autor, Google agregó texto invisible incrustado en los marcos de los videos creados con Veo 2. Marca de agua SynthID añade. Sin embargo, no se garantiza que esta marca de agua sea completamente indestructible.

Colaboraciones y competidores

DeepMind colaboró ​​particularmente estrechamente con artistas y productores durante todo el proceso de desarrollo. artistas famosos Donald Glover (Gambino infantil), The Weeknd Y d4vd Nombres como participaron en el desarrollo de Veo.

El competidor más importante de Veo 2 de Google es, sin duda, la herramienta de creación de vídeos basada en IA de OpenAI. sora. Sin embargo, el mercado también Pista ML, Pika Labs Y Luma A.I. Empresas como estas también están logrando avances notables.

Otra innovación de Google: Imagen 3

Google DeepMind continúa su trabajo en el campo de la producción visual y de vídeo. Google presentó el modelo más nuevo de la serie Imagen, Imagen 3. Imagen 3 puede producir imágenes de alta resolución con comandos basados ​​en texto, aumentando la coherencia visual detallada. Destaca especialmente por su capacidad para escribir y crear finas texturas.

Google afirma que se centró en las áreas de seguridad, ética y uso creativo mientras desarrollaba Veo 2 e Imagen 3. Se espera que en el futuro estos modelos se utilicen ampliamente en áreas como los productores de contenidos, la industria cinematográfica y la publicidad.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept