Google ha añadido una función de producción de vídeo basada en fotos a su plataforma Gemini, impulsada por IA. Con esta función, los usuarios pueden crear un vídeo de ocho segundos a partir de una sola imagen que suban. Los vídeos producidos también incluyen sonidos de fondo, locuciones y efectos adecuados al entorno. Por el momento, esta función solo está disponible para los suscriptores de Google AI Ultra y Pro.
Los usuarios pueden subir sus fotos haciendo clic en la opción «vídeo» del menú «herramientas» de la interfaz de Gemini. La producción de vídeo no sólo requiere imágenes, sino también un breve texto que describa la acción. Además, también es posible describir qué sonidos se van a incluir en la escena. Google afirma que estos sonidos estarán totalmente sincronizados con el vídeo. Los vídeos se presentan en resolución 720p, formato MP4 y proporción 16:9.
Google ha puesto esta nueva herramienta a disposición de los abonados a Gemini Pro y Ultra en determinadas regiones. El acceso a través de la web es inmediato, mientras que el despliegue para dispositivos móviles continuará a lo largo de la semana. En Europa, los suscriptores de Gemini Pro tienen acceso limitado a través del modelo «Veo 3 Fast». Estos usuarios pueden producir vídeos hasta tres veces al día; cuando se supera este límite, el sistema cambia automáticamente al modelo Veo 2, más antiguo.
La aplicación Flow de Google ya está disponible en 75 países más
Google, presentó en marzo Flujo herramienta de creación de vídeo a 75 nuevos países. Esta aplicación ofrece opciones de control avanzadas, como la configuración de escenas y el movimiento de la cámara. Flujoofrece más posibilidades de personalización que Gemini, pero funciona como una aplicación independiente. Con la nueva función, los usuarios de Gemini pueden ahora producir vídeos a partir de una sola foto sin necesidad de abrir una aplicación adicional. De este modo, se ofrece una experiencia más rápida y accesible.
Google ha desarrollado Veo 3 incluye mejoras significativas con respecto a las versiones anteriores. La precisión del movimiento, la sincronización labial y la correspondencia audiovisual son las principales mejoras. Además, se añade a cada vídeo una marca de agua visible y una marca invisible llamada SynthID. Esta aplicación pretende indicar claramente que el contenido está producido por inteligencia artificial. Google afirma que ha realizado pruebas exhaustivas en este proceso y ha preparado el sistema contra usos indebidos.
Con esta función, los usuarios pueden animar sus dibujos, añadir movimiento a fotos de la naturaleza o animar objetos de forma realista. Los sonidos deseados pueden definirse manualmente o el sistema puede analizar automáticamente el entorno y hacer sugerencias. El contenido producido puede compartirse en las redes sociales y descargarse en formatos adecuados para secuencias de vídeo cortas y verticales. De este modo, se ofrecen nuevas herramientas tanto a los productores de contenidos individuales como a los profesionales que se centran en la narración visual.
El modelo Veo 3 se anunció por primera vez en el evento I/O 2025 de Google. Este modelo Géminis y Flujo La integración con Google se hizo para simplificar el proceso de producción. Aunque actualmente sólo está disponible en regiones limitadas, se afirma que Google planea ofrecer esta función a un público más amplio a finales de año. Según el comunicado oficial de la empresa, se está trabajando en el soporte de nuevos idiomas y distribuciones regionales. Cuando se completen las mejoras, se pretende abrirlo a más usuarios.
