Runway, la startup de producción de videos con inteligencia artificial, anunció su nuevo modelo llamado Gen-4.5. El modelo ocupó el primer lugar con 1.247 puntos Elo en el ranking Video Arena elaborado por la empresa independiente de evaluación de inteligencia artificial Artificial Analysis. En la misma lista, el modelo Veo 3 de Google ocupa el segundo lugar y el modelo Sora 2 Pro de OpenAI ocupa el séptimo lugar.

Gen-4.5 ofrece una estructura que refleja con mayor precisión las leyes de la física, el flujo de la escena, los movimientos de la cámara y el movimiento humano mientras produce videos de alta resolución a partir de comandos escritos. Runway afirma que el modelo es significativamente más fuerte que la generación anterior en términos de reproducción dinámica de la acción, consistencia del tiempo y control en escena.
Cristóbal Valenzuela, director general de la pistaEn su declaración a CNBC, destacó «un equipo de cien personas que compiten con empresas de billones de dólares» y afirmó que el proceso de desarrollo del modelo duró muchos años. Según datos de PitchBook, la valoración de la empresa es de 3.550 millones de dólares.
Se utilizaron GPU Nvidia en todas las etapas de desarrollo de Gen-4.5. Runway dice que junto con Nvidia, optimizaron tanto el proceso de entrenamiento como la velocidad de inferencia. A pesar del modelo, todavía se observan limitaciones en muchos modelos de producción de video: errores de causalidad en algunas escenas, objetos que desaparecen y reaparecen entre cuadros y ciertas acciones tienen éxito más fácilmente de lo que realmente deberían.
El modelo se ha ido implementando gradualmente y estará disponible para todos los usuarios de Runway dentro de una semana. Gen-4.5 estará disponible a través de la plataforma, API y socios de Runway. La compañía también anunció que los modos de control existentes (Imagen a Video, Fotogramas Clave, Video a Video, etc.) se transferirán al nuevo modelo en poco tiempo.
