Google presentó la nueva generación de la familia de modelos Gemini en el evento Google I/O 2026. La empresa anunció Géminis 3.5 Flash modelo; Mientras se centra en la velocidad, la baja latencia y los escenarios de uso basados en agentes, Géminis Omni Se posiciona como un modelo de inteligencia artificial multimodal que puede procesar texto, imágenes, audio y vídeo simultáneamente.
Géminis 3.5 Flash
Según la información compartida por Google Géminis 3.5 Flashfue desarrollado especialmente para flujos de trabajo que requieren largas cadenas de tareas y el uso de herramientas. La compañía dijo que en lugar de que el modelo solo genere respuestas de chat; Afirma que está optimizado para agentes de inteligencia artificial que pueden planificar, conducir vehículos, seguir tareas y gestionar procesos de varias etapas.
El nuevo modelo puede funcionar integrado con los servicios de Google como Google Search, Gmail, Docs y Chrome. Así, los usuarios pueden beneficiarse de los sistemas de inteligencia artificial que pueden realizar investigaciones, analizar documentos, preparar notas de reuniones o gestionar flujos de tareas con comandos de lenguaje natural.
Google también destaca que Gemini 3.5 Flash ofrece una latencia más baja y funciona de manera más eficiente en comparación con las generaciones anteriores. La empresa pretende utilizar el modelo en aplicaciones en tiempo real, especialmente para desarrolladores. Se afirma que Gemini 3.5 Flash está disponible para los desarrolladores a través de Google AI Studio y Vertex AI.
Géminis Omni
Otra innovación anunciada en el evento fue Géminis Omni sucedió. Según la declaración de Google, Omni fue desarrollado para interacciones multimodales en tiempo real. Modelo; Puede comprender texto, audio, imagen y vídeo al mismo tiempo y establecer una conexión entre estos contenidos.
Google afirma que Omni destaca especialmente en la producción y edición de vídeos. Los usuarios pueden crear videos con comandos de lenguaje natural, cambiar escenas o editar videos existentes hablando. La compañía también comparte que el modelo puede establecer diálogos de voz en tiempo real e interpretar contenido visual al instante.
También se afirma que Gemini Omni funciona con el modelo de producción de vídeo Veo, respaldado por inteligencia artificial de Google. Así, los usuarios; Puede producir contenido de vídeo más avanzado con comandos basados en texto.
Google también compartió nuevas funciones que llegarán a la aplicación Gemini. En consecuencia, mientras se amplía la experiencia Gemini Live; Las funciones de cámara, uso compartido de pantalla e interacción de voz en tiempo real se están abriendo a más usuarios. La empresa destaca que Gemini se ha transformado ahora en una estructura más «personal», «proactiva» y «útil».
Según el comunicado de Google, Gemini 3.5 Flash ha comenzado a implementarse gradualmente para desarrolladores y usuarios a partir de hoy. Está previsto que el modelo Gemini 3.5 Pro se lance en el próximo período.