Las innovaciones de Google centradas en la inteligencia artificial: Gemini 2.0, Gemini 2.0 Flash, Deep Research y más

Si bien gigantes de la inteligencia artificial como Anthropic y OpenAI destacan con los nuevos modelos de inteligencia artificial que han lanzado recientemente, Google también ha comenzado a presentar el avance del modelo Gemini 2.0 de nueva generación. Además de presentar este modelo, la empresa ideó nuevas herramientas como el modelo Gemini 2.0 Flash, Project Mariner, Jules y Deep Research. Echemos un vistazo a las innovaciones de Google centradas en la inteligencia artificial.

Géminis 2.0

Sundar Pichai, director ejecutivo de Google Según lo que transmitieron; Gemini 2.0 es el modelo más capaz de la compañía hasta el momento. Gemini 2.0 ofrece salida multimodal con renderizado local y salida de audio. Además, el modelo cuenta con nuevas capacidades como el uso local de herramientas como Google Search y Maps. Se espera que Gemini 2.0 permita a Google crear nuevos agentes de inteligencia artificial que lo acerquen a su visión de un asistente universal.

Géminis Los usuarios pueden acceder a la versión 2.0 Experimental optimizada para chat desde cualquier parte del mundo seleccionando de la lista desplegable de modelos en la computadora de escritorio o en la web móvil. Pronto podrás encontrar esta versión en la aplicación móvil de Gemini. En este nuevo modelo los usuarios verán que el asistente Gemini les ayuda más.

Géminis 2.0 Flash

En este contexto, todos los usuarios de Gemini pueden utilizar el modelo Gemini 2.0 Flash, más eficiente y asequible. Si desea probar el modelo, puede habilitar Gemini 2.0 desde el menú desplegable en el cliente web Gemini. Se espera que el modelo esté disponible pronto en la aplicación móvil.

Flash 2.0, compatible con entradas multimodo como visuales, de vídeo y de audio. Puede llamar de forma nativa a herramientas como la Búsqueda de Google, ejecución de código y funciones de terceros definidas por el usuario.

Los desarrolladores podrán utilizar este modelo en la API de Gemini a través de Google AI Studio y Vertex AI. Los usuarios de Gemini y Gemini Advanced de todo el mundo pueden probar una versión optimizada para chat seleccionando Gemini 2.0 en el menú desplegable de modelos en el escritorio.

Funciones de Gemini 2.0 en la búsqueda

En el futuro, Google planea agregar las funciones inteligentes de Gemini 2.0 a su enfoque principal en la Búsqueda. La empresa incluso comenzará esto con descripciones generales de IA. Según la información compartida por la empresa, el nuevo modelo permitirá que la función de búsqueda maneje preguntas más complejas y relevantes. Esto incluye preguntas que involucran problemas de codificación y matemáticas de varios pasos.

Sin embargo, Google planea hacer que AI Overviews esté disponible en más idiomas y países. Si recuerda, la empresa realizó una expansión integral por última vez en octubre. Según la información compartida por Google; Gracias al nuevo modelo, la última versión de Astra puede hablar varios idiomas. De hecho, Astra puede cambiar instantáneamente entre idiomas. También puede acceder a herramientas como Google Lens y Maps, al tiempo que ofrece una latencia más baja y puede recordar durante períodos de tiempo más largos.

Cabe señalar que Gemini 2.0 Flash ofrece un rendimiento significativamente mejor en comparación con el modelo anterior. Según la información compartida; Obtuvo una puntuación del 63 por ciento en HiddenMath. En comparación, Gemini 1.5 Flash obtuvo una puntuación del 47,2 por ciento en la misma prueba. El punto de referencia HiddenMath prueba la capacidad de los modelos de IA para completar problemas matemáticos de nivel competitivo. También cabe destacar que la versión experimental de Gemini 2.0 supera a Gemini 1.5 Pro en muchos aspectos.

Según los datos compartidos por Google, las únicas áreas en las que Gemini 2.0 se queda atrás son la comprensión de textos largos y la traducción automática de voz. Por tanto, cabe señalar que Google seguirá utilizando el modelo antiguo durante un tiempo.

Sundar Pichai explicó que esta nueva versión se basa en Trillium, los TPU de sexta generación de la compañía:

Nuestro progreso en la versión 2.0 se debe a una década de inversiones en un enfoque a gran escala para la innovación en inteligencia artificial. Esta versión se basa en hardware personalizado como Trillium, nuestros TPU de sexta generación. Todo el poder de entrenamiento y semántica de Gemini 2.0 está impulsado por TPU. Hoy en día, nuestros clientes generalmente pueden utilizar Trillium en su trabajo de desarrollo.

El paso del agente de inteligencia artificial de Google: Proyecto Mariner

Project Mariner es una versión inicial del prototipo de investigación creado con Gemini 2.0. Su objetivo es dar forma al futuro de la interacción humano-agente que los usuarios inician desde el navegador. Project Mariner, un prototipo de investigación, puede comprender y razonar sobre una variedad de información, incluidos píxeles en la pantalla del navegador, así como elementos web como texto, código, imágenes y formularios. Se afirma que el producto puede completar tareas por usted utilizando esta información a través de una extensión experimental de Chrome.

Representante de codificación: Jules

Google también afirma que en el próximo período comenzará a explorar cómo los representantes de la inteligencia artificial pueden ayudar a los desarrolladores con Jules. Jules, un agente de codificación experimental impulsado por IA, se integra directamente con el flujo de trabajo de GitHub. Jules puede desarrollar e implementar un plan, así como resolver un problema. Al hacer todo esto bajo las instrucciones y supervisión del desarrollador, Jules es parte del objetivo a largo plazo de desarrollar representantes útiles de la IA en todas las áreas, incluida la codificación.

investigación profunda

La nueva función de Gemini Advanced, Deep Research, investiga problemas complejos en su nombre con el apoyo de la inteligencia artificial. Al presentar sus hallazgos en un informe completo y fácil de leer, esta nueva característica crea un plan de investigación de varios pasos después de ingresar su pregunta. Puedes cambiar o confirmar este plan. Una vez que lo apruebe, comienza a buscar información relevante en su nombre, de una manera muy completa en toda la web.

Si lo deseas, puedes exportar el informe elaborado por Deep Research como documento de Google. El informe se presenta a los usuarios con enlaces a fuentes originales. Simplemente menciónale esto a Géminis para que el informe sea aún más detallado.

Deep Research está disponible a nivel mundial en Gemini Advanced, inicialmente en inglés. Para acceder a esta función, puede seleccionar «Con Gemini 1.5 Pro Deep Research» en el menú desplegable del modelo y luego ingresar su pregunta de investigación.