La nueva familia de modelos de inteligencia artificial multimodal de Amazon: Nova

Amazon presenta la nueva familia de modelos de IA multimodal Nova en la conferencia AWS re:Invent introducido. Amazon Nova Micro, Si bien aparece como un modelo de texto optimizado en términos de velocidad y costo, Amazonas Nova LiteSe describe como un modelo multimodal de muy bajo costo que puede ingerir imágenes, videos y texto para crear texto. Amazon NovaPro Se describe como un modelo multimodo extremadamente capaz.

La empresa también Amazon Nova Premier También entrena a un modelo llamado. Según la empresa; Amazon Nova Premier será el modelo multimodo más capaz para tareas de razonamiento complejas. Amazon tiene como objetivo que Nova Premier esté disponible a “principios de 2025”. Según el comunicado del CEO de Amazon, Andy Jassy; Micro, Lite y Pro se lanzaron ayer para los clientes de AWS.

Modelos Nova que producen texto, principalmente en inglés. 15 idiomas Optimizado para . Una ventana contextual de 128k tokens Micro que tiene aprox. a 100 mil palabras Puede procesar hasta . Lite y Pro 3Ventanas de contexto de 00k tokens es aproximadamente 225 mil palabras, 15 mil líneas de código o 30 minutos de metraje Coincide. Según AWS; Algunos modelos Nova llegarán a principios de 2025 Las ventanas de contexto admitirán más de 2 millones de tokens. se expandirá en consecuencia.

Los modelos en cuestión están disponibles en AWS Bedrock, la plataforma de desarrollo de inteligencia artificial de Amazon. Los usuarios pueden ajustar texto, imágenes y videos en la plataforma. Asimismo, los modelos se pueden destilar para lograr mayor velocidad y mayor eficiencia. Jassy afirma que optimizaron estos modelos para que funcionen con sistemas propietarios y API.

Nova Canvas y Nova Reel

Además, el modelo de renderizado de Amazon. Lienzo Nova Amazon y modelo de renderizado de video Carrete Amazon Nova ser modelos de creación de contenidos También anunció que fue lanzado. Según el comunicado de la empresa; Estos modelos tienen capacidades de marca de agua.

Canvas permite a los usuarios crear y editar imágenes mediante indicaciones. Sin embargo, el modelo proporciona controles para las combinaciones de colores y diseños de las imágenes generadas. Reel, por otro lado, crea videos de hasta seis segundos de duración a partir de indicaciones o imágenes de referencia. Los usuarios pueden ajustar el movimiento de la cámara usando Reel. Esto da como resultado videos con panorámica central, rotación de 360 grados y funciones de zoom. El Real se trata actualmente de en tres minutos vídeos de seis segundos puede producir.

AWS, vídeos de dos minutos de duración También anuncia que pronto estará disponible para los usuarios una versión que puede crear archivos. Amazon no se olvidó de compartir vídeos para demostrar la capacidad de Nova Reel.

Amazon planea lanzar un modelo de voz a conversación y un modelo nativo multimodal a multimodal más adelante en 2025. Amazon dice que su modelo de voz a voz puede ofrecer voces naturales y humanas. En este contexto, también debemos señalar que el modelo discurso a discurso puede interpretar señales verbales y no verbales como el tono y el tempo.

Además de estos nuevos modelos, Amazon también anunció que está construyendo un enorme clúster informático de inteligencia artificial en asociación con Anthropic, en el que invirtió 8.000 millones de dólares. Este clúster de cómputo se basa en chips Trainium 2. Además, Amazon está trabajando en una Alexa compatible con inteligencia artificial. Sin embargo, se esperaba que el asistente de voz se lanzara este otoño, pero parece que el lanzamiento se producirá el próximo año.

Nova Canvas y Nova Reel

Comparte esto: