Plataforma de comunidad de inteligencia artificial Abrazando la cara‘de SMOLVLM-256M y SMOLVLM-500M que pueden analizar el equipo, imágenes, videos cortos y textos Modelos publicados. El equipo afirma que estos modelos son los modelos de inteligencia artificiales más pequeños.
Según el equipo, los modelos están diseñados para funcionar bien en dispositivos limitados, como computadoras portátiles con menos de 1 GB de RAM. La versión más pequeña usa 16 ejemplos en segundos, mientras que una fiesta de 64 partes usa solo 15 GB de RAM. En este sentido, podemos decir que los desarrolladores que intentan procesar una gran cantidad de datos pueden elegir los modelos SMOLVLM-256M y SMOLVLM-500M.
Ambos modelos pueden cumplir tareas, como responder las preguntas sobre PDF y elementos, además de identificar imágenes o videoclips. Cabe señalar que el texto y los gráficos escaneados dentro del alcance de los PDF también se pueden procesar.
El Equipo Face Huging usó el Cauldron y Docmatix para entrenar modelos. El caldero consta de 50 imágenes de alta calidad y grupos de datos de texto. DocMatix es un conjunto de escaneo de archivos coincidente con subtítulos detallados. Mientras tanto, vale la pena señalar que ambos fueron creados por el equipo M4 que desarrolla tecnologías de inteligencia artificial multimodal de abrazar a la cara.
El equipo dice que tanto SMOLVLM-256M como SMOLVLM-500M funcionan mejor que el modelo IDEFICS 80B, un sistema de 300 veces más grande en varias comparaciones como AI2D. Agreguemos que el criterio AI2D probó la capacidad de los modelos para analizar el nivel escolar primario de diagramas de ciencias. SMOLVLM-256M y SMOLVLM-500M se pueden descargar en la web y de abrazar la licencia Apache 2.0. En este punto, los modelos se pueden usar sin restricción.
