Modelo de lenguaje pequeño de código abierto de Microsoft Phi-4 en Hugging Face

Microsoft anunció que lanzó su modelo de lenguaje pequeño Phi-4 como código completamente abierto. Así, el modelo quedó disponible para descargar en la plataforma Hugging Face.

Phi-4 es la cuarta versión de la serie de modelos de lenguajes pequeños que Microsoft presentó en 2023. Con 14 mil millones de parámetros, el modelo supera a sus rivales más grandes en áreas como razonamiento matemático, comprensión de lenguajes multitarea y generación de códigos funcionales. Por ejemplo; Se afirmó que Google superó modelos más grandes como Gemini Pro y GPT-4o-mini con más del 80 por ciento de éxito en las desafiantes pruebas comparativas MATH y MGSM.

El modelo se basa en una arquitectura de transformador densa y únicamente decodificadora. Este enfoque proporciona una estructura más eficiente al reducir los costos computacionales. Phi-4 se entrenó con conjuntos de datos de alta calidad de datos matemáticos, de codificación y basados ​​en lógica de más de 9,8 billones de tokens. También ofrece soporte limitado para aplicaciones que no están en inglés, utilizando un 8 por ciento de contenido multilingüe.

Phi-4 estuvo disponible por primera vez bajo una licencia de investigación en la plataforma Azure AI Foundry de Microsoft en diciembre de 2024. Sin embargo, este acceso era limitado. Ahora, el modelo se ha puesto a disposición del público bajo la licencia del MIT a través de Hugging Face. Esta licencia permite que el modelo se utilice libremente en proyectos comerciales.

Compartir los pesos del modelo permite a otros investigadores y desarrolladores personalizar el modelo y adaptarlo a diferentes proyectos. Con este movimiento, Microsoft pretende apoyar la transparencia y la innovación en el campo de la inteligencia artificial.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept