OPERAI O1 OPOPONENTE BAJO DE CONSEJO Modelo de razonamiento abierto: S1

Los investigadores de inteligencia artificial en la Universidad de Stanford y Washington aparecen con un modelo de razonamiento de bajo costo. Investigadores, Este modelo llamado S1 Pudo entrenar a un costo de menos de $ 50 en préstamos comerciales de nubes.

En matemáticas y criterios de codificación, S1 se desempeña similar a los principales modelos de razonamiento como Openi’s O1 y Deepseek’s R1. Si recuerda, Openai afirmó que el método de destilación de Deepseek ha creado modelos avanzados de inteligencia artificial a bajos costos. Los investigadores dicen que usan el método de destilación en el artículo de S1.

Según los investigadores, S1 se destiló de Gemini 2.0 Flash Thinking Experimental, uno de los modelos de razonamiento de Google. Sin embargo, de acuerdo con la información contenida en el artículo del S1, puede destilarse mediante un conjunto de datos relativamente pequeño de modelos de razonamiento utilizando el ajuste fino controlado (SFT).

Según la información compartida, S1 se basa en un modelo de inteligencia artificial pequeño y listo para usar, que puede descargar de forma gratuita por el Laboratorio de Inteligencia Artificial propiedad de Alibaba. Los investigadores discutieron el proceso de pensamiento detrás de cada respuesta del programa experimental Gemini 2.0 Flash Thinking de Google para educar a S1. Además, creó un conjunto de datos que consiste en mil preguntas emparejadas con las respuestas dadas a estas preguntas.

Usando 16 GPU H100 NVIDIA, S1 logró un rendimiento fuerte en comparaciones de comparación después del entrenamiento S1 que duró menos de 30 minutos. Según el investigador de Stanford, Niklas Manennight, el procesador se puede alquilar por $ 20. Al modelo S1, datos de capacitación y código Es posible acceder desde Github.

Comparte esto: