OpenAi, modelos de idiomas con peso abierto Gpt -oos -20b Y Gpt-oos-20bintroducido. Estos dos modelos, a los que se puede acceder bajo la licencia Apache 2.0, ofrecen resultados notables en términos de rendimiento de razonamiento y eficiencia de hardware. Openai publica estos modelos para desarrolladores, instituciones e investigadores que desean obtener una producción sólida con bajo costo.
El enfoque de mezcla de expertos (MOE) se prefiere en ambos modelos basados en transformador. De esta manera, para cada entrada dada al modelo, se reduce el número de parámetros activos y se aumenta la productividad.
- GPT-OOS-120B: un total de 117 mil millones de parámetros, 5.1 mil millones de parámetros activos para cada token
- GPT-OOS-20B: un total de 21 mil millones de parámetros, 3.600 millones de parámetros activos para cada token
Ambos modelos admiten la longitud de contexto de hasta 128 mil token. Además, la codificación de posición de la cuerda (incrustación posicional rotativa), la atención múltiple y las técnicas de atención de escasez, como la memoria y la eficiencia del cálculo, se han aumentado.
Compatibilidad de hardware
Gpt -oos -20b, Una GPU con 80 GB de memoria puede trabajar. Si gpt-oos-20b Necesita solo 16 GB de memoria Y adecuado para usar dispositivos en el borde. Los modelos se pueden descargar en formato MXFP4 a través de la cara de Huging, pre -Cuantizada. Para Pytorch y Apple Metal, también se publican códigos de ejecución de muestras.
Razonamiento alto y rendimiento de uso del vehículo
Los modelos se comparan con los modelos O3, O3-Mini y O4-Mini de OpenAI; CodeForces, Información general académica (MMLU, HLE), Matemáticas (AIME 2024–2025), Banco de Salud, llamadas de vehículos y uso de funciones (Taubench) recibió puntajes muy altos. En particular, el modelo GPT-OOS -20B funciona cerca de O4-Mini o mejor. El modelo más pequeño de 20B logra tomar O3-Mini en muchas pruebas.
Cot (cadena de pensamiento) y seguimiento de pensamientos desatendidos
Las capacidades de pensamiento en cadena de los modelos (COT) se desarrollaron especialmente sin control. Este enfoque hace que el posible abuso del modelo, las respuestas engañosas o los procesos de razonamiento defectuosos. Operai sugiere que los desarrolladores no muestran estas cadenas de pensamiento al usuario final.
Las pruebas se realizaron contra escenarios de abuso
Operai ha tomado medidas especiales en varias etapas para la seguridad de los modelos. Durante el entrenamiento preliminar, se filtraron el contenido de químicos, biológicos, radiológicos y nucleares (CBRN). Más tarde, durante el proceso de educación, el modelo fue resistente a las demandas dañinas. Además, se probaron escenarios de que un atacante malicioso podría abusar del modelo. En estas pruebas, las versiones especiales y no rejunidas fueron capacitadas para campos como la biología y la seguridad cibernética. Los resultados mostraron que las habilidades de estos modelos eran limitadas. Este proceso también fue auditado por expertos independientes externas. OpenAi para promover la investigación de seguridad, total Una competencia de equipo rojo con un grupo de premios de $ 500 mil También comenzó.
Opciones de accesibilidad y distribución
Para desarrolladores que desean ejecutar modelos en dispositivos locales; Abrazando la cara, Azure, AWS, Databricks, Vercel, Cloudflare La distribución es compatible con plataformas como. En el lado del hardware Nvidia, AMD, Cerebras, Groq Estudios de optimización. Microsoft trae las versiones optimizadas del GPT-OOSS-20B con el tiempo de ejecución de ONNX a los dispositivos Windows. Se puede acceder a VS Code y Foundry Local.
