Iniciativa de inteligencia artificial con sede en China El nuevo modelo de razonamiento de Z.Ai: GLM-4.5

Iniciativa de inteligencia artificial basada en chino Z.Ai, GLM-4.5 ha lanzado el modelo de razonamiento hoy como código abierto. La iniciativa sugiere que GLM-4.5 es más costoso que el R1 de Deepseek. Según la información compartida, el modelo puede funcionar en la tarjeta gráfica H20.

GLM-4.5 Características y proceso de entrenamiento

Con un parámetro de 355 mil millones, el GLM-4.5 atrae la atención con su R1 con un parámetro de aproximadamente 316 millones menos. Además, GLM-4.5 activa solo 32 mil millones de estos parámetros en cualquier momento para reducir el uso de hardware.

Z.AI, partículas de código de neurona artificial de GLM-4.5 Para editar algunos componentes para editar, agregó más capas. Por lo tanto, se mejoraron las habilidades de razonamiento del modelo. En el proceso de capacitación, Z.Ai desarrolló por primera vez la primera versión del modelo utilizando un conjunto de datos que contiene información sobre 15 billones de tokens. Luego, la compañía desarrolló algunos pequeños conjuntos de datos de capacitación con un total de más de 7 billones de tokens, y desarrolló las habilidades de razonamiento del GLM-4.5.

Rendimiento de los modelos GLM-4.5

De acuerdo con la información compartida por Z.Ai; GLM-4.5 ha dejado muchas alternativas populares, incluida Claude 4 Opus para varios criterios de inteligencia artificial. En estos criterios, Gok 4 y OpenAi ocuparon el tercer lugar después de O3. GLM-4.5, Navegación, AIME24 Y Swe-Bench Verificado en evaluaciones como Soneto de Claude 4, Claude 4 Opus Y Géminis 2.5 Pro Combina o los deja con modelos registrados líderes como.

Z.ai, también 106 mil millones de parámetros GLM-4.5-AIR También ha desarrollado una versión reducida del modelo. El modelo original es sobre Tres veces menos parámetro El propietario GLM-4.5-AIR, para procesar comandos Habilita 12 mil millones de parámetros.

¿Qué ofrecen GLM-4.5 y GLM-4.5-Air?

Ambos modelos tienen un modo de trabajo doble, incluido el modo de pensamiento para razonamiento complejo y uso del vehículo y no el modo de pensamiento para escenarios de respuesta instantánea. Modelos de un solo título o comando Puede crear automáticamente presentaciones de PowerPoint.

Además, los modelos, las redes sociales y la web para crear contenido de marca para la escritura creativa, la escritura de texto de conciencia emocional y las características de creación de escenarios. Según Z.AI, los modelos admiten el desarrollo del personaje virtual y los sistemas de diálogo basados en la secuencia para la atención al cliente, el juego de roles, la interacción de los fanáticos o la narración de historias de personalidad digital. Si bien ambos modelos admiten capacidades de razonamiento, codificación y agente, el AIR GLM-4.5 se destaca como una alternativa más rentable con inferencia más rápida y requisitos de recursos más bajos.

GLM-4.5 y GLM-4.5-AIR, con una licencia de código abierto para uso comercial Licencia Apache 2.0 bajo el interés de los desarrolladores. Z.ai’nin GLM-4.5 dentro del alcance de cada 1 millón de tokens de entrada por 11 centavos de planes para pagar. Este precio es 3 centavos más bajo que las tarifas de R1. Z.AI, que planea comprar 28 centavos para la ficha de una producción de un millón, viene con un precio un poco más de la tarifa solicitada por Deepseek para R1.

Con estos nuevos modelos, Z.Ai puede ser la nueva estrella en ascenso de China. Z.AI, que ha invertido $ 1.5 mil millones de inversores, incluidos Alibaba Group y Tencent, planea solicitar la oferta pública este año.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept