La empresa china de investigación en inteligencia artificial DeepSeek ha presentado un modelo de «razonamiento» con características que pueden competir con el modelo O1 de OpenAI. Este modelo, denominado DeepSeek-R1, se considera un nuevo paso que llama la atención en el mundo de la inteligencia artificial. La versión preliminar del modelo publicada el miércoles destaca por su capacidad para realizar su propia validación interna, dedicando más tiempo a responder preguntas especialmente difíciles.
El desarrollador DeepSeek dijo que R1 pretende reducir los problemas a los que suelen enfrentarse los modelos de inteligencia artificial, como las respuestas erróneas o las inferencias equivocadas. El modelo realiza una serie de operaciones antes de responder a una pregunta, lo que en algunos casos puede llevar desde unos segundos hasta decenas de segundos para generar una respuesta. Esta es una característica que también se observa en el modelo O1 de OpenAI.
DeepSeek-R1 y criterios de rendimiento
DeepSeek afirma que el rendimiento de R1 está a la par con el modelo O1 de OpenAI en las pruebas AIME y MATH, ampliamente utilizadas para evaluar las capacidades de los modelos de IA. AIME permite comparar los modelos con otras IA, mientras que MATH pone a prueba el modelo con problemas matemáticos y preguntas basadas en la lógica. Sin embargo, a pesar de estos logros, el modelo muestra algunas deficiencias en problemas lógicos sencillos como el tres en raya.
Además, el DeepSeek-R1 ha sido criticado por su seguridad y sus límites éticos. Algunos usuarios sugieren que el modelo puede ser fácilmente «jailbroken», lo que significa que puede eludir las salvaguardas y proporcionar respuestas no deseadas o poco éticas. Por ejemplo, un usuario pudo obtener del modelo instrucciones detalladas para la producción de sustancias químicas ilegales.
Se observó que DeepSeek-R1 se negaba a responder preguntas sobre algunos temas políticos. Por ejemplo, las preguntas sobre Xi Jinping, la plaza de Tiananmen o una posible invasión china de Taiwán fueron bloqueadas por el modelo. Esto demuestra que el modelo se desarrolló específicamente en función de las sensibilidades políticas de China.
Los modelos de razonamiento como DeepSeek-R1 se consideran un paso importante en el desarrollo de la tecnología de inteligencia artificial. Estos modelos no sólo pueden procesar datos, sino que también pueden utilizarse para tareas más complejas, como la planificación y la previsión. Sin embargo, aclarar los límites éticos de estas tecnologías y mejorar las medidas de seguridad es un requisito fundamental para una adopción más amplia.
Aunque DeepSeek-R1 es una iniciativa innovadora que puede aumentar la competencia en el mundo de la inteligencia artificial, es un modelo que debe vigilarse cuidadosamente debido a sus limitaciones actuales y a sus riesgos potenciales. Estos rápidos avances en el campo de la inteligencia artificial ofrecen una importante oportunidad para lograr un ecosistema tecnológico más fiable y completo.
