Los modelos de IA 'peligrosos' están llegando pase lo que pase

A finales de la semana pasada, Anthropic desconectó sus nuevos modelos de IA Claude Fable 5 y Mythos 5 luego de una directiva de control de exportaciones del gobierno de los Estados Unidos que prohíbe a “cualquier ciudadano extranjero” utilizar los servicios. La compañía ha estado en conversaciones con la Casa Blanca desde el viernes, pero aún no ha logrado un acuerdo que le permita restablecer las ofertas.

Desde que Mythos debutó en abril, Anthropic ha afirmado (y advertido) que el modelo tiene capacidades avanzadas no sólo para encontrar vulnerabilidades de software para ayudar a los defensores a parchearlas, sino también para descubrir formas de explotarlas que podrían ser utilizadas por malos actores. La propia Anthropic notó este arma de doble filo en el lanzamiento de Mythos 5 y Claude Fable 5. “Gran parte del uso avanzado de modelos de IA es de doble uso: las mismas consultas que son beneficiosas en manos de profesionales de ciberseguridad e investigadores de biología podrían ser peligrosas si estuvieran disponibles para actores maliciosos”, escribió la compañía en una publicación de blog la semana pasada.

Con esto en mente, la compañía lanzó inicialmente una versión llamada Mythos Preview a un consorcio selecto como parte de un grupo de trabajo conocido como Proyecto Glasswing. Mythos 5 también se lanzó de forma privada a este grupo la semana pasada, mientras que Claude Fable 5, que es un modelo de grado Mythos, se lanzó al público en general con bloqueos específicos sobre su capacidad para dar respuestas a preguntas sobre biología y ciberseguridad.

Luego, a fines de la semana pasada, la administración Trump tomó medidas para restringir ambos modelos porque cree que las barreras de seguridad de Fable 5 pueden desactivarse para permitir el acceso total a las capacidades de Mythos 5, lo que supuestamente lo convierte en un riesgo para la seguridad nacional.

Los expertos dicen, sin embargo, que este choque institucional simplemente está retrasando o enmascarando una dura verdad: Anthropic puede ser la punta de lanza en este momento, pero las capacidades de IA en general y los modelos de múltiples compañías y desarrolladores de peso abierto casi seguramente tendrán capacidades similares a Mythos 5 en el futuro cercano, si es que no las tienen ya.

«Es extremadamente miope pensar que ningún otro competidor de Anthropic desarrollará capacidades similares a Mythos o incluso que no lo hayan hecho ya», dice Tarah Wheeler, directora de seguridad de la consultora especializada en ciberseguridad TPO Group. «Hay otras empresas pisándole los talones a Anthropic que probablemente también tengan las capacidades y las están manteniendo en reserva mientras ven cómo se trata a Anthropic en el entorno regulatorio actual».

La propia Anthropic ha enfatizado este punto desde el lanzamiento de Mythos Preview. «El verdadero mensaje es que no se trata del modelo o Anthropic», dijo a WIRED Logan Graham, líder del equipo rojo fronterizo de la compañía, cuando se lanzó Mythos Preview en abril. «Necesitamos prepararnos ahora para un mundo en el que estas capacidades estén ampliamente disponibles en 6, 12 o 24 meses».

OpenAI, por ejemplo, también lanzó de forma privada un modelo centrado en la ciberseguridad a mediados de abril y anunció una estrategia de ciberseguridad ampliada.

Los investigadores señalan que incluso antes de esta próxima generación de modelos, las ofertas de IA existentes podrían usarse para la búsqueda avanzada de vulnerabilidades y el desarrollo de exploits con un arnés refinado. Un gran grupo de líderes de ciberseguridad enfatizaron esto a la administración en una carta abierta el domingo, argumentando que la directiva de control de exportaciones de la Casa Blanca estaba equivocada.

«No es un modelo, es la tendencia general de la tecnología», dice Bruce Schneier, investigador de la Universidad de Harvard y de la Universidad de Toronto que ha estado analizando la situación. «Los modelos de código abierto más pequeños, más baratos, a veces por sí solos y a veces en conjunto entre sí, pueden igualar el desempeño de Mythos/Fable con indicaciones más sofisticadas. Y deberíamos esperar que otros modelos igualen la creatividad y tenacidad de Mythos/Fable en unos meses, un poco más para los modelos de código abierto».

Según los expertos, en lo que la Casa Blanca y los gobiernos de todo el mundo deben centrarse es en desarrollar democráticamente planes mucho más amplios y transparentes sobre cómo afrontarán los avances en las capacidades de la IA en materia de ciberseguridad y en otras áreas sensibles a medida que inevitablemente se produzcan.

“La cuestión política no es si una tecnología tiene riesgo”, dice Chris Wysopal, cofundador de la firma de seguridad en la nube Veracode. «La pregunta es si una restricción específica reduce significativamente ese riesgo o si principalmente ralentiza a las personas que intentan hacer que los sistemas sean más seguros».

Comparte esto: