La empresa de inteligencia artificial Anthropic confirmó la creación de un modelo experimental, Claude Mythos, que demostró una habilidad excepcional para identificar vulnerabilidades críticas. Debido a los riesgos potenciales, la compañía optó por restringir su uso a un entorno controlado.
La compañía de inteligencia artificial Anthropic informó sobre el desarrollo de un nuevo modelo experimental, denominado Claude Mythos, cuyas capacidades en el ámbito de la ciberseguridad han generado un amplio debate dentro de la industria tecnológica. Según la empresa, durante pruebas internas, este sistema demostró una habilidad excepcional para detectar, explotar y encadenar vulnerabilidades informáticas de alta gravedad, incluso en sistemas ampliamente auditados.
De acuerdo con el comunicado de Anthropic, el modelo logró identificar fallas críticas que habían pasado inadvertidas durante décadas, a pesar de haber sido analizadas por expertos y herramientas automatizadas. Entre los hallazgos, se menciona la detección de una vulnerabilidad de 27 años en el sistema OpenBSD, históricamente reconocido por su enfoque en la seguridad.
La empresa reconoció que, en manos equivocadas, un sistema con estas capacidades podría facilitar ciberataques contra infraestructuras críticas, como hospitales o redes eléctricas, con consecuencias potencialmente graves. En ese contexto, Anthropic decidió no liberar el modelo al público general y limitar su uso a un entorno altamente controlado.
En lugar de un lanzamiento público, Claude Mythos será utilizado de manera restringida por más de 40 empresas dentro del marco del Proyecto Glasswing, una iniciativa orientada a reforzar defensas. Entre las compañías seleccionadas figuran Amazon, Google, Apple, Nvidia, CrowdStrike y JPMorgan Chase. El objetivo es que estas organizaciones utilicen la herramienta para detectar fallos en sus propios sistemas antes de que modelos de capacidades similares estén disponibles de forma abierta.
Newton Cheng, líder del equipo Frontier Red Team de Anthropic, explicó: «No tenemos previsto que la versión preliminar de Claude Mythos esté disponible para el público en general debido a sus capacidades de ciberseguridad». La empresa aclaró que busca aprender cómo podría implementar modelos de esta clase a gran escala una vez que existan marcos de seguridad adecuados.
Este anuncio se da en medio de una creciente preocupación global por el avance acelerado de la inteligencia artificial y su impacto en diversos ámbitos, incluyendo la seguridad económica y nacional.
