
La IA es la nueva frontera de la ciberseguridad
La carrera armamentística entre la seguridad del software y su explotación ha entrado en una nueva fase. En una demostración importante del poder de la IA de frontera, investigadores han utilizado el modelo “Mythos” de Anthropic para eludir algunos de los sistemas de seguridad más avanzados de Apple, descubriendo una vulnerabilidad que podría permitir a un atacante tomar el control de una Mac.
Anteriormente ya se había anunciado que el modelo más avanzado de Anthropic había sido capaz de descubrir fallas en el navegador Firefox de Mozilla y en el sistema operativo BSD.
El hallazgo se logró eludiendo protecciones de hardware
El descubrimiento fue realizado por investigadores de la firma de ciberseguridad Calif, con sede en Palo Alto. Usando una versión no liberada de Claude Mythos Preview, un modelo potente que Anthropic ha mantenido en gran parte en secreto debido a su capacidad para identificar exploits, el equipo descubrió una cadena de escalada de privilegios del kernel basada solo en datos.
El exploit se encontró en macOS 26.4.1 ejecutándose en hardware Apple M5. Lo más llamativo es que logró sortear la Memory Integrity Enforcement (MIE), una mitigación asistida por hardware basada en la extensión Memory Tagging de ARM diseñada para hacer casi imposibles los exploits de corrupción de memoria en Apple Silicon.
Al enlazar dos fallos distintos de macOS, los investigadores consiguieron corromper la memoria del sistema y obtener acceso a shells con privilegios root y a zonas protegidas del dispositivo. Aunque el ataque requiere inicialmente acceso local sin privilegios, combinado con otras técnicas podría permitir comprometer totalmente el sistema.
La colaboración humano-IA
A pesar del titular llamativo de una IA “hackeando” una Mac, los investigadores aclaran que Mythos no actuó solo. El exploit fue fruto de una colaboración humano-IA:
- Mythos aceleró la investigación e identificó distintas clases de fallos.
- Los especialistas humanos desarrollaron y validaron el exploit.
Según Thai Dong, CEO de Calif, el modelo actuó como un multiplicador de fuerza, permitiendo crear la cadena de ataque en unos cinco días tras detectar los bugs iniciales.
Project Glasswing, Mythos una IA para la defensa
Esta investigación forma parte del Project Glasswing, una iniciativa de Anthropic creada para usar modelos avanzados de forma controlada con grandes empresas tecnológicas. El objetivo es permitir que compañías como Apple encuentren y solucionen vulnerabilidades antes de que los atacantes las exploten.
Respuesta de Apple
El hallazgo se trató con urgencia. Calif entregó a Apple un informe técnico de 55 páginas en persona en Cupertino.
Apple confirmó que está revisando los hallazgos y reiteró que la seguridad es su prioridad. Además, hay indicios de que ya existe una solución en marcha porque en las notas de seguridad de macOS 26.5 mencionan un parche para una vulnerabilidad del kernel y acreditan tanto a Calif como a Anthropic por el descubrimiento.
Este caso sirve como demostración de que las mismas herramientas de IA capaces de romper las defensas más avanzadas también pueden ser fundamentales para reforzarlas.




