Inteligencia Artificial

Claude Mythos: El Modelo que Anthropic Construyó y Se Negó a Lanzar - Dentro de Project Glasswing

|
18 de abril de 2026
|
9 min de lectura
Claude Mythos: El Modelo que Anthropic Construyó y Se Negó a Lanzar - Dentro de Project Glasswing - Featured Image

Get weekly AI tool reviews

We test tools so you don't have to. No spam.

Anthropic anunció el modelo más capaz que jamás ha construido y se negó a lanzarlo. Claude Mythos Preview puede encontrar y explotar vulnerabilidades de software de forma autónoma a un nivel que Anthropic dice rivaliza con investigadores de seguridad humanos expertos. Ya ha destapado miles de zero-days de alta severidad en los principales sistemas operativos y navegadores, incluyendo fallos que habían sobrevivido 27 años en OpenBSD. En lugar de un lanzamiento público, Anthropic dio acceso controlado a 52 organizaciones seleccionadas a través de Project Glasswing, se comprometió con 100 millones de dólares en créditos de uso, y publicó Claude Opus 4.7 como el modelo de cara al público. La Fed y el Tesoro ya están informando a los CEOs de los principales bancos estadounidenses. La evaluación independiente del UK AI Safety Institute confirma que las capacidades son reales.

Claude Mythos y Project Glasswing - Lo Confirmado
Updated Abril 2026
  • Anthropic lo llama 'el mayor riesgo de alineamiento de cualquier modelo que hayamos lanzado hasta la fecha.'
  • Primer modelo de IA en superar los desafíos capture-the-flag de nivel experto del UK AISI con un 73% - ningún modelo anterior había pasado del 50%.
  • Primer modelo de IA en completar la simulación de ataque de 32 pasos contra red empresarial del UK AISI de principio a fin.
  • Encontró miles de zero-days de alta severidad incluyendo vulnerabilidades en OpenBSD (27 años), FFmpeg (16 años) y el kernel de Linux.
  • Project Glasswing se lanzó con 12 socios nombrados: AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, JPMorgan Chase, Broadcom, Palo Alto Networks, la Linux Foundation y Anthropic. Otras 40+ organizaciones tienen acceso.
  • Anthropic comprometió 100 millones de dólares en créditos de uso para Glasswing, más 4 millones a seguridad open-source (2.5M a Alpha-Omega/OpenSSF, 1.5M a la Apache Software Foundation).
  • El presidente de la Fed Jerome Powell y el Secretario del Tesoro Scott Bessent informaron a los CEOs de bancos estadounidenses sobre los riesgos cibernéticos de Mythos la misma semana.
  • Claude Opus 4.7 es el sustituto público. Anthropic ha admitido que está por detrás de Mythos en todos los benchmarks principales.

La mayoría de las semanas en IA, la historia es qué modelo salió. Esta semana es lo opuesto: un modelo que Anthropic terminó, evaluó y luego decidió que el público no podía tener.

Anthropic anunció Claude Mythos Preview. Poco después, publicó Claude Opus 4.7 como el modelo público. La brecha entre esos dos modelos es la historia de IA más interesante del año, y casi nadie la está contando correctamente.

organizaciones con acceso
52
12 iniciales + 40 más
créditos de uso
$100M
financiados por Anthropic
CTF experto AISI
73%
primer modelo en superarlo
zero-day más antiguo
27 años
encontrado en OpenBSD

Qué Es Claude Mythos Realmente

Mythos es un modelo que Anthropic terminó y luego retiró del flujo de lanzamiento público. Supera a Claude Opus 4.7, GPT-5.4 y Gemini 3.1 Pro en todos los benchmarks de ciberseguridad y programación avanzada que la empresa ha publicado.

La afirmación clave de capacidad, en palabras de la propia Anthropic en la página de Project Glasswing:

La razón declarada por Anthropic

"Los modelos de IA han alcanzado un nivel de capacidad de programación donde pueden superar a todos excepto a los humanos más expertos en encontrar y explotar vulnerabilidades de software."

Esto no es lenguaje de marketing. La documentación técnica de Mythos dice, sin rodeos, que un lanzamiento amplio "le daría a los atacantes una cornucopia de zero-days para prácticamente todo el software de la Tierra, incluyendo los principales sistemas operativos y navegadores."

Los hallazgos concretos lo respaldan. Mythos ya ha descubierto de forma autónoma miles de vulnerabilidades de alta severidad en software en producción, incluyendo fallos que habían sobrevivido más de 40 años combinados en OpenBSD, FFmpeg y el kernel de Linux.

Por Qué Anthropic Lo Retuvo

La mayoría de la cobertura se equivoca en esta parte. El encuadre habitual, "Anthropic construyó algo demasiado peligroso para lanzar," no es del todo correcto. La versión más precisa es que Anthropic cree que el equilibrio ofensivo-defensivo se inclina mal si todos consiguen Mythos a la vez.

El razonamiento es así. Si una empresa de ciberseguridad con Mythos puede encontrar una vulnerabilidad en tres horas, también puede hacerlo un atacante con Mythos. El defensor luego tiene que parchearla antes de que el atacante la use. Dale la herramienta a ambos lados al mismo tiempo y gana el atacante, porque las cadenas de suministro son lentas y los ciclos de parcheo tardan semanas.

Así que la apuesta de Anthropic es dejar correr primero a los defensores. Dar a la Linux Foundation, la Apache Software Foundation, AWS, Apple, Microsoft, Google y los principales proveedores de seguridad 90 días de ventaja. Que encuentren y parcheen las peores vulnerabilidades mientras el modelo no puede ser alquilado por cualquiera con una tarjeta de crédito. Después, quizás, ampliar el acceso.

Qué es realmente Opus 4.7

La coincidencia temporal del lanzamiento de Opus 4.7 no es casualidad. Anthropic necesitaba un modelo público que fuera muy bueno pero medible inferior a Mythos en tareas cibernéticas ofensivas. La propia Anthropic ha admitido que Opus 4.7 está por detrás de Mythos en los benchmarks avanzados de programación y ciberseguridad. Esa brecha es el producto, no un efecto secundario.

Dónde Mythos Saca Ventaja

Anthropic no ha publicado una hoja de benchmarks comparativa completa junto con Mythos. Lo que ha revelado, combinado con la evaluación independiente del UK AISI, apunta en la misma dirección: Mythos está por encima de todos los modelos en producción en tareas cibernéticas ofensivas.

El dato público más claro viene del AISI. Mythos se convirtió en el primer modelo de IA en superar los desafíos capture-the-flag de nivel experto con una tasa de éxito del 73%. Ningún modelo anterior había pasado del 50% en ese nivel. También es el primer modelo en completar la simulación de ataque de 32 pasos contra red empresarial del AISI de principio a fin, que a un red-teamer humano experto le toma aproximadamente 20 horas.

Anthropic ha reconocido por separado que Claude Opus 4.7, su modelo público, está por detrás de Mythos en los benchmarks avanzados de programación y ciberseguridad. La diferencia exacta no es pública. Lo que sí es público es la decisión que Anthropic tomó basándose en ella: los socios que necesitan parchear vulnerabilidades reciben Mythos; al resto nos dan Opus 4.7.

Esa brecha es también la razón completa por la que existe Project Glasswing.

Dentro de Project Glasswing

¿Necesitas ayuda para implementar esto?

Más de 50 implementaciones · 60% más rápido · 2-4 semanas

Glasswing está estructurado como una ventana de 90 días con prioridad defensiva. Anthropic publicó la lista completa de socios y se comprometió a publicar hallazgos dentro de los 90 días desde el lanzamiento.

Los 12 socios de lanzamiento:

Socios de lanzamiento - qué aporta cada uno

SocioRol
AnthropicAloja Mythos, financia los créditos de uso, revisa hallazgos
AWSEscanea sus propios servicios; integración con Bedrock para miembros empresariales de Glasswing
AppleEscanea iOS, macOS, Safari y servicios propios
GoogleEscanea Android, Chrome, Gmail, Google Cloud
MicrosoftEscanea Windows, Azure, Office, Edge
NVIDIAEscanea el stack de drivers, CUDA, firmware de GPU
CiscoEscanea infraestructura de red y stack de enrutamiento empresarial
CrowdStrikeIntegración de inteligencia de amenazas y despliegue defensivo
Palo Alto NetworksEscaneos de productos de firewall y seguridad de red
JPMorgan ChaseRed team de servicios financieros, el primer banco grande en el programa
BroadcomVMware, Symantec, y superficies de hardware/firmware
Linux FoundationKernel open-source, OpenSSF y proyectos Alpha-Omega

Otras 40 organizaciones tienen acceso sin ser nombradas públicamente. Anthropic las describe únicamente como entidades que "construyen o mantienen software crítico."

La estructura financiera importa. Anthropic está pagando los créditos de uso ella misma, 100 millones de dólares comprometidos, en lugar de cobrar a los miembros de Glasswing. Es un cambio notable frente a cómo cualquier otro laboratorio de IA frontier maneja el acceso a capacidades altas. Además, Anthropic donó 4 millones de dólares en efectivo: 2.5 millones a Alpha-Omega y OpenSSF a través de la Linux Foundation, y 1.5 millones a la Apache Software Foundation. Ambas son organizaciones que mantienen silenciosamente el stack de software open-source sobre el que corre la mayor parte de internet.

La apuesta de Glasswing en una frase

Anthropic está gastando 100 millones de dólares para que 52 organizaciones encuentren y arreglen vulnerabilidades en el software crítico del mundo antes de vender la misma capacidad a quien quiera comprarla.

Lo Que Encontró el UK AI Safety Institute

El UK AI Safety Institute realizó evaluaciones independientes sobre Mythos Preview y publicó sus hallazgos. Dos resultados importan.

En los desafíos capture-the-flag de nivel experto, Mythos superó el 73% de los problemas más difíciles que el AISI pudo lanzarle. Ningún modelo había pasado del 50% en ese nivel antes. Opus 4.6, el estado del arte anterior, estaba con una tasa de éxito sustancialmente menor.

En la simulación de red corporativa "Last Ones" (TLO), Mythos hizo algo que ningún modelo había hecho antes. TLO es un ataque de 32 pasos contra una red empresarial sintética. A un red-teamer humano experto le toma alrededor de 20 horas completarlo. Mythos terminó la cadena completa en 3 de 10 intentos y promedió 22 de 32 pasos. Opus 4.6 promedió 16.

La advertencia del AISI importa aquí:

La advertencia del AISI

Los entornos de prueba "carecen de defensores activos y herramientas defensivas." El AISI "no puede afirmar con certeza si Mythos Preview podría atacar sistemas bien defendidos." La evaluación del instituto es que Mythos es "capaz de atacar de forma autónoma sistemas empresariales pequeños, poco defendidos y vulnerables." Lo cual, siendo francos, cubre la mayoría de redes de pequeñas empresas, la mayoría de sistemas informáticos de gobiernos locales y una proporción preocupante de proveedores sanitarios.

Por Qué la Fed y el Tesoro Informan a los Bancos Estadounidenses

El presidente de la Reserva Federal Jerome Powell y el Secretario del Tesoro Scott Bessent reunieron a los CEOs de los principales bancos estadounidenses alrededor del momento en que se anunció Mythos, según CNBC y Bloomberg. El tema fue Mythos específicamente, no la IA en general.

La preocupación no es que Mythos en sí se filtre. Los controles de acceso de Anthropic para Glasswing parecen genuinamente estrictos. La preocupación es por lo que viene después. Si Mythos es la mejor IA ciberofensiva ahora mismo, el segundo mejor probablemente esté a meses de distancia, no a años. Los modelos open-weight de laboratorios fuera del marco de Responsible Scaling Policy alcanzarán. Los reguladores financieros de EE.UU. están preguntando si los bancos están listos para ataques que corran con capacidad a nivel Mythos sin la capa de seguridad de Anthropic.

La respuesta, a juzgar por la disposición de la Fed a convocar una reunión de emergencia, es "todavía no." Bloomberg informa que la administración está urgiendo a los principales bancos de Wall Street a hacer red-team voluntariamente de su propia infraestructura contra Mythos a través de Glasswing antes de que algún adversario traiga una capacidad equivalente online.

El Precedente Que Esto Crea

Esta es la primera vez que un laboratorio de IA frontier termina un modelo, lo evalúa al estado del arte y se niega a lanzarlo por los canales comerciales normales por iniciativa propia. OpenAI ha retrasado lanzamientos por revisión de seguridad. Google ha limitado capacidades específicas. Ningún laboratorio había dicho antes en público: "construimos algo, creemos que es el mejor modelo que hemos entrenado, y ninguna cantidad de andamiaje de seguridad es suficiente para dejar que el público lo use."

Dos cosas se siguen de esto.

Primero, la Responsible Scaling Policy ya es estructural. El marco RSP de Anthropic clasifica modelos en Niveles de Seguridad de IA (ASL) y fue diseñado exactamente para este escenario. Si Mythos cruza formalmente el umbral ASL-3 está, en realidad, en disputa. Algunos investigadores de alineamiento argumentan que no, y Anthropic lo retuvo igualmente. De cualquier manera, la decisión sienta el precedente de que un laboratorio puede ir más allá de sus umbrales publicados si considera que la situación lo justifica. Esa flexibilidad corta en ambas direcciones.

Segundo, el debate público-versus-acceso-controlado ya no es teórico. Cualquiera que quiera capacidad ciberofensiva frontier ahora tiene prueba concreta de que la capacidad existe y que Anthropic no se la venderá. Eso cambia el cálculo para todos los demás laboratorios. El GPT-5.4-Cyber de OpenAI se movió en una dirección similar con verificación de usuarios obligatoria. Esperen más de esto, no menos.

La pregunta abierta, y nadie tiene una buena respuesta todavía: ¿qué pasa cuando el próximo laboratorio que construya un modelo cibernético a nivel Mythos no esté basado en un país que aplique Responsible Scaling Policies?

Preguntas Frecuentes

¿Cuál es la diferencia entre Claude Mythos y Claude Opus 4.7?

Opus 4.7 es el modelo público actual de Anthropic. Cualquiera puede usarlo a través de la API, Claude.ai, Amazon Bedrock, Google Vertex o Microsoft Foundry. Mythos no está disponible públicamente. Puntúa significativamente más alto en todos los benchmarks avanzados de programación y ciberseguridad. Mythos solo está disponible para unas 52 organizaciones seleccionadas a través de Project Glasswing.

¿Puede mi empresa conseguir acceso a Project Glasswing?

Probablemente no, a menos que ya construyas o mantengas software crítico. Anthropic no ha publicado criterios de solicitud, pero los 40+ miembros adicionales (sin nombre) de Glasswing se concentran, según se informa, entre los principales mantenedores de open-source, operadores de infraestructura crítica e instituciones financieras. Los clientes empresariales en AWS, Azure y GCP tienen vías de acceso a través de esas alianzas cloud.

¿"Mythos" es el nombre final o un nombre en clave?

Anthropic lo llama "Claude Mythos Preview" en sus comunicaciones oficiales, lo que sugiere que un sucesor bajo el nombre Mythos puede llegar más adelante. La etiqueta "Preview" es significativa: señala una estrategia pública inconclusa, no un archivado permanente.

¿Se lanzará Claude Mythos públicamente alguna vez?

Anthropic no se ha comprometido con un lanzamiento público. La ventana de Glasswing es de 90 días inicialmente, con un reporte de hallazgos publicados al final. Un lanzamiento más amplio depende de lo que revele esa ventana, específicamente si el atraso de parcheos de los zero-days que Mythos está encontrando puede ser procesado más rápido de lo que los adversarios pueden construir modelos equivalentes.

¿Cómo se compara esto con el GPT-5.4-Cyber de OpenAI?

GPT-5.4-Cyber tiene verificación de usuarios obligatoria para profesionales de defensa y ciberseguridad. Está restringido pero comercialmente disponible: los clientes que pasen la verificación pueden alquilarlo. Mythos no es alquilable en absoluto. El acceso es por invitación, no por transacción. Mythos también es materialmente más capaz en los benchmarks de ciberseguridad.

¿Qué debería hacer como organización que no está en Glasswing?

Tres cosas. Primero, asumir que capacidad ofensiva a nivel Mythos estará disponible comercial o ilícitamente dentro de 12 meses, y ajustar tu postura de seguridad en consecuencia. Segundo, si operas software crítico, prioriza la reducción de superficie expuesta y el hardening de la cadena de suministro ahora; esas son las defensas que funcionan independientemente de la capacidad del atacante. Tercero, vigila el reporte público de Glasswing a 90 días de Anthropic. Los patrones de parcheo que revele señalarán dónde quedan las superficies blandas restantes.

Stay ahead of the AI curve

We test new AI tools every week and share honest results. Join our newsletter.