Künstliche Intelligenz

Claude Mythos: Das Modell, das Anthropic gebaut und nicht veröffentlicht hat - Einblick in Project Glasswing

|
18. April 2026
|
9 Min. Lesezeit
Claude Mythos: Das Modell, das Anthropic gebaut und nicht veröffentlicht hat - Einblick in Project Glasswing - Featured Image

Get weekly AI tool reviews

We test tools so you don't have to. No spam.

Anthropic hat das leistungsfähigste Modell angekündigt, das sie jemals gebaut haben, und sich geweigert, es zu veröffentlichen. Claude Mythos Preview kann Software-Schwachstellen autonom auf einem Niveau finden und ausnutzen, das laut Anthropic mit erfahrenen menschlichen Sicherheitsforschern konkurriert. Es hat bereits tausende hochschwerwiegender Zero-Days in jedem großen Betriebssystem und Browser aufgedeckt, darunter Lücken, die 27 Jahre in OpenBSD überlebt hatten. Statt einer öffentlichen Veröffentlichung gab Anthropic 52 ausgewählten Organisationen kontrollierten Zugang über Project Glasswing, sagte 100 Millionen Dollar an Nutzungsguthaben zu und brachte Claude Opus 4.7 als öffentliches Modell heraus. Die Fed und das Finanzministerium briefen nun die CEOs der großen US-Banken. Die unabhängige Evaluation des UK AI Safety Institute bestätigt, dass die Fähigkeiten real sind.

Claude Mythos und Project Glasswing - Was Bestätigt Ist
Updated April 2026
  • Anthropic nennt es 'das größte ausrichtungsbezogene Risiko aller Modelle, die wir bisher veröffentlicht haben.'
  • Erstes KI-Modell, das die Expert-Level Capture-the-Flag-Herausforderungen des UK AISI mit 73% bestand - kein früheres Modell hatte 50% überschritten.
  • Erstes KI-Modell, das die 32-Schritte-Angriffssimulation des UK AISI gegen ein Unternehmensnetzwerk von Anfang bis Ende abschloss.
  • Fand tausende hochschwerwiegender Zero-Days, darunter Schwachstellen in OpenBSD (27 Jahre alt), FFmpeg (16 Jahre alt) und dem Linux-Kernel.
  • Project Glasswing startete mit 12 benannten Partnern: AWS, Apple, Google, Microsoft, NVIDIA, Cisco, CrowdStrike, JPMorgan Chase, Broadcom, Palo Alto Networks, die Linux Foundation und Anthropic. Weitere 40+ Organisationen haben Zugang.
  • Anthropic hat 100 Millionen Dollar an Nutzungsguthaben für Glasswing zugesagt, plus 4 Millionen für Open-Source-Sicherheit (2,5 Mio. an Alpha-Omega/OpenSSF, 1,5 Mio. an die Apache Software Foundation).
  • Fed-Chef Jerome Powell und Finanzminister Scott Bessent briefen die CEOs der US-Banken zu Mythos-Cyber-Risiken in derselben Woche.
  • Claude Opus 4.7 ist der öffentliche Ersatz. Anthropic hat eingeräumt, dass es Mythos bei allen großen Benchmarks unterlegen ist.

In den meisten Wochen der KI-Welt ist die Story, welches Modell gerade erschienen ist. Diese ist das Gegenteil: ein Modell, das Anthropic fertig gebaut, getestet und dann entschieden hat, dass die Öffentlichkeit es nicht haben kann.

Anthropic kündigte Claude Mythos Preview an. Nicht lange danach veröffentlichte das Unternehmen Claude Opus 4.7 als öffentliches Flaggschiff. Die Lücke zwischen diesen beiden Modellen ist die interessanteste KI-Geschichte dieses Jahres, und fast niemand erzählt sie richtig.

Organisationen mit Zugang
52
12 Launch + 40 weitere
Nutzungsguthaben
100 Mio. $
von Anthropic finanziert
AISI Expert-CTF
73%
erstes Modell, das bestand
ältester Zero-Day
27 Jahre
in OpenBSD gefunden

Was Claude Mythos Tatsächlich Ist

Mythos ist ein Modell, das Anthropic fertiggestellt und dann aus der öffentlichen Veröffentlichungspipeline gezogen hat. Es übertrifft Claude Opus 4.7, GPT-5.4 und Gemini 3.1 Pro in allen Cybersicherheits- und fortgeschrittenen Coding-Benchmarks, die das Unternehmen veröffentlicht hat.

Die entscheidende Fähigkeitsaussage, in Anthropics eigenen Worten auf der Project-Glasswing-Seite:

Anthropics erklärter Grund

"KI-Modelle haben ein Niveau an Coding-Fähigkeit erreicht, auf dem sie alle bis auf die erfahrensten Menschen beim Finden und Ausnutzen von Software-Schwachstellen übertreffen können."

Das ist keine Marketing-Sprache. Anthropics technische Dokumentation zu Mythos sagt nüchtern, dass eine breite Veröffentlichung "Angreifern ein Füllhorn an Zero-Day-Exploits für praktisch jede Software auf der Erde geben würde, einschließlich aller großen Betriebssysteme und Browser."

Die konkreten Funde stützen das. Mythos hat bereits autonom tausende hochschwerwiegender Schwachstellen in Produktionssoftware entdeckt, darunter Lücken, die zusammen über 40 Jahre in OpenBSD, FFmpeg und dem Linux-Kernel überlebt hatten.

Warum Anthropic Es Zurückhielt

Die meiste Berichterstattung hat diesen Teil falsch. Der übliche Rahmen, "Anthropic hat etwas gebaut, das zu gefährlich für eine Veröffentlichung ist", ist nicht ganz richtig. Die präzisere Version lautet: Anthropic glaubt, dass das Gleichgewicht zwischen Offensive und Defensive in die falsche Richtung kippt, wenn alle Mythos gleichzeitig bekommen.

Die Überlegung geht so. Wenn eine Cybersicherheitsfirma mit Mythos eine Schwachstelle in drei Stunden finden kann, kann ein Angreifer mit Mythos das auch. Der Verteidiger muss sie dann patchen, bevor der Angreifer sie nutzt. Gibt man beiden Seiten das Werkzeug gleichzeitig, gewinnt der Angreifer, weil Lieferketten langsam sind und Patch-Zyklen Wochen dauern.

Anthropics Wette ist daher, die Verteidiger zuerst laufen zu lassen. Der Linux Foundation, der Apache Software Foundation, AWS, Apple, Microsoft, Google und den großen Sicherheitsanbietern einen 90-Tage-Vorsprung zu geben. Sie sollen die schlimmsten Schwachstellen finden und patchen, während das Modell von niemandem mit einer Kreditkarte gemietet werden kann. Danach, vielleicht, den Zugang ausweiten.

Was Opus 4.7 wirklich ist

Das Timing der Opus-4.7-Veröffentlichung ist kein Zufall. Anthropic brauchte ein öffentliches Flaggschiff, das sehr gut, aber messbar schwächer als Mythos bei offensiven Cyber-Aufgaben ist. Anthropic selbst hat eingeräumt, dass Opus 4.7 Mythos bei fortgeschrittenen Coding- und Cybersicherheits-Benchmarks unterlegen ist. Diese Lücke ist das Produkt, kein Nebeneffekt.

Wo Mythos Vorne Liegt

Anthropic hat zusammen mit Mythos keine vollständige Vergleichstabelle veröffentlicht. Was offengelegt wurde, kombiniert mit der unabhängigen Evaluation des UK AISI, zeigt in dieselbe Richtung: Mythos steht über jedem veröffentlichten Modell bei offensiven Cyber-Aufgaben.

Der klarste öffentliche Datenpunkt kommt vom AISI. Mythos wurde das erste KI-Modell, das die Expert-Level Capture-the-Flag-Herausforderungen mit einer Erfolgsrate von 73% bestand. Kein früheres Modell hatte auf diesem Niveau 50% überschritten. Es ist auch das erste Modell, das die 32-Schritte-Angriffssimulation des AISI gegen ein Unternehmensnetzwerk von Anfang bis Ende abschloss, was einen erfahrenen menschlichen Red-Teamer etwa 20 Stunden kostet.

Anthropic hat separat eingeräumt, dass Claude Opus 4.7, sein öffentliches Flaggschiff, Mythos bei fortgeschrittenen Coding- und Cybersicherheits-Benchmarks unterlegen ist. Der genaue Abstand ist nicht öffentlich. Was öffentlich ist, ist die Entscheidung, die Anthropic auf dieser Basis traf: Die Partner, die Schwachstellen patchen müssen, bekommen Mythos; der Rest von uns bekommt Opus 4.7.

Diese Lücke ist auch der einzige Grund, warum Project Glasswing überhaupt existiert.

Einblick in Project Glasswing

Brauchen Sie Hilfe bei der Umsetzung?

Über 50 Umsetzungen · 60 % schneller · 2–4 Wochen

Glasswing ist als 90-Tage-Fenster mit Defensiv-Vorrang strukturiert. Anthropic veröffentlichte die vollständige Partnerliste und verpflichtete sich, Ergebnisse innerhalb von 90 Tagen nach Start zu veröffentlichen.

Die 12 Launch-Partner:

Launch-Partner - was jeder beisteuert

PartnerRolle
AnthropicHostet Mythos, finanziert Nutzungsguthaben, prüft Funde
AWSScannt eigene Services; Bedrock-Integration für Enterprise-Glasswing-Mitglieder
AppleScannt iOS, macOS, Safari und Erstanbieter-Services
GoogleScannt Android, Chrome, Gmail, Google Cloud
MicrosoftScannt Windows, Azure, Office, Edge
NVIDIAScannt Treiber-Stack, CUDA, GPU-Firmware
CiscoScannt Netzwerkinfrastruktur und Enterprise-Routing-Stack
CrowdStrikeThreat-Intelligence-Integration und defensive Bereitstellung
Palo Alto NetworksScans von Firewall- und Netzwerksicherheits-Produkten
JPMorgan ChaseFinancial-Services-Red-Team, erste Großbank im Programm
BroadcomVMware, Symantec und Hardware-/Firmware-Flächen
Linux FoundationOpen-Source-Kernel, OpenSSF und Alpha-Omega-Projekte

Weitere 40 Organisationen haben Zugang, ohne öffentlich genannt zu werden. Anthropic beschreibt sie nur als Einheiten, die "kritische Software bauen oder warten."

Die Finanzstruktur zählt. Anthropic zahlt die Nutzungsguthaben selbst, 100 Millionen Dollar zugesagt, statt Glasswing-Mitgliedern Gebühren zu berechnen. Das ist ein bemerkenswerter Bruch damit, wie jedes andere Frontier-KI-Labor Zugang zu hohen Fähigkeiten handhabt. Obendrein spendete Anthropic 4 Millionen Dollar in bar: 2,5 Millionen an Alpha-Omega und OpenSSF über die Linux Foundation, und 1,5 Millionen an die Apache Software Foundation. Beides sind Organisationen, die leise den Open-Source-Software-Stack warten, auf dem das meiste des Internets läuft.

Die Glasswing-Wette in einem Satz

Anthropic gibt 100 Millionen Dollar aus, damit 52 Organisationen Schwachstellen in der kritischen Software der Welt finden und beheben, bevor es dieselbe Fähigkeit an jeden verkauft, der sie kaufen will.

Was Das UK AI Safety Institute Fand

Das UK AI Safety Institute führte unabhängige Evaluationen an Mythos Preview durch und veröffentlichte seine Ergebnisse. Zwei Resultate zählen.

Bei den Expert-Level Capture-the-Flag-Herausforderungen bestand Mythos 73% der schwierigsten Probleme, die das AISI ihm vorlegen konnte. Kein Modell hatte auf diesem Niveau zuvor 50% geknackt. Opus 4.6, der bisherige Stand der Technik, lag bei einer deutlich niedrigeren Erfolgsrate.

Bei der Unternehmensnetzwerk-Simulation "Last Ones" (TLO) tat Mythos etwas, das kein Modell zuvor getan hatte. TLO ist ein 32-Schritte-Angriff gegen ein synthetisches Unternehmensnetzwerk. Ein erfahrener menschlicher Red-Teamer braucht dafür etwa 20 Stunden. Mythos beendete die vollständige Kette in 3 von 10 Durchläufen und schaffte durchschnittlich 22 von 32 Schritten. Opus 4.6 schaffte im Schnitt 16.

Der Vorbehalt des AISI zählt hier:

Der Vorbehalt des AISI

Testumgebungen "haben keine aktiven Verteidiger und defensive Tools." Das AISI "kann nicht sicher sagen, ob Mythos Preview gut verteidigte Systeme angreifen könnte." Die Bewertung des Instituts lautet, dass Mythos "in der Lage ist, kleine, schwach verteidigte und verwundbare Unternehmenssysteme autonom anzugreifen." Was, offen gesagt, die meisten Netzwerke kleiner Unternehmen, die meisten IT-Systeme lokaler Behörden und einen beunruhigenden Anteil von Gesundheitsdienstleistern abdeckt.

Warum Die Fed Und Das Finanzministerium US-Banken Briefen

Fed-Chef Jerome Powell und Finanzminister Scott Bessent versammelten die CEOs der großen US-Banken etwa zu der Zeit, als Mythos angekündigt wurde, laut CNBC und Bloomberg. Das Thema war Mythos konkret, nicht KI im Allgemeinen.

Die Sorge ist nicht, dass Mythos selbst leckt. Anthropics Zugangskontrollen für Glasswing wirken wirklich eng. Die Sorge gilt dem, was als Nächstes kommt. Wenn Mythos derzeit die beste offensive Cyber-KI ist, ist die zweitbeste wahrscheinlich Monate entfernt, nicht Jahre. Open-Weight-Frontier-Modelle von Laboren außerhalb des Responsible-Scaling-Policy-Rahmens werden aufholen. US-Finanzregulierer fragen, ob Banken bereit sind für Angriffe auf Mythos-Niveau ohne Anthropics Sicherheitsschicht.

Die Antwort, gemessen an der Bereitschaft der Fed, ein Notfalltreffen einzuberufen, ist "noch nicht." Bloomberg berichtet, dass die Regierung die größten Wall-Street-Banken drängt, ihre eigene Infrastruktur freiwillig über Glasswing gegen Mythos zu red-teamen, bevor ein Gegner eine gleichwertige Fähigkeit online bringt.

Der Präzedenzfall, Den Das Schafft

Es ist das erste Mal, dass ein Frontier-KI-Labor ein Modell fertigstellt, es auf Stand-der-Technik-Niveau misst und sich aus eigenem Antrieb weigert, es über die normalen Vertriebskanäle zu veröffentlichen. OpenAI hat Releases für Sicherheitsprüfungen verzögert. Google hat einzelne Fähigkeiten eingeschränkt. Kein Labor hatte zuvor öffentlich gesagt: "Wir haben etwas gebaut, wir halten es für das beste Modell, das wir je trainiert haben, und keine Menge Sicherheitsarchitektur reicht, um es die Öffentlichkeit nutzen zu lassen."

Zwei Dinge folgen daraus.

Erstens, die Responsible Scaling Policy ist jetzt tragend. Anthropics RSP-Rahmen klassifiziert Modelle in KI-Sicherheitsstufen (ASL) und wurde genau für dieses Szenario entworfen. Ob Mythos formal eine ASL-3-Schwelle überschreitet, ist tatsächlich umstritten. Einige Alignment-Forscher argumentieren, dass es das nicht tut, und Anthropic hielt es trotzdem zurück. So oder so: Die Entscheidung schafft den Präzedenzfall, dass ein Labor über seine veröffentlichten Schwellen hinausgehen kann, wenn es die Lage für gerechtfertigt hält. Diese Flexibilität schneidet in beide Richtungen.

Zweitens, die Debatte zwischen öffentlichem und kontrolliertem Zugang ist nicht mehr theoretisch. Wer Frontier-Cyber-Offensivfähigkeit will, hat jetzt konkrete Beweise, dass die Fähigkeit existiert und Anthropic sie ihm nicht verkaufen wird. Das verändert die Rechnung für jedes andere Labor. OpenAIs GPT-5.4-Cyber ging mit obligatorischer Nutzerverifikation in eine ähnliche Richtung. Rechnen Sie mit mehr davon, nicht weniger.

Die offene Frage, und niemand hat eine gute Antwort: Was passiert, wenn das nächste Labor, das ein Modell auf Mythos-Niveau für Cyber baut, nicht in einem Land sitzt, das Responsible Scaling Policies anwendet?

FAQ

Was ist der Unterschied zwischen Claude Mythos und Claude Opus 4.7?

Opus 4.7 ist Anthropics aktuelles öffentliches Flaggschiff. Jeder kann es über die API, Claude.ai, Amazon Bedrock, Google Vertex oder Microsoft Foundry nutzen. Mythos ist nicht öffentlich verfügbar. Es erzielt deutlich höhere Werte in allen fortgeschrittenen Coding- und Cybersicherheits-Benchmarks. Mythos ist nur für rund 52 ausgewählte Organisationen über Project Glasswing verfügbar.

Kann mein Unternehmen Zugang zu Project Glasswing bekommen?

Wahrscheinlich nicht, es sei denn, Sie bauen oder warten bereits kritische Software. Anthropic hat keine Bewerbungskriterien veröffentlicht, aber die 40+ zusätzlichen (nicht genannten) Glasswing-Mitglieder konzentrieren sich laut Berichten auf große Open-Source-Maintainer, Betreiber kritischer Infrastruktur und Finanzinstitute. Enterprise-Kunden auf AWS, Azure und GCP haben Zugangswege über diese Cloud-Partnerschaften.

Ist "Mythos" der endgültige Name oder ein Codename?

Anthropic nennt es "Claude Mythos Preview" in offiziellen Kommunikationen, was nahelegt, dass ein Nachfolger unter dem Namen Mythos später kommen könnte. Das "Preview"-Label ist bedeutsam: Es signalisiert eine unfertige öffentliche Strategie, kein dauerhaftes Einmotten.

Wird Claude Mythos jemals öffentlich veröffentlicht?

Anthropic hat sich nicht zu einer öffentlichen Veröffentlichung verpflichtet. Das Glasswing-Fenster beträgt zunächst 90 Tage, mit einem veröffentlichten Ergebnisbericht am Ende. Eine breitere Veröffentlichung hängt davon ab, was dieses Fenster hervorbringt, konkret, ob der Patch-Rückstand der Zero-Days, die Mythos findet, schneller abgebaut werden kann, als Gegner gleichwertige Modelle bauen können.

Wie ist das im Vergleich zu OpenAIs GPT-5.4-Cyber?

GPT-5.4-Cyber hat obligatorische Nutzerverifikation für Verteidigungs- und Cybersicherheits-Profis. Es ist eingeschränkt, aber kommerziell verfügbar: Kunden, die die Verifikation bestehen, können es mieten. Mythos ist gar nicht mietbar. Zugang erfolgt per Einladung, nicht per Transaktion. Mythos ist auch substanziell leistungsfähiger bei Cybersicherheits-Benchmarks.

Was sollte ich als Nicht-Glasswing-Organisation tatsächlich tun?

Drei Dinge. Erstens, davon ausgehen, dass offensive Fähigkeit auf Mythos-Niveau innerhalb von 12 Monaten kommerziell oder illegal verfügbar sein wird, und die eigene Sicherheitsposition entsprechend einpreisen. Zweitens, wer kritische Software betreibt, sollte jetzt Angriffsflächenreduktion und Lieferketten-Härtung priorisieren; das sind die Verteidigungen, die unabhängig von der Angreiferfähigkeit funktionieren. Drittens, Anthropics 90-Tage-Glasswing-Report im Auge behalten. Die Patch-Muster, die er offenlegt, werden signalisieren, wo die verbleibenden weichen Flächen liegen.

Stay ahead of the AI curve

We test new AI tools every week and share honest results. Join our newsletter.