Claude Opus 4.7 ist live: Der bewusste Halbschritt

Anthropic hat Claude Opus 4.7 am 16. April 2026 veröffentlicht — und sofort erklärt, dass dieses Modell weniger leistungsfähig ist als sein stärkstes Modell. Diese Formulierung ist kein Zufall. Sie ist das bislang deutlichste Signal dafür, dass das Rennen um die KI-Frontier in eine neue Phase eingetreten ist: eine Phase, in der Zurückhaltung selbst das Produkt ist.

Was Opus 4.7 tatsächlich verändert

Claude Opus 4.7 ist kein Generationssprung. Es ist ein gezieltes Upgrade gegenüber Opus 4.6, das in den vergangenen Wochen Schwächezeichen gezeigt hatte. Die Verbesserungen konzentrieren sich auf drei Bereiche: fortgeschrittenes Software-Engineering, visuelles Denken und Instruktionstreue.

Auf der Engineering-Seite ist Anthropics eigene Beschreibung präzise: „deutliche Verbesserung gegenüber Opus 4.6 im fortgeschrittenen Software-Engineering, mit besonders großen Fortschritten bei den schwierigsten Aufgaben." Tester mit Frühzugang von Cursor berichten von einem Sprung von 58 % auf 70 % im CursorBench. Notions Auswertung ergab eine 14-prozentige Verbesserung der Aufgabenlösung gegenüber Opus 4.6 bei weniger Token-Verbrauch und einem Drittel der Werkzeugfehler. Hex bezeichnet es als „ein intelligenteres, effizienteres Opus 4.6" und stellt fest, dass Opus 4.7 mit geringem Aufwand in etwa Opus 4.6 mit mittlerem Aufwand entspricht.

Das visuelle Upgrade ist erheblich. Opus 4.7 verarbeitet Bilder mit höherer Auflösung — relevant für Dokumentenanalyse, Diagramminterpretation und multimodale Workflows. Nick Saraevs unabhängige Benchmark-Tests messen einen Sprung des visuellen Denkens von 69,1 % auf 82,1 % — ein Gewinn von 13 Prozentpunkten, der sich nicht ignorieren lässt.

Doch hier ist die Zahl, die sich nicht verändert hat: Agentisches Terminal-Coding zeigte in Saraevs Tests ein minimales oder sogar negatives Delta. Für Teams, die autonome Agenten-Workflows betreiben, dürfte der praktische Unterschied bei Routineaufgaben vernachlässigbar sein.

Die Glasswing-Beschränkung

Der interessanteste Aspekt von Opus 4.7 ist das, was es nicht kann. Anthropic stellt ausdrücklich fest, dass während des Trainings „Experimente unternommen wurden, um die Cybersicherheitsfähigkeiten des Modells gezielt zu reduzieren". Dies ist eine direkte Folge von Project Glasswing, das eine Woche zuvor angekündigt wurde und Risiken sowie Nutzen von KI-Modellen für die Cybersicherheit darlegte.

Claude Mythos Preview bleibt Anthropics leistungsfähigstes Modell, doch seine Verfügbarkeit ist weiterhin eingeschränkt. Opus 4.7 wird mit automatisierten Schutzmaßnahmen ausgeliefert, die unzulässige oder risikoreiche Cybersicherheitsanfragen erkennen und blockieren. Es handelt sich faktisch um eine bewusst beschränkte Veröffentlichung — leistungsstark genug für produktives Software-Engineering, aber absichtlich geschwächt in den Fähigkeiten, die Anthropic als besonders risikoreich einstuft.

Dies ist eine neue Art von Produktentscheidung im Bereich der Frontier-KI. Anstatt das leistungsfähigste Modell zu veröffentlichen und das Beste zu hoffen, stuft Anthropic seine Veröffentlichung ab. Sicherheitsexperten, die den vollen Funktionsumfang benötigen, können sich für das neue Cyber Verification Program bewerben. Alle anderen erhalten ein Modell, das hervorragend beim Programmieren und bei der Bildanalyse ist, aber bewusst eingeschränkte Fähigkeiten bei der Schwachstellenreproduktion besitzt.

Für Agenturen und Entwicklungsteams bedeutet das: Opus 4.7 ist das Produktionsmodell. Mythos ist das Forschungsmodell. Wer beide als eine einheitliche Produktlinie behandelt, verkennt den wesentlichen Unterschied.

Effizienz statt Leistung: Die eigentliche Geschichte

Nick Saraev, dessen YouTube-Analyse innerhalb von Stunden nach der Veröffentlichung 64.000 Aufrufe erreichte, brachte die Verschiebung prägnant auf den Punkt: Opus 4.7 „macht Dinge nicht mehr möglich. Es macht sie lediglich etwas profitabler."

Diese Formulierung verdient Aufmerksamkeit. Die Benchmark-Verbesserungen sind real, aber graduell. Opus 4.7 glänzt bei der Effizienz: weniger Token pro Aufgabe, weniger Werkzeugfehler, bessere Instruktionsbefolgung. Devin berichtet, dass Opus 4.7 „kohärent über Stunden arbeitet und schwierige Probleme durchhält, anstatt aufzugeben." Replit beschreibt es als „gleiche Qualität zu geringeren Kosten." Harvey, die KI-Plattform für Rechtsdienstleistungen, maß 90,9 % auf dem BigLaw Bench mit hohem Aufwand und „besserer Reasoning-Kalibrierung bei Prüftabellen." Das sind keine Leistungsgeschichten — es sind Geschichten über betriebliche Effizienz.

Das Muster zieht sich konsistent durch alle frühen Testberichte, die Anthropic veröffentlichte. Notion: +14 % Aufgabenlösung, ein Drittel weniger Werkzeugfehler. Cursor: CursorBench von 58 % auf 70 %. Eine namentlich nicht genannte Finanztech-Plattform nennt es „einen bedeutenden Sprung" bei der Beschleunigung der „Entwicklungsgeschwindigkeit für schnellere Lieferung." Der gemeinsame Nenner ist nicht rohe Intelligenz — es ist Zuverlässigkeit im großen Maßstab.

Für Teams, die Claude bereits produktiv einsetzen, ist die Upgrade-Rechnung unkompliziert. Die Preise bleiben identisch mit Opus 4.6 (5 USD pro Million Input-Token, 25 USD pro Million Output-Token). Wenn Ihre Agenten weniger Wiederholungsversuche benötigen und weniger Token pro Aufgabe verbrauchen, sinken Ihre effektiven Kosten, ohne dass sich Ihr Abrechnungstarif ändert.

Dies ist besonders relevant für Unternehmen, die abwägen, ob sie Automatisierung mit KI-Agenten oder traditionellen Workflow-Tools aufbauen. Die Kosten-pro-Aufgabe-Kennzahl verschiebt sich spürbar, wenn das Modell weniger Rechenleistung für fehlgeschlagene Versuche verschwendet.

Claude Code v2.1.111: Die Vertrauensschicht kommt mit

Am selben Tag, an dem Opus 4.7 startete, lieferte Anthropic Claude Code v2.1.111 mit zwei Funktionen, die keine Leistungsupgrades sind — sondern Vertrauensfunktionen. Die /less-permission-prompts-Funktion durchsucht Ihre Sitzungsprotokolle und schlägt eine Zulassungsliste von Werkzeugen vor, die der Agent ohne Rückfrage verwenden kann. Der /ultrareview-Befehl fügt einen tieferen Code-Review-Durchlauf hinzu.

Ein v2.1.112-Hotfix folgte innerhalb von Stunden und behob einen „vorübergehend nicht verfügbar"-Fehler beim Einsatz von Opus 4.7 im Auto-Modus — ein Beleg dafür, wie schnell das Entwickler-Tooling-Team iteriert.

Drei Releases in 24 Stunden sind kein Chaos. Es ist eine koordinierte Strategie: Modell und Vertrauensinfrastruktur gemeinsam ausliefern. Der Engpass bei der KI-Einführung im Unternehmensbereich hat sich verschoben von „Kann das Modell das?" zu „Können wir dem Modell das unbeaufsichtigt überlassen?" Der /effort-Regler und die Berechtigungsverwaltungswerkzeuge in v2.1.111 adressieren die zweite Frage direkt. Für Teams, die bereits in KI-gestützte Entwicklungs-Workflows investieren, ist diese Vertrauensschicht das fehlende Bindeglied.

Was das für Ihre KI-Strategie bedeutet

Wenn Sie heute Claude Opus 4.6 in der Produktion betreiben, ist das Upgrade risikoarm und wahrscheinlich kostenpositiv. Die identischen Preise bedeuten keine Überraschungen bei der Abrechnung. Die Effizienzgewinne bei komplexen, mehrstufigen Aufgaben — Notion maß +14 % Aufgabenlösung bei 33 % weniger Werkzeugfehlern — schlagen sich direkt in niedrigeren Betriebskosten nieder.

Wenn Sie Frontier-Modelle für neue Projekte evaluieren, ist Opus 4.7 die klarste Produktionsempfehlung, die Anthropic je ausgesprochen hat. Anders als Mythos, das das Gewicht der Sicherheitsdebatten trägt, ist Opus 4.7 explizit für den Einsatz konzipiert. Die Glasswing-Beschränkungen machen es tatsächlich zu einer sichereren Wahl für Unternehmensumgebungen, in denen Sicherheitsprüfprozesse unkontrollierte Cyberfähigkeiten beanstanden würden.

Wenn Sie agentische Workflows aufbauen — mehrstufige autonome Aufgaben, die stundenlang laufen — legen die frühen Testberichte von Devin und Notion nahe, dass Opus 4.7 Langhorizont-Autonomie besser handhabt als jedes frühere Claude-Modell. Die Kombination aus verbesserter Instruktionsbefolgung und weniger Werkzeugfehlern bedeutet weniger Interventionspunkte — das ist die eigentliche Voraussetzung für die Skalierung von Agentenbetrieb. Solve Intelligence bestätigte dies im multimodalen Bereich: Opus 4.7s höherauflösendes Sehen ermöglicht „branchenführende Werkzeuge für Patent-Workflows in den Lebenswissenschaften, von der Ausarbeitung und Verfolgung bis zur Verletzungserkennung."

Der Wettbewerbskontext verdient Beachtung. Am selben Tag, an dem Opus 4.7 startete, veröffentlichte Alibaba Qwen3.6-35B — ein freies Apache-2.0-Modell, das auf einem Laptop läuft und etwa 3,5 Milliarden aktive Parameter hat. Simon Willisons Pelican-SVG-Benchmark zeigte, dass das lokale Modell Opus 4.7 bei kreativen Generierungsaufgaben übertraf. Wenn ein kostenloses lokales Modell eine API zu 15 USD pro Million Token bei kreativen Aufgaben innerhalb von Stunden nach dem Launch einholt, verschiebt sich das Wertversprechen von Frontier-Modellen dauerhaft von „Was kann es tun?" zu „Wie zuverlässig tut es das im großen Maßstab?" Opus 4.7s Effizienzgeschichte ist Anthropics Antwort auf diese Verschiebung.

Die Formulierung „bewusster Halbschritt" ist keine Bescheidenheit. Es ist Anthropics Signal, dass die Ära der leistungsorientierten Veröffentlichungen vorbei ist. Die nächste Phase dreht sich um Deployment-Zuverlässigkeit, betriebliche Effizienz und kontrollierte Freigabe risikoreicher Fähigkeiten. Für Teams, die auf Claude aufbauen, sind das bessere Neuigkeiten als ein weiterer Benchmark-Rekord.

Häufig gestellte Fragen

Ist Claude Opus 4.7 besser als Claude Mythos Preview?

Nein — Anthropic stellt ausdrücklich fest, dass Opus 4.7 „weniger breit einsatzfähig" ist als Mythos Preview. Opus 4.7 überzeugt bei Software-Engineering, Bildanalyse und Instruktionstreue, doch Mythos behält eine höhere Rohleistung über ein breiteres Aufgabenspektrum. Opus 4.7 ist das produktionsoptimierte Modell; Mythos ist das Frontier-Forschungsmodell mit eingeschränkter Verfügbarkeit.

Was kostet Claude Opus 4.7?

Die Preise sind identisch mit Opus 4.6: 5 USD pro Million Input-Token und 25 USD pro Million Output-Token. Durch die Effizienzgewinne (weniger Token pro Aufgabe, weniger Wiederholungsversuche) sinken Ihre effektiven Kosten pro abgeschlossener Aufgabe wahrscheinlich. Opus 4.7 ist über die Claude API, Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry verfügbar.

Was ist Project Glasswing und wie beeinflusst es Opus 4.7?

Project Glasswing ist Anthropics Sicherheitsrahmen für Cybersicherheit, der am 9. April 2026 angekündigt wurde. Er führte zu bewussten Beschränkungen der Cyberfähigkeiten von Opus 4.7 — das Modell wurde mit reduzierter Fähigkeit zur Reproduktion von Sicherheitslücken trainiert. Automatisierte Schutzmaßnahmen blockieren unzulässige Cybersicherheitsanfragen. Legitime Sicherheitsexperten können sich für das Cyber Verification Program bewerben, um Zugang zu den vollen Fähigkeiten zu erhalten.

Sollte ich von Opus 4.6 auf Opus 4.7 upgraden?

Ja, für die meisten Produktionsfälle. Frühe Tester berichten durchgängig von gleicher oder besserer Qualität bei geringerem Token-Verbrauch. Hex stellt fest, dass „Opus 4.7 mit geringem Aufwand in etwa Opus 4.6 mit mittlerem Aufwand entspricht" — das bedeutet, Sie erhalten Opus-4.6-Niveau-Output bei geringerem Rechenressourceneinsatz. Das Upgrade ist ein Direktersatz ohne Preisänderungen.

Was hat sich bei Opus 4.7 im Vergleich zu Opus 4.6 am meisten verbessert?

Das visuelle Denken verzeichnete den größten messbaren Gewinn — unabhängige Tests messen einen Sprung von 69,1 % auf 82,1 %. Software-Engineering-Benchmarks verbesserten sich bei mehreren Testern um 12–14 %. Instruktionstreue und Werkzeug-Zuverlässigkeit verbesserten sich ebenfalls erheblich, wobei Notion 33 % weniger Werkzeugfehler meldet. Agentisches Terminal-Coding zeigte in unabhängigen Benchmarks hingegen minimale Verbesserungen.

Claude Opus 4.7 ist live: Der bewusste Halbschritt