Claude Opus 4.6 wird langsamer — und Opus 4.7 kommt
Claude Opus 4.6 ist auf Bridgebench von Platz 2 auf Platz 10 gefallen. Claude Opus 4.6 erreichte im neuesten Test nur noch 68,3 % — ein Rückgang von 83,3 % und damit ein Verlust von 15 Punkten bei einem der angesehensten Benchmarks für faktische Genauigkeit. Gleichzeitig berichtet WorldofAI, dass Anthropic intern Claude Opus 4.7 testet, und Claude Code hat vier Updates in 24 Stunden veröffentlicht, um eine Token-Inflation zu beheben.
Bridgebench-Ergebnisse: 15 Punkte Genauigkeitsverlust
Claude Opus 4.6 wurde am 13. April 2026 auf Bridgebench erneut getestet und erzielte 68,3 % — ein Rückgang von 83,3 %. Damit fiel Claude Opus 4.6 von Platz 2 auf Platz 10.
Für Unternehmen, die Claude Opus 4.6 gezielt wegen seiner Genauigkeit gewählt haben — für Produktions-Workflows, bei denen Halluzinationen echte Kosten verursachen — ist das eine wesentliche Veränderung. Claude Opus 4.6 gehörte zu den zwei zuverlässigsten großen Sprachmodellen. Es liegt jetzt hinter mehreren Konkurrenten, die es zuvor übertroffen hatte.
Die wahrscheinliche Erklärung: Ressourcenumverteilung. Wenn Anthropic einen Nachfolger vorbereitet, verlagern sich Rechenleistung und Engineering-Aufmerksamkeit auf die neue Version. Claude Opus 4.6 wird nicht architektonisch schlechter — es erhält weniger Optimierungsaufwand.
Was wir über Claude Opus 4.7 wissen
WorldofAI berichtete am 13. April 2026, dass Claude Opus 4.7 in internen Anthropic-Tests gesichtet wurde. Eine offizielle Ankündigung gibt es nicht. Was wir wissen:
- Die Bezeichnung Claude Opus 4.7 tauchte in internen Tooling-Referenzen auf
- Keine Benchmark-Ergebnisse für Claude Opus 4.7 veröffentlicht
- Das Timing passt zu Anthropics Project-Glasswing-Ankündigung
Zwischen Claude Opus 4.5 und Claude Opus 4.6 lagen etwa 4 Monate. Ein ähnlicher Rhythmus würde Claude Opus 4.7 auf Q2 oder Q3 2026 datieren.
Claude Code Token-Inflations-Regression
Separat hat Claude Code zwischen dem 12. und 13. April 2026 die Versionen 2.1.100 bis 2.1.105 veröffentlicht. Eine Token-Inflations-Regression in v2.1.100 fügt etwa 20.000 zusätzliche Tokens pro Anfrage ein. Entwickler mit nutzungsbasierten Tarifen erreichen Rate-Limits deutlich schneller.
Workaround: Auf v2.1.98 fixieren mit npx claude-code@2.1.98, bis die Regression behoben ist.
Produktions-Aktionsplan für Claude Opus 4.6
Wenn Ihr Team Claude Opus 4.6 für agentische Workflows oder KI-gestützte Automatisierung nutzt:
Genauigkeit: Claude Opus 4.6 kann mehr Halluzinationen erzeugen als auf dem Höhepunkt seiner Leistung. Das betrifft besonders juristische Analysen, Finanzberichte oder Workflows, bei denen fehlerhafte Aussagen echten Schaden anrichten.
Token-Kosten: Prüfen Sie den Verbrauch bei Claude Code v2.1.100+. Fixieren Sie vorübergehend auf v2.1.98.
Übergangsplanung: Bauen Sie jetzt Ihre Test- und Validierungs-Pipeline auf, um Claude Opus 4.7 schnell evaluieren zu können.
Das Pre-Successor-Muster
Claude Opus 4.6 folgt einem branchenweiten Muster. OpenAI-Nutzer berichteten Ähnliches bei GPT-4o vor GPT-5. Googles Gemini 2.0 Pro zeigte Inkonsistenzen vor dem Gemini-2.5-Launch. KI-Labore arbeiten mit endlichen Rechenbudgets, und das Training eines Nachfolgers erfordert enorme Ressourcen.
Bei Context Studios empfehlen wir automatisierte Qualitätsprüfungen bei jedem Model-Update. Regressionen bei Claude Opus 4.6 frühzeitig zu erkennen ist deutlich günstiger, als sie durch Kundenbeschwerden zu entdecken.
FAQ
Ist Claude Opus 4.6 noch produktionstauglich?
Ja. Claude Opus 4.6 bleibt für die meisten Workloads leistungsfähig. Verstärken Sie die Validierungsschichten für halluzinationskritische Anwendungen.
Wann erscheint Claude Opus 4.7?
Kein offizielles Datum. Basierend auf dem ~4-Monats-Rhythmus zwischen Claude Opus 4.5 und Claude Opus 4.6 ist Q2 oder Q3 2026 plausibel.
Sollte ich Claude Code auf v2.1.98 fixieren?
Wenn Sie seit v2.1.100 erhöhten Token-Verbrauch feststellen, ist die Fixierung mit npx claude-code@2.1.98 eine sinnvolle Zwischenlösung.
Warum verändert sich die Leistung von Claude Opus 4.6 vor einem Nachfolger?
Ressourcen verlagern sich auf das Training des Nachfolgers. Claude Opus 4.6 ändert sich architektonisch nicht, erhält aber weniger Infrastruktur-Optimierung.
Wie kann ich die Qualität von Claude Opus 4.6 überwachen?
Implementieren Sie automatisierte Genauigkeitsprüfungen auf einer repräsentativen Stichprobe nach jedem Update. Ihre Produktionsdaten sind die maßgebliche Referenz.
Fazit
Claude Opus 4.6 ist nicht kaputt — aber messbar weniger genau als auf dem Höhepunkt. Der 15-Punkte-Bridgebench-Verlust, die Token-Inflations-Regression und die Berichte über Claude-Opus-4.7-Tests signalisieren: Anthropic befindet sich im Übergangsmodus.
Fixieren Sie Claude Code auf v2.1.98, falls betroffen. Fügen Sie Halluzinations-Monitoring zu Ihren Claude-Opus-4.6-Pipelines hinzu. Beginnen Sie jetzt mit der Planung Ihres Claude-Opus-4.7-Evaluierungs-Frameworks. Das Modell vom 14. April 2026 wird in sechs Monaten nicht dasselbe sein.