Claude Opus 4.6 — Anthropics neues Flaggschiff mit 1M Kontext und Agent Teams
Claude Opus 4.6 ist das leistungsfähigste KI-Modell von Anthropic und setzt neue Standards für Enterprise-KI. Anthropic hat heute Claude Opus 4.6 veröffentlicht — das leistungsfähigste Modell des Unternehmens für Enterprise-Workflows und agentengesteuerte Softwareentwicklung. Mit einem 1-Million-Token-Kontextfenster, Agent Teams und PowerPoint-Integration setzt Claude Opus 4.6 neue Maßstäbe für KI-gestützte Wissensarbeit.
Was ist neu in Claude Opus 4.6?
1M Token Kontextfenster (Beta)
Claude Opus 4.6 ist das erste Opus-Modell mit einem erweiterten Kontextfenster von 1 Million Tokens. Bisherige Opus-Modelle waren auf 200K Tokens beschränkt — ein häufiger Engpass bei langwierigen Coding-Sessions und umfangreichen Dokumentanalysen.
In einem Needle-in-a-Haystack-Test (MRCR v2) über 1M Tokens erreichte Claude Opus 4.6 76% — verglichen mit nur 18,5% für Sonnet 4.5. Das bedeutet: weniger Context-Compaction, weniger unterbrochene Sessions und zuverlässigere Ergebnisse bei komplexen Aufgaben.
Agent Teams
Die vielleicht wichtigste Neuerung: Agent Teams ermöglichen die parallele Koordination mehrerer KI-Agenten in Claude Code. Statt eines einzelnen Agenten, der Aufgaben sequenziell abarbeitet, können nun mehrere Agenten gleichzeitig an verschiedenen Teilaufgaben arbeiten.
Scott White, Head of Product bei Anthropic, verglich das Feature mit einem talentierten Team von Fachleuten: Jeder Agent übernimmt seinen Teil und koordiniert sich direkt mit den anderen. Agent Teams sind derzeit als Research Preview für API-Nutzer und Abonnenten verfügbar.
Praxisbeispiel: Bei Rakuten hat Claude Opus 4.6 autonom 13 Issues geschlossen und 12 Issues den richtigen Teammitgliedern zugewiesen — an einem einzigen Tag, über eine Organisation mit rund 50 Personen und 6 Repositories.
PowerPoint-Integration
Claude ist jetzt direkt in PowerPoint als Seitenpanel verfügbar. Das Modell kann Layouts, Schriftarten und Slide-Master lesen und Bearbeitungen vornehmen, die dem Corporate Design treu bleiben. Funktionen umfassen:
- Folien aus Vorlagen erstellen
- Storylines umstrukturieren
- Aufzählungen in Diagramme konvertieren
- Komplette Präsentationen aus Beschreibungen generieren
Die PowerPoint-Integration ist als Research Preview über eine Warteliste verfügbar.
Adaptive Thinking und Effort Controls
Entwickler erhalten feinere Kontrolle über Performance und Kosten durch neue Steuerungsmechanismen:
- Adaptive Thinking: Das Modell passt seine Denktiefe automatisch an die Komplexität der Aufgabe an
- Effort Controls: Ermöglichen die Steuerung von Intelligenz, Latenz und Kosten pro Anwendungsfall
- Context Compaction: Verbesserte Verdichtung für längere, stabilere Sessions
Benchmarks: Deutliche Fortschritte
Claude Opus 4.6 zeigt signifikante Verbesserungen gegenüber seinem Vorgänger und der Konkurrenz:
| Benchmark | Opus 4.5 | Claude Opus 4.6 | GPT-5.2 | Gemini 3 Pro |
|---|---|---|---|---|
| Terminal Bench 2.0 | 59,8% | 65,4% | — | — |
| OSWorld | 66,3% | 72,7% | — | — |
| ARC AGI 2 | 37,6% | 68,8% | 54,2% | 45,1% |
| BigLaw Bench | — | 90,2% | — | — |
Besonders beeindruckend: Der ARC AGI 2 Score stieg von 37,6% auf 68,8% — ein Sprung von über 83%. Dieser Benchmark misst die Fähigkeit, Probleme zu lösen, die für Menschen einfach, für KI aber extrem schwierig sind. Claude Opus 4.6 übertrifft hier sowohl GPT-5.2 (54,2%) als auch Gemini 3 Pro (45,1%).
Hinweis: Kleine Rückgänge wurden beim SWE-bench Verified und beim MCP Atlas Benchmark verzeichnet — Bereiche, die Anthropic voraussichtlich in zukünftigen Updates adressieren wird.
Enterprise-Validierung
Mehrere Unternehmen haben bereits beeindruckende Ergebnisse mit Claude Opus 4.6 gemeldet:
- Harvey (Legal AI): 90,2% BigLaw Bench Score mit 40% perfekten Bewertungen und 84% über 0,8. Das höchste Ergebnis aller Claude-Modelle für juristische Argumentation.
- Box: 10% Leistungssteigerung bei High-Reasoning-Aufgaben — 68% gegenüber einer Baseline von 58% — mit nahezu perfekten Ergebnissen in technischen Bereichen.
- Rakuten: Autonome Verwaltung von Issues und Teamzuweisungen über 6 Repositories und 50 Mitarbeiter.
Preise und Verfügbarkeit
Claude Opus 4.6 ist ab sofort verfügbar auf:
- claude.ai (Webinterface und mobile App)
- Anthropic API ($5/$25 pro Million Input-/Output-Tokens — unverändert gegenüber 4.5)
- Microsoft Azure (über Microsoft Foundry)
- Alle großen Cloud-Plattformen
Der maximale Output wurde auf 128K Tokens erhöht, was besonders für Coding- und Dokumentenaufgaben relevant ist.
Was bedeutet das für Entwickler?
Claude Opus 4.6 markiert einen Wendepunkt für agentengesteuerte Workflows:
- Längere Sessions ohne Unterbrechung: 1M Kontext bedeutet, dass komplexe Coding-Projekte ohne Compaction-Zyklen durchlaufen können
- Echte Team-Arbeit: Agent Teams ermöglichen die Aufteilung großer Projekte in parallele Arbeitsstränge
- Enterprise-ready: Die Kombination aus verbesserten Benchmarks, PowerPoint-Integration und rechtlicher Argumentation macht Claude Opus 4.6 zum ersten echten Enterprise-AI-Modell
- Gleicher Preis, mehr Leistung: Keine Preiserhöhung trotz signifikanter Verbesserungen
Fazit
Mit Claude Opus 4.6 macht Anthropic einen entscheidenden Schritt von der KI als Assistent zur KI als Teammitglied. Die Kombination aus 1M Kontextfenster, Agent Teams und der Fähigkeit, komplexe Enterprise-Aufgaben autonom zu bewältigen, positioniert Claude als ernstzunehmende Plattform für professionelle Wissensarbeit.
Die Frage ist nicht mehr, ob KI in Enterprise-Workflows integriert wird — sondern wie schnell Teams ihre bestehenden Prozesse anpassen können.