Claude Opus 4.6 — Le nouveau modèle phare d'Anthropic avec 1M de contexte et Agent Teams

Anthropic a lancé aujourd'hui Claude Opus 4.6 — le modèle le plus performant de l'entreprise pour les workflows d'entreprise et le développement logiciel agentique. Avec une fenêtre de contexte d'1 million de tokens, des Agent Teams et une intégration PowerPoint, Opus 4.6 établit de nouvelles normes pour le travail intellectuel assisté par l'IA.

Les nouveautés d'Opus 4.6

Fenêtre de contexte d'1M de tokens (Bêta)

Opus 4.6 est le premier modèle Opus doté d'une fenêtre de contexte étendue à 1 million de tokens. Les modèles Opus précédents étaient limités à 200K tokens — un goulot d'étranglement fréquent lors des longues sessions de programmation et des analyses documentaires approfondies.

Lors d'un test needle-in-a-haystack (MRCR v2) sur 1M de tokens, Opus 4.6 a obtenu 76% — contre seulement 18,5% pour Sonnet 4.5. Cela signifie moins de compaction de contexte, moins de sessions interrompues et des résultats plus fiables pour les tâches complexes.

Agent Teams

L'ajout le plus significatif : les Agent Teams permettent la coordination parallèle de plusieurs agents IA dans Claude Code. Au lieu d'un seul agent traitant les tâches séquentiellement, plusieurs agents peuvent désormais travailler simultanément sur différentes sous-tâches.

Scott White, responsable produit chez Anthropic, a comparé cette fonctionnalité à une équipe de professionnels talentueux : chaque agent prend en charge sa partie et se coordonne directement avec les autres. Les Agent Teams sont actuellement disponibles en aperçu de recherche pour les utilisateurs API et les abonnés.

Exemple concret : Chez Rakuten, Opus 4.6 a fermé de manière autonome 13 issues et attribué 12 issues aux bons membres de l'équipe — en une seule journée, au sein d'une organisation d'environ 50 personnes et 6 dépôts.

Intégration PowerPoint

Claude est désormais disponible directement dans PowerPoint sous forme de panneau latéral. Le modèle peut lire les mises en page, les polices et les masques de diapositives, effectuant des modifications fidèles à la charte graphique. Les fonctionnalités incluent :

Création de diapositives à partir de modèles d'entreprise
Restructuration de scénarios
Conversion de listes à puces en diagrammes
Génération de présentations complètes à partir de descriptions

L'intégration PowerPoint est disponible en aperçu de recherche via une liste d'attente.

Pensée adaptative et contrôles d'effort

Les développeurs bénéficient d'un contrôle plus fin sur les performances et les coûts grâce à de nouveaux mécanismes :

Pensée adaptative : Le modèle ajuste automatiquement sa profondeur de raisonnement en fonction de la complexité de la tâche
Contrôles d'effort : Permettent d'ajuster l'intelligence, la latence et le coût par cas d'utilisation
Compaction de contexte : Amélioration de la compaction pour des sessions plus longues et plus stables

Benchmarks : Des progrès significatifs

Opus 4.6 montre des améliorations significatives par rapport à son prédécesseur et à la concurrence :

Benchmark	Opus 4.5	Opus 4.6	GPT-5.2	Gemini 3 Pro
Terminal Bench 2.0	59,8%	65,4%	—	—
OSWorld	66,3%	72,7%	—	—
ARC AGI 2	37,6%	68,8%	54,2%	45,1%
BigLaw Bench	—	90,2%	—	—

Particulièrement impressionnant : le score ARC AGI 2 est passé de 37,6% à 68,8% — une augmentation de plus de 83%. Ce benchmark mesure la capacité à résoudre des problèmes faciles pour les humains mais extrêmement difficiles pour l'IA. Opus 4.6 dépasse à la fois GPT-5.2 (54,2%) et Gemini 3 Pro (45,1%).

Note : De légères régressions ont été observées sur le SWE-bench Verified et le benchmark MCP Atlas — des domaines qu'Anthropic corrigera probablement dans de futures mises à jour.

Validation en entreprise

Plusieurs entreprises ont déjà signalé des résultats impressionnants avec Opus 4.6 :

Harvey (IA juridique) : Score BigLaw Bench de 90,2% avec 40% de scores parfaits et 84% au-dessus de 0,8. Le meilleur résultat de tous les modèles Claude pour le raisonnement juridique.
Box : Amélioration de 10% des performances sur les tâches de raisonnement avancé — 68% contre une base de 58% — avec des scores quasi parfaits dans les domaines techniques.
Rakuten : Gestion autonome des issues et attribution aux équipes sur 6 dépôts et 50 employés.

Prix et disponibilité

Opus 4.6 est disponible dès maintenant sur :

claude.ai (interface web et application mobile)
API Anthropic (5$/25$ par million de tokens entrée/sortie — inchangé par rapport à 4.5)
Microsoft Azure (via Microsoft Foundry)
Toutes les principales plateformes cloud

La sortie maximale a été augmentée à 128K tokens, particulièrement pertinent pour les tâches de programmation et de documentation.

Ce que cela signifie pour les développeurs

Opus 4.6 marque un tournant pour les workflows agentiques :

Sessions plus longues sans interruption : 1M de contexte permet aux projets de programmation complexes de s'exécuter sans cycles de compaction
Véritable collaboration d'équipe : Les Agent Teams permettent de diviser les grands projets en flux de travail parallèles
Prêt pour l'entreprise : La combinaison de benchmarks améliorés, d'intégration PowerPoint et de raisonnement juridique fait d'Opus 4.6 le premier véritable modèle IA d'entreprise
Même prix, plus de puissance : Aucune augmentation de prix malgré des améliorations significatives

Conclusion

Avec Opus 4.6, Anthropic franchit une étape décisive : l'IA passe du statut d'assistant à celui de membre d'équipe. La combinaison d'une fenêtre de contexte d'1M, des Agent Teams et de la capacité à gérer de manière autonome des tâches d'entreprise complexes positionne Claude comme une plateforme sérieuse pour le travail intellectuel professionnel.

La question n'est plus de savoir si l'IA sera intégrée aux workflows d'entreprise — mais à quelle vitesse les équipes pourront adapter leurs processus existants.

Claude Opus 4.6 — Le nouveau modèle phare d'Anthropic avec 1M de contexte et Agent Teams