Claude Opus 4.6 — Il nuovo modello di punta di Anthropic con 1M di contesto e Agent Teams

Anthropic ha rilasciato oggi Claude Opus 4.6 — il modello più potente dell'azienda per i workflow aziendali e lo sviluppo software agentivo. Con una finestra di contesto da 1 milione di token, Agent Teams e integrazione PowerPoint, Opus 4.6 stabilisce nuovi standard per il lavoro intellettuale assistito dall'IA.

Le novità di Opus 4.6

Finestra di contesto da 1M di token (Beta)

Opus 4.6 è il primo modello Opus con una finestra di contesto estesa a 1 milione di token. I modelli Opus precedenti erano limitati a 200K token — un collo di bottiglia frequente durante le lunghe sessioni di programmazione e le analisi documentali approfondite.

In un test needle-in-a-haystack (MRCR v2) su 1M di token, Opus 4.6 ha ottenuto 76% — contro solo il 18,5% di Sonnet 4.5. Ciò significa meno compattazione del contesto, meno sessioni interrotte e risultati più affidabili per le attività complesse.

Agent Teams

L'aggiunta più significativa: gli Agent Teams consentono il coordinamento parallelo di più agenti IA in Claude Code. Invece di un singolo agente che elabora le attività in sequenza, più agenti possono ora lavorare simultaneamente su sotto-attività diverse.

Scott White, responsabile prodotto di Anthropic, ha paragonato la funzionalità a un team di professionisti talentuosi: ogni agente gestisce la propria parte e si coordina direttamente con gli altri. Gli Agent Teams sono attualmente disponibili come anteprima di ricerca per gli utenti API e gli abbonati.

Esempio pratico: In Rakuten, Opus 4.6 ha chiuso autonomamente 13 issue e assegnato 12 issue ai membri giusti del team — in un solo giorno, all'interno di un'organizzazione di circa 50 persone e 6 repository.

Integrazione PowerPoint

Claude è ora disponibile direttamente in PowerPoint come pannello laterale. Il modello può leggere layout, font e slide master, apportando modifiche coerenti con il brand aziendale. Le funzionalità includono:

Creazione di diapositive da modelli aziendali
Ristrutturazione delle storyline
Conversione di elenchi puntati in diagrammi
Generazione di presentazioni complete da descrizioni

L'integrazione PowerPoint è disponibile come anteprima di ricerca tramite lista d'attesa.

Pensiero adattivo e controlli dello sforzo

Gli sviluppatori ottengono un controllo più fine su prestazioni e costi attraverso nuovi meccanismi:

Pensiero adattivo: Il modello adatta automaticamente la profondità di ragionamento in base alla complessità dell'attività
Controlli dello sforzo: Permettono di regolare intelligenza, latenza e costo per caso d'uso
Compattazione del contesto: Compattazione migliorata per sessioni più lunghe e stabili

Benchmark: Progressi significativi

Opus 4.6 mostra miglioramenti significativi rispetto al predecessore e alla concorrenza:

Benchmark	Opus 4.5	Opus 4.6	GPT-5.2	Gemini 3 Pro
Terminal Bench 2.0	59,8%	65,4%	—	—
OSWorld	66,3%	72,7%	—	—
ARC AGI 2	37,6%	68,8%	54,2%	45,1%
BigLaw Bench	—	90,2%	—	—

Particolarmente impressionante: il punteggio ARC AGI 2 è passato dal 37,6% al 68,8% — un aumento di oltre l'83%. Questo benchmark misura la capacità di risolvere problemi facili per gli esseri umani ma estremamente difficili per l'IA. Opus 4.6 supera sia GPT-5.2 (54,2%) che Gemini 3 Pro (45,1%).

Nota: Lievi regressioni sono state osservate su SWE-bench Verified e sul benchmark MCP Atlas — aree che Anthropic probabilmente correggerà nei prossimi aggiornamenti.

Validazione aziendale

Diverse aziende hanno già riportato risultati impressionanti con Opus 4.6:

Harvey (IA legale): Punteggio BigLaw Bench del 90,2% con il 40% di punteggi perfetti e l'84% sopra 0,8. Il miglior risultato di qualsiasi modello Claude per il ragionamento giuridico.
Box: Miglioramento del 10% delle prestazioni nelle attività di ragionamento avanzato — 68% contro un baseline del 58% — con punteggi quasi perfetti nei domini tecnici.
Rakuten: Gestione autonoma delle issue e assegnazioni ai team su 6 repository e 50 dipendenti.

Prezzi e disponibilità

Opus 4.6 è disponibile ora su:

claude.ai (interfaccia web e app mobile)
API Anthropic ($5/$25 per milione di token input/output — invariato rispetto a 4.5)
Microsoft Azure (tramite Microsoft Foundry)
Tutte le principali piattaforme cloud

L'output massimo è stato aumentato a 128K token, particolarmente rilevante per le attività di programmazione e documentazione.

Cosa significa per gli sviluppatori

Opus 4.6 segna un punto di svolta per i workflow agentivi:

Sessioni più lunghe senza interruzioni: 1M di contesto significa che i progetti di programmazione complessi possono proseguire senza cicli di compattazione
Vera collaborazione di team: Gli Agent Teams consentono di suddividere grandi progetti in flussi di lavoro paralleli
Pronto per l'azienda: La combinazione di benchmark migliorati, integrazione PowerPoint e ragionamento giuridico rende Opus 4.6 il primo vero modello IA aziendale
Stesso prezzo, più potenza: Nessun aumento di prezzo nonostante miglioramenti significativi

Conclusione

Con Opus 4.6, Anthropic compie un passo decisivo: l'IA passa da assistente a membro del team. La combinazione di una finestra di contesto da 1M, Agent Teams e la capacità di gestire autonomamente attività aziendali complesse posiziona Claude come una piattaforma seria per il lavoro intellettuale professionale.

La domanda non è più se l'IA verrà integrata nei workflow aziendali — ma quanto velocemente i team potranno adattare i loro processi esistenti.

Claude Opus 4.6 — Il nuovo modello di punta di Anthropic con 1M di contesto e Agent Teams