Claude Opus 4.6 sta rallentando — e Opus 4.7 è in arrivo
Claude Opus 4.6 è sceso dalla 2a alla 10a posizione su Bridgebench per accuratezza fattuale. Claude Opus 4.6 ha ottenuto il 68,3 % nell'ultimo test, in calo rispetto all'83,3 % precedente — una perdita di 15 punti su uno dei benchmark più rispettati nell'IA. Nel frattempo, WorldofAI riporta che Anthropic sta testando internamente Claude Opus 4.7, e Claude Code ha rilasciato quattro aggiornamenti in 24 ore per risolvere una regressione dell'inflazione dei token.
Risultati Bridgebench: un calo di 15 punti
Claude Opus 4.6 è stato ritestato su Bridgebench il 13 aprile 2026, ottenendo il 68,3 % — in calo rispetto all'83,3 %. Claude Opus 4.6 è così passato dalla 2a alla 10a posizione.
Per le aziende che hanno scelto Claude Opus 4.6 per la sua accuratezza — per workflow di produzione dove le allucinazioni hanno un costo reale — si tratta di un cambiamento sostanziale. Claude Opus 4.6 era tra i due modelli linguistici più affidabili disponibili. Ora si posiziona dietro a diversi concorrenti che in precedenza superava.
La spiegazione probabile: riallocazione delle risorse. Quando Anthropic prepara un successore, la potenza di calcolo e l'attenzione ingegneristica si spostano verso la nuova versione. Claude Opus 4.6 non peggiora architettonicamente — riceve meno attenzione all'ottimizzazione.
Cosa sappiamo su Claude Opus 4.7
WorldofAI ha riportato il 13 aprile 2026 che Claude Opus 4.7 è stato individuato nei test interni di Anthropic. Nessun annuncio ufficiale è stato fatto. Quello che sappiamo:
- La designazione Claude Opus 4.7 è apparsa in riferimenti di tooling interno
- Nessun punteggio benchmark è stato pubblicato per Claude Opus 4.7
- I tempi coincidono con l'annuncio Project Glasswing di Anthropic
Tra Claude Opus 4.5 e Claude Opus 4.6 sono passati circa 4 mesi. Un ritmo simile collocherebbe Claude Opus 4.7 nel Q2 o Q3 2026.
Regressione inflazione token di Claude Code
Separatamente, Claude Code ha rilasciato le versioni da 2.1.100 a 2.1.105 tra il 12 e il 13 aprile 2026. Una regressione dell'inflazione dei token nella v2.1.100 inietta circa 20.000 token aggiuntivi per richiesta. Gli sviluppatori con piani a consumo raggiungono i limiti di rate molto più velocemente.
Soluzione temporanea: Fissare alla v2.1.98 con npx claude-code@2.1.98 fino alla risoluzione della regressione.
Piano d'azione produzione per Claude Opus 4.6
Se il vostro team utilizza Claude Opus 4.6 per workflow agentici o automazione basata su IA:
Accuratezza: Claude Opus 4.6 potrebbe produrre più allucinazioni rispetto al suo picco di prestazioni. Questo è particolarmente critico per analisi legali, report finanziari o qualsiasi workflow dove affermazioni errate causano danni reali.
Costi token: Verificate il consumo con Claude Code v2.1.100+. Fissate temporaneamente alla v2.1.98.
Pianificazione della transizione: Costruite ora la vostra pipeline di test e validazione per valutare rapidamente Claude Opus 4.7 al suo rilascio.
Il pattern pre-successore
Claude Opus 4.6 segue un pattern osservato in tutta l'industria. Gli utenti OpenAI hanno riportato osservazioni simili con GPT-4o prima di GPT-5. Il Gemini 2.0 Pro di Google ha mostrato inconsistenze prima del lancio di Gemini 2.5. I laboratori di IA operano con budget di calcolo finiti, e l'addestramento di un successore richiede risorse enormi.
In Context Studios, raccomandiamo controlli di qualità automatizzati ad ogni aggiornamento del modello. Individuare le regressioni di Claude Opus 4.6 precocemente costa molto meno che scoprirle attraverso le lamentele dei clienti.
FAQ
Claude Opus 4.6 è ancora utilizzabile in produzione?
Sì. Claude Opus 4.6 rimane performante per la maggior parte dei carichi di lavoro. Rafforzate i livelli di validazione per i casi d'uso critici in termini di allucinazioni.
Quando uscirà Claude Opus 4.7?
Nessuna data ufficiale. Sulla base del ritmo di circa 4 mesi tra Claude Opus 4.5 e Claude Opus 4.6, il Q2 o Q3 2026 è plausibile.
Dovrei fissare Claude Code alla v2.1.98?
Se riscontrate un consumo elevato di token dalla v2.1.100, fissare con npx claude-code@2.1.98 è una misura provvisoria ragionevole.
Perché le prestazioni di Claude Opus 4.6 cambiano prima di un successore?
Le risorse si spostano verso l'addestramento del successore. Claude Opus 4.6 non cambia architettonicamente ma riceve meno ottimizzazione dell'infrastruttura.
Come posso monitorare la qualità di Claude Opus 4.6?
Implementate verifiche di accuratezza automatizzate su un campione rappresentativo dopo ogni aggiornamento. I vostri dati di produzione sono il riferimento definitivo.
Conclusione
Claude Opus 4.6 non è rotto — ma è misurabilmente meno accurato rispetto al suo apice. La perdita di 15 punti su Bridgebench, combinata con la regressione dell'inflazione dei token e i report sui test di Claude Opus 4.7, segnala che Anthropic è in modalità transizione.
Fissate Claude Code alla v2.1.98 se interessati. Aggiungete il monitoraggio delle allucinazioni alle vostre pipeline Claude Opus 4.6. Iniziate ora a pianificare il vostro framework di valutazione per Claude Opus 4.7. Il modello che usate il 14 aprile 2026 non sarà lo stesso tra sei mesi.