Claude Opus 4.7 è Disponibile: Il Mezzo Passo Deliberato
Anthropic ha rilasciato Claude Opus 4.7 il 16 aprile 2026 — dichiarando immediatamente che si tratta di un modello meno capace rispetto al suo prodotto più potente. Questa presentazione non è casuale. È il segnale più chiaro finora che la corsa all'intelligenza artificiale di frontiera è entrata in una nuova fase: una in cui la moderazione è il prodotto.
Cosa Cambia Davvero con Opus 4.7
Claude Opus 4.7 non è un salto generazionale. È un aggiornamento mirato rispetto a Opus 4.6, che nelle ultime settimane aveva mostrato segnali di affaticamento. I miglioramenti si concentrano in tre aree: ingegneria del software avanzata, ragionamento visivo e aderenza alle istruzioni.
Sul fronte dell'ingegneria, la descrizione di Anthropic è precisa: "miglioramento significativo rispetto a Opus 4.6 nell'ingegneria del software avanzata, con guadagni particolari sui compiti più difficili." I tester in accesso anticipato di Cursor segnalano un salto dal 58% al 70% su CursorBench. La valutazione di Notion ha rilevato un aumento del 14% nella risoluzione dei task rispetto a Opus 4.6, con meno token e un terzo degli errori degli strumenti. Hex lo definisce "un Opus 4.6 più intelligente e più efficiente" e osserva che Opus 4.7 a basso sforzo è approssimativamente equivalente a Opus 4.6 a medio sforzo.
L'aggiornamento della visione è sostanziale. Opus 4.7 elabora le immagini ad alta risoluzione, il che è rilevante per l'analisi di documenti, l'interpretazione di diagrammi e i flussi di lavoro multimodali. I test di benchmark indipendenti di Nick Saraev hanno misurato un salto del ragionamento visivo dal 69,1% all'82,1% — un guadagno di 13 punti percentuali difficile da ignorare.
Ma ecco il numero che non si è mosso: la codifica agentica da terminale ha mostrato un delta minimo o addirittura negativo nei test di Saraev. Per i team che eseguono flussi di lavoro con agenti autonomi, la differenza pratica sui task di routine potrebbe essere trascurabile.
Il Vincolo Glasswing
La parte più interessante di Opus 4.7 è ciò che non può fare. Anthropic afferma esplicitamente che durante l'addestramento hanno "sperimentato sforzi per ridurre differenzialmente" le capacità di cybersicurezza del modello. Questa è una diretta conseguenza di Project Glasswing, annunciato la settimana precedente, che ha delineato i rischi e i benefici dei modelli di intelligenza artificiale per la cybersicurezza.
Claude Mythos Preview rimane il modello più potente di Anthropic, ma la sua distribuzione resta limitata. Opus 4.7 viene rilasciato con protezioni automatizzate che rilevano e bloccano le richieste vietate o ad alto rischio in materia di cybersicurezza. Si tratta, in sostanza, di un rilascio deliberatamente vincolato — sufficientemente potente per l'ingegneria del software in produzione, ma intenzionalmente indebolito nelle capacità che Anthropic considera ad alto rischio.
Questa è una nuova tipologia di decisione di prodotto nell'IA di frontiera. Invece di rilasciare il modello più capace sperando nel meglio, Anthropic gestisce il rilascio in fasi. I professionisti della sicurezza che necessitano del set completo di capacità possono fare domanda per il nuovo Cyber Verification Program. Tutti gli altri ricevono un modello eccellente nella codifica e nella visione, ma deliberatamente meno capace nella riproduzione delle vulnerabilità.
Per le agenzie e i team di sviluppo, questo significa che Opus 4.7 è il modello di produzione. Mythos è il modello di ricerca. Trattarli come la stessa linea di prodotti significa perdere il punto fondamentale.
Efficienza Prima della Capacità: La Vera Notizia
Nick Saraev, la cui analisi su YouTube ha raggiunto 64.000 visualizzazioni nel giro di poche ore dalla pubblicazione, ha catturato il cambiamento con chiarezza: Opus 4.7 "non rende possibili nuove cose. Le rende semplicemente un po' più redditizie."
Questa prospettiva merita attenzione. I miglioramenti nei benchmark sono reali ma incrementali. Dove Opus 4.7 eccelle è nell'efficienza: meno token per task, meno errori degli strumenti, migliore rispetto delle istruzioni. Devin riferisce che Opus 4.7 "lavora in modo coerente per ore, affronta i problemi difficili invece di arrendersi." Replit lo descrive come "la stessa qualità a costo inferiore." Harvey, la piattaforma di IA per il settore legale, ha misurato il 90,9% su BigLaw Bench ad alto sforzo con una "migliore calibrazione del ragionamento sulle tabelle di revisione." Non si tratta di storie di capacità — sono storie di efficienza operativa.
Il modello è coerente in tutti i report dei primi tester pubblicati da Anthropic. Notion: +14% nella risoluzione dei task, un terzo in meno di errori degli strumenti. Cursor: CursorBench dal 58% al 70%. Una piattaforma di tecnologia finanziaria non nominata lo definisce "un salto significativo" per accelerare la "velocità di sviluppo per una consegna più rapida." Il filo conduttore non è l'intelligenza grezza — è l'affidabilità su scala.
Per i team che già utilizzano Claude in produzione, il calcolo dell'aggiornamento è immediato. Il prezzo rimane identico a Opus 4.6 ($5 per milione di token in input, $25 per milione di token in output). Se i vostri agenti eseguono meno tentativi e consumano meno token per task, il costo effettivo scende senza modificare la tariffa di fatturazione.
Questo è particolarmente rilevante per le aziende che valutano se costruire automazioni con agenti IA o con strumenti tradizionali per i flussi di lavoro. La metrica del costo per task cambia in modo significativo quando il modello spreca meno risorse computazionali nei tentativi falliti.
Claude Code v2.1.111: Il Livello di Fiducia Arriva Insieme
Lo stesso giorno del lancio di Opus 4.7, Anthropic ha rilasciato Claude Code v2.1.111 con due funzionalità che non sono miglioramenti delle prestazioni — sono funzionalità di fiducia. La skill /less-permission-prompts analizza i trascritti della sessione e propone una lista di strumenti che l'agente può utilizzare senza chiedere autorizzazione. Il comando /ultrareview aggiunge un passaggio di revisione del codice più approfondito.
Un hotfix v2.1.112 ha seguito nel giro di poche ore, risolvendo un errore "temporaneamente non disponibile" durante l'utilizzo di Opus 4.7 in modalità automatica — confermando la velocità con cui il team degli strumenti per sviluppatori sta iterando.
Tre rilasci in 24 ore non sono caos. È una strategia coordinata: rilasciare il modello e l'infrastruttura di fiducia insieme. Il collo di bottiglia per l'adozione dell'IA in ambito enterprise si è spostato da "il modello può farlo?" a "possiamo lasciare che il modello lo faccia senza supervisione?" Il cursore /effort e gli strumenti di gestione dei permessi in v2.1.111 affrontano direttamente la seconda domanda. Per i team che già investono in flussi di lavoro di sviluppo assistiti dall'IA, questo livello di fiducia è il tassello mancante.
Cosa Significa per la Vostra Strategia IA
Se oggi utilizzate Claude Opus 4.6 in produzione, l'aggiornamento è a basso rischio e probabilmente positivo in termini di costi. Il prezzo identico significa nessuna sorpresa in fattura. I guadagni di efficienza su task complessi e multi-fase — Notion ha misurato +14% nella risoluzione con il 33% in meno di errori degli strumenti — si traducono direttamente in costi operativi inferiori.
Se state valutando modelli di frontiera per nuovi progetti, Opus 4.7 è la raccomandazione di produzione più chiara che Anthropic abbia mai formulato. A differenza di Mythos, che porta il peso dei dibattiti sulla sicurezza, Opus 4.7 è esplicitamente progettato per il deployment. I vincoli di Glasswing lo rendono effettivamente una scelta più sicura per gli ambienti enterprise dove i processi di revisione della sicurezza segnalerebbero capacità informatiche non controllate.
Se state costruendo flussi di lavoro agentici — task autonomi multi-fase che funzionano per ore — il feedback dei primi tester di Devin e Notion suggerisce che Opus 4.7 gestisce l'autonomia a lungo orizzonte meglio di qualsiasi modello Claude precedente. La combinazione di un migliore rispetto delle istruzioni e di un minor numero di errori degli strumenti significa meno punti di intervento, che è il vero sblocco per scalare le operazioni degli agenti. Solve Intelligence lo ha confermato nel dominio multimodale: la visione ad alta risoluzione di Opus 4.7 sta abilitando "strumenti di livello mondiale per i flussi di lavoro di brevetti nelle scienze della vita, dalla redazione e gestione dei procedimenti al rilevamento delle violazioni."
Si consideri il contesto competitivo. Lo stesso giorno del lancio di Opus 4.7, Alibaba ha rilasciato Qwen3.6-35B — un modello gratuito con licenza Apache 2.0 che funziona su un laptop con circa 3,5 miliardi di parametri attivi. Il benchmark pelican SVG di Simon Willison ha mostrato il modello locale superare Opus 4.7 nei task di generazione creativa. Quando un modello locale gratuito eguaglia un'API da $15/MTok nei task creativi a poche ore dal lancio, la proposta di valore dei modelli di frontiera si sposta definitivamente da "cosa può fare" a "con quale affidabilità lo fa su scala." La storia di efficienza di Opus 4.7 è la risposta di Anthropic a questo cambiamento.
Il framing del mezzo passo deliberato non è modestia. È Anthropic che segnala che l'era dei rilasci incentrati sulla capacità è finita. La prossima fase riguarda l'affidabilità nel deployment, l'efficienza operativa e il rilascio controllato delle capacità ad alto rischio. Per i team che costruiscono su Claude, questa è una notizia migliore di qualsiasi nuovo record nei benchmark.
Domande Frequenti
Claude Opus 4.7 è migliore di Claude Mythos Preview?
No — Anthropic afferma esplicitamente che Opus 4.7 è "meno ampiamente capace" di Mythos Preview. Opus 4.7 eccelle nell'ingegneria del software, nella visione e nell'aderenza alle istruzioni, ma Mythos mantiene una capacità grezza superiore su una gamma più ampia di task. Opus 4.7 è il modello ottimizzato per la produzione; Mythos è il modello di ricerca di frontiera con disponibilità limitata.
Quanto costa Claude Opus 4.7?
Il prezzo è identico a Opus 4.6: $5 per milione di token in input e $25 per milione di token in output. I guadagni di efficienza (meno token per task, meno tentativi) significano che il costo effettivo per task completato probabilmente diminuisce. Opus 4.7 è disponibile tramite Claude API, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.
Cos'è Project Glasswing e come influenza Opus 4.7?
Project Glasswing è il framework di sicurezza informatica di Anthropic, annunciato il 9 aprile 2026. Ha portato a vincoli deliberati sulle capacità informatiche di Opus 4.7 — il modello è stato addestrato con una ridotta capacità di riprodurre vulnerabilità di sicurezza. Le protezioni automatizzate bloccano le richieste di cybersicurezza vietate. I professionisti della sicurezza legittimi possono fare domanda per il Cyber Verification Program per accedere alle capacità complete.
Dovrei aggiornare da Opus 4.6 a Opus 4.7?
Sì, per la maggior parte dei casi d'uso in produzione. I primi tester riportano costantemente qualità uguale o superiore con un consumo di token inferiore. Hex osserva che "Opus 4.7 a basso sforzo è approssimativamente equivalente a Opus 4.6 a medio sforzo", il che significa che si ottiene un output di livello Opus 4.6 utilizzando meno risorse computazionali. L'aggiornamento è una sostituzione diretta senza modifiche ai prezzi.
Cosa è migliorato maggiormente in Opus 4.7 rispetto a Opus 4.6?
Il ragionamento visivo ha registrato il guadagno più misurabile — i test indipendenti hanno misurato un salto dal 69,1% all'82,1%. I benchmark di ingegneria del software sono migliorati del 12-14% in più valutatori. Anche l'aderenza alle istruzioni e l'affidabilità nell'utilizzo degli strumenti sono migliorate in modo significativo, con Notion che riporta il 33% in meno di errori degli strumenti. La codifica agentica da terminale, invece, ha mostrato un miglioramento minimo nei benchmark indipendenti.