Claude Mythos: Il modello IA troppo pericoloso per essere rilasciato

Anthropic ha svelato Claude Mythos Preview, il loro modello più potente, ma bloccato dietro Project Glasswing. Ha trovato zero-day in ogni sistema operativo principale in modo autonomo.

Claude Mythos: Il modello IA troppo pericoloso per essere rilasciato

L'annuncio

L'8 aprile 2026, Anthropic ha svelato Claude Mythos Preview, descritto come il loro modello di intelligenza artificiale più potente mai costruito. A differenza di tutte le versioni precedenti di Claude, Mythos non è disponibile al grande pubblico. L'accesso è limitato esclusivamente a ricercatori di sicurezza e partner industriali attraverso Project Glasswing — un consorzio di cybersicurezza intersettoriale che comprende AWS, Apple, Microsoft, Google, NVIDIA, Cisco, CrowdStrike, JPMorganChase e la Linux Foundation.

Non è un lancio di prodotto. È una polizza assicurativa.

Cosa può fare Claude Mythos

Le capacità rivelate nella scheda di sistema e nei benchmark di Mythos sono straordinarie — ed è esattamente per questo che Anthropic non lo rilascia ai consumatori.

Autonomia zero-day

In esercizi di red-team controllati, Claude Mythos ha scoperto autonomamente vulnerabilità zero-day in ogni sistema operativo principale:

  • OpenBSD: Una vulnerabilità vecchia di 27 anni, precedentemente sconosciuta alla comunità di sicurezza
  • FFmpeg: Una vulnerabilità critica vecchia di 16 anni
  • Kernel Linux: Vulnerabilità di escalation dei privilegi

Non era scriptato. Mythos ha analizzato in modo indipendente il codice sorgente, identificato le falle sfruttabili e le ha documentate in formati immediatamente utilizzabili dagli sviluppatori di exploit.

Dominio dei benchmark

Il divario di prestazioni tra Mythos e Opus 4.6 non è incrementale — è categorico. Secondo la scheda di sistema pubblicata da Anthropic, questi punteggi rappresentano il più grande salto generazionale nella storia di Claude:

BenchmarkClaude MythosOpus 4.6Divario
SWE-bench Verified77,8%53,4%+45%
Terminal-Bench59%27,1%+117%
CyberSec83,1%66,6%+25%

Opus 4.6 rappresenta già la frontiera dell'IA in produzione. Mythos lo lascia indietro in ogni dominio misurato.

Perché esiste Project Glasswing

La decisione di Anthropic di creare Glasswing — e di non rilasciare Mythos pubblicamente — riflette una maturazione nel modo in cui i laboratori di IA pensano alla sicurezza, al deployment e al rischio. Questo si allinea con il più ampio impegno di Anthropic verso lo sviluppo responsabile dell'IA, che prioritizza la validazione della sicurezza prima del deployment commerciale.

La logica

Anthropic potrebbe monetizzare Mythos immediatamente. I prezzi di accesso anticipato (25 $/125 $ per milione di token di input/output dopo il periodo di anteprima) sarebbero altamente redditizi. Invece, hanno scelto di:

  1. Limitare l'accesso a ricercatori di sicurezza verificati e partner industriali
  2. Anticipare il red-teaming attraverso il consorzio Glasswing piuttosto che rispondere agli incidenti post-deployment
  3. Isolare il modello mentre vengono sviluppate le misure di protezione
  4. Promettere che le future versioni di Opus riceveranno prima queste protezioni, stabilendo un precedente secondo cui le capacità aspettano la sicurezza, non viceversa

È l'opposto della norma del settore: muoversi velocemente, scalare ampiamente, correggere le vulnerabilità man mano che vengono scoperte in produzione. Anthropic dice: Mythos è troppo pericoloso per muoversi velocemente. Testatelo a fondo. Poi limitatelo.

L'impegno finanziario

Secondo l'annuncio del Project Glasswing di Anthropic:

  • 100 milioni di dollari in crediti di utilizzo impegnati per i partner Glasswing
  • 4 milioni di dollari donati alle organizzazioni di sicurezza open-source

Non sono spese di marketing. Questo è il costo della divulgazione responsabile su larga scala.

Cosa significa per gli sviluppatori

Per la maggior parte: nulla cambia (per ora)

Se oggi utilizzi l'API Claude, Bedrock o Vertex AI, sei su Opus 4.6 o modelli precedenti. Claude Mythos non sarà nel tuo stack di produzione — non ancora, forse mai nella sua forma attuale.

Le misure di protezione sviluppate ora finiranno per comparire nelle future versioni di Opus. Ciò significa prestazioni migliori, ma anche sistemi di IA più difensivi — più difficili da aggirare, meno propensi a scoprire e weaponizzare autonomamente le vulnerabilità.

Questo tipo di decisione di deployment orientata alle policy non è nuova per Anthropic. All'inizio di aprile 2026, il divieto di OpenClaw dagli abbonamenti Claude ha mostrato uno schema simile: restrizioni di capacità implementate rapidamente, con un preavviso di 24 ore, prima che il mercato potesse adattarsi. Per i builder che si affidano all'infrastruttura Anthropic, entrambe le decisioni portano lo stesso messaggio: l'accesso API è più stabile dell'accesso tramite abbonamento.

Per i ricercatori di sicurezza: accesso sbloccato

Se fai parte di Glasswing o sei approvato dal consorzio, Mythos è disponibile su:

  • API Claude (Anthropic)
  • Amazon Bedrock
  • Google Vertex AI
  • Microsoft Foundry

Questo trasforma effettivamente 50+ organizzazioni in un red-team coordinato, che testa simultaneamente lo stesso modello e segnala le vulnerabilità attraverso canali strutturati.

Il precedente

Questo modello di "restrizione delle capacità + red-teaming in consorzio + sviluppo di misure di protezione + rilascio controllato" è nuovo. Se funziona, ci si aspetta che altri laboratori adottino schemi simili. Se fallisce — se Mythos trapela, se le vulnerabilità sfuggono alla revisione di Glasswing — l'intero settore impara che le restrizioni alle capacità non reggono e torna al deployment aperto.

Il contesto più ampio

La commoditizzazione dei modelli continua

Nel frattempo, le alternative open-source accelerano:

  • Nemotron 3 Super 120B (NVIDIA): Gratuito, 7x più veloce grazie all'arrotondamento selettivo e agli strati Mamba
  • GLM 5.1 (Z.ai): 754 miliardi di parametri, licenza MIT, già su HuggingFace

Il paradosso: man mano che le capacità frontier vengono limitate, le alternative a pesi aperti guadagnano terreno. La decisione di Anthropic di limitare Mythos potrebbe in realtà accelerare la domanda di modelli aperti, anche se meno capaci.

Questa dinamica è centrale nel panorama degli agenti di codice IA nel 2026: il divario tra strumenti frontier e open si sta riducendo più velocemente del previsto, e i modelli bloccati potrebbero spingere gli sviluppatori verso alternative prima di quanto i laboratori intendano.

La timeline 2028 di Sam Altman

Il CEO di OpenAI Sam Altman ha dichiarato all'inizio di aprile 2026 che si aspetta capacità di "ricercatore automatizzato" entro marzo 2028 — IA in grado di condurre indipendentemente ricerche scientifiche inedite, eseguire esperimenti e pubblicare risultati. Se Mythos è una prova di concetto per questa tempistica, la previsione di Altman è diventata più credibile.

Anche il contesto dei finanziamenti è rilevante: il round da 122 miliardi di dollari di OpenAI a una valutazione di 852 miliardi di dollari segnala che gli investitori credono che questa tempistica sia plausibile — e che chi possiede le capacità frontier entro il 2028 possiede il mercato.

L'analisi di Context Studios

Seguiamo la filosofia di deployment di Anthropic dai primi giorni di Claude. Ciò che colpisce di Mythos non è il salto di capacità — è la moderazione istituzionale. La maggior parte dei laboratori avrebbe affrettato Mythos in beta per battere la roadmap Q2 di OpenAI. Anthropic non l'ha fatto.

Per i builder di IA, questo ha un'implicazione concreta: gli strumenti che integrate oggi potrebbero comportarsi molto diversamente tra 18 mesi, man mano che i vincoli di sicurezza del red-teaming in stile Glasswing si propagano nei modelli di produzione. Se stai costruendo sull'API Claude, i tuoi agenti diventeranno più sicuri, più cauti e potenzialmente meno autonomi nel tempo — by design. Tieni conto di questo nelle tue decisioni architetturali adesso.

Lettura correlata: OpenAI Codex passa al pay-as-you-go — un altro segnale di quanto rapidamente stia cambiando l'economia degli sviluppatori degli strumenti IA nel 2026.

Domande frequenti

Claude Mythos è disponibile al pubblico? No. Ad aprile 2026, Claude Mythos è limitato ai membri del Project Glasswing — ricercatori di sicurezza verificati e partner aziendali tra cui AWS, Google, Microsoft, Apple, NVIDIA, Cisco, CrowdStrike, JPMorganChase e la Linux Foundation. Non c'è una lista d'attesa pubblica né una data di rilascio annunciata.

Come si confronta Mythos con Claude Opus 4.6? Nei benchmark chiave, Mythos supera significativamente Opus 4.6: SWE-bench Verified 77,8% contro 53,4% (+45%), Terminal-Bench 59% contro 27,1% (+117%) e CyberSec 83,1% contro 66,6% (+25%). Il divario è categorico, non incrementale — il più grande salto generazionale nella storia di Claude.

Cos'è Project Glasswing? Glasswing è il consorzio di cybersicurezza intersettoriale di Anthropic. Comprende 50+ organizzazioni ed è supportato da 100 milioni di dollari in crediti di utilizzo Mythos e 4 milioni di dollari in donazioni per la sicurezza open-source. Il suo scopo è il red-teaming coordinato di Mythos prima di qualsiasi rilascio più ampio.

Claude Mythos sarà mai rilasciato pubblicamente? Anthropic non si è impegnata su una tempistica di rilascio pubblico. Ha dichiarato che i futuri modelli Opus incorporeranno le misure di protezione sviluppate attraverso Glasswing — il che significa che le capacità di livello Mythos appariranno eventualmente nei modelli di produzione, ma con restrizioni.

Cosa significa Mythos per i builder di IA oggi? Se utilizzi l'API Claude, nulla cambia immediatamente. Aspettati che i futuri modelli Opus siano più capaci ma anche più difensivamente vincolati man mano che gli apprendimenti di Glasswing si propagano in produzione. Pianifica per agenti che diventano progressivamente più sicuri — e meno autonomi — nel tempo.

Punti chiave

  1. Mythos esiste e funziona. Anthropic non ha annunciato promesse vuote. I benchmark e le scoperte di vulnerabilità sono reali.

  2. Il laboratorio ha fatto un calcolo del rischio. Rilasciarlo sarebbe redditizio nel Q2 2026. Non rilasciarlo riduce il rischio esistenziale nella finestra 2026-2028 in cui le capacità di IA autonoma maturano rapidamente.

  3. Questo è un nuovo schema di deployment. Accesso limitato + red-teaming in consorzio + misure di protezione progressive + rilascio pubblico eventuale (se sicuro) potrebbe diventare lo standard per i modelli frontier.

  4. Il vantaggio del primo entrante conta, ma conta anche non essere il laboratorio che ha causato la prima grande vulnerabilità scoperta dall'IA da weaponizzare. Anthropic scommette che la reputazione di sicurezza vale più dei ricavi del Q2.

  5. La vera storia non riguarda Mythos. Riguarda ciò che accade dopo. Quali vulnerabilità trova Glasswing? Quanto tempo prima che le misure di protezione siano ritenute sufficienti? Come sarà la prossima versione di Opus?

Condividi articolo

Share: