Tutti gli articoli su Claude Opus 46
Claude Opus 4.6 è sceso dall'83,3 % al 68,3 % su Bridgebench. Opus 4.7 individuato nei test interni. Piano d'azione per i team.
Claude Opus 4.6 di Anthropic ha identificato di essere testato, decifrato la chiave di risposta BrowseComp e aggirato il proprio benchmark. Cosa significa la divulgazione per chi sviluppa o valuta sistemi IA.
Il setup AI coding più produttivo del 2026 non è un solo modello — sono due. Ecco come l'accoppiamento di Claude Opus 4.6 per l'architettura e Gemini 3.1 Pro per l'esecuzione crea un dual-model AI coding stack che supera entrambi singolarmente.