AI Knowledge Base 2026

Glossario IA 2026

Definizioni chiare per l'era dell'IA Agentica e dell'Intelligenza Spaziale.

Capitale di rischio (VC)

Una forma di finanziamento in equity per startup in fase iniziale ad alta crescita. Nel settore IA, il finanziamento VC e diventato critico per la scalabilita.

Explore Concept

UX Agentica

Chain-of-Thought Prompting

Il prompting a catena di pensiero è una tecnica utilizzata per migliorare le capacità di ragionamento dei grandi modelli di linguaggio, incoraggiandoli a generare esplicitamente i passaggi intermedi di ragionamento che portano a una risposta finale. Questo consente agli utenti di osservare il processo di pensiero del modello e identificare potenziali errori.

Explore Concept

Business Agentico

Claude Code

Strumento CLI ufficiale di Anthropic per lo sviluppo software basato su agenti. Permette a Claude di interagire direttamente con file system, Git, terminali e browser. Funzionalità: Background Agents, integrazione LSP, connettività server MCP, editing multi-file. Lo standard de facto per il coding assistito da IA dal 2025.

Explore Concept

Ragionamento & Affidabilità

Claude Code

Strumento CLI ufficiale di Anthropic per lo sviluppo software basato su agenti. Consente a Claude di interagire direttamente con file system, Git, terminali e browser. Caratteristiche: Agenti in background, integrazione LSP, connettività server MCP, modifica di più file. Lo standard de facto per la codifica assistita da AI dal 2025.

Explore Concept

Business Agentico

Claude Code Review

Un sistema multi-agente di analisi delle pull request integrato nella piattaforma Claude Code di Anthropic. Invia agenti IA paralleli per esaminare le PR da diverse angolazioni, valida i risultati tramite uno strato critico e pubblica commenti classificati direttamente in GitHub. Lanciato il 9 marzo 2026 in anteprima di ricerca per Teams ed Enterprise.

Explore Concept

Ragionamento & Affidabilità

Claude Code Security

Claude Code Security è una funzionalità di scansione delle vulnerabilità integrata in Claude Code. Lanciata da Anthropic il 21 febbraio 2026, utilizza il ragionamento IA per comprendere il codice contestualmente e identificare vulnerabilità complesse che l'analisi statica tradizionale non rileva.

Explore Concept

Business Agentico

Claude Cowork

Un agente AI di Anthropic che opera sul tuo dispositivo, gestendo file ed eseguendo compiti complessi tramite linguaggio naturale.

Explore Concept

Business Agentico

Claude Cowork

Agente AI di Anthropic che opera sul tuo dispositivo per la gestione dei file e l'esecuzione di compiti complessi tramite linguaggio naturale.

Explore Concept

Ragionamento & Affidabilità

Claude Opus 4.6

Claude Opus 4.6 è il modello IA più potente di Anthropic all'inizio del 2026, eccellendo nel coding, ragionamento complesso e pensiero esteso. È classificato #1 su SWE-bench per compiti di ingegneria del software e alimenta Claude Code. La sua nuova integrazione PowerPoint sfida direttamente Microsoft Copilot.

Explore Concept

Business Agentico

Claude Skills

Pacchetti di istruzioni riutilizzabili per Claude Code che incapsulano conoscenze e workflow specifici del progetto in unità richiamabili.

Explore Concept

Ragionamento & Affidabilità

CLAUDE.md

Un file di configurazione a livello di progetto per Claude Code che fornisce contesto persistente, istruzioni e regole che l agente IA legge all inizio di ogni sessione.

Explore Concept

Ragionamento & Affidabilità

Codebase IA-Native

Architettura software progettata da zero per essere facilmente mantenuta, aggiornata ed estesa sia da umani che da agenti IA.

Explore Concept

Ragionamento & Affidabilità

Codex App

L'applicazione macOS di OpenAI per gestire simultaneamente più agenti IA di codifica con esecuzione parallela.

Explore Concept

Inferenza & Ingegneria

Context Engineering

La disciplina sistematica di strutturare e prioritizzare in modo ottimale tutte le informazioni rilevanti per un task IA – il nuovo paradigma oltre il Prompt Engineering.

Explore Concept

Ragionamento & Affidabilità

Context Engineering

La pratica di progettare e gestire sistematicamente l intero contesto fornito a un LLM incluse istruzioni esempi output degli strumenti e memoria per un comportamento affidabile in produzione.

Explore Concept

Economia & Scalabilità

Caching Semantico

Una tecnica che memorizza le risposte IA per query simili (non solo identiche), permettendo al sistema di servire risposte istantaneamente senza nuovi costi API.

Explore Concept

Ragionamento & Affidabilità

Chain-of-Thought (CoT)

Una tecnica di prompting e ragionamento dove i sistemi IA articolano la loro logica passo-passo, migliorando trasparenza e accuratezza nei task complessi.

Explore Concept

Infrastruttura Agentica

Chrome DevTools Protocol (CDP)

Protocollo per il controllo programmatico dei browser Chromium.

Explore Concept

Infrastruttura Agentica

CI/CD Pipeline

Un insieme di processi automatizzati per l'integrazione continua delle modifiche al codice (CI) e la loro consegna o distribuzione negli ambienti di produzione (CD). Le pipeline CI/CD includono tipicamente fasi di test automatizzati, costruzione e distribuzione.

Explore Concept

Ragionamento & Affidabilità

Claude

Un modello AI di Anthropic, noto per il ragionamento complesso, le revisioni del codice sfumate e le decisioni architettoniche.

Explore Concept

Ragionamento & Affidabilità

Claude Code Agent SDK

Un kit di sviluppo software di Anthropic progettato per semplificare la creazione e il deployment di agenti IA, specificamente adattato per l'uso con il modello Claude.

Explore Concept

Business Agentico

Claude Cowork

Lo strumento di automazione desktop di Anthropic, costruito sul modello di IA Claude, progettato per assistere in vari compiti direttamente dal computer dell'utente.

Explore Concept

Ragionamento & Affidabilità

Claude Cowork

La funzionalità di automazione desktop di Anthropic che permette a Claude di osservare e interagire con lo schermo. Lanciato inizio 2026.

Explore Concept

Business Agentico

Claude Cowork plug-ins

Strumenti di IA specifici per il settore sviluppati da Anthropic progettati per automatizzare i flussi di lavoro professionali in aree come l'analisi legale e finanziaria e le operazioni aziendali.

Explore Concept

Infrastruttura Agentica

CLAUDE.md

Un file di configurazione a livello di progetto per Claude Code che fornisce contesti persistenti, istruzioni e regole che l'agente IA legge all'inizio di ogni sessione per comprendere le convenzioni e i requisiti del progetto.

Explore Concept

Business Agentico

CLI Coding Agent

Uno strumento alimentato da AI che opera attraverso un'interfaccia a riga di comando (CLI) per generare e gestire codice in modo autonomo.

Explore Concept

Business Agentico

Clinical Documentation Agent (CDA)

Un agente IA progettato per automatizzare la creazione di documentazione medica, estraendo dati strutturati dalle conversazioni tra medici e pazienti e popolando le cartelle cliniche elettroniche.

Explore Concept

Business Agentico

Codex App

L'applicazione desktop macOS di OpenAI per gestire e orchestrare più agenti di codifica AI.

Explore Concept

Ragionamento & Affidabilità

Coding Agentis

Un approccio allo sviluppo software in cui agenti IA eseguono autonomamente attività di codifica multi-step — scrivere codice, testare, revisionare PR e iterare — con un intervento umano minimo. A differenza dell'autocompletamento IA, il coding agentis prevede un'IA che pianifica ed esegue interi workflow di sviluppo.

Explore Concept

Sicurezza IA & Guardrail

Cognitive Offloading

La strategia di delegare il lavoro di pensiero routinario ai sistemi IA per liberare capacità umana per task strategici e creativi.

Explore Concept

Business Agentico

Competenze degli agenti

Capacità modulari che possono essere aggiunte agli agenti IA, consentendo loro di eseguire compiti specifici come gestione file, chiamate API o analisi dati. Una funzionalità chiave nelle architetture moderne di agenti IA.

Explore Concept

Business Agentico

Computer Use (GUI Agents)

Agenti IA capaci di controllare interfacce utente grafiche (GUI) come farebbe un umano — cliccando, digitando e navigando nelle applicazioni software.

Explore Concept

Business Agentico

Connessione orizzontale (IA)

La connessione tra agenti IA per comunicazione e collaborazione. ACP gestisce questa dimensione.

Explore Concept

Ragionamento & Affidabilità

Consolidamento delle Piattaforme

La tendenza a sostituire molteplici strumenti specializzati con piattaforme più complete. Nell'era dell'IA, le super app IA assorbono funzioni di prodotti SaaS separati, riducendo la proliferazione software.

Explore Concept

Fiducia & Sovranità

Container sandbox

Un ambiente sicuro e isolato per l'esecuzione di applicazioni che limita l'accesso alle risorse di sistema. Critico per il deployment di agenti IA enterprise.

Explore Concept

Ragionamento & Affidabilità

Context Compaction

La compattazione del contesto è il processo di riduzione delle dimensioni della finestra di contesto di un modello linguistico mantenendo le informazioni rilevanti, consentendo sessioni più lunghe e stabili. Permette ai sistemi di IA di gestire conversazioni prolungate senza perdere contesto critico.

Explore Concept

Business Agentico

Context Fork

Un meccanismo per creare ambienti di esecuzione isolati all interno di un agente IA, prevenendo l inquinamento del contesto.

Explore Concept

Inferenza & Ingegneria

Context Rot

Il graduale decadimento della rilevanza delle informazioni di contesto nelle lunghe conversazioni IA, quando le istruzioni precedenti vengono sovrascritte o dimenticate dalle nuove.

Explore Concept

Ragionamento & Affidabilità

Context Rot

Il deterioramento delle prestazioni di un modello IA quando la finestra di contesto si riempie di informazioni irrilevanti obsolete o contraddittorie.

Explore Concept

Ragionamento & Affidabilità

Context Window

La quantità massima di testo (misurata in token) che un grande modello di linguaggio può elaborare in un'unica interazione. Finestre di contesto più grandi consentono ai modelli di gestire documenti più lunghi e mantenere una maggiore cronologia delle conversazioni.

Explore Concept

Inferenza & Ingegneria

Context Window Optimization

L'ottimizzazione della finestra di contesto implica tecniche per massimizzare l'uso efficace della finestra di contesto di un modello linguistico, inclusa la strutturazione strategica dei prompt, l'augmentazione del recupero e la potatura del contesto per gestire informazioni che superano i limiti nativi.

Explore Concept

Ragionamento & Affidabilità

Context: Fork

Un meccanismo per creare ambienti di esecuzione isolati all'interno di un agente IA, prevenendo la contaminazione del contesto tra diverse abilità o compiti.

Explore Concept

Business Agentico

Continuità di Sessione

La continuità di sessione si riferisce alla capacità di un agente AI o di un sistema di mantenere lo stato, il contesto e il progresso di un compito in corso attraverso interruzioni, riavvii o cambi di sessione. Poiché i LLM sono intrinsecamente privi di stato (nessuna memoria a lungo termine incorporata), la continuità deve essere implementata esplicitamente tramite meccanismi esterni. La sfida fondamentale: ogni nuova conversazione LLM inizia senza conoscenza delle interazioni precedenti. Per i task di agenti di lunga durata — come un progetto di ricerca multi-giorno o un processo di contenuto in esecuzione continua — questo è problematico. La soluzione risiede in archivi di stato esterni e handoff di contesto strutturati. Le strategie di implementazione per la continuità di sessione includono: file di memoria (lo stato è salvato in file di testo su disco, caricati alla ripresa), database vettoriali, oggetti di stato strutturati (documenti JSON che rappresentano lo stato completo dell'agente), e log di eventi. L'architettura di continuità di sessione tipicamente coinvolge più livelli: una hot cache per il contesto recente, un archivio di memoria semantica per la conoscenza a lungo termine, e un log di eventi per la riproducibilità completa.

Explore Concept

Ragionamento & Affidabilità

Copilot Pro+

Copilot Pro+ è il livello di abbonamento premium di GitHub per il coding IA che fornisce accesso a funzionalità avanzate tra cui Agent HQ, supporto multi-agente e utilizzo illimitato di Copilot. Si rivolge agli sviluppatori professionisti che necessitano dell'esperienza completa di sviluppo alimentato dall'IA.

Explore Concept

Economia & Scalabilità

Costo di Inferenza

Il costo di inferenza si riferisce alle spese finanziarie sostenute nell'operare un modello linguistico AI. A differenza dei costi di addestramento (una tantum, molto elevati), i costi di inferenza si accumulano continuamente e rappresentano il principale fattore di costo AI nelle operazioni continuative. I costi di inferenza sono addebitati a prezzo per token. Nel 2026: GPT-4o circa $2–5/M token di input; Claude Sonnet a $3/M input, $15/M output; modelli più accessibili come Haiku o Gemini Flash $0,25–1/M token. I token di output costano più dei token di input, quindi i sistemi efficienti ottimizzano attivamente la lunghezza dell'output. I costi di inferenza sono calati di oltre 100× dal 2023. Le strategie di ottimizzazione chiave: routing dei modelli (modelli economici per compiti semplici), inferenza batch (sconto 50–75%), ottimizzazione dei prompt (richiedere output più brevi), caching delle richieste frequenti.

Explore Concept

Infrastruttura Agentica

Chip di Inferenza

Un chip di inferenza è un processore a semiconduttori specializzato ottimizzato per eseguire efficientemente modelli AI durante l'inferenza. A differenza delle CPU general-purpose o delle GPU ottimizzate per l'addestramento, i chip di inferenza privilegiano throughput (TPS), efficienza energetica e bassa latenza per modelli già addestrati. Le tre categorie dominanti: GPU come le H100 e B200 Blackwell di NVIDIA, che eccellono attraverso architettura di calcolo massicciamente parallela e Tensor Core specializzati; TPU di Google, costruiti appositamente per le moltiplicazioni matriciali nelle reti neurali; e ASIC come l'LPU di Groq che raggiunge 500+ token/secondo, il CS-3 di Cerebras e i chip Inferentia di Amazon. La generazione Blackwell di NVIDIA (GB200, B200) ha ridisegnato il panorama: FP4 nativo consente 4× più operazioni per watt vs H100; 192 GB HBM3e contiene interamente anche i più grandi modelli frontier nella VRAM. Il rack GB200 NVL72 raggiunge 30× più throughput rispetto ai sistemi H100. La scelta del giusto chip di inferenza influenza profondamente costo, latenza e dimensione massima del modello.

Explore Concept

Business Agentico

Codice Agentivo Asincrono

Un workflow di sviluppo in cui un agente di codice AI gira autonomamente sulla macchina locale, eseguendo compiti per un periodo prolungato senza richiedere supervisione costante dello sviluppatore. Lo sviluppatore controlla periodicamente per rivedere i progressi, approvare azioni o fornire indicazioni. Abilitato da strumenti come Claude Code Remote Control.

Explore Concept

Business Agentico

Coding Agent

Un sistema AI che va oltre il completamento del codice per eseguire autonomamente compiti complessi di ingegneria del software come l'implementazione di funzionalità, la correzione di bug, l'esecuzione di test e la gestione dei flussi di lavoro git.

Explore Concept

Business Agentico

Coding Agentivo

Il coding agentivo (agentic coding) si riferisce a workflow di sviluppo software in cui agenti AI scrivono, testano, debuggano, rifattorizzano e iterano codice in modo autonomo con minima supervisione umana, operando su più passaggi per completare task di programmazione complessi. A differenza dei tradizionali assistenti di codice AI come GitHub Copilot — che suggeriscono completamenti o snippet in risposta ai prompt degli sviluppatori — i sistemi di coding agentivo ricevono istruzioni di alto livello ed eseguono piani multi-step: leggere codebase esistenti, scrivere nuove funzioni, eseguire test, interpretare messaggi di errore e correggere bug in un ciclo finché il task non è completato. Le principali piattaforme di coding agentivo includono Claude Code di Anthropic, Codex CLI di OpenAI, Cursor, Devin di Cognition AI e l'integrazione AI avanzata di Xcode di Apple. Questi sistemi sfruttano grandi modelli linguistici con capacità di uso degli strumenti, fornendo agli agenti accesso a file system, terminali, ambienti browser e API esterne. Il coding agentivo accelera lo sviluppo software delegando task implementativi ripetitivi, generazione di boilerplate, scrittura di test e refactoring ad agenti AI, liberando gli sviluppatori per concentrarsi su architettura e decisioni di prodotto. Le sfide chiave includono il mantenimento della correttezza del codice in sessioni agentive lunghe, l'evitare il context drift e garantire sandbox sicuri. In Context Studios utilizziamo strumenti di coding agentivo — in particolare Claude Code e Cursor — come componenti fondamentali del nostro workflow di sviluppo interno, consentendo iterazioni prototipali più rapide e generazione automatizzata di test per applicazioni AI dei clienti.

Explore Concept

Business Agentico

Computer Use AI

Il computer use AI si riferisce alla capacità degli agenti AI di operare direttamente un computer — spostare il mouse, fare clic, digitare testo, leggere il contenuto dello schermo e accedere alle applicazioni — esattamente come farebbe un utente umano. Questa capacità è stata introdotta nel 2024 da Anthropic con Claude come prima implementazione ampiamente disponibile. A differenza della tradizionale automazione del browser (che si basa su API strutturate, selettori CSS e script predefiniti), un agente di computer use lavora a livello di pixel: vede uno screenshot dello schermo, decide dove fare clic o cosa digitare, esegue l'azione e osserva il risultato. Questo approccio è universale — funziona con qualsiasi applicazione e qualsiasi sito web senza ingegneria specializzata. Le capacità pratiche includono: navigare qualsiasi sito web senza accesso API, interagire con applicazioni desktop, compilare moduli, estrarre dati da interfacce visive, ed eseguire workflow multi-step privi di interfacce programmatiche. Il computer use AI presenta anche limitazioni note: è più lento delle chiamate API dirette (poiché ogni passaggio richiede uno screenshot), più soggetto a errori in caso di modifiche UI inattese, e più costoso in consumo di token. Tuttavia, rimane l'unica opzione pratica per molte attività di automazione senza API.

Explore Concept

Business Agentico

Comunicazione Multi-Agente

La comunicazione multi-agente comprende i protocolli, i meccanismi e i pattern attraverso cui più agenti AI interagiscono, scambiano informazioni e coordinano compiti. Nei sistemi AI complessi, agenti specializzati collaborano frequentemente: un orchestratore coordina sotto-agenti per ricerca, scrittura, controllo qualità e pubblicazione. Modelli di comunicazione dominanti: orchestrazione diretta (un agente padre invoca sotto-agenti e integra gli output), MCP (Model Context Protocol) di Anthropic come protocollo standardizzato di chiamata strumenti, A2A (Agent-to-Agent Protocol) di Google come standard aperto per la comunicazione peer-to-peer, e sistemi basati su code di messaggi per la comunicazione asincrona. Decisioni di progettazione critiche: sincrono vs. asincrono; push vs. pull; gestione degli errori (cosa succede quando un sotto-agente fallisce?); gestione dello stato (come il contesto condiviso viene mantenuto coerente?). Ogni interfaccia agente-ad-agente deve essere esplicitamente specificata, versionata e testata indipendentemente. Esempio reale: un sistema multi-agente di creazione contenuti comprende un Agente di Ricerca, un Agente di Scrittura, un Agente Qualità e un Agente di Pubblicazione. Senza chiari contratti di comunicazione, i sistemi multi-agente diventano fragili.

Explore Concept

Sicurezza IA & Guardrail

Contaminazione dei Benchmark

La contaminazione dei benchmark si riferisce al problema in cui i dati di valutazione di un benchmark appaiono nei dati di addestramento di un modello, accidentalmente o intenzionalmente. Di conseguenza, il modello sembra performare meglio su quel benchmark di quanto effettivamente generalizzi a dati non visti — ha 'memorizzato' le risposte piuttosto che acquisire le capacità sottostanti. La contaminazione è una sfida sistemica: i moderni modelli linguistici si addestrano su vasti dati web; i benchmark popolari (MMLU, HumanEval, GSM8K, MATH) sono liberamente disponibili online, rendendo l'inclusione accidentale probabile. Incentivi economici creano anche condizioni per la contaminazione intenzionale. I sintomi includono: punteggi benchmark notevolmente migliori rispetto alle prestazioni su compiti reali; l'effetto 'MMLU shuffle' dove il riordino casuale delle scelte di risposta altera significativamente i punteggi — un segnale di contaminazione ben documentato. Le contromisure: benchmark privati tenuti segreti prima del rilascio; benchmark dinamici con domande generate giornalmente; rilevamento della contaminazione tramite analisi di sovrapposizione n-gram; affidarsi a valutazioni esterne indipendenti. Organizzazioni come METR, HELM e ARC Evals sviluppano metodologie sempre più resistenti alla contaminazione.

Explore Concept