La crisi dei budget IA: chi paga davvero per l'IA?

La crisi dei budget IA è arrivata nel momento in cui l'IA ha smesso di essere una voce di bilancio per diventare un contatore. Nel 2026, le aziende che avevano acquistato IA con licenze forfettarie vedono le bollette a consumo superare qualunque cifra avessero modellato i loro reparti finanziari — e chi ha approvato la spesa non è più sicuro di cosa abbia comprato.

La crisi dei budget IA è il passaggio del 2026 da abbonamenti IA forfettari e prevedibili a una fatturazione a consumo che cresce con l'utilizzo, esponendo le aziende a costi di token senza limiti che non avevano mai messo a budget. La soluzione non sono modelli più economici, ma trattare la governance del budget come una vera e propria infrastruttura per agenti.

Non è la stessa storia della nostra precedente analisi sull'economia dei token di Anthropic, che riguardava la capacità dei fornitori di modelli di generare profitti. Questa parla degli acquirenti — le imprese che oggi fissano fatture cresciute più in fretta del valore che riescono a dimostrare. La narrazione macro del giugno 2026 è semplice: il ritorno sull'investimento dell'IA ha sbattuto contro un muro e l'America delle imprese inizia a razionare.

Cos'è davvero la crisi dei budget IA

La crisi dei budget IA è un disallineamento strutturale tra il modo in cui l'IA viene venduta e quello in cui viene consumata. I fornitori sono passati dal posto forfettario alla fatturazione per token e l'utilizzo è esploso nel momento in cui gli agenti hanno potuto lavorare per minuti anziché secondi.

Per due anni la maggior parte dei team pagava un canone mensile fisso e trattava l'IA come qualsiasi altra voce SaaS. Quel calcolo è saltato con l'arrivo degli strumenti agentici. Un singolo ingegnere che avvia una sessione di coding agentico può bruciare centinaia o migliaia di dollari in token prima di pranzo, perché l'agente legge file, ragiona, riprova e scrive — ogni passaggio è una chiamata fatturabile. Forbes ha spiegato il meccanismo senza giri di parole: le licenze forfettarie rendevano invisibile la spesa in token perché il prezzo non si muoveva con l'utilizzo, ma «nel momento in cui uno strumento viene fatturato a consumo, ogni prompt, ogni lunga sessione di agente e ogni ampia finestra di contesto compare su una fattura dettagliata» (Forbes).

La crisi non sta nel fatto che l'IA sia diventata più cara per token. Sta nel fatto che la fatturazione a consumo ha fatto crescere il costo insieme all'adozione: più un'implementazione ha successo, più grande è la fattura, senza alcun tetto naturale.

L'entità della scommessa rende il problema urgente. Gartner prevede che la spesa globale in IA raggiungerà i 2.590 miliardi di dollari nel 2026, con un aumento del 47% rispetto al 2025 (VaaSBlock). Quando una categoria cresce così in fretta su un contatore a consumo, la funzione finanziaria prima o poi recupera il ritardo — e il 2026 è l'anno in cui lo ha fatto.

Come una licenza forfettaria è diventata una fattura da 500 milioni

La crisi ha un innesco preciso: rimuovere i limiti d'uso su uno strumento a consumo trasforma un'adozione entusiasta in un costo fuori controllo. Accesso illimitato moltiplicato per migliaia di utenti significa un contatore senza tetto.

Il dato più sorprendente dell'anno è anche il meno confermato. Un consulente IA ha dichiarato ad Axios che un cliente enterprise non nominato ha accumulato circa 500 milioni di dollari in un solo mese su Claude dopo aver omesso di impostare limiti d'uso, con il consumo di token esploso una volta concesso l'accesso senza restrizioni (TechStartups). Trattiamo quella cifra come riportata, ma non confermata: proviene da un singolo consulente che descrive un'azienda anonima e Anthropic non ha commentato. Ma è la direzione che conta, e la direzione è confermata ovunque.

Ciò che sembrava gestibile su piccola scala è diventato altra cosa nel momento in cui intere organizzazioni hanno adottato gli stessi strumenti tutte insieme. Lo schema è costante: uno strumento che sembrava gratuito con un piano forfettario diventa una passività mensile a cinque o sei cifre nell'istante in cui il modello di prezzo cambia sotto i piedi. Ecco perché «ci siamo dimenticati di impostare un tetto» non è una battuta: è l'intero rischio.

Le prove: Uber, Microsoft e la svolta del razionamento

Due aziende dal nome noto hanno trasformato un aneddoto in tendenza. Le prove arrivano da Uber, che ha esaurito un budget, e da Microsoft, che ha ritirato delle licenze — il tutto nell'arco di poche settimane.

I numeri di Uber sono l'illustrazione più netta: il 95% dei suoi ingegneri usa ormai strumenti di IA ogni mese, il 70% del codice committato proviene dall'IA e i costi mensili vanno dai 500 ai 2.000 dollari per ingegnere a seconda dell'utilizzo (Reddit). L'azienda avrebbe esaurito l'intero budget IA del 2026 in quattro mesi e il suo COO ha dichiarato che giustificare la spesa sta diventando sempre più difficile (Fortune). Quando una delle aziende più orientate all'IA della Silicon Valley «riparte da zero» sul budget dell'anno prossimo, il segnale è forte.

Uber ha riferito che il 70% del suo codice committato proviene ormai dall'IA e che i costi mensili vanno dai 500 ai 2.000 dollari per ingegnere — eppure ha esaurito il budget IA del 2026 in quattro mesi.

Microsoft ha compiuto la mossa più fredda. Il 15 maggio 2026 ha comunicato alla propria organizzazione di ingegneria che le licenze interne di Claude Code sarebbero state progressivamente dismesse, con l'accesso che terminerà il 30 giugno nella divisione Experiences and Devices e gli sviluppatori migrati verso GitHub Copilot CLI (Yahoo Finance; TopReviewed). Gli ingegneri avevano adottato pesantemente lo strumento agentico; la fatturazione a token ha reso il costo impossibile da ignorare. È la svolta del razionamento — non un divieto dell'IA, ma una decisione deliberata su quale IA, per chi e con quale tetto.

Perché è un problema di governance, non una pulizia contabile

La governance del budget è ormai un'infrastruttura per agenti indispensabile, non un ripensamento contabile. I team che sopravvivono alla crisi sono quelli che integrano i controlli di costo nello stack di agenti stesso, prima che arrivi la prima fattura.

Il riflesso è rincorrere un modello più economico. Aiuta al margine — lavori come Alibaba Qwen che fa sembrare Opus costoso sono concreti — ma cura un sintomo. Un modello più economico senza governance dell'uso continua a non avere un tetto; si sbatte semplicemente contro il muro più tardi. Il rimedio duraturo è architetturale. La contabilità dettagliata dei token di Simon Willison mostra perché: in un singolo task di un agente, i token di ragionamento e le query di ricerca — non l'input e l'output visibili — spesso dominano la fattura (Simon Willison). Non si può gestire ciò che non si vede, e la maggior parte dei team non vede dove vanno i propri token.

Questo ridefinisce il problema. La domanda non è «quale modello è il più economico» ma «quale lavoro merita di far girare un agente, e come fermiamo quelli che non lo meritano». Lo abbiamo già sostenuto: la governance del routing — inviare ogni task al modello giusto al prezzo giusto — è un piano di controllo, non un file di configurazione. La crisi dei budget rende l'argomento concreto: il routing è ormai una decisione di spesa, e le decisioni di spesa hanno bisogno di responsabili.

Il check pre-volo di cui ogni studio di sviluppo ha bisogno

Tre controlli trasformano un contatore senza tetto in un budget gestito: telemetria dei costi, contabilità per risultato e budget di routing. Nessuno di questi è esotico. Tutti devono esistere prima di scalare, non dopo.

Telemetria dei costi. Serve una visibilità dei token per task, per team e per agente in tempo reale, non una sorpresa mensile. La stessa disciplina che ha reso affidabili i workflow dinamici — osservare ogni passaggio compiuto da un agente — è ciò che li rende sostenibili. Se un ciclo di agente può girare senza supervisione, può anche perdere denaro senza supervisione; la strumentazione fa la differenza.

Contabilità per risultato. Leghi la spesa a un'unità di valore: dollari per pull request unita, per ticket risolto, per funzionalità rilasciata. I 500-2.000 dollari per ingegnere di Uber fanno paura solo se non si riesce a dire cosa abbiano comprato. Una volta che può dividere il costo per risultato, «costoso» diventa un numero che può difendere o tagliare — e una contromossa sui costi in stile Cursor diventa una decisione anziché un panico.

Budget di routing. Ponga un tetto alla spesa a livello del layer di routing, non della carta di credito. Assegni a ogni agente un budget, retroceda a modelli più economici quando un task non giustifica una chiamata di frontiera e richieda l'approvazione umana oltre una soglia. È la versione agentica di un limite di spesa, ed è l'unico controllo che avrebbe evitato il mese da 500 milioni.

Il rimedio in tre parti alla crisi dei budget IA: telemetria dei costi in tempo reale, contabilità per risultato che lega la spesa al lavoro effettivamente unito e budget di routing che pongono un tetto e retrocedono automaticamente prima che un essere umano veda la fattura.

Integri tutto questo e l'IA smette di essere un conto aperto. Le aziende che oggi razionano lo fanno con uno strumento grezzo — cancellare la licenza — perché non hanno mai costruito quello preciso. Uno studio che tratta il costo come un input di prima classe consegna lo stesso lavoro IA-nativo senza il colpo di frusta sul budget.

FAQ

Cos'è la crisi dei budget IA? È il passaggio del 2026 dagli abbonamenti IA forfettari a una fatturazione a consumo, che ha fatto crescere i costi con l'utilizzo ed esposto le aziende a bollette di token mai modellate. Gartner prevede una spesa in IA di 2.590 miliardi di dollari quest'anno (VaaSBlock).

Un'azienda ha davvero speso 500 milioni di dollari su Claude in un mese? È riportato ma non confermato. Un consulente IA ha dichiarato ad Axios che un cliente anonimo ha raggiunto circa 500 milioni dopo aver rimosso i limiti d'uso; Anthropic non ha commentato (TechStartups). Consideri la cifra indicativa, non verificata.

Perché Microsoft ha tagliato le licenze interne di Claude Code? La fatturazione a token rendeva i costi difficili da giustificare. Microsoft ha iniziato a dismettere l'accesso interno a Claude Code a metà maggio 2026, terminandolo nella divisione Experiences and Devices entro il 30 giugno e spostando gli sviluppatori su GitHub Copilot CLI (Yahoo Finance).

La risposta è semplicemente usare un modello di IA più economico? No. Un modello più economico senza governance dell'uso continua a non avere un tetto. Il rimedio duraturo è la telemetria dei costi, la contabilità per risultato e i budget di routing che pongono un tetto alla spesa prima che avvenga, come chiarisce la contabilità dei token di Simon Willison (Simon Willison).

Come dovrebbe mettere a budget l'IA agentica un'azienda? Leghi la spesa ai risultati, non ai posti. Uber riporta 500-2.000 dollari per ingegnere al mese con il 70% del codice di origine IA (Fortune); è difendibile solo se può misurare i dollari per modifica unita.

Conclusione

La crisi dei budget IA non è il segno che l'IA abbia fallito — è il segno che gli acquirenti sono maturati. L'IA a tariffa fissa nascondeva il contatore; il prezzo a consumo lo ha acceso; e le aziende colte senza governance oggi razionano con l'unico strumento che hanno. La risposta migliore è integrare i controlli di costo nello stack di agenti, così che l'IA resti un investimento e non un conto aperto.

È esattamente il lavoro che facciamo. Se la sua spesa in IA cresce più in fretta della fiducia che ripone in essa, ne parli con Context Studios: costruiamo la telemetria, la contabilità e la governance del routing che mantengono i sistemi agentici utili e sostenibili al tempo stesso.

Fonti

Forbes — Why Your Engineers' Favorite AI Tools Are Wrecking Your 2026 Budget: https://www.forbes.com/sites/janakirammsv/2026/05/26/why-your-engineers-favorite-ai-tools-are-wrecking-your-2026-budget
Fortune — Uber's COO says it's getting harder to justify the company's AI spend: https://fortune.com/2026/05/26/uber-coo-ai-spending-tokens-claude-code
Yahoo Finance — AI Cost Crisis Emerges as Claude Usage and Agentic Coding Bills Spiral: https://finance.yahoo.com/sectors/technology/articles/ai-cost-crisis-emerges-claude-195612806.html
TechStartups — Company accidentally spent $500 million on Claude AI in one month: https://techstartups.com/2026/05/28/company-accidentally-spent-500-million-on-claude-ai-in-one-month-after-forgetting-usage-limits
VaaSBlock — Corporate AI Spending ROI Enterprise Reckoning 2026 (Gartner 2.590 mld $): https://www.vaasblock.com/news/corporate-ai-spending-roi-enterprise-reckoning-2026
TopReviewed — Microsoft Drops Claude Code, Uber Burns Its AI Budget: https://topreviewed.ai/blog/microsoft-claude-code-uber-ai-budget-cost-management
Reddit r/artificial — Uber burned its entire 2026 AI coding budget in 4 months: https://www.reddit.com/r/artificial/comments/1t1mhx6/uber_burned_its_entire_2026_ai_coding_budget_in_4
Simon Willison — LLM pricing token accounting: https://simonwillison.net/tags/llm-pricing
Madrona — The End of Cheap AI? Anthropic's Growth & Claude Pricing: https://www.madrona.com/price-of-tokenmaxxing-claude-explosive-growth-cost-of-intelligence
CloudZero — Claude Pricing In 2026: Every Plan, API Cost & Strategy: https://www.cloudzero.com/blog/claude-pricing