La corsa all’oro dell’intelligenza artificiale sta prosciugando rapidamente l’unica risorsa di cui gli sviluppatori non possono fare a meno: la potenza di calcolo. Questa netta carenza di capacità sta causando frustrazione tra gli utenti esperti, costringendo le aziende a cancellare prodotti e provocando problemi di affidabilità.
Negli ultimi mesi, la domanda è esplosa per la cosiddetta IA “agente”, strumenti autonomi che svolgono compiti in modo indipendente. Le aziende stanno lottando per garantire la capacità di calcolo necessaria a servire una base di clienti in crescita che sta aumentando in modo significativo l’uso dell’IA.
«Tutti parlano di petrolio, ma penso che il mondo sia a corto soprattutto di token», ha affermato Ben Pouladian, ingegnere e investitore tecnologico. […] Storicamente, l’aumento dei prezzi è stato uno dei pochi modi per affrontare una crisi di offerta, ma una mossa del genere potrebbe essere pericolosa per le aziende leader, impegnate in una feroce competizione per acquisire utenti.
I prezzi per il noleggio orario delle GPU, i microchip utilizzati per addestrare ed eseguire i modelli, sono impennati dall’autunno. Anthropic, produttrice del chatbot Claude, è stata colpita da frequenti interruzioni e ha iniziato a contingentare l’offerta di calcolo durante le ore di punta. OpenAI ha abbandonato l’app di generazione video Sora, in parte per liberare risorse destinate ai prodotti di programmazione e aziendali basati su un nuovo modello.
L’uso di token nelle API di OpenAI è passato da sei miliardi al minuto in ottobre a 15 miliardi a fine marzo. Sarah Friar, CFO di OpenAI, ha ammesso: «Stiamo facendo dei compromessi molto difficili su progetti che non stiamo portando avanti perché non abbiamo abbastanza calcolo».
Verso la fine dello scorso anno, CoreWeave, una delle maggiori società di cloud IA, ha aumentato i prezzi di oltre il 20%. […] Secondo l’indice Ornn Compute Price, noleggiare uno dei chip Blackwell più avanzati di Nvidia costa oggi 4,08 dollari l’ora, un aumento del 48% rispetto a soli due mesi fa.
«C’è una crisi di capacità massiccia, diversa da qualsiasi cosa io abbia visto in oltre cinque anni di attività», ha dichiarato JJ Kardwell, CEO di Vultr. «Il problema è: perché non installiamo semplicemente più apparecchiature? I tempi di consegna sono troppo lunghi. I tempi di costruzione dei data center sono biblici e l’energia disponibile fino al 2026 è già stata tutta prenotata».
A causa della scarsa affidabilità, alcuni clienti aziendali stanno migrando verso altri fornitori. David Hsu, CEO di Retool, ha spiegato di essere passato ai modelli di OpenAI perché Anthropic «continua a cadere continuamente». L’affidabilità dei servizi core su internet viene solitamente misurata in “nove” (il 99,99% di uptime è lo standard), ma l’API di Anthropic ha registrato una percentuale del 98,95% negli ultimi 90 giorni.
Questi disservizi si verificano mentre Anthropic vive una crescita esplosiva: il suo tasso di ricavi annuali è passato dai 9 miliardi di dollari di fine 2025 ai 30 miliardi di aprile 2026. A fine marzo, l’azienda ha improvvisamente limitato il numero di token utilizzabili nelle ore di punta, scatenando le lamentele degli utenti sui social media. Boris Cherny, responsabile di Claude Code, ha risposto: «La capacità è una risorsa che gestiamo con attenzione e stiamo dando la priorità ai clienti che utilizzano i nostri prodotti e le API».







