Qualche giorno fa Google ha silenziosamente cambiato le regole di Gemini Advanced. Sparita la politica del “hai X messaggi al giorno” (sistema rozzo ma onesto, come il tassametro di un taxi) ma un modello “compute-based” con finestra d’uso di 5 ore, che ricorda quello dei Claude. Traduzione: un prompt con un video allegato e un po’ di reasoning ti può bruciare la quota della mattinata prima che tu abbia finito di sorseggiare il tuo caffè (e farti innervosire più di quest’ultimo). Gli utenti hanno protestato. Google ha corretto (in parte) nel giro di 48 ore: gli errori non consumano più quota, il modello Flash-Lite diventa sostanzialmente gratuito, arrivano le statistiche sui consumi (Anthropic insegna, anche qui). Risposte rapide, comunicazione reattiva. Fin qui, quasi ammirevole. Il punto vero, però, è un altro. Non siamo di fronte a una correzione di rotta, ma a un “modello economico”: il “compute metering” è lo standard che ci ritroveremo ovunque, perché far girare un modello frontier su un’interrogazione agentica lunga e multimodale costa quanto nei primi anni di internet costava una connessione dial-up, in sostanza molto più di quanto il marketing voglia che tu sappia. Per l’utente medio potrebbe essere persino equo… in teoria: chi usa poco paga poco. Il problema è che “poco” e “tanto” li definisce Google, con metriche che per ora restano opache come certi contratti di hosting di vent’anni fa. Come formatore AI lo dico senza drammi: quando insegnate a usare questi strumenti, insegnate anche a usarli con cognizione di causa. Flash-Lite per i task semplici, modelli pesanti quando servono davvero. Non per risparmiare la quota, ma perché un professionista che spara un modello da venti miliardi di parametri per riformulare un’email ha già un problema che il compute metering non risolve. Del resto, diciamocelo, il cloud ha sempre funzionato così, e ora tocca anche all’AI, visto che sempre di data center e di server parliamo, con la differenza che le risorse, in questo caso, costano davvero tanto a chi le gestisce (costo che prima o poi doveva ricadere sugli utilizzatori).
La startup Cowboy Space Corporation, fondata dal cofondatore di Robinhood Baiju Bhatt, ha annunciato un round Series B da 275 milioni di dollari con una valutazione post-money di 2 miliardi. L’azienda punta a risolvere uno dei principali colli di bottiglia dei futuri data center spaziali: la scarsità di razzi disponibili e i costi di lancio troppo elevati. Dopo essere nata come progetto di energia solare orbitale con il nome Aetherflux, la società ha cambiato strategia, decidendo di sviluppare internamente sia i satelliti-data center sia il proprio sistema di lancio. Cowboy Space vuole creare razzi dedicati esclusivamente al trasporto di infrastrutture AI in orbita, integrando direttamente i data center nel secondo stadio del vettore. La mossa la porta in competizione diretta con attori come SpaceX e Blue Origin, in un mercato che potrebbe diventare cruciale per sostenere la crescente domanda globale di calcolo AI.
Un maxi campus di datacenter sviluppato da QTS nella contea di Fayette, in Georgia, avrebbe utilizzato circa 29 milioni di galloni d’acqua tramite due connessioni non registrate, mentre ai residenti veniva chiesto di ridurre i consumi domestici a causa della bassa pressione idrica. Il progetto, controllato dal gruppo Blackstone e noto come “Project Excalibur”, è uno dei più grandi complessi AI-oriented in costruzione negli Stati Uniti, con fino a 16 edifici previsti e investimenti stimati per un miliardo di dollari. L’azienda sostiene che l’acqua sia stata usata principalmente per attività temporanee di costruzione e che, a regime, il sistema utilizzerà un raffreddamento “closed-loop” a riciclo interno. Il caso ha però sollevato forti critiche sulla trasparenza e sulla sostenibilità delle infrastrutture digitali, soprattutto in uno Stato già colpito da siccità e crescente pressione energetica legata ai datacenter. La vicenda evidenzia il conflitto sempre più acceso tra espansione dell’AI, consumo di risorse naturali e tutela delle comunità locali.
Anthropic starebbe valutando una nuova raccolta fondi da decine di miliardi di dollari per finanziare un’espansione massiccia della propria infrastruttura computazionale, con l’obiettivo di raggiungere una valutazione vicina ai 1.000 miliardi di dollari. Secondo il Financial Times, l’operazione potrebbe consentire alla società fondata da Dario Amodei di superare OpenAI nella corsa all’intelligenza artificiale generativa. Parallelamente, SpaceX ha annunciato un accordo che permetterà ad Anthropic di utilizzare Colossus 1, uno dei più potenti supercomputer AI esistenti, per aumentare la capacità dei servizi Claude Pro e Claude Max. Sul fronte competitivo, OpenAI ha risposto lanciando GPT-5.5-Cyber, una versione specializzata del proprio modello destinata ai team di cybersicurezza, mentre Anthropic continua a promuovere Claude Mythos attraverso il programma Project Glasswing. La notizia conferma come la competizione tra i grandi player dell’AI si stia spostando sempre più sull’accesso alla potenza di calcolo, sulle applicazioni strategiche per la sicurezza nazionale e sul sostegno politico-finanziario delle istituzioni statunitensi.
Il Dipartimento della Difesa degli Stati Uniti ha richiesto 46 miliardi di dollari per il 2027 per sviluppare un vasto ecosistema di infrastrutture dedicate all’intelligenza artificiale militare, denominato “Artificial Intelligence Arsenal”. L’iniziativa punta a sostituire l’attuale rete frammentata di cluster GPU con un sistema centralizzato composto da supercomputer AI, data center protetti e strutture certificate Scif per la gestione di informazioni sensibili. Una parte rilevante del budget, pari a 29,5 miliardi, sarebbe destinata all’acquisto di GPU di nuova generazione e capacità computazionali avanzate, mentre oltre 16 miliardi finanzieranno manutenzione, raffreddamento, sicurezza fisica ed energia. Il progetto si inserisce in un bilancio record da 1.500 miliardi di dollari per la difesa americana e riflette la crescente centralità dell’AI nei futuri scenari bellici, dove superiorità computazionale, gestione dei dati e autonomia strategica diventano elementi chiave della deterrenza. L’obiettivo dichiarato è costruire un ecosistema AI sovrano e controllato direttamente dal governo statunitense, riducendo dipendenze esterne e aumentando la resilienza operativa militare.
La startup americana Panthalassa ha raccolto 140 milioni di dollari in un round guidato da Peter Thiel per sviluppare data center oceanici alimentati dall’energia delle onde. Il progetto prevede enormi “nodi” galleggianti capaci di generare elettricità direttamente in mare aperto e alimentare server AI raffreddati naturalmente dall’acqua oceanica, riducendo il carico sulla rete elettrica terrestre. L’iniziativa nasce in risposta alla crescente domanda energetica dell’intelligenza artificiale, che sta spingendo le big tech verso soluzioni sempre più radicali, dal nucleare ai data center spaziali. Panthalassa sostiene che l’oceano aperto rappresenti una delle poche fonti energetiche in grado di sostenere l’espansione futura del calcolo AI su scala globale. Restano però numerose incognite legate a costi, manutenzione offshore, affidabilità tecnica, cybersecurity e reale convenienza economica rispetto ai data center tradizionali alimentati da energie rinnovabili terrestri.
SpaceX ha siglato un accordo strategico con Anthropic concedendo pieno accesso al supercluster AI “Colossus 1” di Memphis, composto da oltre 220.000 GPU NVIDIA e più di 300 megawatt di capacità computazionale. L’operazione arriva poche settimane prima della prevista IPO di SpaceX, che secondo le indiscrezioni potrebbe raggiungere una valutazione record di 1.750 miliardi di dollari. L’intesa rafforza la narrativa di SpaceX come infrastruttura chiave per l’intelligenza artificiale, dimostrando che il cluster nato dall’integrazione con xAI può servire anche clienti esterni oltre al chatbot Grok. Per Anthropic, l’accordo consentirà di aumentare significativamente i limiti di utilizzo di Claude Code e delle API Claude Opus, consolidando la competizione nel mercato dei modelli AI avanzati. Rilevante anche la clausola inserita da Elon Musk, che gli permette di revocare l’accesso alla potenza di calcolo qualora i modelli di Anthropic fossero considerati pericolosi per l’umanità.
Amazon annuncia un investimento potenziale fino a 25 miliardi di dollari in Anthropic, iniziando con 5 miliardi e prevedendo ulteriori tranche legate a obiettivi commerciali. L’operazione consolida la partnership strategica attorno allo sviluppo del chatbot Claude e all’infrastruttura cloud, ambito in cui Amazon mantiene una posizione dominante. Anthropic utilizzerà i chip proprietari Trainium per potenziare le capacità di calcolo necessarie all’addestramento dei modelli. L’accordo evidenzia la strategia di Amazon: compensare le difficoltà dei propri modelli AI con investimenti mirati e infrastrutture. Sullo sfondo, restano tensioni regolatorie tra Anthropic e l’amministrazione statunitense, che potrebbero influenzare il settore.
Il collo di bottiglia che nessuno vuole ammettere: la potenza di calcolo cresce più veloce dell’infrastruttura che dovrebbe sostenerla. Dati, tensioni e qualche previsione inquietante per il 2026-2028.
Il paradosso della macchina che “si mangia l’elettricità”
C’è qualcosa di quasi poetico — o forse tragicomico, dipende da quanto avete investito in GPU — nel fatto che la tecnologia più chiacchierata del decennio stia per sbattere la testa contro un problema vecchissimo: la corrente elettrica. Non parliamo di un limite teorico, di uno di quei colli di bottiglia che esistono solo nelle slide delle conferenze. Parliamo di un problema fisico, strutturale, documentato da IEA, Goldman Sachs, Morgan Stanley, Lawrence Berkeley National Lab e praticamente chiunque abbia voglia di fare i conti sul serio.
La domanda di compute — la potenza di calcolo necessaria ad addestrare, eseguire e scalare i modelli di intelligenza artificiale — cresce a un ritmo che le infrastrutture esistenti faticano a seguire. Non è che il mondo non stia investendo: sta investendo cifre che fino a cinque anni fa erano fantascienza. Il problema è che la domanda cresce ancora più in fretta. E quando domanda e offerta si separano così tanto, succedono cose sgradevoli: prezzi alle stelle, liste d’attesa, outage, limitazioni operative. Tutto quello che stiamo già vedendo.
Capire cosa sta succedendo davvero non è un esercizio accademico. Per chiunque gestisca un’azienda, pianifichi una strategia tecnologica o stia semplicemente cercando di capire perché certi servizi AI ogni tanto scompaiono come fantasmi, questo è il contesto dentro cui si muove tutto il resto.
Le leggi che hanno guidato il progresso (e i loro limiti)
Per capire il problema, bisogna partire da dove nasce. Negli ultimi anni, il progresso dei grandi modelli linguistici è stato guidato da un principio sorprendentemente semplice: più risorse metti, migliori risultati ottieni. Le scaling laws di Kaplan (OpenAI, 2020) e di Chinchilla (DeepMind, 2022) hanno dimostrato che le prestazioni dei modelli migliorano in modo prevedibile aumentando parametri, dati di addestramento e compute totale — misurato in FLOP, operazioni in virgola mobile per chi non ha ancora imparato l’acronimo.
Il problema è che questo principio, per quanto elegante, ha un costo crescente. Addestrare un modello frontier oggi richiede cluster di decine — a volte centinaia — di migliaia di GPU di fascia alta. E la domanda di queste GPU non sta rallentando: sta accelerando. Nel 2026, la capacità Hopper e Blackwell di Nvidia è spesso semplicemente esaurita. I provider cloud segnalano “massive capacity crunch” con tempi di attesa lunghi e prezzi in forte rialzo: il noleggio delle GPU Blackwell è salito del 48% in pochi mesi. Nvidia ha venduto l’intera produzione Blackwell fino a metà 2026. Jensen Huang definisce la domanda “sky high”. Gli ordini visibili parlano di centinaia di miliardi di dollari. Aziende come Anthropic hanno subito interruzioni frequenti con uptime sceso sotto il 99%.
La carenza non riguarda solo il silicio. Costruire un data center richiede anni: permessi, reti elettriche, sistemi di raffreddamento, manodopera specializzata. La densità di potenza dei server AI sta accelerando — rack che consumano decine di kilowatt invece di pochi — e l’infrastruttura esistente non era progettata per questo.
Il vero collo di bottiglia: elettricità
Se le GPU sono la parte visibile del problema, l’energia elettrica è quella strutturale. I data center AI consumano enormemente più energia di quelli tradizionali. I numeri, quando li metti in fila, fanno una certa impressione.
Nel 2024, il consumo globale dei data center ha raggiunto circa 415 TWh — circa l’1,5% dell’elettricità mondiale. Le proiezioni IEA per il 2030 indicano quasi 945 TWh, il doppio, con una crescita annua del 15%, quattro volte più veloce del resto dell’economia. I server accelerati per AI crescono al 30% annuo.
Negli Stati Uniti — che da soli rappresentano il 45% del consumo globale dei data center — la situazione è ancora più marcata. Dal 4,4% dell’elettricità nazionale nel 2023, si potrebbe arrivare a un range tra il 6,7% e il 12% entro il 2028. Goldman Sachs prevede un aumento della domanda di potenza dei data center del 160-165% dal 2023 al 2030, equivalente ad aggiungere al pianeta un nuovo paese tra i dieci maggiori consumatori energetici. Anthropic stima che solo il settore AI statunitense potrebbe richiedere 50 GW di nuova capacità entro il 2028: circa il doppio del picco di consumo di New York City.
Per dare un’idea concreta: xAI Colossus, il supercomputer di Elon Musk con 100.000 chip, richiede già 150 MW da solo. Morgan Stanley prevede 74 GW di domanda data center USA nel 2028, con un possibile shortfall di 49 GW per carenza di infrastrutture di rete. La potenza disponibile fino al 2026-2027 è già “spoken for” — prenotata, assegnata, non disponibile.
Le strozzature invisibili (ma ugualmente dolorose)
L’energia non è l’unico punto critico. La memoria HBM (High-Bandwidth Memory), componente essenziale delle GPU per AI, è esaurita in tutta la produzione near-term. I produttori stanno ridistribuendo capacità da altri settori — automotive, consumer electronics — verso l’AI, creando una cascata di shortage su CPU, SSD e HDD. Un settore che si ottimizza trascina con sé problemi in tutti gli altri.
Sul piano geografico, la competizione è globale: USA, Europa e Asia si contendono le stesse risorse, gli stessi chip, gli stessi materiali. I vincoli burocratici e la congestione della rete elettrica rallentano ulteriormente anche chi avrebbe le risorse per investire. I lead time per un data center significativo sono di due-cinque anni. In un settore che si muove su cicli di sei mesi, è un’eternità.
Il 2026-2028 come banco di prova
Il mismatch tra domanda e offerta è reale e rischia di produrre effetti concreti: rallentamento nell’addestramento dei nuovi modelli frontier, aumento dei costi di inferenza, outage e limitazioni per gli utenti enterprise. Alcune aziende stanno già spostando workload o riducendo i limiti di token nelle ore di punta. Non è disfunzione: è gestione di una carenza strutturale.
Esistono mitigazioni. Gli algoritmi migliorano l’efficienza computazionale, le architetture test-time compute e i modelli più piccoli e specializzati riducono il fabbisogno lordo. Sul fronte energetico, investimenti massicci puntano su nucleare modulare (SMR), gas, rinnovabili con storage e data center collegati direttamente alle centrali. Nvidia sta sviluppando l’architettura Rubin per la prossima generazione di GPU. Qualcosa si muove, ma si muove lento rispetto alla domanda.
Alcuni analisti parlano di possibile bullwhip effect: sovra-ordinazioni seguite da una temporanea sovraccapacità. La storia dei mercati tecnologici conosce bene questo schema. Ma la domanda di fondo — alimentata dalle applicazioni agentiche, dalla robotica, dagli usi enterprise — appare abbastanza robusta da non collassare nemmeno in uno scenario di rallentamento.
Cosa significa davvero questo per i prossimi anni
Il 2026-2028 non è solo una proiezione statistica. È il periodo in cui si capirà se la supply chain globale dell’AI — chip, energia, reti — riesce davvero a scalare alla velocità richiesta. Le previsioni convergono su una cosa sola: servono centinaia di miliardi di dollari di investimento, e servono ora. Non tra cinque anni.
Per chi prende decisioni tecnologiche o strategiche, il messaggio è duplice. Da un lato, i costi dell’AI non sono destinati a scendere nel breve termine come molti si aspettavano: la pressione sulla supply chain manterrà i prezzi alti. Dall’altro, chi riesce a garantirsi accesso a risorse computazionali — attraverso contratti a lungo termine, cloud ibrido, o infrastruttura propria — avrà un vantaggio competitivo reale e misurabile.
L’AI non ha smesso di crescere. Ha semplicemente incontrato i limiti fisici del mondo in cui deve crescere. E quei limiti, per una volta, non si aggirano con un aggiornamento software.
Fonti di riferimento: IEA World Energy Outlook 2024, Morgan Stanley Research, Goldman Sachs Global Investment Research, Lawrence Berkeley National Lab, Brookings Institution, Wall Street Journal.
Anthropic ha stretto un accordo strategico con Google e Broadcom per garantirsi almeno 3,5 GW di capacità computazionale basata su TPU a partire dal 2027, assicurando risorse cruciali per la crescita del modello Claude. L’intesa arriva mentre il fatturato annuale dell’azienda supera i 30 miliardi di dollari nel 2026, trainato da un rapido aumento dei clienti enterprise. Broadcom fornirà i chip progettati da Google, con un contratto valido fino al 2031, e gran parte dell’infrastruttura sarà costruita negli Stati Uniti. L’operazione riflette la necessità di anticipare colli di bottiglia nella disponibilità di calcolo, sempre più critici nel settore AI. Anthropic continua inoltre a diversificare l’hardware utilizzato, mantenendo Amazon AWS come partner principale per il training.
Zhao Haijun, co-CEO di Semiconductor Manufacturing International Co. (SMIC), ha lanciato un allarme sul possibile eccesso di investimenti nei data center dedicati all’intelligenza artificiale, paragonando l’attuale corsa infrastrutturale alla bolla dei data center cinesi dei primi anni 2020. Secondo il dirigente, le aziende stanno cercando di costruire in uno o due anni una capacità prevista per un intero decennio, senza una chiara visione sull’effettivo utilizzo futuro. Nonostante la forte domanda generata dall’AI generativa e dai large language model – che spinge colossi come Microsoft, Google e Meta a investire miliardi – resta il rischio di sovracapacità e infrastrutture sottoutilizzate. L’avvertimento è particolarmente significativo perché proviene da un attore centrale nella filiera globale dei semiconduttori, in grado di osservare direttamente le dinamiche di domanda e offerta. Il tema solleva interrogativi su sostenibilità economica, costi energetici e stabilità dell’attuale ciclo di espansione dell’AI.
Il forte calo del titolo Oracle, in discesa del 45% dai massimi, sta diventando un campanello d’allarme per l’intero boom dell’intelligenza artificiale.
L’azienda ha speso molto più del previsto in investimenti per data center dedicati a OpenAI, finanziando gran parte dell’espansione tramite debito e alimentando i timori degli investitori sulla sostenibilità finanziaria.
A complicare il quadro emergono limiti fisici: ritardi nella costruzione dei data center, carenze di materiali e lunghi tempi di consegna per componenti critici mostrano che l’AI non può crescere alla velocità del software.
Anche il mercato obbligazionario sta reagendo negativamente, con rendimenti in aumento e titoli Oracle che iniziano a essere classificati come “spazzatura”.
Il caso Oracle evidenzia così un doppio vincolo per l’AI: le leggi della fisica e quelle della finanza.
Masayoshi Son ha rivelato di aver venduto l’intera partecipazione di SoftBank in Nvidia per 5,83 miliardi di dollari, definendo l’operazione un sacrificio necessario nonostante il forte legame con l’azienda.
La scelta non deriva da sfiducia verso Nvidia né da timori di una bolla AI, ma dalla volontà di convertire profitti in liquidità per finanziare investimenti massicci in OpenAI, data center e robotica.
SoftBank punta infatti a costruire le infrastrutture e le piattaforme che, secondo Son, rappresenteranno il prossimo livello di valore nell’intelligenza artificiale.
La cessione, tuttavia, solleva dubbi tra alcuni analisti, che vedono nel “segnale Son” un possibile indicatore di rallentamento dell’euforia speculativa sui chip AI.
Il mercato osserva ora come verranno utilizzati i capitali liberati e se la strategia porterà SoftBank a guidare — o a inseguire — il nuovo ecosistema AI.
Amazon ha annunciato un investimento fino a 50 miliardi di dollari per potenziare l’infrastruttura AI e di supercalcolo destinata alle agenzie federali statunitensi, con lavori previsti dal 2026.
Il piano prevede la costruzione di nuovi data center avanzati che aggiungeranno circa 1,3 GW di capacità computazionale nelle regioni AWS Top Secret, Secret e GovCloud, integrando servizi come SageMaker, Bedrock e chip proprietari Trainium insieme a hardware Nvidia.
L’iniziativa risponde alle priorità dell’amministrazione USA in ambiti critici come difesa, cybersicurezza, sistemi autonomi e ricerca sanitaria, riducendo drasticamente i tempi di analisi e modellazione dei dati.
Il progetto include architetture energeticamente più efficienti e si inserisce nella crescente competizione tecnologica con la Cina, mentre l’ecosistema cloud americano supera i 200 miliardi di nuovi impegni grazie anche agli investimenti paralleli di Microsoft e Google.
Le nuove infrastrutture dovrebbero generare ricadute economiche significative, creando posti di lavoro e accelerando l’adozione dell’IA nel settore pubblico.
Sam Altman ha annunciato che OpenAI prevede di attivare oltre 1 milione di GPU entro la fine del 2025 per sostenere modelli avanzati come ChatGPT e Sora. L’ambizione, dichiarata in modo provocatorio, è di raggiungere 100 milioni di GPU, ma i costi stimati superano i 3.000 miliardi di dollari, rendendo il traguardo finanziariamente insostenibile al momento. Le difficoltà nel reperire risorse hanno costretto l’azienda a ridimensionare progetti come Stargate. Intanto, la concorrenza con Meta e la necessità di attirare nuovi investimenti rappresentano una sfida critica per l’espansione futura di OpenAI.