Categoria: News

GTC 2026: Jensen Huang lancia l’era dell’inferenza, la partita da mille miliardi che ridefinisce l’AI

Al keynote della GTC 2026, il CEO di NVIDIA Jensen Huang ha dichiarato che l’intelligenza artificiale sta entrando nell’era dell’inferenza (inference inflection point).
Il valore non è più principalmente nella fase di training dei modelli, ma nel loro utilizzo su larga scala in produzione.
Huang ha annunciato una previsione aggiornata di almeno 1 trilione di dollari in ordini e ricavi dai sistemi Blackwell e Vera Rubin tra il 2025 e il 2027, raddoppiando le stime precedenti.
Il messaggio è chiaro: l’inferenza diventa il workload dominante, trasformando l’AI in un’infrastruttura industriale continua fatta di “token factories” e agentic AI.
Tra gli annunci principali, la nuova piattaforma full-stack Vera Rubin (con sette chip, Vera CPU e integrazione con Groq 3 LPU), i reference design per AI Factories e l’enfasi su efficienza, latenza e produzione costante di valore economico.
L’evento ridefinisce NVIDIA non più solo come fornitore di chip, ma come architetto di fabbriche AI su scala planetaria.

Link alla fonte:
https://www.cnbc.com/2026/03/16/nvidia-gtc-2026-ceo-jensen-huang-keynote-blackwell-vera-rubin.html

Aprile 1, 2026
Pretext riscrive il layout web: Cheng Lou introduce un nuovo standard ad alte prestazioni

L’ingegnere Cheng Lou ha lanciato Pretext, una libreria open source che promette di rivoluzionare il layout del testo sul web eliminando la dipendenza dal DOM e i costosi processi di reflow.
Sviluppata con il supporto di strumenti AI come OpenAI Codex e Claude, la soluzione consente di calcolare il layout dei testi tramite pura matematica, raggiungendo prestazioni fino a 600 volte superiori rispetto agli approcci tradizionali.
Pretext introduce un modello “prepare + layout” che rende il rendering prevedibile e adatto a interfacce dinamiche, generative e ad alta frequenza.
Il progetto ha già ottenuto un’enorme trazione nella community, segnalando un possibile cambio di paradigma nello sviluppo frontend.
Le implicazioni sono profonde: il web potrebbe evolvere da documento statico a piattaforma programmabile simile a un motore grafico, spinta anche dall’accelerazione dell’AI-assisted coding.

Link alla fonte:
https://venturebeat.com/technology/midjourney-engineer-debuts-new-vibe-coded-open-source-standard-pretext-to

Aprile 1, 2026
Guardian AI: usiamo l’AI generativa (imprevedibile per definizione) sotto forma di agenti per controllare… altra AI agentica generativa?!?

Le grandi aziende tipo ServiceNow, insieme a una valanga di startup, stanno sviluppando i cosiddetti “guardian AI agents”: sistemi che dovrebbero sorvegliare e raddrizzare gli altri agenti AI quando questi decidono di “fare di testa loro”.

Funzionano più o meno così: un’app cloud che si collega via API a tutti gli altri agenti, stabilisce regole ferree (“non usare fonti random per i dati finanziari, grazie”), e se l’agente ribelle sgarra, il guardian interviene con alert o gli cambia il comportamento futuro.

Il bello è che, visto che noi umani non riusciamo più a stare dietro a questi sistemi che corrono più veloci di noi, abbiamo deciso la soluzione perfetta: usare AI generativa (notoriamente creativa, allucinatoria e un po’ anarchica) per controllare altra AI generativa potenzialmente ancora più anarchica.

Geniale, no?

Perché, giova ripeterlo: l’AI non “esegue le istruzioni”, ma genera contenuti, sempre e comunque, usando algoritmi statistici.

Alla fine resta solo la domanda classica, aggiornata al 2026:

“Quis custodiet ipsos IA custodes?”

Chi controllerà i controllori, quando anche loro sono fatti della stessa “pasta imprevedibile”?

https://www.theinformation.com/newsletters/applied-ai/guardian-apps-aim-stop-ai-agents-going-rogue

#AI #GenAI #Agenti #AIAgentica #Sicurezza

Aprile 1, 2026