Tag: VeraRubin

  • GTC 2026: Jensen Huang lancia l’era dell’inferenza, la partita da mille miliardi che ridefinisce l’AI

    Al keynote della GTC 2026, il CEO di NVIDIA Jensen Huang ha dichiarato che l’intelligenza artificiale sta entrando nell’era dell’inferenza (inference inflection point).
    Il valore non è più principalmente nella fase di training dei modelli, ma nel loro utilizzo su larga scala in produzione.
    Huang ha annunciato una previsione aggiornata di almeno 1 trilione di dollari in ordini e ricavi dai sistemi Blackwell e Vera Rubin tra il 2025 e il 2027, raddoppiando le stime precedenti.
    Il messaggio è chiaro: l’inferenza diventa il workload dominante, trasformando l’AI in un’infrastruttura industriale continua fatta di “token factories” e agentic AI.
    Tra gli annunci principali, la nuova piattaforma full-stack Vera Rubin (con sette chip, Vera CPU e integrazione con Groq 3 LPU), i reference design per AI Factories e l’enfasi su efficienza, latenza e produzione costante di valore economico.
    L’evento ridefinisce NVIDIA non più solo come fornitore di chip, ma come architetto di fabbriche AI su scala planetaria.

    Link alla fonte:
    https://www.cnbc.com/2026/03/16/nvidia-gtc-2026-ceo-jensen-huang-keynote-blackwell-vera-rubin.html

  • NVIDIA presenta Vera Rubin (NVL72): 72 GPU unite da NVLink per spingere l’AI oltre la legge di Moore

    NVIDIA ha svelato “Vera Rubin”, un nuovo supercomputer a scala rack (NVL72) che integra 72 GPU collegate tramite NVLink per operare come un unico sistema ad altissima banda e bassa latenza.
    Il progetto nasce dall’esigenza di colmare il divario tra crescita esplosiva dei modelli AI e limiti fisici/energetici dei data center, puntando su un redesign verticale dell’intero stack: CPU Vera, GPU Rubin, networking ConnectX-9, switch NVLink di nuova generazione e componenti dedicati alla memoria contestuale.
    Tra le innovazioni chiave spiccano l’efficienza “per watt” (cruciale in data center con budget di potenza fisso), nuove logiche di calcolo come NVFP4 TensorCore e un assemblaggio drasticamente semplificato (fino a “zero cavi” e montaggio in pochi minuti) con raffreddamento a liquido ottimizzato.
    L’obiettivo dichiarato è ridurre il costo per token e rendere praticabili carichi di training/inferenza su scala molto più grande, abilitando una nuova ondata di applicazioni e robotica avanzata.

    Link alla fonte:
    https://www.dday.it/redazione/55846/vera-rubin-il-nuovo-super-computer-nvidia-e-un-miracolo-di-ingegneria