Blog

  • TurboQuant di Google rivoluziona la “compressione AI” riducendo memoria e costi senza perdita di precisione

    I ricercatori di Google Research presentano TurboQuant, un nuovo algoritmo di quantizzazione progettato per comprimere drasticamente i modelli AI senza perdita di accuratezza.

    La tecnica combina due innovazioni — QJL e PolarQuant — per ridurre fino a 6 volte la memoria del key-value cache, migliorando al contempo velocità e prestazioni nei modelli linguistici.

    TurboQuant riesce a operare con rappresentazioni a soli 3 bit mantenendo risultati equivalenti ai modelli non compressi, con accelerazioni fino a 8x su GPU.

    Questo approccio ha implicazioni cruciali per il futuro della ricerca semantica e degli LLM su larga scala, rendendo possibile gestire enormi quantità di dati con maggiore efficienza. Il lavoro, che sarà presentato a ICLR 2026 e AISTATS 2026, rappresenta un avanzamento teorico e pratico nella compressione vettoriale.

    Link alla fonte:

    https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression

  • Huang afferma che abbiamo raggiunto l’AGI… ma non ancora “su scala industriale”

    Durante una recente intervista con Lex Fridman Nvidia, tramite il suo CEO Jensen Huang, ha sostenuto che l’Intelligenza Artificiale Generale (AGI) sia già stata raggiunta.
    Huang basa questa affermazione sulla crescente diffusione di agenti autonomi capaci di creare prodotti digitali, contenuti virali e applicazioni innovative senza intervento umano diretto.
    Tuttavia, introduce una distinzione cruciale: se le capacità individuali degli agenti sono avanzate, la coordinazione necessaria per costruire e gestire aziende complesse su scala globale resta irraggiungibile.
    Il CEO sottolinea infatti che replicare strutture industriali come Nvidia tramite agenti IA è, allo stato attuale, impossibile.
    La posizione si inserisce in un dibattito più ampio che coinvolge anche attori come Microsoft e OpenAI, evidenziando l’ambiguità e la natura ancora controversa del concetto di AGI.

    Link alla fonte:
    https://www.adnkronos.com/tecnologia/nvidia-ceo-huang-abbiamo-raggiunto-lintelligenza-artificiale-generale_2saNRir64hLktI5ZuHeNcv

  • La Cina conquista terreno nella “valuta” dell’AI: i token

    Le aziende cinesi come DeepSeek e MiniMax stanno superando i concorrenti statunitensi nella riduzione del consumo di token, l’unità chiave che misura l’uso e il costo dei modelli di intelligenza artificiale. Questo sorpasso segnala un cambiamento strutturale nella competizione globale, dove il prezzo per token diventa determinante soprattutto con la diffusione degli agenti AI, molto più esigenti in termini computazionali. Grazie a costi energetici più bassi e modelli più efficienti, le aziende cinesi offrono prezzi fino a sei volte inferiori rispetto a player come Anthropic, attirando sviluppatori e aumentando rapidamente l’adozione. Tuttavia, restano criticità legate a limiti infrastrutturali e a rischi geopolitici, in particolare sull’uso di data center cinesi. Il tema dei token emerge così come nuova leva strategica nella corsa verso l’AGI e il dominio dell’economia AI.

    Link alla fonte:
    https://www.ft.com/content/2567877b-9acc-4cf3-a9e5-5f46c1abd13e?syn-25a6b1a6=1