Tag: Inferenza

  • Microsoft presenta Maia 200: il chip a 3nm progettato per rivoluzionare l’inferenza AI

    Microsoft ha annunciato Maia 200, un nuovo acceleratore di intelligenza artificiale sviluppato specificamente per l’inferenza, segnando un passaggio chiave dalla sperimentazione alla scalabilità operativa dell’AI.

    Realizzato con processo produttivo a 3 nanometri da TSMC, il chip integra oltre 140 miliardi di transistor ed è ottimizzato per ridurre costi, latenza e consumi energetici rispetto all’hardware general-purpose.

    Secondo l’azienda, Maia 200 offre un miglioramento del 30% nelle prestazioni per dollaro, consentendo di eseguire modelli generativi complessi con meno risorse.

    Il chip sarà progressivamente integrato nell’infrastruttura di Microsoft Azure e nei servizi di Microsoft 365 Copilot, con l’obiettivo di rendere l’AI più sostenibile e accessibile su larga scala.

    Link alla fonte:

    https://www.adnkronos.com/tecnologia/microsoft-maia-200-il-nuovo-chip-per-linferenza-ai-a-3nm_3s3gsc7v70h2Ab1pUa3OhI

  • Il futuro dell’AI? L’economia dell’inferenza

    Il vero valore e il futuro dei profitti nell’intelligenza artificiale aziendale non risiedono più nell’addestramento di modelli linguistici di grandi dimensioni (LLM), ma nell’inferenza, ovvero l’applicazione pratica e quotidiana di questi modelli ai dati reali delle organizzazioni.
    Le previsioni di IDC indicano che entro la fine del 2025 gli investimenti nelle infrastrutture per l’inferenza supereranno quelli destinati all’addestramento, confermando un cambiamento epocale nelle priorità del settore.
    La sfida cruciale per le aziende è l’integrazione dei modelli con il contesto aziendale e i dati proprietari, che costituiscono il vero vantaggio competitivo e prevengono le “allucinazioni” su larga scala.
    Tecnologie come la Retrieval-Augmented Generation (RAG) e i database vettoriali stanno emergendo come soluzioni fondamentali per fornire memoria e contesto ai sistemi di intelligenza artificiale.
    L’obiettivo strategico è rendere l’inferenza economica, sicura e ubiqua, ottimizzando i costi e garantendo la governance dei dati sensibili.

    Fonte:
    https://www.tomshw.it/business/altro-che-algoritmi-e-linferenza-il-reale-valore-dei-modelli-di-ia-2025-11-11