Tag: Risorse

  • Il traffico dei bot supera quello umano e mette sotto pressione il web (e non c’entra solo l’AI)

    Per la prima volta, il traffico web generato da sistemi automatizzati ha superato quello prodotto dagli utenti umani, raggiungendo il 57,4% delle richieste monitorate da Cloudflare.

    Il fenomeno è alimentato dalla rapida diffusione dell’intelligenza artificiale generativa e degli agenti AI autonomi, capaci di effettuare in pochi secondi attività che richiederebbero ore a una persona.

    Secondo il report di Human Security, il traffico automatizzato cresce a una velocità otto volte superiore rispetto a quello umano, mentre una quota significativa continua a provenire da bot malevoli impiegati in frodi e abusi informatici.

    Questa trasformazione aumenta i costi infrastrutturali ed energetici per aziende ed editori, compromette l’affidabilità degli analytics e mette in discussione il modello economico del web basato sulle visite umane e sulla pubblicità.

    Il sorpasso rappresenta un passaggio verso un ecosistema digitale sempre più dominato da interazioni tra macchine.

    Link alla fonte:

  • Le piattaforme AI alzano i prezzi mentre riducono le risorse disponibili

    L’articolo di cui trovare il link in basso analizza il progressivo deterioramento del rapporto tra provider di AI e utenti, sostenendo che aziende come OpenAI e Anthropic (ma anche Google, a quanto pare) stiano entrando in una dinamica tipica dei monopoli tecnologici: far pagare di più offrendo contemporaneamente meno risorse.
    Il testo spiega in modo accessibile i tre principali costi tecnici associati all’uso degli LLM nel cloud — token, contesto e tool — traducendoli in consumo reale di GPU, memoria e processi server-side.
    Secondo l’autore, la fine dell’era della “crescita finanziata” da investitori come BlackRock sta imponendo ai provider la necessità di trasformare utenti ad alta intensità computazionale in fonti di profitto, anche tramite limiti nascosti e degradazione graduale delle performance.
    L’articolo sottolinea, inoltre, i rischi sistemici per aziende che hanno integrato gli LLM nei propri processi operativi, esponendosi a dipendenze economiche e tecnologiche difficili da controllare.
    La conclusione invita a usare i modelli linguistici come strumenti di elaborazione del linguaggio e non come sostituti del pensiero critico o decisionale (mentre l’inizio accenna a un successivo articolo sull’AI locale).

    Link alla fonte:
    https://www.zeusnews.it/n.php?c=32073

  • Un datacenter AI di QTS consumava milioni di litri d’acqua senza controlli nel pieno della siccità in Georgia

    Un maxi campus di datacenter sviluppato da QTS nella contea di Fayette, in Georgia, avrebbe utilizzato circa 29 milioni di galloni d’acqua tramite due connessioni non registrate, mentre ai residenti veniva chiesto di ridurre i consumi domestici a causa della bassa pressione idrica.
    Il progetto, controllato dal gruppo Blackstone e noto come “Project Excalibur”, è uno dei più grandi complessi AI-oriented in costruzione negli Stati Uniti, con fino a 16 edifici previsti e investimenti stimati per un miliardo di dollari.
    L’azienda sostiene che l’acqua sia stata usata principalmente per attività temporanee di costruzione e che, a regime, il sistema utilizzerà un raffreddamento “closed-loop” a riciclo interno.
    Il caso ha però sollevato forti critiche sulla trasparenza e sulla sostenibilità delle infrastrutture digitali, soprattutto in uno Stato già colpito da siccità e crescente pressione energetica legata ai datacenter.
    La vicenda evidenzia il conflitto sempre più acceso tra espansione dell’AI, consumo di risorse naturali e tutela delle comunità locali.

    Link alla fonte:
    https://www.hwupgrade.it/news/server-workstation/mentre-i-cittadini-risparmiavano-acqua-un-mega-datacenter-ne-consumava-milioni-senza-controlli_153437.html

  • Panthalassa punta sui data center galleggianti per alimentare l’AI con l’energia delle onde

    La startup americana Panthalassa ha raccolto 140 milioni di dollari in un round guidato da Peter Thiel per sviluppare data center oceanici alimentati dall’energia delle onde.
    Il progetto prevede enormi “nodi” galleggianti capaci di generare elettricità direttamente in mare aperto e alimentare server AI raffreddati naturalmente dall’acqua oceanica, riducendo il carico sulla rete elettrica terrestre.
    L’iniziativa nasce in risposta alla crescente domanda energetica dell’intelligenza artificiale, che sta spingendo le big tech verso soluzioni sempre più radicali, dal nucleare ai data center spaziali. Panthalassa sostiene che l’oceano aperto rappresenti una delle poche fonti energetiche in grado di sostenere l’espansione futura del calcolo AI su scala globale.
    Restano però numerose incognite legate a costi, manutenzione offshore, affidabilità tecnica, cybersecurity e reale convenienza economica rispetto ai data center tradizionali alimentati da energie rinnovabili terrestri.

    Link alla fonte:
    https://prometeo.adnkronos.com/tendenze/data-center-oceanici-galleggianti-peter-thiel-panthalassa-consumo-energetico/

  • TurboQuant di Google rivoluziona la “compressione AI” riducendo memoria e costi senza perdita di precisione

    I ricercatori di Google Research presentano TurboQuant, un nuovo algoritmo di quantizzazione progettato per comprimere drasticamente i modelli AI senza perdita di accuratezza.

    La tecnica combina due innovazioni — QJL e PolarQuant — per ridurre fino a 6 volte la memoria del key-value cache, migliorando al contempo velocità e prestazioni nei modelli linguistici.

    TurboQuant riesce a operare con rappresentazioni a soli 3 bit mantenendo risultati equivalenti ai modelli non compressi, con accelerazioni fino a 8x su GPU.

    Questo approccio ha implicazioni cruciali per il futuro della ricerca semantica e degli LLM su larga scala, rendendo possibile gestire enormi quantità di dati con maggiore efficienza. Il lavoro, che sarà presentato a ICLR 2026 e AISTATS 2026, rappresenta un avanzamento teorico e pratico nella compressione vettoriale.

    Link alla fonte:

    https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression

  • La Cina conquista terreno nella “valuta” dell’AI: i token

    Le aziende cinesi come DeepSeek e MiniMax stanno superando i concorrenti statunitensi nella riduzione del consumo di token, l’unità chiave che misura l’uso e il costo dei modelli di intelligenza artificiale. Questo sorpasso segnala un cambiamento strutturale nella competizione globale, dove il prezzo per token diventa determinante soprattutto con la diffusione degli agenti AI, molto più esigenti in termini computazionali. Grazie a costi energetici più bassi e modelli più efficienti, le aziende cinesi offrono prezzi fino a sei volte inferiori rispetto a player come Anthropic, attirando sviluppatori e aumentando rapidamente l’adozione. Tuttavia, restano criticità legate a limiti infrastrutturali e a rischi geopolitici, in particolare sull’uso di data center cinesi. Il tema dei token emerge così come nuova leva strategica nella corsa verso l’AGI e il dominio dell’economia AI.

    Link alla fonte:
    https://www.ft.com/content/2567877b-9acc-4cf3-a9e5-5f46c1abd13e?syn-25a6b1a6=1

  • Anthropic regala il doppio dei limiti. Generosità o… ingegneria?

    Come annunciavo in un post precedente, dal 13 al 28 marzo, Claude raddoppia i limiti d’uso fuori dagli orari di punta (8–14 ET nei giorni feriali). Automaticamente, senza upgrade, per tutti i piani Free, Pro, Max e Team.

    Bella mossa. Ma cosa c’è davvero dietro?

    I datacenter hanno capacità fissa. Nelle ore di punta sono saturi. Nelle ore off-peak, quella potenza computazionale resta inutilizzata — un costo fisso che non si recupera. Regalare token in quelle fasce non costa quasi nulla in termini marginali. Ridistribuisce il carico, invece di aumentarlo.

    È load balancing vestito da promozione.

    Ma c’è di più. Questa iniziativa raccoglie dati preziosi: come cambiano i pattern d’uso quando i limiti vengono rimossi? Quali workflow emergono su Claude Code, Cowork, i plugin Office? Quanto vale davvero un piano senza tetto artificiale?

    E tutto questo apre una domanda strategica: stiamo forse assistendo al test preliminare di un nuovo tier (pacchetto di abbonamento), basato su un piano “off-peak” o a crediti flessibili, a prezzo ridotto? OpenAI ci ha già provato con ChatGPT Go. Anthropic potrebbe avere in mente qualcosa di più sofisticato: non un piano minore, ma un modello di accesso legato all’orario, come le spot instances di AWS.

    L’esclusione degli Enterprise dal promo non è un dettaglio: quei clienti hanno SLA garantiti e non possono essere soggetti a variabilità di throughput. Il confine è preciso.

    La simmetria degli interessi è perfetta: Anthropic ottimizza i server, raccoglie dati comportamentali e riduce il churn. L’utente ottiene più spazio per esplorare il prodotto.

    Win-win — a patto di capire le regole del gioco.

    https://support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion

  • Claude “raddoppia” fino al 28 marzo

    nthropic annuncia ufficialmente il raddoppio delle risorse di utilizzo di Claude per un periodo limitato, ovvero al di fuori delle “ore d’ufficio” dal lunedì al venerdì e durante tutte le 24 ore nei weekend, ma solo fino al 28 marzo.

    Questa “concessione” vale anche per gli utenti della versione gratuita, e si estende quindi alle opzioni disponibili in questa versione.

    Se non avete ancora usato intensivamente strumenti che di solito fanno un uso massiccio di risorse (Cowork, modello Opus, progetti ricchi di contenuti, ecc.) è sicuramente il momento di farlo, per valutare ancora meglio le capacità di questa splendida piattaforma.

    Qui il comunicato ufficiale con i dettagli:

    https://support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion

  • Altman immagina l’AI come un servizio a consumo: “come elettricità o acqua”

    Sam Altman, CEO di OpenAI, ha proposto una visione in cui l’intelligenza artificiale diventa un’infrastruttura di base accessibile come un servizio pubblico.
    Durante l’U.S. Infrastructure Summit organizzato da BlackRock, Altman ha ipotizzato un modello in cui gli utenti pagano l’IA in base al consumo, simile alle bollette di acqua o elettricità.
    L’idea riflette l’ambizione di rendere la “capacità di intelligenza computazionale” abbondante e disponibile su larga scala per imprese, istituzioni e cittadini.
    Tuttavia, questa prospettiva richiede enormi investimenti in potenza di calcolo e data center, con conseguente aumento dei consumi energetici.
    Il dibattito riguarda quindi sia il modello economico della futura IA sia la sostenibilità energetica delle infrastrutture necessarie.

    Link alla fonte:
    https://www.elconfidencial.com/tecnologia/2026-03-13/sam-altman-pagar-chatgpt-contador-agua-1qrt_4319887/

  • SMIC avverte: il boom dei data center per l’AI rischia di trasformarsi in una bolla

    Zhao Haijun, co-CEO di Semiconductor Manufacturing International Co. (SMIC), ha lanciato un allarme sul possibile eccesso di investimenti nei data center dedicati all’intelligenza artificiale, paragonando l’attuale corsa infrastrutturale alla bolla dei data center cinesi dei primi anni 2020.
    Secondo il dirigente, le aziende stanno cercando di costruire in uno o due anni una capacità prevista per un intero decennio, senza una chiara visione sull’effettivo utilizzo futuro.
    Nonostante la forte domanda generata dall’AI generativa e dai large language model – che spinge colossi come Microsoft, Google e Meta a investire miliardi – resta il rischio di sovracapacità e infrastrutture sottoutilizzate.
    L’avvertimento è particolarmente significativo perché proviene da un attore centrale nella filiera globale dei semiconduttori, in grado di osservare direttamente le dinamiche di domanda e offerta.
    Il tema solleva interrogativi su sostenibilità economica, costi energetici e stabilità dell’attuale ciclo di espansione dell’AI.

    Link alla fonte:
    https://www.tomshw.it/hardware/smic-avverte-data-center-ai-rischiano-linutilizzo-2026-02-11

  • Google restringe l’accesso gratuito a Gemini 3 Pro per “sovraccarico di richiesta”

    Google ha ridotto l’accesso gratuito a Gemini 3 Pro dopo un’improvvisa ondata di richieste seguita al lancio del modello in Italia e dell’engine visivo Nano Banana Pro.
    Il limite iniziale di 5 prompt al giorno (e 3 immagini per Nano Banana Pro) è stato sostituito da un generico “Basic access” dai confini variabili, segno di una gestione più elastica per contenere il traffico.
    Anche NotebookLM ha dovuto sospendere temporaneamente funzioni chiave come Infographics e Slide Decks per gli utenti free, applicando limiti aggiuntivi ai piani Pro a causa di un sovraccarico dei server.
    Le funzionalità visive, appena integrate nella scheda Studio, promettevano una forte spinta creativa, ma ora risultano parzialmente inaccessibili.
    La mossa indica che Google mira a preservare la stabilità del servizio e che potrebbe spingere ulteriormente verso i piani a pagamento in futuro.

    Link alla fonte:
    https://www.hdblog.it/google/articoli/n640072/gemini-3-pro-limiti-account-gratis-pro-nano-banana/