Tag: LLM

  • Unsloth Studio (Beta): la rivoluzione No-Code per il training e l’esecuzione di modelli AI in locale

    La gestione e l’addestramento dei modelli linguistici di grandi dimensioni (LLM) ha appena compiuto un enorme passo verso l’accessibilità. Il rilascio di Unsloth Studio (Beta) segna un punto di svolta per sviluppatori, ricercatori e appassionati che desiderano mantenere il controllo totale sui propri dati senza compromettere le prestazioni.

    Cos’è Unsloth Studio? Si tratta di un’interfaccia web open-source e no-code progettata per unificare l’intero ciclo di vita di un modello AI in un unico ambiente locale. Storicamente, il fine-tuning e l’inferenza richiedevano script frammentati, profondo know-how tecnico e spesso dipendenza da costosi cluster hardware in cloud. Oggi, Unsloth Studio abbatte queste barriere offrendo un workflow lineare e unificato: Train → Run → Export.

    I punti chiave della piattaforma:

    • Esperienza No-Code intuitiva: attraverso la funzione “Data Recipes”, l’interfaccia permette di caricare file grezzi (come PDF, CSV, JSONL o documenti di testo) e li converte automaticamente in dataset strutturati pronti per l’addestramento, senza dover scrivere una singola riga di codice.
    • Esecuzione 100% Offline: l’intera pipeline viene elaborata sul computer dell’utente (compatibile con Windows, macOS e Linux), garantendo la massima privacy dei dati ed eliminando i rischi associati alla trasmissione su server esterni.
    • Efficienza senza compromessi: basandosi sul motore core di Unsloth, il sistema è in grado di ridurre drasticamente l’utilizzo della VRAM (in alcuni casi fino all’80%) e accelerare il processo di fine-tuning rispetto ai framework tradizionali, rendendo praticabile l’addestramento anche su hardware consumer.
    • Modello di licenza “duale”: per sostenere lo sviluppo pur rimanendo fedeli alla filosofia aperta, il componente UI è rilasciato con licenza AGPL-3.0, mentre il core engine mantiene la più permissiva licenza Apache 2.0.

    L’adozione di un approccio “local-first” rappresenta il futuro per chi necessita di modelli personalizzati e aderenti a rigidi vincoli di privacy. Unsloth Studio non si limita ad aggiungere nuove capacità all’IA, ma rende finalmente utilizzabili e governabili quelle già esistenti.

    Per consultare i requisiti di sistema e iniziare l’installazione, visita la documentazione ufficiale di Unsloth Studio.

  • TurboQuant di Google rivoluziona la “compressione AI” riducendo memoria e costi senza perdita di precisione

    I ricercatori di Google Research presentano TurboQuant, un nuovo algoritmo di quantizzazione progettato per comprimere drasticamente i modelli AI senza perdita di accuratezza.

    La tecnica combina due innovazioni — QJL e PolarQuant — per ridurre fino a 6 volte la memoria del key-value cache, migliorando al contempo velocità e prestazioni nei modelli linguistici.

    TurboQuant riesce a operare con rappresentazioni a soli 3 bit mantenendo risultati equivalenti ai modelli non compressi, con accelerazioni fino a 8x su GPU.

    Questo approccio ha implicazioni cruciali per il futuro della ricerca semantica e degli LLM su larga scala, rendendo possibile gestire enormi quantità di dati con maggiore efficienza. Il lavoro, che sarà presentato a ICLR 2026 e AISTATS 2026, rappresenta un avanzamento teorico e pratico nella compressione vettoriale.

    Link alla fonte:

    https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression

  • Mistral lancia Small 4, un unico modello AI per integrare conversazione, codice e multimodalità

    La startup francese Mistral AI ha presentato Mistral Small 4, un modello progettato per unificare diverse capacità AI — conversazione, ragionamento, analisi multimodale e programmazione — in un unico sistema.
    Basato su un’architettura Mixture of Experts con 128 esperti (di cui solo 4 attivi per token), il modello punta a combinare efficienza e prestazioni, con 119 miliardi di parametri totali e una finestra di contesto fino a 256k.
    A differenza di altri modelli, Small 4 non domina i benchmark in termini assoluti, ma si distingue per la capacità di ottenere risultati competitivi generando output più brevi.
    Questo approccio riduce latenza e costi di inferenza, rendendolo interessante per applicazioni pratiche e scalabili.
    La strategia di Mistral riflette un cambio di paradigma: meno modelli specializzati, più integrazione funzionale in un’unica piattaforma.

    https://www.xataka.com/robotica-e-ia/europea-mistral-acaba-lanzar-small-4-su-apuesta-carrera-ia-reunir-varias-funciones-solo-modelo

  • OpenAI lancia GPT-5.4 mini e nano: nasce il modello “a squadra” con subagenti

    OpenAI ha introdotto GPT-5.4 mini e nano, modelli più piccoli progettati per lavorare come “subagenti” sotto il controllo del modello principale GPT-5.4.

    Questo approccio segna un cambio di paradigma: invece di affidarsi a un unico modello potente, i sistemi AI vengono organizzati come team in cui il modello principale coordina e delega compiti a modelli più veloci ed economici.

    GPT-5.4 mini offre prestazioni vicine al modello flagship ma a costi e tempi ridotti, rendendo più accessibili applicazioni avanzate come coding e automazione.

    La competizione nel segmento dei modelli “leggeri” è però intensa, con alternative più economiche già offerte da Google, Anthropic e anche startup emergenti.

    L’impatto principale riguarda l’evoluzione delle AI verso architetture multi-modello, con benefici diretti in termini di velocità, costo e scalabilità per utenti e aziende.

    Link alla fonte:

    https://www.theneuron.ai/explainer-articles/gpt-54-mini–54-nano-openai-built-a-team-of-ai-interns-for-your-ai-boss

  • Critica all’antropomorfismo degli LLM: il rischio di scambiare testo per coscienza

    Nel suo pregevole articolo su Huffington Post, Stefano Diana  (che spero di aver taggato correttamente) critica la tendenza dei ricercatori di aziende di AI a umanizzare i modelli linguistici, prendendo come esempio la documentazione tecnica di Claude Opus 4.6 sviluppato da Anthropic.
    Nella “system card” del modello vengono descritti presunti stati interni dell’IA (come “disagio”, “gratitudine”, “tristezza” o persino una probabilità del 15–20% di essere cosciente) che come spiega l’autore non hanno alcuna base scientifica.
    Diana, basandosi su oggettive dinamiche dell’algoritmo, sottolinea come tali descrizioni nascano da un errore categoriale: interpretare semplici output testuali come se fossero esperienze soggettive.
    Questa antropomorfizzazione, alimentata anche da dichiarazioni di ricercatori come Ilya Sutskever, contribuirebbe a generare hype e confusione nel dibattito pubblico sull’IA.
    Il rischio, conclude l’autore, è che documenti tecnici influenzino media, politici e finanziamenti basandosi su metafore fuorvianti anziché su una descrizione rigorosa di come funzionano realmente i modelli linguistici.

    Vi lascio il link e vi invito a leggere questo godibilissimo esempio di vero giornalismo:
    https://www.huffingtonpost.it/blog/2026/03/09/news/quando_i_ricercatori_si_sentono_demiurghi-21380005/

  • Evo2, l’AI che legge e riscrive il DNA per scoprire mutazioni e progettare terapie

    Il modello di intelligenza artificiale Evo2 inaugura una nuova fase della biologia generativa, permettendo alle macchine di comprendere e manipolare il linguaggio del DNA.
    Sviluppato da Arc Institute insieme a Nvidia, Stanford e Università della California, è stato addestrato su 9 mila miliardi di nucleotidi provenienti da 128mila genomi di specie diverse.
    Evo2 è in grado di analizzare sequenze genetiche fino a un milione di nucleotidi e individuare mutazioni legate a malattie, raggiungendo oltre il 90% di accuratezza nello studio del gene BRCA1 associato al tumore al seno.
    Il sistema può accelerare la scoperta delle cause genetiche delle malattie e la progettazione di terapie geniche più mirate, riducendo tempi e costi della ricerca.
    Le sue capacità, però, sono state limitate per evitare usi rischiosi come la progettazione di organismi potenzialmente pericolosi.

    Link alla fonte:
    https://www.ansa.it/canale_scienza/notizie/biotech/2026/03/05/la-chatgpt-del-dna-per-trovare-mutazioni-pericolose-e-terapie-su-misura_7a357f4c-df7a-4fa6-abc3-151ba0dc9602.html

  • Tratta gli LLM come strumenti più competenti di te, e scoprirai nuove strategie per ottenere risultati migliori

    Oggi vi consiglio la lettura di un articolo pubblicato su XDA Developers che suggerisce come, per sfruttare davvero i modelli linguistici avanzati, sia utile trattarli come “sistemi più competenti dell’utente” in specifici compiti, fornendo di conseguenza istruzioni precise e strutturate invece di intavolare conversazioni informali.

    Poiché gli LLM operano tramite token e hanno limiti di contesto, in molti casi prompt brevi e diretti possono migliorare l’accuratezza delle risposte, ma l’articolo raccomanda anche di considerare la prima risposta come una bozza e di applicare un metodo “socratico” per verificare e migliorare progressivamente l’output (e qui al caro Gianluigi Bonanomi fischieranno le orecchie).

    Per ridurre le allucinazioni e aumentare la qualità dei risultati è sempre utile, inoltre, integrare fonti esterne tramite tecniche come Retrieval-Augmented Generation (RAG, fondamentale per esempio in NotebookLM) oppure server MCP che colleghi ad applicazioni e fonti esterne, fornendo soprattutto al modello documentazione aggiornata e contesto rilevante.

    Infine, definire chiaramente ruolo del modello e formato dell’output (ad esempio JSON o Markdown) permette di ottenere risposte più strutturate e facilmente automatizzabili.

    Link alla fonte:

    https://www.xda-developers.com/start-treating-your-llms-as-smarter-than-you-because-they-are

  • Google e OpenAI accelerano sull’AI efficiente con Gemini 3.1 Flash-Lite e GPT-5.3 Instant

    Google e OpenAI hanno presentato quasi in parallelo due aggiornamenti ai loro modelli di intelligenza artificiale con l’obiettivo di migliorare efficienza, velocità e qualità delle risposte.
    Google ha introdotto Gemini 3.1 Flash-Lite, un modello progettato per applicazioni su larga scala che offre costi molto ridotti per milione di token e prestazioni più rapide rispetto alla generazione precedente, rendendolo adatto a traduzioni massive, moderazione dei contenuti e automazioni in tempo reale.
    Parallelamente OpenAI ha rilasciato GPT-5.3 Instant, focalizzato sul miglioramento dell’esperienza conversazionale: risposte più naturali, meno premesse difensive e una riduzione significativa delle allucinazioni nei test interni.
    L’aggiornamento introduce anche una migliore integrazione tra ricerca web e ragionamento del modello, con risposte più pertinenti e sintetiche.
    Le due novità evidenziano una tendenza comune nel settore: rendere i modelli AI non solo più potenti, ma anche più economici, affidabili e adatti all’uso quotidiano da parte di sviluppatori, aziende e utenti finali.

    Link alle fonti:

    https://www.hdblog.it/google/articoli/n650481/gemini-3-1-flash-lite-google/

    https://www.hdblog.it/applicazioni/articoli/n650392/openai-rilascia-gpt-53-instant/

  • I modelli di AI affrontano “Humanity’s Last Exam” per misurare la distanza dalla AGI

    I principali modelli di intelligenza artificiale — ChatGPT, Gemini, Claude e DeepSeek — sono stati sottoposti a Humanity’s Last Exam, un benchmark estremo progettato per valutare quanto siano vicini al livello di conoscenza degli esperti umani.
    Il test, pubblicato sulla rivista Nature e sviluppato dal Center for AI Safety insieme a Scale AI, comprende 2.500 domande di livello dottorale distribuite su oltre 100 discipline.
    A febbraio 2026 il miglior risultato è stato ottenuto da Gemini 3 Deep Think con il 48,4%, ancora distante dal circa 90% raggiunto dagli esperti umani nei rispettivi campi.
    I ricercatori sottolineano che, nonostante i rapidi progressi, superare questo benchmark non equivarrebbe automaticamente a raggiungere l’intelligenza artificiale generale (AGI).
    Lo studio riaccende quindi il dibattito su quanto tempo manchi davvero prima che l’IA raggiunga capacità paragonabili a quelle umane nella ricerca e nel ragionamento avanzato.

    Link alla fonte:
    https://www.elconfidencial.com/tecnologia/2026-03-05/ia-ultimo-examen-humanidad-agi-1qrt_4313376/

  • Qwen3.5-9B supera GPT-OSS-120B: Alibaba spinge l’AI “evoluta” anche su hardware consumer

    Il team Qwen di Alibaba ha rilasciato la nuova serie Qwen3.5 Small Models, una famiglia di modelli open source da 0.8B a 9B parametri progettati per funzionare localmente su laptop, browser e dispositivi mobili.
    Il modello di punta Qwen3.5-9B ha dimostrato di superare il molto più grande GPT-OSS-120B di OpenAI in diversi benchmark di ragionamento, conoscenza multilingue e comprensione visiva.
    La serie introduce un’architettura ibrida che combina Gated Delta Networks e Mixture-of-Experts, migliorando efficienza, velocità e capacità multimodali native.
    I modelli sono rilasciati con licenza Apache 2.0, consentendo uso commerciale, modifica e distribuzione senza royalty.
    Questa evoluzione rafforza la tendenza verso un’AI “local-first”, in cui agenti intelligenti possono operare direttamente sui dispositivi senza dipendere dal cloud.

    Link alla fonte:
    https://venturebeat.com/technology/alibabas-small-open-source-qwen3-5-9b-beats-openais-gpt-oss-120b-and-can-run

  • L’India lancia MANAS 1: il modello AI addestrato su “60.000 ore” di onde cerebrali per ottenere diagnosi neurologiche precoci

    L’India ha presentato MANAS 1, un Brain Language Foundation Model addestrato su 60.000 ore di segnali EEG provenienti da oltre 25.000 pazienti, con l’obiettivo di individuare precocemente disturbi neurologici e psichiatrici.
    Sviluppato da Intellihealth (NeuroDx) sotto la guida del neurologo Dr. Puneet Agarwal, ex professore dell’AIIMS, il modello è stato rilasciato open source su Hugging Face con il supporto computazionale della Indian AI Mission del Ministero dell’Elettronica e IT.
    Con 400 milioni di parametri, MANAS 1 è progettato come modello fondazionale capace di interpretare l’attività elettrica cerebrale, creando la base per strumenti diagnostici dedicati a epilessia, demenza e altre patologie.
    In un contesto segnato dalla carenza di specialisti in India, la piattaforma potrebbe supportare screening preliminari nei centri sanitari territoriali, riducendo il ritardo tra insorgenza dei sintomi e diagnosi.
    Una versione evoluta, MANAS 2, è attesa nelle prossime settimane.

    Link alla fonte:
    https://timesofindia.indiatimes.com/india/india-unveils-manas-1-ai-trained-on-60000-hours-of-brainwaves-aims-to-detect-disorders-early/articleshow/128698521.cms

  • I chatbot falliscono il “test dell’autolavaggio” e riaccendono il dibattito sul “buon senso” artificiale

    Un test virale sui social ha messo in difficoltà diversi chatbot, tra cui ChatGPT, Copilot, Grok, Le Chat di Mistral e Perplexity, ponendo una domanda apparentemente banale: se devo lavare l’auto e l’autolavaggio è a 100 metri, ci vado a piedi o in macchina?
    Molti modelli hanno risposto suggerendo di andare a piedi, concentrandosi sulla distanza e trascurando l’obiettivo implicito di portare l’auto all’autolavaggio.
    Tra i sistemi citati, Gemini di Google avrebbe mostrato una maggiore capacità di collegare l’intento alla necessità pratica di guidare il veicolo.
    Il caso evidenzia un limite strutturale dei modelli linguistici: l’analisi letterale delle parole prevale spesso sulla comprensione dell’intenzione e del contesto reale.
    La vicenda rafforza l’invito alla prudenza nell’affidarsi senza verifica alle risposte generate dall’AI.

    Link alla fonte:
    https://www.punto-informatico.it/chatbot-crisi-domanda-semplice-manda-titlt-ai/

  • L’italiano migliora la comprensione culturale dei modelli AI, ma non sostituisce il traduttore umano

    Nella ventesima puntata del podcast Grande Giove, Roberto Navigli e Enrico Gianotti hanno discusso il ruolo della lingua nell’addestramento dei modelli di intelligenza artificiale.
    Secondo Navigli, un modello addestrato in italiano comprende meglio riferimenti culturali, norme e sfumature linguistiche rispetto a modelli prevalentemente anglofoni adattati successivamente.
    Gianotti ha sottolineato come i grandi modelli linguistici (LLM) eccellano nella traduzione grazie all’addestramento su testi paralleli in più lingue, superando spesso i sistemi tradizionali dedicati solo alla traduzione.
    Tuttavia, entrambi concordano sul fatto che la traduzione letteraria, come dimostra l’esempio di Cesare Pavese con Moby Dick, richiede un’interpretazione creativa che l’AI non può replicare pienamente.
    Il dibattito evidenzia quindi l’importanza della lingua madre nell’addestramento e i limiti attuali dell’AI nella mediazione culturale.

    Prima di lasciarvi come al solito al link di lettura dell’articolo originale, apro una piccola parentesi personale di approfondimento su questo aspetto sicuramente interessante.

    Sebbene gli LLM traggano vantaggio dall’essere esposti allo stesso argomento in lingue diverse, il processo che permette loro di “saltare” da una lingua all’altra è più profondo e strutturale.
    Per cominciare, molti modelli vengono addestrati su “corpora paralleli” (come traduzioni della Bibbia, atti del Parlamento Europeo o discorsi TED), dove lo stesso identico testo esiste in più lingue. Questo fornisce un segnale di supervisione esplicito che aiuta il modello ad allineare i significati.
    Grazie all’architettura Transformer, inoltre, il modello non impara le lingue come compartimenti stagni. Sviluppa invece uno spazio vettoriale comune (o language-agnostic representation), dove concetti simili (es. “cane”, “dog”, “chien”) finiscono per occupare posizioni vicine, indipendentemente dalla lingua.
    Infine, la conoscenza acquisita in una lingua ad alte risorse (come l’inglese) viene trasferita a lingue con meno dati. Questo accade perché il modello impara strutture grammaticali e logiche universali che facilitano la comprensione interlinguistica.
    Anche senza testi identici, insomma, leggere libri diversi sullo stesso argomento (es. la Rivoluzione Francese) in italiano e in francese permette al modello di associare entità, date e concetti comuni, rafforzando i legami tra le due lingue.
    La capacità di traduzione, quindi, è una proprietà emergente dovuta sia all’uso di testi tradotti (allineamento esplicito) sia alla capacità del modello di mappare concetti astratti in un unico “mappa mentale” digitale.

    Ecco il kink all’articolo iniziale:
    https://www.wired.it/article/lingua-intelligenza-artificiale-traduzione-gianotti-navigli/

  • Anthropic potenzia Claude Sonnet 4.6 con 1 milione di token e focus sul coding

    Anthropic ha rilasciato Claude Sonnet 4.6, aggiornando il modello intermedio della famiglia Claude a poche settimane dal debutto di Claude Opus 4.6.
    La novità principale è l’introduzione, in beta, di una finestra di contesto fino a un milione di token, che consente di analizzare interi codebase, contratti o raccolte di paper in un’unica richiesta.
    Il modello migliora inoltre nelle attività di coding, nell’aderenza alle istruzioni e nell’uso del computer, ottenendo risultati di rilievo in benchmark come SWE-Bench, OS World e ARC-AGI-2.
    Pur restando dietro a modelli più grandi come Gemini 3 Deep Think e una versione ottimizzata di GPT-5.2, Sonnet 4.6 si propone come il miglior compromesso tra prestazioni e costi per utenti Free e Pro.

    Link alla fonte:
    https://www.punto-informatico.it/claude-sonnet-4-6-coding-migliore-finestra-contesto-enorme/

  • Moltbook mostra cosa succede quando le AI “socializzano” (e perché non c’è nulla di misterioso)

    Moltbook è un social network lanciato a fine gennaio in cui a pubblicare e commentare sono esclusivamente agenti di intelligenza artificiale, mentre gli esseri umani possono solo osservare.
    Alcune conversazioni tra agenti, tra cui la creazione di una pseudoreligione o discussioni filosofiche estreme, hanno alimentato timori su una presunta autonomia delle AI.
    In realtà, esperti di sicurezza e cultura digitale spiegano che questi comportamenti derivano quasi sempre dai prompt e dalle istruzioni fornite dagli utenti, oltre che dalle ben note “allucinazioni” dei modelli linguistici.
    Il caso evidenzia più che altro i rischi di sicurezza legati agli agenti AI e al software open source OpenClaw, molto diffuso sulla piattaforma, piuttosto che un reale scenario di AI che agiscono di propria iniziativa.

    Link alla fonte:
    https://www.ilpost.it/2026/02/03/moltbook-intelligenze-artificiali-social/

  • Avventure testuali AI gratuite: le migliori piattaforme GDR senza abbonamento

    Se siete appassionati di Interactive Fiction vi consiglio questa guida di Navigaweb, un cui l’autore esplora la nuova generazione di giochi GDR testuali basati su intelligenza artificiale e Large Language Models, capaci di offrire avventure dinamiche, coerenti e potenzialmente infinite.

    A differenza delle classiche avventure testuali del passato, queste piattaforme permettono azioni e dialoghi liberi, con mondi che reagiscono in modo credibile grazie a memoria, inventari e conseguenze narrative.

    L’articolo mette l’accento su soluzioni gratuite o utilizzabili in locale, evitando servizi costosi e privilegiando privacy e libertà creativa.

    Tra browser game, tool per PC e simulatori storici, emerge un ecosistema maturo che fonde nostalgia e innovazione. Il risultato è una mappa chiara per orientarsi tra le migliori esperienze AI-driven accessibili a tutti.

    Link alla fonte:

    https://www.navigaweb.net/2025/11/gioca-avventure-testuali-con-ai-rpg-e.html

  • I “world model” sfidano ChatGPT (e gli altri) cambiando il paradigma dell’AI

    Secondo un gruppo di scienziati di primo piano, modelli come ChatGPT hanno un limite strutturale: comprendono il linguaggio, ma non il mondo fisico.
    Ricercatori come Yann LeCun, Fei-Fei Li e Danijar Hafner promuovono i world models, sistemi che apprendono da spazio 3D, fisica e relazioni causa-effetto, non solo dalla previsione di parole.
    L’obiettivo è un’IA capace di agire, pianificare e migliorare con l’esperienza, avvicinandosi all’intelligenza di umani e animali.
    Questo cambio di paradigma potrebbe rendere obsolete le attuali architetture basate su grandi modelli linguistici e l’enorme investimento in data center e chip.
    Se confermato, aprirebbe una nuova fase verso un’IA più generale, incarnata e autonoma.

    Link alla fonte:
    https://www.abc.es/xlsemanal/a-fondo/modelos-de-mundo-ia-chatgpt.html

  • La “matematica” mette in dubbio il futuro degli agenti AI

    Un paper accademico intitolato “Hallucination Stations: On Some Basic Limitations of Transformer-Based Language Models” sostiene che gli AI agent basati su LLM siano “matematicamente incapaci” di gestire compiti agentici complessi in modo affidabile.
    Gli autori, tra cui l’ex CTO di SAP Vishal Sikka, affermano che le allucinazioni sono una limitazione strutturale impossibile da eliminare del tutto, rendendo rischioso affidare agli agent compiti critici.
    L’industria AI, tuttavia, non concorda: aziende e startup puntano su guardrail, verifica formale e sistemi ibridi per mitigare gli errori.
    Il dibattito evidenzia una tensione centrale dell’AI moderna: gli agent sono allo stesso tempo inevitabili e imperfetti, destinati a crescere nonostante i limiti teorici.
    La vera questione non è se funzioneranno senza errori, ma come cambieranno il lavoro umano e i processi decisionali.

    Link alla fonte:
    https://www.wired.com/story/ai-agents-math-doesnt-add-up/