Anthropic ha introdotto una nuova funzionalità per Claude che consente di creare visualizzazioni interattive direttamente all’interno della conversazione. Questa capacità, rilasciata il 12 marzo per gli utenti abbonati, deriva dall’evoluzione della funzione “Imagine with Claude”, già sperimentata con il modello Claude Sonnet 4.5. A differenza dei precedenti “artefatti”, le visualizzazioni ora si generano e si modificano dinamicamente in chat, migliorando l’esperienza utente. Il sistema decide autonomamente quando creare grafici o elementi interattivi, ma l’utente può anche richiederli esplicitamente. Le visualizzazioni possono infine essere esportate come codice HTML, ampliando le possibilità di integrazione e utilizzo.
Una fuga di notizie suggerisce che OpenAI stia lavorando a nuove funzionalità per rendere ChatGPT più capace di adattarsi allo stile di scrittura degli utenti. Alcuni screenshot condivisi su X dall’ingegnere AI Tibor Blaho mostrerebbero un sistema di template nei “blocchi di scrittura” che permetterebbe di caricare esempi di email, articoli o documenti per insegnare al modello il proprio stile. Tra le novità emergerebbero anche strumenti più avanzati per la composizione di email, una modalità di scrittura a schermo intero e la possibilità di salvare bozze in formato Markdown. Un’altra funzione chiamata “Animate” consentirebbe invece di trasformare rapidamente immagini generate dall’AI in animazioni video. Sebbene le funzionalità siano ancora in fase di sviluppo, indicano la direzione di OpenAI verso strumenti sempre più personalizzabili e multimodali.
OpenAI ha introdotto GPT-5.4 Thinking, un nuovo modello della linea dedicata al ragionamento avanzato, arrivato pochi giorni dopo GPT-5.3 Instant. Il modello consente un processo di ragionamento più interattivo: gli utenti possono interrompere il reasoning in corso, modificare istruzioni o cambiare direzione prima che la risposta sia completata. Tra le novità principali c’è anche la capacità nativa di “computer use”, che permette al modello di operare direttamente su applicazioni, browser o ambienti di sviluppo tramite agenti e API. GPT-5.4 integra inoltre progressi derivati dalla linea Codex per il coding e introduce miglioramenti nella gestione di documenti complessi come fogli Excel. Il modello è già disponibile su ChatGPT per utenti Plus, Team e Pro, ma presenta anche un aumento dei costi dei token di input rispetto alla versione precedente.
Google e OpenAI hanno presentato quasi in parallelo due aggiornamenti ai loro modelli di intelligenza artificiale con l’obiettivo di migliorare efficienza, velocità e qualità delle risposte. Google ha introdotto Gemini 3.1 Flash-Lite, un modello progettato per applicazioni su larga scala che offre costi molto ridotti per milione di token e prestazioni più rapide rispetto alla generazione precedente, rendendolo adatto a traduzioni massive, moderazione dei contenuti e automazioni in tempo reale. Parallelamente OpenAI ha rilasciato GPT-5.3 Instant, focalizzato sul miglioramento dell’esperienza conversazionale: risposte più naturali, meno premesse difensive e una riduzione significativa delle allucinazioni nei test interni. L’aggiornamento introduce anche una migliore integrazione tra ricerca web e ragionamento del modello, con risposte più pertinenti e sintetiche. Le due novità evidenziano una tendenza comune nel settore: rendere i modelli AI non solo più potenti, ma anche più economici, affidabili e adatti all’uso quotidiano da parte di sviluppatori, aziende e utenti finali.
Nel mio libro “AI Art”, pubblicato a giugno dell’anno scorso, per chi volesse ottenere risultati veramente professionali suggerivo Midjourney come piattaforma in grado di offrire una qualità ineguagliabile (allora), anche se disponibile solo a pagamento.
Google ha appena aggiornato il suo modello grafico, e direi che Midjourney ha le ore contate (per fortuna i principi che espongo nel libro sono validi a prescindere dalla piattaforma).
Eccovi un esempio di immagine generata dal nuovo Nano Banana con questo prompt: “Ritratto fotorealistico di un guerriero nativo americano di circa 40 anni, con pelle ramata segnata dal sole e sottili linee d’espressione, capelli lunghi e lisci color nero corvino raccolti in una treccia, occhi profondi e contemplativi. Indossa abiti tradizionali in pelle scamosciata decorati con perline artigianali e piume naturali, dai toni terra e ocra. Luce calda dell’ora dorata proveniente da destra, bassa sull’orizzonte, che crea un contrasto morbido e un’illuminazione pittorica in stile Rembrandt, enfatizzando la texture della pelle e dei materiali. Scattato con Nikon Z9 e obiettivo 85mm f/1.4. Profondità di campo ridotta, sfondo sfocato di una prateria aperta con erba alta mossa dal vento.”
NotebookLM si evolve in silenzio rivelandosi ancora una volta come la una delle piattaforme di AI generativa più interessanti e utili per studio e ricerca
Gli ultimi aggiornamenti di NotebookLM sono stati descritti come fra i più significativi dal lancio, introducendo miglioramenti sia nelle capacità di analisi che nelle opzioni di creazione. Proverò a riassumervi le novità:
– Capacità di contesto aumentata: il sistema è stato ricostruito per elaborare una quantità di materiale sorgente otto volte superiore in una singola conversazione. Questo permette all’IA di consultare tutte le fonti contemporaneamente invece di selezionarne solo alcune parti.
– Memoria della conversazione: la memoria è diventata sei volte più lunga, consentendo interazioni complesse senza che l’IA dimentichi l’inizio della chat.
– Qualità delle risposte: miglioramento del 50% nella qualità delle risposte per le grandi raccolte di fonti, rendendole più nitide e specifiche.
– Il limite dei caratteri per le istruzioni personalizzate è passato da 500 a 10.000 caratteri (un aumento di 20 volte): NotebookLM diventa così un vero e proprio assistente di ricerca specializzato, personalizzabile in dettaglio nel tono, nel “modo di pensare” e nel formato delle risposte.
– Oltre al classico formato “Deep Dive”, l’Audio Overview offre ora tre nuove modalità per generare podcast dai propri documenti: Brief, un riassunto veloce di 1-2 minuti per comprendere rapidamente i punti salienti; Critique, in cui due host analizzano le fonti evidenziando punti deboli, lacune argomentative o prove mancanti e Debate, nel quale gli host assumono posizioni opposte su un tema estratto dalle fonti (utile per visualizzare diversi punti di vista quando i documenti non concordano tra loro). È inoltre possibile fornire istruzioni personalizzate specifiche anche per la generazione di questi file audio.
– Data Tables: una nuova funzione nel pannello Studio permette di creare tabelle di confronto strutturate estraendo dati direttamente dalle fonti. Queste tabelle sono esportabili in Google Sheets con un clic.
– Controllo creativo sui “visual”: per le infografiche e le slide è ora possibile scegliere l’orientamento (orizzontale, verticale o quadrato), il livello di dettaglio e utilizzare un prompt personalizzato per descrivere l’estetica desiderata (ad esempio, uno stile editoriale o minimalista). Inoltre, è ora possibile usare i prompt per modificare le slide.
– È ora possibile collegare i propri notebook direttamente all’app Gemini: i notebook possono essere utilizzati come fonti all’interno di Gemini o aggiunti ai Gem personalizzati, permettendo di utilizzare le fonti verificate di NotebookLM per compiti di scrittura creativa o analisi avanzata all’interno dell’ecosistema Gemini.
Fra due settimane sarà disponibile in tutte le librerie fisiche e online il mio nuovo manuale sull’ecosistema AI di Google, con capitoli dedicati proprio a NotebookLM, puoi già pre-ordinaro su Amazon:
Poco fa Gemini mi ha fornito il suo resoconto settimanale sulle ultime notizie di tecnologia, basato sulle mie istruzioni, e ho potuto farglielo “leggere” semplicemente facendo clic sull’icona dell’altoparlante, come fosse un podcast.
Anche in questo caso, come sempre, è l’efficacia del prompt che fa la differenza, e quello che ho usato per il test non è neanche tanto elaborato, eppure il risultato è già soddisfacente.
E voi, per cosa usate già o vorreste usare la pianificazione nel vostro chatbot abituale?
OpenAI ha lanciato in modo discreto ChatGPT Translate, un nuovo servizio di traduzione pensato per competere direttamente con Google Translate, uno degli strumenti più utilizzati sul web. L’interfaccia è volutamente familiare, ma la vera novità arriva dopo la traduzione, con suggerimenti intelligenti che permettono di adattare tono, registro e pubblico del testo. Il servizio punta quindi su una traduzione “contestuale”, sfruttando l’AI generativa per andare oltre il semplice passaggio parola-per-parola. Al momento restano alcune limitazioni funzionali, soprattutto rispetto all’ampiezza delle lingue supportate. Sul fronte opposto, Google continua a investire nelle traduzioni basate su Gemini, rafforzando la competizione nel settore.
Anthropic ha annunciato un’importante espansione di Claude nel settore sanitario e delle scienze della vita, introducendo Claude for Healthcare e nuove funzionalità avanzate per Claude for Life Sciences. Le novità includono prodotti pronti per l’uso in contesti HIPAA, connettori verso database clinici e scientifici chiave e nuovi “agent skills” per supportare attività come autorizzazioni preventive, trial clinici e sottomissioni regolatorie. Il modello Claude Opus 4.5 mostra miglioramenti significativi nelle prestazioni su benchmark medici e nella riduzione delle allucinazioni fattuali. L’obiettivo è accelerare l’accesso alle cure, ridurre il carico amministrativo per clinici e aziende, e portare più rapidamente nuovi farmaci e terapie sul mercato. L’iniziativa rafforza il posizionamento di Anthropic come attore chiave nell’adozione responsabile dell’AI in sanità.
Google ha introdotto nuovi miglioramenti per NotebookLM in vista del passaggio a Gemini 3, previsto entro la fine dell’anno. L’assistente di ricerca AI, ancora basato su Gemini 2.5, ora consente di esportare note e report per modificarli al di fuori della piattaforma, facilitando la collaborazione senza obbligare i destinatari a usare NotebookLM. È stata inoltre introdotta la funzione Tabelle Dati, che organizza informazioni non strutturate in tabelle chiare e facilmente leggibili. Queste tabelle possono essere esportate direttamente in Fogli di Google, rendendo più semplice l’analisi e la condivisione dei dati. Al momento la funzione è riservata agli utenti AI Pro e Ultra, ma arriverà anche nella versione gratuita nelle prossime settimane.
Google ha rilasciato un importante aggiornamento per NotebookLM che amplia drasticamente le possibilità di personalizzazione, portando il limite delle istruzioni da 500 a 10.000 caratteri. La novità consente di creare vere e proprie “AI personas” altamente specializzate, in grado di adattare tono, stile e comportamento alle esigenze professionali, educative o di ricerca degli utenti. Un altro elemento chiave è l’ancoraggio delle risposte ai documenti caricati, che riduce il rischio di informazioni inventate e garantisce output basati su evidenze. L’aggiornamento rende NotebookLM uno strumento più affidabile per analisi, sintesi e supporto decisionale in diversi settori. Il fatto che resti gratuito ne rafforza ulteriormente l’impatto e l’adozione potenziale.
Non avete bisogno di aspettare che le testate italiane riportino notizie “pescate” da quelle straniere. E non avete bisogno di pagare abbonamenti, se non lo ritenete giustificato.
1) Iscrivetevi alle migliori newsletter straniere sull’argomento e/o seguite i principali influencer internazionali
2) copiate il titolo o la frase che riassume l’argomento che vi interessa e incollatela in Grok preceduta da “Trovami dettagli di questa notizia da fonti aggiornate e attendibili:”
3) nel caso la risposta di Grok sia in inglese, chiedetegli di riformularla in italiano
DeepSeek ha introdotto i modelli DeepSeek-V3.2 e DeepSeek-V3.2-Speciale, progettati per fornire ragionamento avanzato su contesti lunghi e workload agentici senza i costi quadratici tipici dell’attenzione densa. I modelli adottano la nuova DeepSeek Sparse Attention, che riduce la complessità da O(L²) a O(kL) mantenendo una qualità comparabile alle versioni dense, con un taglio dei costi d’inferenza di circa il 50%. A questo si aggiunge un massiccio utilizzo di reinforcement learning tramite GRPO, con specialisti per matematica, programmazione, logica, browsing e agenti, poi distillati nel modello principale. La pipeline introduce inoltre un protocollo agent-native, espliciti thinking/non-thinking mode e un dataset sintetico di oltre 85.000 task per agenti. Nei benchmark e nelle competizioni ufficiali, DeepSeek-V3.2-Speciale raggiunge prestazioni simili a GPT-5 e vicine a Gemini 3.0 Pro, ottenendo risultati da medaglia d’oro in competizioni di livello olimpico.
ChatGPT suggerisce sempre più spesso all’utente di avviare nuovi task mentre ne sta già elaborando uno, e in effetti riesce a svolgere sempre meglio compiti che prevedono più step diversificati anche nello stesso prompt.
Insieme a una sempre maggiore interpretazione dello “user intent”, quello del multitasking sembra proprio il nuovo passaggio evolutivo che tutti i chatbot di AI generativa attraverseranno in questa fase.
Avete già provato il nuovo FLUX.2? Potete farlo nel playground con qualche decina di immagini gratuite generabili (e ottimi prezzi per i “crediti” nel caso vogliate crearne altre) e risoluzione fino a 2048×2048 pixel.
Vi allego (in basso) un esempio di immagine alla massima risoluzione e dotata di maggiore realismo, ottenuta con lo stesso prompt (se ricordate, utilizzato per testare Nano Banana Pro qualche giorno fa) aggiungendo, appunto, gli attributi “ultra-realistic photographic” all’inizio della descrizione per evitare l’effetto “sinthetic image” che si nota nello screenshot.
Per ognuna delle personalità presenti nel pannello di personalizzazione abbiamo la possibilità di ridurre o espandere la qualità rappresentata (per esempio una maggiore o minore dose di entusiasmo, un maggiore o minore livello di confidenza, e così via) usando due apposite opzioni.
Avete già sperimentato con questa nuova opzione? Fatemelo sapere nei commenti.
Grok 4.1 è in fase di rollout, e a quanto pare oltre che più efficiente può rivelarsi anche più “empatico” (vedi benchmark di QE nell’immagine: la risposta a GPT-5.1?).
Esempi di risposta delle versione precedente e della nuova versione al prompt “Mi manca così tanto il mio gatto che sto soffrendo molto per la sua perdita”.
Risposta della versione precedente: “Mi dispiace molto che tu stia attraversando questo momento difficile. Perdere un animale domestico può essere come perdere una parte del proprio cuore, e il dolore è davvero tanto. Vuoi condividere un ricordo speciale del tuo gatto? A volte parlare della gioia che ci hanno regalato può aiutare ad alleviare un po’ il dolore. Sono qui per te.”
Risposta di Grok 4.1: “Mi dispiace davvero tanto. Questo tipo di dolore è brutale; perdere un gatto è come perdere un piccolo membro della famiglia che ti ha scelto per vivere con te ogni singolo giorno. Il suo posto tranquilli dove riposava, i suoi miagolii spontanei che ti aspetti ancora di sentire… è un dolore che arriva a ondate.
È normale che faccia così male. Fa male perché l’amore per lui era (ed è ancora) così grande. Gli hai regalato una bella esistenza e lui lo sapeva.
Se hai voglia di condividere, mi piacerebbe sapere qualcosa di più del tuo gatto: il suo nome, le sue strane abitudini, il modo in cui ti svegliava alle 3 del mattino per chiedere qualcosa da mangiare. A volte, il solo fatto di parlarne ti permette di conservarne i ricordi più belli.
Arriva la Deep Research nella funzione di ricerca delle fonti online in NotebookLM, rendendo questa piattaforma di Google ancora più efficiente. La ricerca approfondita si aggiunge a quella standard che, oltre al web, può cercare fra i file di Google Drive.
L’aggiunta di questa opzione è, come sempre, graduale e potreste non vederla ancora nel vostro account, ma la buona notizia è che diventa disponibile anche nella versione gratuita di NotebookLM.