Tag: Gemini

  • Google e il “compute metering”: un segno dei tempi?

    Qualche giorno fa Google ha silenziosamente cambiato le regole di Gemini Advanced. Sparita la politica del “hai X messaggi al giorno” (sistema rozzo ma onesto, come il tassametro di un taxi) ma un modello “compute-based” con finestra d’uso di 5 ore, che ricorda quello dei Claude. Traduzione: un prompt con un video allegato e un po’ di reasoning ti può bruciare la quota della mattinata prima che tu abbia finito di sorseggiare il tuo caffè (e farti innervosire più di quest’ultimo).
    Gli utenti hanno protestato. Google ha corretto (in parte) nel giro di 48 ore: gli errori non consumano più quota, il modello Flash-Lite diventa sostanzialmente gratuito, arrivano le statistiche sui consumi (Anthropic insegna, anche qui). Risposte rapide, comunicazione reattiva. Fin qui, quasi ammirevole.
    Il punto vero, però, è un altro.
    Non siamo di fronte a una correzione di rotta, ma a un “modello economico”: il “compute metering” è lo standard che ci ritroveremo ovunque, perché far girare un modello frontier su un’interrogazione agentica lunga e multimodale costa quanto nei primi anni di internet costava una connessione dial-up, in sostanza molto più di quanto il marketing voglia che tu sappia.
    Per l’utente medio potrebbe essere persino equo… in teoria: chi usa poco paga poco. Il problema è che “poco” e “tanto” li definisce Google, con metriche che per ora restano opache come certi contratti di hosting di vent’anni fa.
    Come formatore AI lo dico senza drammi: quando insegnate a usare questi strumenti, insegnate anche a usarli con cognizione di causa. Flash-Lite per i task semplici, modelli pesanti quando servono davvero. Non per risparmiare la quota, ma perché un professionista che spara un modello da venti miliardi di parametri per riformulare un’email ha già un problema che il compute metering non risolve.
    Del resto, diciamocelo, il cloud ha sempre funzionato così, e ora tocca anche all’AI, visto che sempre di data center e di server parliamo, con la differenza che le risorse, in questo caso, costano davvero tanto a chi le gestisce (costo che prima o poi doveva ricadere sugli utilizzatori).

  • Come creare il tuo “avatar” in Gemini Omni

    In questi pochi minuti Matt Wolfe mostra la nuova funzione “avatar” in Gemini Omni.
    Questa nuova tecnologia generativa, fra quelle presentate al recente evento Google I/O, fa ciò che finora era possibile fare solo con le immagini, ma con i video: inserire nei video anche informazioni, che tuttavia non si limitano solo al testo ma anche alla “conoscenza”.
    Come vedremo nel corso dei prossimi mesi, quasi tutte le tecnologie presentate da Google sono “risposte” a quelle introdotte finora dai suoi concorrenti, ma “amplificate” (un altro esempio sono gli agenti in Spark con le loro “skill”).

  • Lo studio RiTA rivela come gli italiani usano ChatGPT e Gemini

    Il primo studio italiano sull’uso dei chatbot GenAI, promosso dalla rete di ricerca RiTA e basato su quasi 2.000 partecipanti, fotografa in dettaglio le abitudini degli utenti italiani di strumenti come ChatGPT, Gemini e Claude.
    Le attività più diffuse sono la richiesta di spiegazioni, la generazione di immagini e la scrittura di email, mentre cresce anche l’utilizzo per riassunti, programmazione e analisi dati.
    La ricerca evidenzia però criticità importanti: utenti meno alfabetizzati digitalmente tendono a usare i chatbot per fact checking o consigli medici, attribuendo loro un’affidabilità simile a quella dei motori di ricerca.
    Emergono inoltre forti disuguaglianze sociali e di genere: l’utente “tipo” è giovane, istruito e benestante, mentre donne e persone anziane risultano meno coinvolte e più esitanti nell’adozione della GenAI.
    Lo studio sottolinea quindi l’urgenza di programmi di formazione diffusi, per evitare che l’intelligenza artificiale amplifichi divari già esistenti invece di ridurli.

    Link alla fonte:
    https://www-corriere-it.cdn.ampproject.org/v/s/www.corriere.it/tecnologia/26_maggio_23/cosa-facciamo-davvero-con-chatgpt-gemini-co-i-dati-del-primo-studio-sugli-utenti-italiani-dei-chatbot-genai-9bdbd6d2-3c12-4bf2-8ceb-ded720ad5xlk_amp.shtml?amp_js_v=0.1&amp_gsa=1#webview=1

  • Gemini trasforma gli utenti “avatar” realistici e li mette nei video

    Google ha introdotto nella sua app Google una nuova funzione di avatar AI basata sul modello video Omni, capace di creare cloni digitali fotorealistici degli utenti da inserire in video generati automaticamente.
    In un test raccontato da WIRED, il giornalista Reece Rogers ha creato in pochi minuti una versione virtuale di sé stesso, generando clip surreali ma sorprendentemente credibili, tra dinosauri a Dolores Park e surf sotto il Golden Gate Bridge.
    Nonostante errori visivi, outfit incoerenti e piccoli glitch, il risultato è stato percepito come inquietantemente realistico, soprattutto nelle espressioni facciali e nella voce sintetica.
    A differenza delle precedenti funzionalità di OpenAI con Sora, Google limita la creazione di avatar agli adulti e solo per il proprio volto, nel tentativo di ridurre i rischi legati ai deepfake non consensuali.
    La novità evidenzia quanto l’AI generativa stia accelerando verso esperienze sempre più immersive e personali, ma anche quanto siano urgenti nuove riflessioni su identità digitale, consenso e manipolazione visiva.

    Link alla fonte:
    https://www.wired.com/story/i-cloned-myself-with-geminis-ai-avatar-tool-the-result-was-unnervingly-me/

  • Gemini integra Canva e rende le immagini AI completamente modificabili

    Google ha annunciato al Google I/O 2026 una nuova integrazione tra Google, Gemini e Canva che permette di trasformare le immagini generate dall’IA in progetti completamente editabili.
    Attraverso un semplice comando testuale nella chat, gli utenti possono inviare un contenuto creato con Gemini direttamente nell’editor Canva, eliminando passaggi manuali e workflow frammentati.
    La funzione “Magic Layers” consente inoltre di separare automaticamente sfondi, oggetti e testi in livelli indipendenti, rendendo molto più semplice la modifica grafica avanzata.
    L’integrazione include anche il supporto al Brand Kit di Canva, così da adattare automaticamente colori, font e identità visiva aziendale ai contenuti generati.
    Questa collaborazione conferma la strategia di Google di trasformare Gemini in una piattaforma AI sempre più integrata con strumenti professionali di creazione e publishing digitale.

    Link alla fonte:
    https://www.hdblog.it/business/articoli/n659070/gemini-canva-modificare-immagini-ai/

  • Google I/O 2026

    Tutte le novità più importanti dell’evento Google I/O in meno di 15 minuti e con sottotitoli in italiano attivabili:
    https://youtu.be/tfx2CjqtCUI?si=JKM6_tqJlPyhqVpq

  • Google accelera sull’AI agentica: “Remy” punta a diventare un assistente AI sempre attivo

    Google starebbe sviluppando una nuova evoluzione di Gemini chiamata internamente “Remy”, progettata come assistente AI agentico capace di operare in autonomia su diverse attività digitali.
    La piattaforma permetterebbe agli utenti di salvare operazioni tra i preferiti, rinominarle e riprenderle successivamente, trasformando Gemini in un sistema più persistente e organizzato.
    Google ha però evidenziato che Agent potrebbe commettere errori o esporre involontariamente dati sensibili, motivo per cui invita gli utenti a supervisionare le attività ed evitare incarichi in ambiti professionali delicati come medicina, finanza o diritto.
    Sul fronte privacy, l’assistente conserverà dati di navigazione e cookie per personalizzare l’esperienza, lasciando comunque all’utente la possibilità di cancellare tali dati o limitare la personalizzazione.
    L’iniziativa conferma la forte accelerazione di Google verso modelli AI agentici sempre più autonomi e integrati nella quotidianità digitale.

    Link alla fonte(dove trovate anche un video “teaser”):
    https://www.tuttoandroid.net/news/2026/05/07/gemini-agent-remy-assistente-agentico-sempre-disponibile-1152502/

  • Si chiama Flow Music, e ti permette di generare musica ma anche… video musicali!

    Google ha appena sganciato una delle sue “bombe”, con una piattaforma in grado di rivoluzionare la generazione di contenuti musicali: Flow Music.

    Ho appena “fatto un giro” e, al  di là della qualità ancora simile a quella di Suno nei suoi primi stadi evolutivi, in questo caso ci si trova di fronte a una piattaforma dove la potenza di Gemini ci permette di interagire con dei prompt e con il processo “iterativo” fino a dare vita a veri e propri video musicali.

    Dopo aver scelto un prompt in grado di generare un brano particolarmente interessante e coinvolgente, ho usato una mia vecchia foto per creare, automaticamente, il video relativo secondo alcune indicazioni di massima sullo stile, ma soprattutto allineato al contenuto e allo stile del brano stesso.

    Ve lo condivido anche se ovviamente “imperfetto”, giusto per darvi un’idea di cosa si può fare con questa prima versione della piattaforma, in attesa di osservarla “crescere” come già visto per tutte quelle dell’ecosistema di Google AI.

  • Dopo ChatGPT e Claude, anche Gemini introduce simulazioni interattive direttamente in chat

    Google Gemini compie un significativo salto evolutivo introducendo modelli interattivi e simulazioni dinamiche direttamente all’interno della chat.
    Gli utenti non sono più limitati a contenuti statici, ma possono esplorare concetti complessi attraverso visualizzazioni manipolabili in tempo reale.
    Questa innovazione consente, ad esempio, di modificare parametri fisici come velocità o gravità per osservare l’impatto su sistemi come le orbite celesti.
    La funzionalità apre nuove possibilità per l’apprendimento e l’analisi, rendendo l’AI uno strumento più immersivo e sperimentale.
    Il rollout è in corso a livello globale e accessibile tramite il modello Pro sulla piattaforma ufficiale.

    Link alla fonte: 
    https://andreagaleazzi.com/news/gemini-introduce-simulazioni-interattive-modelli-esplorabili-direttamente-in-chat/

    Una piccola precisazione: funzionalità di questo tipo erano già state introdotte dai principali concorrenti nel mese di marzo 2026.
    OpenAI ha rilasciato per ChatGPT spiegazioni visive interattive focalizzate su materie STEM, con grafici animati e slider per modificare variabili in tempo reale (disponibili anche agli utenti gratuiti).
    Pochi giorni dopo, Anthropic ha integrato in Claude visualizzazioni “living” inline (chiamate spesso interactive visuals o whiteboard visualizations), capaci di generare diagrammi, dashboard e vere e proprie mini-app modificabili durante la conversazione.
    L’aggiornamento di Gemini si inserisce quindi in una rapida evoluzione del settore, con un’enfasi particolare su simulazioni fisiche e modelli 3D esplorabili direttamente nella chat.

  • Arriva “Google desktop app”

    Google sta “detronizzando” Bing e Copilot di Microsoft direttamente dall’interno di Windows?

    Ho appena letto su Silicon India della nuova applicazione Google (sic!) per Windows, l’ho scaricata e… mi rendo conto che si tratta di un’app pronta per sostituire quelle concorrenti (comprese quelle native di Microsoft, ma non solo) offrendo “al volo” funzionalità di AI e ricerca con la semplice combinazione di tasti Alt + Barra spaziatrice.

    L’app, inoltre, offre tutta la multimodalità di Gemini e addirittura la funzione di condivisione dello schermo, che per quanto sia “limitata” a catturare il contenuto di una finestra o dell’intero schermo per poi usarlo come allegato di AI Mode (Gemini), unita alla potenza di ricerca di Lens diventa uno strumento incredibilmente flessibile e rapido per ottenere informazioni e assistenza su virtualmente qualsiasi cosa.

    Domanda: come mai la notizia è passata così in sordina, finora, che ho dovuto leggerla su una testata indiana per scoprirla?

    Se volete “farci un giro”, ecco il link alla pagina ufficiale, intanto:

    https://search.google/google-app/desktop

  • Google introduce i notebook in Gemini e trasforma la gestione dei progetti con l’AI

    Google ha annunciato l’introduzione dei notebook all’interno di Gemini, trasformando l’assistente in uno strumento avanzato di gestione della conoscenza.
    I notebook (equivalenti dei progetti di ChatGPT o Claude) permettono di organizzare chat, file e fonti in spazi dedicati a singoli “contenitori”, migliorando coerenza e continuità delle interazioni con l’IA.
    La forte integrazione con NotebookLM consente una sincronizzazione automatica dei contenuti tra piattaforme, rendendo più fluido il passaggio tra analisi, sintesi e produzione di contenuti.
    Gli utenti possono inoltre personalizzare fonti, tono e memoria del contesto, aumentando il controllo sull’output dell’IA. Questa novità segna un passo importante verso un utilizzo più strutturato e produttivo dell’intelligenza artificiale.

    Link alla fonte:
    https://www.tuttoandroid.net/news/2026/04/09/gemini-notebook-1148103/

  • Idea + Vibe Design + Vibe Coding = rivoluzione by Google

    Ieri vi ho parlato del lancio di Google Stitch, ma naturalmente non potevo esimermi dal “farci un giro” e sottoporlo a qualcosa di impegnativo.

    Usando un semplice prompt in cui chiedevo di creare qualcosa che fosse ispirato alla Kabbalah, ho ottenuto una serie di layout di interfaccia che combinavano sacro e moderno. Uno di questi è visibile in alto a sinistra nello screenshot, ed è quello che ho allegato poi in Gemini, chiedendo all’AI di sviluppare un’applicazione per l’esplorazione dei significati sacri delle 22 lettere ebraiche.

    Gemini ha sviluppato, in React, l’applicazione che si vede a destra dello screenshot, completamente interattiva.

    Un altro aspetto sicuramente interessante sono i suggerimenti che Stitch visualizza a seguito dello sviluppo, e che sono naturalmente ispirati all’idea di partenza.

    Se non avete ancora provato questa meraviglia, o non l’avete ancora abbinata ai Canvas di Gemini, è arrivato il momento di farlo e creare l’applicazione (o le applicazioni) dei vostri sogni.

    E se volete esplorare l’AI di Google e la potenza e versatilità di Gemini e NotebookLM, vi lascio il link al mio nuovo libro sull’argomento:

    https://www.hoepli.it/libro/google-ai-e-gemini-for-dummies/9788836020645.html

  • Gemini è diventato ancora più potente nel generare infografiche, ma lo stai davvero utilizzando al massimo delle sue potenzialità?

    Leggendo un post di Axelle Malek (di cui vi lascio come sempre il link sotto) ho appena scoperto come attingere a una vera miniera d’oro visuale, ovvero le infografiche su Pinterest, per scoprire nuovi stili da dare in pasto a Gemini affinché ne estragga il “concept” e lo impieghi per rappresentare i miei dati.

    In Pinterest non solo puoi sfogliare all’infinito i risultati della semplice ricerca “infografiche”, ma anche mettere nei “preferiti” quelli che ti piacciono di più o salvarle come file, seguire l’autore, oppure cercare altre infografiche dallo stile simile (vedi il menu nella terza immagine in basso).

    Per il resto, vi lascio al post da cui sono partito, per scoprire altre interessanti strategie per il vostro lavoro sulle infografiche:

    https://www.linkedin.com/posts/axellemalek_people-are-making-handwritten-infographics-activity-7435618040416940032-lFz_

  • Google e OpenAI accelerano sull’AI efficiente con Gemini 3.1 Flash-Lite e GPT-5.3 Instant

    Google e OpenAI hanno presentato quasi in parallelo due aggiornamenti ai loro modelli di intelligenza artificiale con l’obiettivo di migliorare efficienza, velocità e qualità delle risposte.
    Google ha introdotto Gemini 3.1 Flash-Lite, un modello progettato per applicazioni su larga scala che offre costi molto ridotti per milione di token e prestazioni più rapide rispetto alla generazione precedente, rendendolo adatto a traduzioni massive, moderazione dei contenuti e automazioni in tempo reale.
    Parallelamente OpenAI ha rilasciato GPT-5.3 Instant, focalizzato sul miglioramento dell’esperienza conversazionale: risposte più naturali, meno premesse difensive e una riduzione significativa delle allucinazioni nei test interni.
    L’aggiornamento introduce anche una migliore integrazione tra ricerca web e ragionamento del modello, con risposte più pertinenti e sintetiche.
    Le due novità evidenziano una tendenza comune nel settore: rendere i modelli AI non solo più potenti, ma anche più economici, affidabili e adatti all’uso quotidiano da parte di sviluppatori, aziende e utenti finali.

    Link alle fonti:

    https://www.hdblog.it/google/articoli/n650481/gemini-3-1-flash-lite-google/

    https://www.hdblog.it/applicazioni/articoli/n650392/openai-rilascia-gpt-53-instant/

  • I modelli di AI affrontano “Humanity’s Last Exam” per misurare la distanza dalla AGI

    I principali modelli di intelligenza artificiale — ChatGPT, Gemini, Claude e DeepSeek — sono stati sottoposti a Humanity’s Last Exam, un benchmark estremo progettato per valutare quanto siano vicini al livello di conoscenza degli esperti umani.
    Il test, pubblicato sulla rivista Nature e sviluppato dal Center for AI Safety insieme a Scale AI, comprende 2.500 domande di livello dottorale distribuite su oltre 100 discipline.
    A febbraio 2026 il miglior risultato è stato ottenuto da Gemini 3 Deep Think con il 48,4%, ancora distante dal circa 90% raggiunto dagli esperti umani nei rispettivi campi.
    I ricercatori sottolineano che, nonostante i rapidi progressi, superare questo benchmark non equivarrebbe automaticamente a raggiungere l’intelligenza artificiale generale (AGI).
    Lo studio riaccende quindi il dibattito su quanto tempo manchi davvero prima che l’IA raggiunga capacità paragonabili a quelle umane nella ricerca e nel ragionamento avanzato.

    Link alla fonte:
    https://www.elconfidencial.com/tecnologia/2026-03-05/ia-ultimo-examen-humanidad-agi-1qrt_4313376/

  • Nano Banana 2 sta per spodestare Midjourney? Parrebbe di sì.

    Nel mio libro “AI Art”, pubblicato a giugno dell’anno scorso, per chi volesse ottenere risultati veramente professionali suggerivo Midjourney come piattaforma in grado di offrire una qualità ineguagliabile (allora), anche se disponibile solo a pagamento.

    Google ha appena aggiornato il suo modello grafico, e direi che Midjourney ha le ore contate (per fortuna i principi che espongo nel libro sono validi a prescindere dalla piattaforma).

    Eccovi un esempio di immagine generata dal nuovo Nano Banana con questo prompt: “Ritratto fotorealistico di un guerriero nativo americano di circa 40 anni, con pelle ramata segnata dal sole e sottili linee d’espressione, capelli lunghi e lisci color nero corvino raccolti in una treccia, occhi profondi e contemplativi. Indossa abiti tradizionali in pelle scamosciata decorati con perline artigianali e piume naturali, dai toni terra e ocra. Luce calda dell’ora dorata proveniente da destra, bassa sull’orizzonte, che crea un contrasto morbido e un’illuminazione pittorica in stile Rembrandt, enfatizzando la texture della pelle e dei materiali. Scattato con Nikon Z9 e obiettivo 85mm f/1.4. Profondità di campo ridotta, sfondo sfocato di una prateria aperta con erba alta mossa dal vento.”

  • L’evoluzione silenziosa e inarrestabile di NotebookLM

    NotebookLM si evolve in silenzio rivelandosi ancora una volta come la una delle piattaforme di AI generativa più interessanti e utili per studio e ricerca

    Gli ultimi aggiornamenti di NotebookLM sono stati descritti come fra i più significativi dal lancio, introducendo miglioramenti sia nelle capacità di analisi che nelle opzioni di creazione. Proverò a riassumervi le novità:

    Capacità di contesto aumentata: il sistema è stato ricostruito per elaborare una quantità di materiale sorgente otto volte superiore in una singola conversazione. Questo permette all’IA di consultare tutte le fonti contemporaneamente invece di selezionarne solo alcune parti.

    Memoria della conversazione: la memoria è diventata sei volte più lunga, consentendo interazioni complesse senza che l’IA dimentichi l’inizio della chat.

    Qualità delle risposte: miglioramento del 50% nella qualità delle risposte per le grandi raccolte di fonti, rendendole più nitide e specifiche.

    Il limite dei caratteri per le istruzioni personalizzate è passato da 500 a 10.000 caratteri (un aumento di 20 volte): NotebookLM diventa così un vero e proprio assistente di ricerca specializzato, personalizzabile in dettaglio nel tono, nel “modo di pensare” e nel formato delle risposte.

    – Oltre al classico formato “Deep Dive”, l’Audio Overview offre ora tre nuove modalità per generare podcast dai propri documenti: Brief, un riassunto veloce di 1-2 minuti per comprendere rapidamente i punti salienti; Critique, in cui due host analizzano le fonti evidenziando punti deboli, lacune argomentative o prove mancanti e Debate, nel quale gli host assumono posizioni opposte su un tema estratto dalle fonti (utile per visualizzare diversi punti di vista quando i documenti non concordano tra loro). È inoltre possibile fornire istruzioni personalizzate specifiche anche per la generazione di questi file audio.

    Data Tables: una nuova funzione nel pannello Studio permette di creare tabelle di confronto strutturate estraendo dati direttamente dalle fonti. Queste tabelle sono esportabili in Google Sheets con un clic.

    Controllo creativo sui “visual”: per le infografiche e le slide è ora possibile scegliere l’orientamento (orizzontale, verticale o quadrato), il livello di dettaglio e utilizzare un prompt personalizzato per descrivere l’estetica desiderata (ad esempio, uno stile editoriale o minimalista). Inoltre, è ora possibile usare i prompt per modificare le slide.

    È ora possibile collegare i propri notebook direttamente all’app Gemini: i notebook possono essere utilizzati come fonti all’interno di Gemini o aggiunti ai Gem personalizzati, permettendo di utilizzare le fonti verificate di NotebookLM per compiti di scrittura creativa o analisi avanzata all’interno dell’ecosistema Gemini.

    Fra due settimane sarà disponibile in tutte le librerie fisiche e online il mio nuovo manuale sull’ecosistema AI di Google, con capitoli dedicati proprio a NotebookLM, puoi già pre-ordinaro su Amazon:

    https://amzn.eu/d/0jaLojUz

  • Google potenzia Gemini: dalle foto ai video con modelli predefiniti e limiti chiari su Veo 3.1 e Lyria 3

    Google amplia le capacità creative di Gemini introducendo modelli video predefiniti che permettono di trasformare foto o descrizioni testuali in clip pronte all’uso, riducendo la necessità di prompt complessi.
    La nuova sezione “Crea video” integra stili guidati e si collega alla funzione Ingredients to Video, ora compatibile anche con il formato verticale 9:16.
    La generazione video si basa sul modello Veo 3.1, con limiti giornalieri differenziati per i piani AI Plus, Pro e Ultra. In parallelo, Google chiarisce anche le soglie per la musica generata con Lyria 3, delineando un ecosistema creativo strutturato ma regolato da contatori precisi.
    L’obiettivo è consolidare Gemini come piattaforma completa per la produzione multimediale AI, bilanciando semplicità d’uso e controllo delle risorse.

    Link alla fonte:
    https://www.smartworld.it/news/google-gemini-video-foto-modelli-veo.html