In questi pochi minuti Matt Wolfe mostra la nuova funzione “avatar” in Gemini Omni.
Questa nuova tecnologia generativa, fra quelle presentate al recente evento Google I/O, fa ciò che finora era possibile fare solo con le immagini, ma con i video: inserire nei video anche informazioni, che tuttavia non si limitano solo al testo ma anche alla “conoscenza”.
Come vedremo nel corso dei prossimi mesi, quasi tutte le tecnologie presentate da Google sono “risposte” a quelle introdotte finora dai suoi concorrenti, ma “amplificate” (un altro esempio sono gli agenti in Spark con le loro “skill”).
Tag: Video
-
Come creare il tuo “avatar” in Gemini Omni
-
Gemini trasforma gli utenti “avatar” realistici e li mette nei video
Google ha introdotto nella sua app Google una nuova funzione di avatar AI basata sul modello video Omni, capace di creare cloni digitali fotorealistici degli utenti da inserire in video generati automaticamente.
In un test raccontato da WIRED, il giornalista Reece Rogers ha creato in pochi minuti una versione virtuale di sé stesso, generando clip surreali ma sorprendentemente credibili, tra dinosauri a Dolores Park e surf sotto il Golden Gate Bridge.
Nonostante errori visivi, outfit incoerenti e piccoli glitch, il risultato è stato percepito come inquietantemente realistico, soprattutto nelle espressioni facciali e nella voce sintetica.
A differenza delle precedenti funzionalità di OpenAI con Sora, Google limita la creazione di avatar agli adulti e solo per il proprio volto, nel tentativo di ridurre i rischi legati ai deepfake non consensuali.
La novità evidenzia quanto l’AI generativa stia accelerando verso esperienze sempre più immersive e personali, ma anche quanto siano urgenti nuove riflessioni su identità digitale, consenso e manipolazione visiva.Link alla fonte:
https://www.wired.com/story/i-cloned-myself-with-geminis-ai-avatar-tool-the-result-was-unnervingly-me/ -
Gemini Omni sarà la prossima bomba che Google sgancerà all’evento del 19 e 20 maggio?
Google potrebbe essere pronta a lanciare Gemini Omni, un nuovo modello di generazione video basato su intelligenza artificiale scoperto da alcuni utenti all’interno dell’app Gemini, anche se non è ancora stato annunciato ufficialmente.
Le prime demo condivise online mostrano la capacità del sistema di creare scene molto dettagliate e coerenti, sia in contesti educativi — come un professore che spiega formule matematiche alla lavagna — sia in ambientazioni cinematografiche con personaggi realistici e interazioni naturali.
I risultati evidenziano un notevole salto qualitativo nella resa visiva e narrativa, pur con alcune imperfezioni nei movimenti e nella sincronizzazione degli elementi.
Secondo le informazioni emerse, il modello avrebbe però limiti di utilizzo piuttosto stringenti anche per gli utenti del piano Google AI Pro, suggerendo un elevato consumo computazionale.
L’annuncio ufficiale potrebbe arrivare durante il prossimo evento Google I/O 2026, dove Google potrebbe rafforzare ulteriormente la competizione nel settore dei video generativi contro piattaforme come Sora di OpenAI e altri modelli multimodali emergenti.Link alla fonte (include video):
https://multiplayer.it/notizie/gemini-omni-e-il-nuovo-generatore-di-video-ultra-realistici-ecco-cosa-puo-fare.html -
Si chiama Flow Music, e ti permette di generare musica ma anche… video musicali!
Google ha appena sganciato una delle sue “bombe”, con una piattaforma in grado di rivoluzionare la generazione di contenuti musicali: Flow Music.
Ho appena “fatto un giro” e, al di là della qualità ancora simile a quella di Suno nei suoi primi stadi evolutivi, in questo caso ci si trova di fronte a una piattaforma dove la potenza di Gemini ci permette di interagire con dei prompt e con il processo “iterativo” fino a dare vita a veri e propri video musicali.
Dopo aver scelto un prompt in grado di generare un brano particolarmente interessante e coinvolgente, ho usato una mia vecchia foto per creare, automaticamente, il video relativo secondo alcune indicazioni di massima sullo stile, ma soprattutto allineato al contenuto e allo stile del brano stesso.
Ve lo condivido anche se ovviamente “imperfetto”, giusto per darvi un’idea di cosa si può fare con questa prima versione della piattaforma, in attesa di osservarla “crescere” come già visto per tutte quelle dell’ecosistema di Google AI.
-
NotebookLM introduce le Cinematic Video Overview: video AI immersivi generati automaticamente dalle fonti
NotebookLM introduce i Cinematic Video Overviews, una nuova funzione che espande le precedenti Video Overviews trasformandole in veri e propri video immersivi generati dall’AI.
Il sistema utilizza una combinazione di modelli avanzati di Gemini, Veo e Nano Banana Pro per creare animazioni fluide e visual ricchi a partire dalle fonti dell’utente.
Gemini assume il ruolo di “creative director”, prendendo centinaia di decisioni narrative e stilistiche per costruire la storia, scegliere lo stile visivo e mantenere la coerenza del video.
Il risultato sono contenuti più dinamici e coinvolgenti rispetto alle precedenti presentazioni con slide narrate.
La funzionalità è disponibile inizialmente in inglese per gli abbonati Google AI Ultra (18+) su web e mobile.Annuncio ufficiale:
https://blog.google/innovation-and-ai/products/notebooklm/generate-your-own-cinematic-video-overviews-in-notebooklm/Video “trailer” di esempio:
-
Google potenzia Gemini: dalle foto ai video con modelli predefiniti e limiti chiari su Veo 3.1 e Lyria 3
Google amplia le capacità creative di Gemini introducendo modelli video predefiniti che permettono di trasformare foto o descrizioni testuali in clip pronte all’uso, riducendo la necessità di prompt complessi.
La nuova sezione “Crea video” integra stili guidati e si collega alla funzione Ingredients to Video, ora compatibile anche con il formato verticale 9:16.
La generazione video si basa sul modello Veo 3.1, con limiti giornalieri differenziati per i piani AI Plus, Pro e Ultra. In parallelo, Google chiarisce anche le soglie per la musica generata con Lyria 3, delineando un ecosistema creativo strutturato ma regolato da contatori precisi.
L’obiettivo è consolidare Gemini come piattaforma completa per la produzione multimediale AI, bilanciando semplicità d’uso e controllo delle risorse.Link alla fonte:
https://www.smartworld.it/news/google-gemini-video-foto-modelli-veo.html -
OpenAI ammette: Sora 2 è “insostenibile” e continua a bruciare miliardi
OpenAI sta affrontando una crisi economica interna legata a Sora 2, il suo generatore video basato su IA.
Secondo Futurism e Forbes, la società avrebbe registrato perdite per circa 12 miliardi di dollari nell’ultimo trimestre, con Sora 2 responsabile di una quota significativa dei costi operativi.
Si stima che il modello costi fino a 5 miliardi di dollari l’anno, pari a circa 15 milioni al giorno, nonostante non sia ancora disponibile pubblicamente.
L’analista Deepak Mathivanan (Cantor Fitzgerald) ha calcolato un costo medio di 1,30 dollari per ogni 10 secondi di video generato, mentre Bill Peebles, responsabile del progetto, ha definito il modello “completamente insostenibile”.
L’episodio alimenta i timori di una possibile bolla dell’intelligenza artificiale, con OpenAI che, nonostante le perdite, prevede investimenti futuri nell’ordine del trilione di dollari.
Link alla fonte:
-
Google potenzia la generazione video guidata da più immagini in Gemini
Google sta distribuendo un aggiornamento di Gemini che consente di creare video con Veo utilizzando fino a tre immagini come riferimento visivo, eliminando la necessità di prompt lunghi e altamente descrittivi.
Le immagini fungono da ancore per personaggi, stile e ambientazioni, migliorando coerenza e controllo creativo.
La funzione si rivela utile per mantenere volti e oggetti coerenti, trasferire estetiche specifiche e ricostruire scenari affini all’interno dei video generati.
Nelle demo ufficiali, i personaggi mostrati nelle foto vengono integrati con fluidità nelle scene richieste dal prompt.
L’aggiornamento, basato su Veo 3.1, è in rollout e sarà disponibile per gli utenti dei piani AI Plus, Pro e Ultra.
Link alla fonte:
https://www.hdblog.it/google/articoli/n638495/google-gemini-nuova-funzione-video-veo/
