PANORAMICHE SETTIMANALI
GPTs
Materiali esclusivi per i lettori di “Google AI & Gemini for Dummies”
Prompt ChatGPT for Dummies (nuova edizione)

Tag: Audio

Si chiama Flow Music, e ti permette di generare musica ma anche… video musicali!

Google ha appena sganciato una delle sue “bombe”, con una piattaforma in grado di rivoluzionare la generazione di contenuti musicali: Flow Music.

Ho appena “fatto un giro” e, al di là della qualità ancora simile a quella di Suno nei suoi primi stadi evolutivi, in questo caso ci si trova di fronte a una piattaforma dove la potenza di Gemini ci permette di interagire con dei prompt e con il processo “iterativo” fino a dare vita a veri e propri video musicali.

Dopo aver scelto un prompt in grado di generare un brano particolarmente interessante e coinvolgente, ho usato una mia vecchia foto per creare, automaticamente, il video relativo secondo alcune indicazioni di massima sullo stile, ma soprattutto allineato al contenuto e allo stile del brano stesso.

Ve lo condivido anche se ovviamente “imperfetto”, giusto per darvi un’idea di cosa si può fare con questa prima versione della piattaforma, in attesa di osservarla “crescere” come già visto per tutte quelle dell’ecosistema di Google AI.

Maggio 3, 2026
Mistral lancia Voxtral TTS: modello open source per la generazione vocale in tempo reale

La francese Mistral AI ha rilasciato Voxtral TTS, un nuovo modello open source per la sintesi vocale progettato per applicazioni enterprise e assistenti vocali. Il modello supporta nove lingue e può essere eseguito anche su dispositivi edge come smartphone e smartwatch, offrendo costi ridotti rispetto ai concorrenti. Tra le caratteristiche distintive, Voxtral TTS consente di clonare una voce con meno di cinque secondi di audio e di mantenere accenti e intonazioni anche nel passaggio tra lingue diverse. Le prestazioni in tempo reale (TTFA di 90 ms e RTF di 6x) lo rendono adatto a scenari come customer support, traduzione simultanea e doppiaggio. Con questo lancio, Mistral punta a competere con player come OpenAI e a costruire una piattaforma multimodale completa che integri audio, testo e immagini.

Link alla fonte:
https://techcrunch.com/2026/03/26/mistral-releases-a-new-open-source-model-for-speech-generation/

Marzo 27, 2026

AI NEWS by BDB

Notizie (e altro) sull'Intelligenza Artificiale

LinkedInProfilo LinkedIn di Bonaventura Di Bello
FacebookPagina Facebook “AI Generativa” di Bonaventura Di Bello
WhatsAppCanale WhatsApp “Te la do io l’Intelligenza Artificiale” di Bonaventura Di Bello
AutoreSito ufficiale dell’autore (Bonaventura ‘BDB’ Di Bello)

Eventi
Negozio
Pattern
Temi

Addestramento Agenti Aggiornamenti AGI AIAct AIAgentica AILocale Allucinazioni Amazon Anthropic Apprendimento Automazione BigTech Bolla Browser Business Chatbot ChatGPT Cina Claude Codex Coding Competizione Concorrenza Contenuti Copyright Cybersecurity DataCenter Deepfake DeepMind DeepSeek Didattica DirittoDAutore Disinformazione Ecommerce Economia Etica Europa Formazione Futuro Gemini Geopolitica Google Grafica Grok Hardware Immagini Inferenza Infrastrutture Innovazione Investimenti JensenHuang Lavoro Lingue LLM Medicina Mercati Mercato Meta Microsoft Mistral Modelli Multimodalità Musica NanoBanana Normative NotebookLM Nvidia Occupazione OpenAI OpenSource Ottimizzazione Personalizzazione Podcast Produttività Prompt PromptEngineering Regolamentazione Ricerca Risorse Robotica Salute SaluteMentale SamAltman Sanità Scenari Scuola Sicurezza Società Strategie Strumenti Sviluppo Tecnologia Tendenze Traduzione USA UX VibeCoding Video xAI

Twenty Twenty-Five

Progettato con WordPress

Tag: Audio

Si chiama Flow Music, e ti permette di generare musica ma anche… video musicali!

Mistral lancia Voxtral TTS: modello open source per la generazione vocale in tempo reale