Tag: Audio

  • Si chiama Flow Music, e ti permette di generare musica ma anche… video musicali!

    Google ha appena sganciato una delle sue “bombe”, con una piattaforma in grado di rivoluzionare la generazione di contenuti musicali: Flow Music.

    Ho appena “fatto un giro” e, al  di là della qualità ancora simile a quella di Suno nei suoi primi stadi evolutivi, in questo caso ci si trova di fronte a una piattaforma dove la potenza di Gemini ci permette di interagire con dei prompt e con il processo “iterativo” fino a dare vita a veri e propri video musicali.

    Dopo aver scelto un prompt in grado di generare un brano particolarmente interessante e coinvolgente, ho usato una mia vecchia foto per creare, automaticamente, il video relativo secondo alcune indicazioni di massima sullo stile, ma soprattutto allineato al contenuto e allo stile del brano stesso.

    Ve lo condivido anche se ovviamente “imperfetto”, giusto per darvi un’idea di cosa si può fare con questa prima versione della piattaforma, in attesa di osservarla “crescere” come già visto per tutte quelle dell’ecosistema di Google AI.

  • Mistral lancia Voxtral TTS: modello open source per la generazione vocale in tempo reale

    La francese Mistral AI ha rilasciato Voxtral TTS, un nuovo modello open source per la sintesi vocale progettato per applicazioni enterprise e assistenti vocali. Il modello supporta nove lingue e può essere eseguito anche su dispositivi edge come smartphone e smartwatch, offrendo costi ridotti rispetto ai concorrenti. Tra le caratteristiche distintive, Voxtral TTS consente di clonare una voce con meno di cinque secondi di audio e di mantenere accenti e intonazioni anche nel passaggio tra lingue diverse. Le prestazioni in tempo reale (TTFA di 90 ms e RTF di 6x) lo rendono adatto a scenari come customer support, traduzione simultanea e doppiaggio. Con questo lancio, Mistral punta a competere con player come OpenAI e a costruire una piattaforma multimodale completa che integri audio, testo e immagini.

    Link alla fonte:
    https://techcrunch.com/2026/03/26/mistral-releases-a-new-open-source-model-for-speech-generation/