La francese Mistral AI ha rilasciato Voxtral TTS, un nuovo modello open source per la sintesi vocale progettato per applicazioni enterprise e assistenti vocali. Il modello supporta nove lingue e può essere eseguito anche su dispositivi edge come smartphone e smartwatch, offrendo costi ridotti rispetto ai concorrenti. Tra le caratteristiche distintive, Voxtral TTS consente di clonare una voce con meno di cinque secondi di audio e di mantenere accenti e intonazioni anche nel passaggio tra lingue diverse. Le prestazioni in tempo reale (TTFA di 90 ms e RTF di 6x) lo rendono adatto a scenari come customer support, traduzione simultanea e doppiaggio. Con questo lancio, Mistral punta a competere con player come OpenAI e a costruire una piattaforma multimodale completa che integri audio, testo e immagini.
Link alla fonte:
https://techcrunch.com/2026/03/26/mistral-releases-a-new-open-source-model-for-speech-generation/
Tag: TextToSpeech
-
Mistral lancia Voxtral TTS: modello open source per la generazione vocale in tempo reale
