Mistral objavljuje novi otvoreni model za generiranje govora

Mistral objavljuje novi otvoreni model za generiranje govoraš· Ā© Tech&Space
- ā Novi model za generiranje govora
- ā Kompatibilan sa pametnim satovima
- ā Podržava devet jezika
Mistral, francuska tvrtka za umjetnu inteligenciju, objavila je novi otvoreni model za generiranje govora zvan Voxtral TTS. Ovaj model može se koristiti od strane glasovnih pomoÄnika ili u poduzeÄima za potrebe podrÅ”ke kupcima.
Prema dostupnim informacijama, model može raditi na pametnim satovima ili smartphone-u, Å”to ga Äini izuzetno prilagodljivim. Mistral je veÄ ranije pokazao sposobnosti u transkripciji, a sada proÅ”iruje svoje ponude na generiranje govora.
Ovaj model podržava devet jezika i može se prilagoditi posebnim glasovima s uzorkom manjim od pet sekundi. To otvara nove moguÄnosti za poduzeÄa koja žele koristiti glasovne pomoÄnike ili automatske sustave za podrÅ”ku kupcima.
TechCrunch navodi da je ovo znaÄajan korak za Mistral, koji time ulazi u direktan konkurentski odnos s tvrtkama kao Å”to su ElevenLabs, Deepgram i OpenAI.

Stvarna priÄa iza Mistralovog novog modelaš· Ā© Tech&Space
Stvarna priÄa iza Mistralovog novog modela
Kao Å”to je objavljeno od strane Mistrala, cilj im je stvoriti krajnju platformu koja može obraÄivati multimodalne ulaze, ukljuÄujuÄi audio, tekst i slike, kao i izlazne podatke. To bi omoguÄilo tvrtkama da koriste glasovne pomoÄnike na daleko sofisticiraniji naÄin.
Voxtral TTS bi mogao biti kljuÄni dio te platforme, nudeÄi sposobnost generiranja kvalitetnog govora koji se može prilagoditi potrebama korisnika. Å to se tiÄe performansi, Mistral navodi da je njihov model izuzetno brz, s vremenom odgovora manjim od 90 ms.
To bi ga uÄinilo jednim od najbržih modela za generiranje govora dostupnih na tržiÅ”tu. MeÄutim, važno je uzeti u obzir da su ovi brojevi joÅ” uvijek u fazi testiranja i da Äe stvarna performansa ovisiti o konkretnim aplikacijama i okruženjima u kojima se koristi.
Razvoj Voxtral TTS-a je rezultat Mistralovog nastojanja da stvori krajnju platformu za multimodalne ulaze. Ova platforma Äe omoguÄiti tvrtkama da koriste glasovne pomoÄnike na daleko sofisticiraniji naÄin, Å”to Äe rezultirati boljom podrÅ”kom kupcima i poboljÅ”anim njihovim iskustvom. Mistralov model je izuzetno brz i podržava devet jezika.