Kas ir runas un teksta tehnoloģijas?
Runas pārvēršana tekstā (Speech-to-Text, STT) un teksta pārvēršana runā (Text-to-Speech, TTS) ir MI tehnoloģijas, kas nodrošina pāreju starp runāto un rakstīto valodu. STT sistēmas atpazīst un transkribē cilvēku runu, savukārt TTS sistēmas ģenerē dabiski skanošu runu no teksta. Kopā tās veido balss saskarņu pamatu.
Mūsdienu STT sistēmas izmanto dziļās mācīšanās modeļus, kas var: precīzi transkribēt runu trokšņainās vidēs, apstrādāt vairākas valodas un akcentus, veikt reāllaika transkripciju ar zemu latentumu un identificēt runātājus. TTS sistēmas var: ģenerēt dabiski skanošu runu ar emocijām, klonēt balsis no neliela audio parauga, veikt reāllaika runas sintēzi un pielāgot runas ātrumu un toni.
Uzņēmuma lietojumi
Šīs tehnoloģijas darbina: klientu apkalpošanas balss robotus, sapulču transkripciju un protokolēšanu, pieejamības risinājumus (ekrāna lasītāji), daudzvalodu komunikāciju un balss kontrolētas saskarnes.