Glasovna UI: STT in TTS
Pretvorba govora v besedilo (STT) in besedila v govor (TTS) sta temeljni sestavni deli glasovnih izkušenj z UI. Moderni modeli STT (Whisper, AssemblyAI) dosegajo natančnost >95 % za čist govor. Modeli TTS (ElevenLabs, Azure Neural Voice) generirajo govor, ki je skoraj nerazločljiv od človeškega.
Aplikacije v poslovanju
Samodejno prepisovanje: opombe s sestankov, prepisi klicev. Glasovni asistenti: telefonski klepetalniki. Analitika klicev: prepis in analiza sentimenta tisoče klicev dnevno.
Izzivi in premisleki
Izzivi STT: razlike v naglaseh in dialektih, hrupno ozadje, tehnično besedišče. Globinski ponaredki zvoka so rastoča grožnja.