Nazaj na slovar Umetna inteligenca

Pretvorba govora v besedilo in besedila v govor

Modeli UI za samodejno pretvorbo govora v besedilo in sintezo naravnega govora iz besedila — temelj glasovnih izkušenj z UI.

Glasovna UI: STT in TTS

Pretvorba govora v besedilo (STT) in besedila v govor (TTS) sta temeljni sestavni deli glasovnih izkušenj z UI. Moderni modeli STT (Whisper, AssemblyAI) dosegajo natančnost >95 % za čist govor. Modeli TTS (ElevenLabs, Azure Neural Voice) generirajo govor, ki je skoraj nerazločljiv od človeškega.

Aplikacije v poslovanju

Samodejno prepisovanje: opombe s sestankov, prepisi klicev. Glasovni asistenti: telefonski klepetalniki. Analitika klicev: prepis in analiza sentimenta tisoče klicev dnevno.

Izzivi in premisleki

Izzivi STT: razlike v naglaseh in dialektih, hrupno ozadje, tehnično besedišče. Globinski ponaredki zvoka so rastoča grožnja.