Podnaslavljanje oddaj v živo - Inštitut za elektroniko in telekomunikacijeInštitut za elektroniko in telekomunikacije

Podnaslavljanje televizijskih oddaj v živo zahteva uporabo sistema razpoznavanja pogovornega govora. Za dosego dovolj velike uspešnosti razpoznavanja pogovornega govora mora sistem razpoznavanja govora znati modelirati značilnosti spontanega govora – slovnično nepravilne stavke, koartikulacijo, prekinjene začetke, mašila, večjo vlogo konteksta itd. Zaradi težavnosti problema je napaka razpoznavanja današnjih tovrstnih sistemov še zelo visoka, njihova uporaba pa je omejena na posamezne domene.
Na Fakulteti za elektrotehniko, računalništvo in informatiko v Mariboru smo v okviru aktivnosti projekta Broadcast News za slovenski jezik, ki ga izvajata Fakulteta za elektrotehniko, računalništvo in informatiko ter Radiotelevizija Slovenija, razvili demonstracijski sistem podnaslavljanja oddaj v živo. Sistem omogoča podnaslavljanje televizijskih oddaj v živo v realnem času. Govorni signal s sprejemnika televizijskega signala razpozna sistem razpoznavanja pogovornega govora za slovenski jezik. Modul za tvorjenje podnapisov priredi tekst, ki je rezultat razpoznavanja govora v ustrezno obliko podnapisov. Ti se nato vključijo v sliko in predvajajo na zaslonu televizorja. Zmožnosti sistema podnaslavljanja oddaj v živo so odvisne predvsem od zmogljivosti in uspešnosti sistema razpoznavanja pogovornega govora za slovenski jezik.
podnaslavljanje_small
Trenutna različica sistema omogoča dovolj uspešno razpoznavanje govora za vnaprej znano domeno in omejen slovar besed. Razširitev delovanja na več domen in večji slovar besed pa zahteva ustrezno rešitev problema akustičnega in predvsem jezikovnega modeliranja jezika v sistemu avtomatskega razpoznavanja slovenskega pogovornega govora.