Počítačový přepis řeči může pomoci neslyšícím

29. listopad 2004
Trendy

Výzkumu počítačové řeči na Technické univerzitě v Liberci se věnuje profesor Jan Nouza, kterého známe díky velmi sledovanému seriálu a také dvěma unikátním knížkách o rozhlednách. Asi před rokem jsme se v jedné reportáži dozvěděli že počítač umí odezírat ze rtů osob, rozumí co lidé říkají a syntetickou řečí jim odpovídá. Bohatě se také rozvíjí slovník, který počítač používá.

Jak se to dá využít? Jak v laboratoři počítačové řeči zjistila kolegyně Ivana Bernáthová, například k titulkování televizních zpráv pro neslyšící.

Audio (Znělka ČT): Agentura Czechtourism při ministerstvu pro místní rozvoj má nesrovnalosti v hospodaření ..

Jistě jste poznali znělku pořadu Události České televize. Moderátorka přečetla úvodní titulky a počítač je slovo po slově přepisoval. Jednotlivé věty se objevovaly na obrazovce jako titulky. Bylo obdivuhodné, že počítač udělal v přepisu velmi málo chyb.

Jan Nouza: Musím skutečně říct, že se nám ten systém podařilo v poslední době výrazně zlepšit. Je to také díky tomu, že už pracuje v současné době s 300 tisíci českými slovy. Přepis televizních nebo i rozhlasových pořadů je už dnes schopen pořídit s "chybovostí", která je menší než 20 %. To znamená dvě chybná slova z deseti.

Tady máme "agentura Czechtourismu" místo "agentura Czechtourism". To znamená, že tam ten počítač nějak nevěděl, tápal .

Jan Nouza: Ano, tohle je příklad jednoho typu chyb. Slovo "tourism" je skutečně velmi neobvyklé slovo v češtině a proto ve slovníku našeho systému není. Systém ho rozpoznal jako nejbližší slovo, které ve slovníku měl. A to bylo "tourismu".

Moderátoři jsou samozřejmě profesionálními spíkry. Ovšem když slyší například počítač hlas z terénu, jak si s ním poradí?

Jan Nouza: Závisí to samozřejmě na okolnostech. Pokud ten člověk mluví spisovně a pokud hluk v terénu není příliš velký, tak i ten přepis dopadá poměrně dobře. Pokud se jedná například o příspěvek z letiště, kde zrovna přistává letadlo a reportér musí křičet, potom ten přepis zatím dopadá velice špatně.

Kde by se tahle záležitost mohla využít?

Jan Nouza: Přepisy zpravodajských pořadů anebo obecněji besed v rozhlase i v televizi dneska jsou velice důležitým zdrojem informací, které se nadají najít například v tištěných médiích jako jsou noviny. A po celém světě se řeší problém, jak tyto audiovizuální pořady co nejlépe umět zpracovat. Tak, aby v nich lidé mohli hledat informace, které je zajímají.

Často když vidím monitoring tisku, tak mi vydí, že právě ty přepisy z televizí a z rádií tam moc nejsou, protože to dá hodně práce.

Jan Nouza: Je to přesně tak. Pokud vím v České republice existují přinejmenším dvě firma, které pořizují přepisy i mluvených pořadů z rozhlasu a televize. Ale je to opravdu velice pracné. Vím, že i pro ty největší experty přepis jedné hodiny rozhlasového nebo televizního pořadu trvá nejméně šestinásobek, tedy šest hodin. V našem případě ten počítač je schopen to udělat úrakticky zadarmo a člověk potom může jen ty nesprávně rozpoznané obraty opravovat.

Ovšem tenhle systém může pomoci i handicapovaným lidem .

Jan Nouza: Ano, jedna z takových možných aplikací je taková, že systém tytio mluvené pořady přepíše. A pokud tam nebude příliš mnoho chyb, pak je možné tyto přepsané texty vysílat jako titulky. A i neslyšící lidé budou mít takto přístup k informacím.

Spustit audio

Více z pořadu