Tato bakalářská práce se zabývá přípravou dat pro tvorbu akustického modelu z webu České televize. Je zde popsána statická metoda rozpoznávání řeči s využitím Markovových modelů. V práci se dále nachází zevrubný návod na přípravu dat a trénování akustického modelu pomocí HTK spolu s ukázkami jednotlivých kroků. Důležitým bodem práce je analýza formátu dat na webu ČT a následná tvorba souborů k trénování. Závěr práce se věnuje metodám synchronizace titulků.
Annotation in English
This work deals with the preparation of data for an acoustic modelling from the Czech Television web. It contains a description of the statistic method of speech recognition that uses Markov models. Very detailed instructions for preparation and training of the acoustic model and samples of the individual steps are described here. A very important part of this work analyzes structure of the data from the Czech Television web and shows a procedure creating files for the training of the acoustic model. The last part focuses on methods that synchronize closed captions.
Tato bakalářská práce se zabývá přípravou dat pro tvorbu akustického modelu z webu České televize. Je zde popsána statická metoda rozpoznávání řeči s využitím Markovových modelů. V práci se dále nachází zevrubný návod na přípravu dat a trénování akustického modelu pomocí HTK spolu s ukázkami jednotlivých kroků. Důležitým bodem práce je analýza formátu dat na webu ČT a následná tvorba souborů k trénování. Závěr práce se věnuje metodám synchronizace titulků.
Annotation in English
This work deals with the preparation of data for an acoustic modelling from the Czech Television web. It contains a description of the statistic method of speech recognition that uses Markov models. Very detailed instructions for preparation and training of the acoustic model and samples of the individual steps are described here. A very important part of this work analyzes structure of the data from the Czech Television web and shows a procedure creating files for the training of the acoustic model. The last part focuses on methods that synchronize closed captions.