Tato práce se zabývá problematikou automatické adaptace akustického modelu na aktuální data od konkrétního řečníka. Pro natrénování modelu je potřeba velkého množství dat, které je z praktického hlediska nemožné získat od jednoho řečníka. Řešením je konstrukce akustického modelu na datech od více řečníků a následná adaptace tohoto modelu na dostupných datech daného řečníka.
Klasické metody adaptace, představené v této práci, mají problémy s malým množstvím adaptačních dat, takto adaptovaný model může ve výsledku zhoršovat rozpoznávání. Práce si klade za cíl vysvětlit principy používaných adaptačních metod a postupy adaptačního trénování, dále se zaměřuje na problém nedostatku dat při adaptaci. Jsou zde představeny známé robustní metody adaptace a navržena vlastní řešení, jejichž účinnost je vzájemně experimentálně porovnána.
Annotation in English
This work is focused on the automatic speaker adaptation of an acoustic model, which is a part of the automatic speech recognition system. To train the acoustic model it is necessary to have large amount of data from many speakers. The final speaker-independent model is then able to recognize the speech from any speaker. The speaker-independent model is adapted to the speech
of a specific speaker. Ordinary adaptation techniques introduced in this work perform poorly in cases with insufficient amount of adaptation data. The aim of this work is to discuss methods of adaptation and adaptation training. To avoid the problem with lack of adaptation data various robust solutions have been described and new one have been proposed. Some of these methods
were tested, and the experiments show that the robust adaptation contributes significantly to the task of automatic speech recognition.
Keywords
Rozpoznávání řeči, robustní adaptace, fMLLR, MLLR, MAP, VTLN, ANN
Keywords in English
Speech recognition, Robust adaptation, fMLLR, MLLR, MAP, VTLN, ANN
Length of the covering note
xii s, 109 s
Language
CZ
Annotation
Tato práce se zabývá problematikou automatické adaptace akustického modelu na aktuální data od konkrétního řečníka. Pro natrénování modelu je potřeba velkého množství dat, které je z praktického hlediska nemožné získat od jednoho řečníka. Řešením je konstrukce akustického modelu na datech od více řečníků a následná adaptace tohoto modelu na dostupných datech daného řečníka.
Klasické metody adaptace, představené v této práci, mají problémy s malým množstvím adaptačních dat, takto adaptovaný model může ve výsledku zhoršovat rozpoznávání. Práce si klade za cíl vysvětlit principy používaných adaptačních metod a postupy adaptačního trénování, dále se zaměřuje na problém nedostatku dat při adaptaci. Jsou zde představeny známé robustní metody adaptace a navržena vlastní řešení, jejichž účinnost je vzájemně experimentálně porovnána.
Annotation in English
This work is focused on the automatic speaker adaptation of an acoustic model, which is a part of the automatic speech recognition system. To train the acoustic model it is necessary to have large amount of data from many speakers. The final speaker-independent model is then able to recognize the speech from any speaker. The speaker-independent model is adapted to the speech
of a specific speaker. Ordinary adaptation techniques introduced in this work perform poorly in cases with insufficient amount of adaptation data. The aim of this work is to discuss methods of adaptation and adaptation training. To avoid the problem with lack of adaptation data various robust solutions have been described and new one have been proposed. Some of these methods
were tested, and the experiments show that the robust adaptation contributes significantly to the task of automatic speech recognition.
Keywords
Rozpoznávání řeči, robustní adaptace, fMLLR, MLLR, MAP, VTLN, ANN
Keywords in English
Speech recognition, Robust adaptation, fMLLR, MLLR, MAP, VTLN, ANN