Tato bakalářská práce je věnovaná návrhu postupu automatické detekce přízvuku v ruském jazyce, která může být využita v rámci syntézy řeči. K detekci přízvuku jsou využity metody strojového učení: klasifikátory Logistic Regression a Support Vector Machine a jednoduchá neuronová síť. V bakalářské práci jsou popsány principy obecného syntetizéru, význam přízvuků ve světových jazycích a jejich specifika v ruském jazyce oproti ostatním. Byly prozkoumány obecné klasifikační principy a teoreticky analyzovány vybrané metody strojového učení. Ty byly následně aplikovány na připravená data. Výsledky efektivnosti vybraných metod byly zanalyzovány a porovnány mezi sebou.
Anotace v angličtině
This bachelor thesis dedicates to the design of automatic word stress detection process in Russian language that can be used in speech synthesis. Several machine learning methods are used to detect word stress: Logistic Regression and Support Vector Machine classifiers and a simple natural network. The thesis explains in whole the structure of a speech synthesizer. It also describes the role of word stress in world languages and its specifics in Russian language over the others. General classification principles were examined and selected methods of machine learning were theoretically analyzed. Afterwards, they were applied to prepared data. Then the results of the selected techniques for word stress detection were analyzed and compared with each other.
Klíčová slova
počítačové zpracování řeči, syntéza řeči z textu, strojové učení, slovní přízvuk, detekce přízvuků, ruština, klasifikace
Klíčová slova v angličtině
computer speech processing, text-to-speech, machine learning, word stress, word stress detection, Russian language, classification
Rozsah průvodní práce
64 s. (84 744 znaků)
Jazyk
CZ
Anotace
Tato bakalářská práce je věnovaná návrhu postupu automatické detekce přízvuku v ruském jazyce, která může být využita v rámci syntézy řeči. K detekci přízvuku jsou využity metody strojového učení: klasifikátory Logistic Regression a Support Vector Machine a jednoduchá neuronová síť. V bakalářské práci jsou popsány principy obecného syntetizéru, význam přízvuků ve světových jazycích a jejich specifika v ruském jazyce oproti ostatním. Byly prozkoumány obecné klasifikační principy a teoreticky analyzovány vybrané metody strojového učení. Ty byly následně aplikovány na připravená data. Výsledky efektivnosti vybraných metod byly zanalyzovány a porovnány mezi sebou.
Anotace v angličtině
This bachelor thesis dedicates to the design of automatic word stress detection process in Russian language that can be used in speech synthesis. Several machine learning methods are used to detect word stress: Logistic Regression and Support Vector Machine classifiers and a simple natural network. The thesis explains in whole the structure of a speech synthesizer. It also describes the role of word stress in world languages and its specifics in Russian language over the others. General classification principles were examined and selected methods of machine learning were theoretically analyzed. Afterwards, they were applied to prepared data. Then the results of the selected techniques for word stress detection were analyzed and compared with each other.
Klíčová slova
počítačové zpracování řeči, syntéza řeči z textu, strojové učení, slovní přízvuk, detekce přízvuků, ruština, klasifikace
Klíčová slova v angličtině
computer speech processing, text-to-speech, machine learning, word stress, word stress detection, Russian language, classification
Zásady pro vypracování
Seznamte se s problematikou syntézy řeči z textu (TTS) a fonetické transkripce.
Nastudujte teorii slovních přízvuků, uveďte rozdíly v jeho realizaci v různých jazycích a podrobně se zaměřte na přízvuk v ruském jazyce.
Nastudujte si základy strojového učení a princip základních klasifikačních přístupů.
Připravte trénovací data pro několik nejednoznačných ruských slov z hlediska umístění přízvuku.
Navrhněte a realizujte postup pro automatickou detekci přízvuků v ruštině na základě získaných trénovacích dat.
Získané výsledky vyhodnoťte.
Zásady pro vypracování
Seznamte se s problematikou syntézy řeči z textu (TTS) a fonetické transkripce.
Nastudujte teorii slovních přízvuků, uveďte rozdíly v jeho realizaci v různých jazycích a podrobně se zaměřte na přízvuk v ruském jazyce.
Nastudujte si základy strojového učení a princip základních klasifikačních přístupů.
Připravte trénovací data pro několik nejednoznačných ruských slov z hlediska umístění přízvuku.
Navrhněte a realizujte postup pro automatickou detekci přízvuků v ruštině na základě získaných trénovacích dat.
Získané výsledky vyhodnoťte.
Seznam doporučené literatury
PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006. \\
PEDREGOSA, F. et al. (2011) Scikit-learn: Machine Learning in Python, Journal of Machine Learning Research, 12, pp. 2825-2830.\\
SKARNITZL, R., ŠTURM, P., VOLÍN, J. Zvuková báze řečové komunikace: Fonetický a fonologický popis řeči, Karolinum, Praha, 2016.
Seznam doporučené literatury
PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006. \\
PEDREGOSA, F. et al. (2011) Scikit-learn: Machine Learning in Python, Journal of Machine Learning Research, 12, pp. 2825-2830.\\
SKARNITZL, R., ŠTURM, P., VOLÍN, J. Zvuková báze řečové komunikace: Fonetický a fonologický popis řeči, Karolinum, Praha, 2016.