Tématem diplomové práce je automatická detekce anotačních chyb v řečových korpusech pořízených pro účely syntézy řeči. Tyto korpusy jsou obvykle rozsáhlé a i přes to, že jsou ručně anotovány, obsahují stále nezanedbatelné množství anotačních a segmentačních chyb, které pak mohou způsobit v syntetizované řeči vznik řečových artefaktů. Práce obsahuje klasifikaci anotačních chyb a definuje jejich detekci jako problém binární klasifikace. Dále navrhuje příznaky, které lze použít pro detekci chyb na slovní úrovni, a zkoumá jejich vliv na úspěšnost klasifikace na ručně anotovaném korpusu. Součástí práce je i porovnání několika typů klasifikátorů na konkrétních datech a ověřuje možnost přenositelnosti natrénovaného klasifikátoru na řečový korpus jiného hlasu. V rámci práce byla vytvořena sada skriptů, která je přiložena na CD a popsána v příloze.
Anotace v angličtině
The subject of this thesis is automatic annotation errors detection in TTS corpora recorded for the purpose of speech synthesis. Although the large corpora are manually annotated, they still contains insignificant number of annotation errors and segmentation errors, which could cause speech artefacts in a synthesized speech. The thesis describes different types of annotation errors and defines their detection as a binary classification problem. Features usable for a word-level error detection are explained in the text, together with their contribution to classification success rate on the manually annotated data. Different types of classifiers are compared and the applicability on different-speaker corpora is examined. A set of scripts was prepared and included on CD, user manual is located in appendix.
Tématem diplomové práce je automatická detekce anotačních chyb v řečových korpusech pořízených pro účely syntézy řeči. Tyto korpusy jsou obvykle rozsáhlé a i přes to, že jsou ručně anotovány, obsahují stále nezanedbatelné množství anotačních a segmentačních chyb, které pak mohou způsobit v syntetizované řeči vznik řečových artefaktů. Práce obsahuje klasifikaci anotačních chyb a definuje jejich detekci jako problém binární klasifikace. Dále navrhuje příznaky, které lze použít pro detekci chyb na slovní úrovni, a zkoumá jejich vliv na úspěšnost klasifikace na ručně anotovaném korpusu. Součástí práce je i porovnání několika typů klasifikátorů na konkrétních datech a ověřuje možnost přenositelnosti natrénovaného klasifikátoru na řečový korpus jiného hlasu. V rámci práce byla vytvořena sada skriptů, která je přiložena na CD a popsána v příloze.
Anotace v angličtině
The subject of this thesis is automatic annotation errors detection in TTS corpora recorded for the purpose of speech synthesis. Although the large corpora are manually annotated, they still contains insignificant number of annotation errors and segmentation errors, which could cause speech artefacts in a synthesized speech. The thesis describes different types of annotation errors and defines their detection as a binary classification problem. Features usable for a word-level error detection are explained in the text, together with their contribution to classification success rate on the manually annotated data. Different types of classifiers are compared and the applicability on different-speaker corpora is examined. A set of scripts was prepared and included on CD, user manual is located in appendix.
Seznamte se s problematikou syntézy řeči z textu (TTS) a s možnostmi automatické detekce anotačních chyb v korpusech pro TTS.
Nadefinujte a kategorizujte chyby anotace. Vyjděte z reálných chyb vyskytujících se ve skutečných TTS korpusech. Navrhněte generátor "umělých" anotačních chyb.
Nadefinujte úlohu detekce anotačních chyb jako klasifikační úlohu. Vyberte vhodné příznaky a porovnejte různé typy klasifikátorů, popř. jiných detektorů.
Prozkoumejte možnosti přenositelnosti klasifikátorů pro detekci anotačních chyb na jiných hlasech.
Všechny navržené algoritmy realizujte formou počítačového programu a získané výsledky vyhodnoťte.
Zásady pro vypracování
Seznamte se s problematikou syntézy řeči z textu (TTS) a s možnostmi automatické detekce anotačních chyb v korpusech pro TTS.
Nadefinujte a kategorizujte chyby anotace. Vyjděte z reálných chyb vyskytujících se ve skutečných TTS korpusech. Navrhněte generátor "umělých" anotačních chyb.
Nadefinujte úlohu detekce anotačních chyb jako klasifikační úlohu. Vyberte vhodné příznaky a porovnejte různé typy klasifikátorů, popř. jiných detektorů.
Prozkoumejte možnosti přenositelnosti klasifikátorů pro detekci anotačních chyb na jiných hlasech.
Všechny navržené algoritmy realizujte formou počítačového programu a získané výsledky vyhodnoťte.
Seznam doporučené literatury
PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006.\\
MATOUŠEK, J., TIHELKA, D. Annotation Errors Detection in TTS Corpora. In: Proc. Interspeech. Lyon, France, 2013. pp. 1511-1514.\\
MATOUŠEK, J., TIHELKA, D. SVM-Based Detection of Misannotated Words in Read Speech Corpora. Lecture Notes in Computer Science; Text, Speech and Dialogue. 2013, vol. 8082, s. 457-464.
Seznam doporučené literatury
PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006.\\
MATOUŠEK, J., TIHELKA, D. Annotation Errors Detection in TTS Corpora. In: Proc. Interspeech. Lyon, France, 2013. pp. 1511-1514.\\
MATOUŠEK, J., TIHELKA, D. SVM-Based Detection of Misannotated Words in Read Speech Corpora. Lecture Notes in Computer Science; Text, Speech and Dialogue. 2013, vol. 8082, s. 457-464.