Portál ZČU - Prohlížení

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Tisk/export:

Export dat do formátu PDF - který můžete pohodlně vytisknout...

Tento odkaz můžete zkopírovat a použít například jako záložku prohlížeče pro zobrazení aktuální pozice v Prohlížení IS/STAG.

Nepřihlášenému uživateli se zobrazují pouze již odevzdané práce.

Osobní čísla studentů se zobrazují pouze přihlášenému uživateli.

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Nalezeno 1 záznamů Tisk Export do Xls URL na seznam

Příjmení (rod. přijm.)	Jméno	Název	Stav práce		Vedoucí/školitelé	Oponenti	Typ práce	Dat. obhaj.	Název
Student	Typ práce	-	-	-	-	-	-	-	-	-	-
ŘEZÁČEK	Petr	Automatická detekce anotačních chyb v TTS korpusech			Matoušek Jindřich	Tihelka Daniel	diplomová	11.09.2014	Automatická detekce anotačních chyb v TTS korpusech
Petr ŘEZÁČEK	diplomová	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX

Informace o kvalifikační práci Automatická detekce anotačních chyb v TTS korpusech

Základní údaje

Anotace
Dokument, ke kterému přistupujete, podléhá autorskému zákonu. Jeho porušením se můžete vystavit trestnímu postihu!
Jméno	ŘEZÁČEK Petr
Akad. rok	2013/2014
Zadávající pracoviště	KKY
Datum obhajoby	11. 9. 2014
Typ práce	diplomová
Stav práce	Dokončená práce s úspěšnou obhajobou (DUO).
Úplnost vyplnění požadovaných údajů	- Následující požadované údaje nejsou u této VŠKP vyplněny: Název v angličtině
Hlavní téma	Automatická detekce anotačních chyb v TTS korpusech
Hlavní téma v angličtině	Automatic Annotation Errors Detection in TTS Corpora
Název dle studenta	Automatická detekce anotačních chyb v TTS korpusech
Název dle studenta v angličtině	-
Souběžný název	-
Podnázev	-
Vedoucí	Matoušek Jindřich, Doc. Ing. Ph.D.
Oponent	Tihelka Daniel, Ing. Ph.D.
Anotace	Tématem diplomové práce je automatická detekce anotačních chyb v řečových korpusech pořízených pro účely syntézy řeči. Tyto korpusy jsou obvykle rozsáhlé a i přes to, že jsou ručně anotovány, obsahují stále nezanedbatelné množství anotačních a segmentačních chyb, které pak mohou způsobit v syntetizované řeči vznik řečových artefaktů. Práce obsahuje klasifikaci anotačních chyb a definuje jejich detekci jako problém binární klasifikace. Dále navrhuje příznaky, které lze použít pro detekci chyb na slovní úrovni, a zkoumá jejich vliv na úspěšnost klasifikace na ručně anotovaném korpusu. Součástí práce je i porovnání několika typů klasifikátorů na konkrétních datech a ověřuje možnost přenositelnosti natrénovaného klasifikátoru na řečový korpus jiného hlasu. V rámci práce byla vytvořena sada skriptů, která je přiložena na CD a popsána v příloze.
Anotace v angličtině	The subject of this thesis is automatic annotation errors detection in TTS corpora recorded for the purpose of speech synthesis. Although the large corpora are manually annotated, they still contains insignificant number of annotation errors and segmentation errors, which could cause speech artefacts in a synthesized speech. The thesis describes different types of annotation errors and defines their detection as a binary classification problem. Features usable for a word-level error detection are explained in the text, together with their contribution to classification success rate on the manually annotated data. Different types of classifiers are compared and the applicability on different-speaker corpora is examined. A set of scripts was prepared and included on CD, user manual is located in appendix.
Klíčová slova	syntéza řeči, řečové korpusy, anotační chyby, detekce chybně anotovaných slov, příznaky, klasifikace
Klíčová slova v angličtině	speech synthesis, speech corpora, annotation errors, annotation errors detection, features, classification
Rozsah průvodní práce	42 s. + 7 s. příloha
Jazyk	CZ
Tématem diplomové práce je automatická detekce anotačních chyb v řečových korpusech pořízených pro účely syntézy řeči. Tyto korpusy jsou obvykle rozsáhlé a i přes to, že jsou ručně anotovány, obsahují stále nezanedbatelné množství anotačních a segmentačních chyb, které pak mohou způsobit v syntetizované řeči vznik řečových artefaktů. Práce obsahuje klasifikaci anotačních chyb a definuje jejich detekci jako problém binární klasifikace. Dále navrhuje příznaky, které lze použít pro detekci chyb na slovní úrovni, a zkoumá jejich vliv na úspěšnost klasifikace na ručně anotovaném korpusu. Součástí práce je i porovnání několika typů klasifikátorů na konkrétních datech a ověřuje možnost přenositelnosti natrénovaného klasifikátoru na řečový korpus jiného hlasu. V rámci práce byla vytvořena sada skriptů, která je přiložena na CD a popsána v příloze.
Anotace v angličtině
The subject of this thesis is automatic annotation errors detection in TTS corpora recorded for the purpose of speech synthesis. Although the large corpora are manually annotated, they still contains insignificant number of annotation errors and segmentation errors, which could cause speech artefacts in a synthesized speech. The thesis describes different types of annotation errors and defines their detection as a binary classification problem. Features usable for a word-level error detection are explained in the text, together with their contribution to classification success rate on the manually annotated data. Different types of classifiers are compared and the applicability on different-speaker corpora is examined. A set of scripts was prepared and included on CD, user manual is located in appendix.
Klíčová slova
syntéza řeči, řečové korpusy, anotační chyby, detekce chybně anotovaných slov, příznaky, klasifikace
Klíčová slova v angličtině
speech synthesis, speech corpora, annotation errors, annotation errors detection, features, classification
Zásady pro vypracování	Seznamte se s problematikou syntézy řeči z textu (TTS) a s možnostmi automatické detekce anotačních chyb v korpusech pro TTS. Nadefinujte a kategorizujte chyby anotace. Vyjděte z reálných chyb vyskytujících se ve skutečných TTS korpusech. Navrhněte generátor "umělých" anotačních chyb. Nadefinujte úlohu detekce anotačních chyb jako klasifikační úlohu. Vyberte vhodné příznaky a porovnejte různé typy klasifikátorů, popř. jiných detektorů. Prozkoumejte možnosti přenositelnosti klasifikátorů pro detekci anotačních chyb na jiných hlasech. Všechny navržené algoritmy realizujte formou počítačového programu a získané výsledky vyhodnoťte.
Zásady pro vypracování
Seznamte se s problematikou syntézy řeči z textu (TTS) a s možnostmi automatické detekce anotačních chyb v korpusech pro TTS. Nadefinujte a kategorizujte chyby anotace. Vyjděte z reálných chyb vyskytujících se ve skutečných TTS korpusech. Navrhněte generátor "umělých" anotačních chyb. Nadefinujte úlohu detekce anotačních chyb jako klasifikační úlohu. Vyberte vhodné příznaky a porovnejte různé typy klasifikátorů, popř. jiných detektorů. Prozkoumejte možnosti přenositelnosti klasifikátorů pro detekci anotačních chyb na jiných hlasech. Všechny navržené algoritmy realizujte formou počítačového programu a získané výsledky vyhodnoťte.
Seznam doporučené literatury	PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006.\\ MATOUŠEK, J., TIHELKA, D. Annotation Errors Detection in TTS Corpora. In: Proc. Interspeech. Lyon, France, 2013. pp. 1511-1514.\\ MATOUŠEK, J., TIHELKA, D. SVM-Based Detection of Misannotated Words in Read Speech Corpora. Lecture Notes in Computer Science; Text, Speech and Dialogue. 2013, vol. 8082, s. 457-464.
Seznam doporučené literatury
PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006.\\ MATOUŠEK, J., TIHELKA, D. Annotation Errors Detection in TTS Corpora. In: Proc. Interspeech. Lyon, France, 2013. pp. 1511-1514.\\ MATOUŠEK, J., TIHELKA, D. SVM-Based Detection of Misannotated Words in Read Speech Corpora. Lecture Notes in Computer Science; Text, Speech and Dialogue. 2013, vol. 8082, s. 457-464.
Přílohy volně vložené	CD
Přílohy vázané v práci	-
Převzato z knihovny	Ano
Plný text práce
Hodnocení z obhajoby práce	Velmi dobře
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby	-
Soubor s průběhem obhajoby

Prohlížení - Portál ZČU

Navigace první úrovně

Navigace druhé úrovně

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Informace o kvalifikační práci Automatická detekce anotačních chyb v TTS korpusech