Syntéza řeči je již v dnešní době schopna vytvářet
syntetickou řeč vysoké kvality. Konkatenační
metoda s výběrem jednotek je známa právě pro
svou schopnost vytvářet kvalitní syntetickou
řeč, která je velmi přirozená.
Nevýhodou této metody je fakt, že špatné
napojení jednotek může vést k náhlému propadu
kvality řeči, což je velmi rušivé. V této
práci je představen návrh automatického systému,
který by tyto jevy dokázal automaticky detekovat.
Nejdříve je představen program, který dokáže analyzovat
syntetickou řeč. Poté jsou na základě poslechových testů sestavena objektivní označení rušivých úseků. Z nich je
trénován SVM klasifikátor. Ten je poté schopen
označovat podobná místa v nových syntetických promluvách
s velkou úspěšností. V provedených experimentech se úspěšnost pohybovala
v rozmezí 70 až 80 %.
Anotace v angličtině
Nowadays, speech synthesis is able to produce high-quality
synthetic speech. Unit selection method produces very natural
speech, but it may suffer from sudden quality drops
at concatenation points, which is very disturbing.
In this thesis, an automatic speech synthesis error
detection system is presented. Firstly, a program for speech analysis
is introduced. Then, based on data gathered during listening tests,
an SVM is trained. Using this classifier, errors can
be labeled automaticaly in any new synthetic speech.
Finnally, few experiments were carried out with a success rate between 70-80 %.
Klíčová slova
syntéza řeči, metoda výběru jednotek, detekce chyb, klasifikace
Klíčová slova v angličtině
speech synthesis, unit selection, error detection, classification
Rozsah průvodní práce
45
Jazyk
CZ
Anotace
Syntéza řeči je již v dnešní době schopna vytvářet
syntetickou řeč vysoké kvality. Konkatenační
metoda s výběrem jednotek je známa právě pro
svou schopnost vytvářet kvalitní syntetickou
řeč, která je velmi přirozená.
Nevýhodou této metody je fakt, že špatné
napojení jednotek může vést k náhlému propadu
kvality řeči, což je velmi rušivé. V této
práci je představen návrh automatického systému,
který by tyto jevy dokázal automaticky detekovat.
Nejdříve je představen program, který dokáže analyzovat
syntetickou řeč. Poté jsou na základě poslechových testů sestavena objektivní označení rušivých úseků. Z nich je
trénován SVM klasifikátor. Ten je poté schopen
označovat podobná místa v nových syntetických promluvách
s velkou úspěšností. V provedených experimentech se úspěšnost pohybovala
v rozmezí 70 až 80 %.
Anotace v angličtině
Nowadays, speech synthesis is able to produce high-quality
synthetic speech. Unit selection method produces very natural
speech, but it may suffer from sudden quality drops
at concatenation points, which is very disturbing.
In this thesis, an automatic speech synthesis error
detection system is presented. Firstly, a program for speech analysis
is introduced. Then, based on data gathered during listening tests,
an SVM is trained. Using this classifier, errors can
be labeled automaticaly in any new synthetic speech.
Finnally, few experiments were carried out with a success rate between 70-80 %.
Klíčová slova
syntéza řeči, metoda výběru jednotek, detekce chyb, klasifikace
Klíčová slova v angličtině
speech synthesis, unit selection, error detection, classification
Zásady pro vypracování
Seznamte se s problematikou konkatenační syntézy řeči, zejména pak se systémem syntézy řeči z textu ARTIC vyvíjeným na KKY.
Systémem ARTIC vygenerujte dostatečně reprezentativní množinu syntetizovaných promluv. Promluvy analyzujte, nalezněte v nich slyšitelné artefakty a vizualizujte je.
Navrhněte metodiku pro označování a kategorizaci slyšitelných artefaktů v syntetické řeči (např. špatná segmentace řečové jednotky ve zdrojové promluvě, nespojitost v průběhu základního hlasivkového tónu, neadekvátní trvání či změna tempa řečových jednotek, nespojitosti ve spektru, apod.).
Navrhněte algoritmus pro automatickou detekci artefaktů v syntetické řeči. Na základě analýzy syntetických promluv a metodiky kategorizace artefaktů navrhněte vhodná pravidla, popř. příznaky pro automatickou klasifikaci artefaktů.
Navržený algoritmus vyhodnoťte a získané výsledky vhodně vizualizujte.
Zásady pro vypracování
Seznamte se s problematikou konkatenační syntézy řeči, zejména pak se systémem syntézy řeči z textu ARTIC vyvíjeným na KKY.
Systémem ARTIC vygenerujte dostatečně reprezentativní množinu syntetizovaných promluv. Promluvy analyzujte, nalezněte v nich slyšitelné artefakty a vizualizujte je.
Navrhněte metodiku pro označování a kategorizaci slyšitelných artefaktů v syntetické řeči (např. špatná segmentace řečové jednotky ve zdrojové promluvě, nespojitost v průběhu základního hlasivkového tónu, neadekvátní trvání či změna tempa řečových jednotek, nespojitosti ve spektru, apod.).
Navrhněte algoritmus pro automatickou detekci artefaktů v syntetické řeči. Na základě analýzy syntetických promluv a metodiky kategorizace artefaktů navrhněte vhodná pravidla, popř. příznaky pro automatickou klasifikaci artefaktů.
Navržený algoritmus vyhodnoťte a získané výsledky vhodně vizualizujte.
Seznam doporučené literatury
PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006.\\
TAYLOR, P. Text-to-Speech Synthesis. Cambridge: Cambridge University Press, 2009.\\
LU, H., WEI, S., DAI, L., WANG, R.-H. Automatic Error Detection for Unit Selection Speech Synthesis Using Log Likelihood Ratio Based SVM Classifier. In: Proc. Interspeech. Makuhari, Japan, 2010. pp. 162-165.
Seznam doporučené literatury
PSUTKA, J., MÜLLER, L., MATOUŠEK, J., RADOVÁ, V. Mluvíme s počítačem česky. Academia, Praha, 2006.\\
TAYLOR, P. Text-to-Speech Synthesis. Cambridge: Cambridge University Press, 2009.\\
LU, H., WEI, S., DAI, L., WANG, R.-H. Automatic Error Detection for Unit Selection Speech Synthesis Using Log Likelihood Ratio Based SVM Classifier. In: Proc. Interspeech. Makuhari, Japan, 2010. pp. 162-165.