Cílem této práce je posoudit vztah hypotézy "uncanny valley" k uměle vytvořené řeči. K těmto účelům je uvedeno stručné představení současných řečových technologií. Konkrétně se jedná o systémy převodu textu na řeč a systémy automatického rozpoznávání řeči, jež jsou popsány v kontextu využití v dialogových systémech. Dále je v práci popsána hypotéza "uncanny valley", která popisuje vztah člověka k neživým objektům, především k robotům. Hypotéza je v práci posuzována primárně ve vztahu k syntetické řeči. K posouzení jejich vztahu byl uspořádán výzkum, který se zaměřil právě na problematiku přijímání a hodnocení syntetické řeči.
Anotace v angličtině
The aim of this paper is to evaluate if there is a relation between the Uncanny Valley hypothesis and the speech which is produced artificially. For this reason there is a mention of the brief introduction to the actual state of speech technologies. Specifically technologies such as Text-To-Speech synthesis and Automatic Speech Recognition are presented, which are described in the context of the use in dialogue systems. Another concept which is discussed in this paper is the Uncanny Valley hypothesis which describes the relation of the human to the inanimate object; in the first place to robots. The hypothesis is considered primarily in the relation to the synthetic speech. Experimental research was organized, which focused mainly to the accepting and evaluation of the synthetic speech.
synthetic speech, TTS, ASR, The Uncanny Valley Hypothesis, Masahiro Mori, experiment, social perception, statistical analysis
Rozsah průvodní práce
63 s. (109 081 znaků)
Jazyk
CZ
Anotace
Cílem této práce je posoudit vztah hypotézy "uncanny valley" k uměle vytvořené řeči. K těmto účelům je uvedeno stručné představení současných řečových technologií. Konkrétně se jedná o systémy převodu textu na řeč a systémy automatického rozpoznávání řeči, jež jsou popsány v kontextu využití v dialogových systémech. Dále je v práci popsána hypotéza "uncanny valley", která popisuje vztah člověka k neživým objektům, především k robotům. Hypotéza je v práci posuzována primárně ve vztahu k syntetické řeči. K posouzení jejich vztahu byl uspořádán výzkum, který se zaměřil právě na problematiku přijímání a hodnocení syntetické řeči.
Anotace v angličtině
The aim of this paper is to evaluate if there is a relation between the Uncanny Valley hypothesis and the speech which is produced artificially. For this reason there is a mention of the brief introduction to the actual state of speech technologies. Specifically technologies such as Text-To-Speech synthesis and Automatic Speech Recognition are presented, which are described in the context of the use in dialogue systems. Another concept which is discussed in this paper is the Uncanny Valley hypothesis which describes the relation of the human to the inanimate object; in the first place to robots. The hypothesis is considered primarily in the relation to the synthetic speech. Experimental research was organized, which focused mainly to the accepting and evaluation of the synthetic speech.
synthetic speech, TTS, ASR, The Uncanny Valley Hypothesis, Masahiro Mori, experiment, social perception, statistical analysis
Zásady pro vypracování
1) Cílem práce je:
seznámit se se současným stavem uplatnitelnosti a kvality systémů převodu textu na řeč (TTS) a rozpoznávání řeči (ASR),
formulovat předpoklady o vztahu mezi syntetickou řečí a tzv. hypotézou "uncanny valley",
experimentálně posoudit platnost hypotézy "uncanny valley" u systémů TTS na základě poslechových testů syntetické řeči,
výsledky experimentů interpretovat z hlediska teorie a filozofie komunikace tak, aby tyto závěry byly uplatnitelné při dalším vývoji řečových technologií.
2) Metody práce: abstrakce, indukce, kauzální a systémová analýza, experiment, pozorování.
3) Studentka bude dodržovat zásady etiky vědecké práce, zejména korektní odkazování na všechny použité zdroje a citování převzatých textů, a to dle normy ČSN ISO 690 a 690-2.
4) Studentka bude v pravidelných intervalech, nejméně však jednou do měsíce, konzultovat s vedoucím práce výběr odborné literatury, strukturu i obsah textu diplomové práce.
5) Plný text práce včetně formálních náležitostí (např. bibliografie, poznámkový aparát atd.) studentka odevzdá ke kontrole vedoucímu práce nejméně jeden měsíc před oficiálním termínem odevzdání diplomové práce.
6) Diplomová práce bude vypracována v souladu s platným rozhodnutím děkana O požadavcích na bakalářské a diplomové práce a o konání státních závěrečných zkoušek.
Zásady pro vypracování
1) Cílem práce je:
seznámit se se současným stavem uplatnitelnosti a kvality systémů převodu textu na řeč (TTS) a rozpoznávání řeči (ASR),
formulovat předpoklady o vztahu mezi syntetickou řečí a tzv. hypotézou "uncanny valley",
experimentálně posoudit platnost hypotézy "uncanny valley" u systémů TTS na základě poslechových testů syntetické řeči,
výsledky experimentů interpretovat z hlediska teorie a filozofie komunikace tak, aby tyto závěry byly uplatnitelné při dalším vývoji řečových technologií.
2) Metody práce: abstrakce, indukce, kauzální a systémová analýza, experiment, pozorování.
3) Studentka bude dodržovat zásady etiky vědecké práce, zejména korektní odkazování na všechny použité zdroje a citování převzatých textů, a to dle normy ČSN ISO 690 a 690-2.
4) Studentka bude v pravidelných intervalech, nejméně však jednou do měsíce, konzultovat s vedoucím práce výběr odborné literatury, strukturu i obsah textu diplomové práce.
5) Plný text práce včetně formálních náležitostí (např. bibliografie, poznámkový aparát atd.) studentka odevzdá ke kontrole vedoucímu práce nejméně jeden měsíc před oficiálním termínem odevzdání diplomové práce.
6) Diplomová práce bude vypracována v souladu s platným rozhodnutím děkana O požadavcích na bakalářské a diplomové práce a o konání státních závěrečných zkoušek.
Seznam doporučené literatury
PSUTKA, J. - MÜLLER, L. - MATOUŠEK, J. - RADOVÁ, V. Mluvíme s počítačem česky. Praha : Academia, 2006. ISBN 80-200-1309-1.
TAYLOR, P. Text-to-Speech Synthesis. Cambridge University Press, 2009. ISBN 9780521899277.
MORI, M. On the Uncanny Valley. In Proceedings of the Humanoids-2005 workshop: Views of the Uncanny Valley. Tsukuba, Japan, 2005. ISBN 978-1-57586-053-4.
PIERACCINI, R. The Voice in the Machine: Building Computers That Understand Speech. The MIT Press, 2012. ISBN 978-0262016858.
ROMPORTL, J. Zvyšování přirozenosti strojově vytvářené řeči v oblasti suprasegmentálních zvukových jevů. Disertační práce, Západočeská univerzita v Plzni. Plzeň, 2008. ISBN neuvedeno.
ŠVARNÝ, P. A Visit on the Uncanny Hill. In Beyond AI: Artificial Dreams. Proceedings of the International Conference Beyond AI 2012. Plzeň, 2012. ISBN 978-80-261-0102-4.
Seznam doporučené literatury
PSUTKA, J. - MÜLLER, L. - MATOUŠEK, J. - RADOVÁ, V. Mluvíme s počítačem česky. Praha : Academia, 2006. ISBN 80-200-1309-1.
TAYLOR, P. Text-to-Speech Synthesis. Cambridge University Press, 2009. ISBN 9780521899277.
MORI, M. On the Uncanny Valley. In Proceedings of the Humanoids-2005 workshop: Views of the Uncanny Valley. Tsukuba, Japan, 2005. ISBN 978-1-57586-053-4.
PIERACCINI, R. The Voice in the Machine: Building Computers That Understand Speech. The MIT Press, 2012. ISBN 978-0262016858.
ROMPORTL, J. Zvyšování přirozenosti strojově vytvářené řeči v oblasti suprasegmentálních zvukových jevů. Disertační práce, Západočeská univerzita v Plzni. Plzeň, 2008. ISBN neuvedeno.
ŠVARNÝ, P. A Visit on the Uncanny Hill. In Beyond AI: Artificial Dreams. Proceedings of the International Conference Beyond AI 2012. Plzeň, 2012. ISBN 978-80-261-0102-4.