Tato práce se zabývá automatickým značkováním sémantických rolí (SRL, z anglického Semantic Role Labeling) ve větách. V teoretické části práce jsou srovnané různé aktuálně používané metody. Zvláštní pozornost je věnována metodám nezávislým na jazyce. Tedy metodám projekce anotací, přenositelným modelům a učení bez učitele.
V práci jsou navržené experimenty ověřující použitelnost univerzální syntaxe - Universal Dependencies (UD) pro vícejazyčné značkování sémantických rolí. Na závěr je navržena, implementována a ověřena metoda vícejazyčného SRL využívající Universal Dependencies. Výsledky vypadají velice slibně a dokazují, že UD jsou pro metody vícejazyčného SRL velice dobré. Práce přináší spoustu možností dalšího výzkumu.
Anotace v angličtině
This thesis is focused on Semantic Role Labeling (SRL). The theoretical part compares the most interesting known methods for SRL. Special attention is paid to language independent methods. Specifically annotation projection, model transfer and unsupervised methods.
We design experiments to verify whether the Universal Dependencies are suitable for cross-lingual SRL. Finally, the whole SRL system based upon Universal Dependencies is designed and implemented. The results are very promising. They prove that Universal Dependencies are suitable for cross-lingual SRL. The work opens new interesting research paths for the future.
Klíčová slova
Zpracování přirozeného jazyka, sémantická analýza, značkování sémantických rolí, vícejazyčný přístup
Klíčová slova v angličtině
Natural language processing, semantic analysis, semantic role labeling, cross-lingual approach
Rozsah průvodní práce
64 s.
Jazyk
CZ
Anotace
Tato práce se zabývá automatickým značkováním sémantických rolí (SRL, z anglického Semantic Role Labeling) ve větách. V teoretické části práce jsou srovnané různé aktuálně používané metody. Zvláštní pozornost je věnována metodám nezávislým na jazyce. Tedy metodám projekce anotací, přenositelným modelům a učení bez učitele.
V práci jsou navržené experimenty ověřující použitelnost univerzální syntaxe - Universal Dependencies (UD) pro vícejazyčné značkování sémantických rolí. Na závěr je navržena, implementována a ověřena metoda vícejazyčného SRL využívající Universal Dependencies. Výsledky vypadají velice slibně a dokazují, že UD jsou pro metody vícejazyčného SRL velice dobré. Práce přináší spoustu možností dalšího výzkumu.
Anotace v angličtině
This thesis is focused on Semantic Role Labeling (SRL). The theoretical part compares the most interesting known methods for SRL. Special attention is paid to language independent methods. Specifically annotation projection, model transfer and unsupervised methods.
We design experiments to verify whether the Universal Dependencies are suitable for cross-lingual SRL. Finally, the whole SRL system based upon Universal Dependencies is designed and implemented. The results are very promising. They prove that Universal Dependencies are suitable for cross-lingual SRL. The work opens new interesting research paths for the future.
Klíčová slova
Zpracování přirozeného jazyka, sémantická analýza, značkování sémantických rolí, vícejazyčný přístup
Klíčová slova v angličtině
Natural language processing, semantic analysis, semantic role labeling, cross-lingual approach
Zásady pro vypracování
Prostudujte teorii značkování sémantických rolí a univerzálních závislostních modelů větné skladby.
Implementujte jednoduchý systém pro automatické značkování sémantických rolí.
Navrhněte systém nezávislý na jazyce a implementujte jej.
Systém ověřte na datových sadách s označenými sémantickými rolemi alespoň ve třech jazycích.
Dosažené výsledky kriticky zhodnoťte.
Zásady pro vypracování
Prostudujte teorii značkování sémantických rolí a univerzálních závislostních modelů větné skladby.
Implementujte jednoduchý systém pro automatické značkování sémantických rolí.
Navrhněte systém nezávislý na jazyce a implementujte jej.
Systém ověřte na datových sadách s označenými sémantickými rolemi alespoň ve třech jazycích.