Cílem této bakalářské práce je prozkoumat dostupné metody sémantické reprezentace současně s návrhem dvou vlastních metod, které budou následně implementovány do předem zvoleného full-textového vyhledávače Apache Solr. Současně budou podrobně prozkoumány dostupné datové kolekce pro full-textové vyhledávání. Funkčnost metod bude posléze ověřena na vybrané datové kolekci. Výstupem práce je zhodnocení dosažených výsledků, zejména účinnosti metod vedoucích ke zvýšení přesnosti a kvality vyhledávání ve zvolené datové kolekcí.
Anotace v angličtině
This Bachelor Thesis aims to examine available methods of semantic representation along with the proposal of two own methods, which will be subsequently integrated into the already selected full-text search engine Apache Solr. At the same time, available data collections for full-text search will be examined in greater detail. The functionality of the methods will be subsequently verified on the selected data collection. The output of the work will be an evaluation of the obtained results, particularly the effectiveness of the methods leading to a greater accuracy and quality of searches in the selected data collection.
Cílem této bakalářské práce je prozkoumat dostupné metody sémantické reprezentace současně s návrhem dvou vlastních metod, které budou následně implementovány do předem zvoleného full-textového vyhledávače Apache Solr. Současně budou podrobně prozkoumány dostupné datové kolekce pro full-textové vyhledávání. Funkčnost metod bude posléze ověřena na vybrané datové kolekci. Výstupem práce je zhodnocení dosažených výsledků, zejména účinnosti metod vedoucích ke zvýšení přesnosti a kvality vyhledávání ve zvolené datové kolekcí.
Anotace v angličtině
This Bachelor Thesis aims to examine available methods of semantic representation along with the proposal of two own methods, which will be subsequently integrated into the already selected full-text search engine Apache Solr. At the same time, available data collections for full-text search will be examined in greater detail. The functionality of the methods will be subsequently verified on the selected data collection. The output of the work will be an evaluation of the obtained results, particularly the effectiveness of the methods leading to a greater accuracy and quality of searches in the selected data collection.
Seznamte se s vybranými metodami sémantické reprezentace textu.
Prostudujte dostupné datové kolekce pro full-textové vyhledávání.
Seznamte se se systémem full-textového vyhledávání Apache Solr.
Na základě prostudované literatury navrhněte alespoň dvě efektivní metody sémantické reprezentace textu, metody implementujte a integrujte do prostudovaného vyhledávače.
Funkčnost metod ověřte na vybrané datové kolekci.
Analyzujte výsledky a navrhněte případná další rozšíření.
Zásady pro vypracování
Seznamte se s vybranými metodami sémantické reprezentace textu.
Prostudujte dostupné datové kolekce pro full-textové vyhledávání.
Seznamte se se systémem full-textového vyhledávání Apache Solr.
Na základě prostudované literatury navrhněte alespoň dvě efektivní metody sémantické reprezentace textu, metody implementujte a integrujte do prostudovaného vyhledávače.
Funkčnost metod ověřte na vybrané datové kolekci.
Analyzujte výsledky a navrhněte případná další rozšíření.