Portál ZČU - Prohlížení

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Tisk/export:

Export dat do formátu PDF - který můžete pohodlně vytisknout...

Tento odkaz můžete zkopírovat a použít například jako záložku prohlížeče pro zobrazení aktuální pozice v Prohlížení IS/STAG.

Nepřihlášenému uživateli se zobrazují pouze již odevzdané práce.

Osobní čísla studentů se zobrazují pouze přihlášenému uživateli.

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Nalezeno 1 záznamů Tisk Export do Xls URL na seznam

Příjmení (rod. přijm.)	Jméno	Název	Stav práce		Vedoucí/školitelé	Oponenti	Typ práce	Dat. obhaj.	Název
Student	Typ práce	-	-	-	-	-	-	-	-	-	-
KUPILÍK	Filip	Automatická identifikace revizí textových dokumentů			Konopík Miloslav	Král Pavel	bakalářská	29.08.2017	Automatická identifikace revizí textových dokumentů
Filip KUPILÍK	bakalářská	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX	0XX

Informace o kvalifikační práci Automatická identifikace revizí textových dokumentů

Základní údaje

Anotace
Dokument, ke kterému přistupujete, podléhá autorskému zákonu. Jeho porušením se můžete vystavit trestnímu postihu!
Jméno	KUPILÍK Filip
Akad. rok	2016/2017
Zadávající pracoviště	KIV
Datum obhajoby	29. 8. 2017
Typ práce	bakalářská
Stav práce	Dokončená práce s úspěšnou obhajobou (DUO).
Úplnost vyplnění požadovaných údajů	- Všechny požadované údaje o této VŠKP jsou vyplněny.
Hlavní téma	Automatická identifikace revizí textových dokumentů
Hlavní téma v angličtině	Automated Identification of Revisions of Text Documents
Název dle studenta	Automatická identifikace revizí textových dokumentů
Název dle studenta v angličtině	Automated Identification of Revisions of Text Documents
Souběžný název	-
Podnázev	-
Vedoucí	Konopík Miloslav, Ing. Ph.D.
Oponent	Král Pavel, Doc. Ing. Ph.D.
Anotace	Cílem této práce je navrhnout, vytvořit a otestovat algoritmus pro identifi- kaci revizí v množině textových dokumentů. V první části práce jsou zmapo- vány současné přístupy ve vyhledávání dokumentů a popsány stávající algo- ritmy pro identifikaci podobných dokumentů. Druhá část se zabývá návrhem a implementací algoritmu zaměřeného na detekci revizí, jehož úspěšnost je ověřena na vytvořené kolekci testovacích dokumentů. Výsledky získané z provedených experimentů jsou porovnány s výsledky vybraných stávajících algoritmů.
Anotace v angličtině	The goal of the thesis is to design, create and test an algorithm which iden- tifies the revisions of test documents. The first part of the thesis is focused on analysing current approaches to document searching and a identification of highly similar documents (near-duplicates). The second part deals with a design and an implementation of a new algorithm. The efficiency of the algorithm is verified on a set of test documents. The tests results are com- pared with the results of the experiments which were done with the selected existing algorithms.
Klíčová slova	revize, duplikáty, Apache Lucene, vyhledávání informací, vektorový model, Kullback-Leiblerova divergence, rozpoznávání pojmenovaných entit
Klíčová slova v angličtině	revision, duplicates, Apache Lucene, information retrieval, vector space model, Kullback-Leibler divergence, named-entity recognition
Rozsah průvodní práce	49 s. (71189 znaků)
Jazyk	CZ
Cílem této práce je navrhnout, vytvořit a otestovat algoritmus pro identifi- kaci revizí v množině textových dokumentů. V první části práce jsou zmapo- vány současné přístupy ve vyhledávání dokumentů a popsány stávající algo- ritmy pro identifikaci podobných dokumentů. Druhá část se zabývá návrhem a implementací algoritmu zaměřeného na detekci revizí, jehož úspěšnost je ověřena na vytvořené kolekci testovacích dokumentů. Výsledky získané z provedených experimentů jsou porovnány s výsledky vybraných stávajících algoritmů.
Anotace v angličtině
The goal of the thesis is to design, create and test an algorithm which iden- tifies the revisions of test documents. The first part of the thesis is focused on analysing current approaches to document searching and a identification of highly similar documents (near-duplicates). The second part deals with a design and an implementation of a new algorithm. The efficiency of the algorithm is verified on a set of test documents. The tests results are com- pared with the results of the experiments which were done with the selected existing algorithms.
Klíčová slova
revize, duplikáty, Apache Lucene, vyhledávání informací, vektorový model, Kullback-Leiblerova divergence, rozpoznávání pojmenovaných entit
Klíčová slova v angličtině
revision, duplicates, Apache Lucene, information retrieval, vector space model, Kullback-Leibler divergence, named-entity recognition
Zásady pro vypracování	Pečlivě prozkoumejte přístupy k hledání podobných dokumentů. Zaměřte se na textovou shodu a využití nástrojů pro indexaci textových dokumentů. Získejte nebo vytvořte netriviální testovací kolekci podobných dokumentů. Vyzkoušejte stávající algoritmy pro hledání podobných dokumentů a navrhněte a implementujte vlastní algoritmus, resp. algoritmy. Změřte úspěšnost stávajících i vlastních algoritmů. Dosažené výsledky kriticky zhodnoťte.
Zásady pro vypracování
Pečlivě prozkoumejte přístupy k hledání podobných dokumentů. Zaměřte se na textovou shodu a využití nástrojů pro indexaci textových dokumentů. Získejte nebo vytvořte netriviální testovací kolekci podobných dokumentů. Vyzkoušejte stávající algoritmy pro hledání podobných dokumentů a navrhněte a implementujte vlastní algoritmus, resp. algoritmy. Změřte úspěšnost stávajících i vlastních algoritmů. Dosažené výsledky kriticky zhodnoťte.
Seznam doporučené literatury	dodá vedoucí bakalářské práce
Seznam doporučené literatury
dodá vedoucí bakalářské práce
Přílohy volně vložené	1 DVD
Přílohy vázané v práci	tabulky
Převzato z knihovny	Ano
Plný text práce
Hodnocení z obhajoby práce	Velmi dobře
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby	-
Soubor s průběhem obhajoby

Prohlížení - Portál ZČU

Navigace první úrovně

Navigace druhé úrovně

Prohlížení (S025)

Hlavní nabídka Prohlížení IS/STAG

Najít Kvalifikační práce

Nalezené termíny, počet: 1

Stránkování výsledků vyhledávání

Informace o kvalifikační práci Automatická identifikace revizí textových dokumentů