Browse IS/STAG - Portál ZČU

Skip to page content
Website ZČU
Portal title page ZČU
Anonymous user Login Česky
HelpDesk - user support contact
Browse IS/STAG
Login Česky
HelpDesk - user support contact
  • My info
  • Study
My portal
Welcome
Webmail JIS
JISSouhlas koloběžky
Browse IS/STAG Applicant
Information for applicantsElectronic applicationECTS arrivalsCourse catalog
Graduate
Getting startedAlumni ClubAbsolvent - website
Courseware
CoursewareCourses by Faculties

1st level navigation

  • My info
  • Study

2nd level navigation

  • Browse IS/STAG
  • Applicant
  • Graduate
  • Courseware
User disconnected from the portal due to long time of inactivity.
Please, click this link to log back in
(sessions are disconnected after 240 minutes of inactivity. Note that mobile devices may get disconnected even sooner).

Browse IS/STAG (S025)

Help

Main menu for Browse IS/STAG

  • Programmes and specializations.
  • Courses
  • Departments
  • Lecturers
  • Students
  • Examination dates
  • Timetable events
  • Theses, selected item
  • Pre-regist. study groups
  • Rooms
  • Rooms – all year
  • Free rooms – Semester
  • Free rooms – Year
  • Capstone project
  • Times overlap
  •  
  • Title page
  • Calendar
  • Help

Search for a Thesis

Print/export:  Data export to PDF format - which you can print easily... Bookmark this link in your browser so that you may quickly load this IS/STAG page in the future.
Not logged-in user will see only submitted theses.
Only logged-in user will see student personal numbers.

Dates found, count: 1

Search result paging

Found 1 records Print Export to xls List URL
  Surname Name Title Thesis status   Supervisors Reviewers Type of thesis Date of def. Title
Student Type of thesis - - - - - - - - - -
Item shown in detail ZÍBAR Includes the selected person into the timetable overlap calculation. Karel Unsupervised methods for automatic keyword extraction Unsupervised methods for automatic keyword extraction Thesis finished and defended successfully (DUO).   Brychcín Tomáš Hercig Tomáš Master's thesis 1497823200000 19.06.2017 Unsupervised methods for automatic keyword extraction Thesis finished and defended successfully (DUO).
Karel ZÍBAR Master's thesis 0XX 0XX 0XX 0XX 0XX 0XX 0XX 0XX 0XX 0XX

Thesis info Automatická extrakce klíčových slov pomocí metod trénovaných bez učitele

  • Basic data
The document you are accessing is protected by copyright law. Unauthorised use may lead to criminal sanctions.
Name ZÍBAR Karel Includes the selected person into the timetable overlap calculation.
Acad. Yr. 2016/2017
Assigning department KIV
Date of defence Jun 19, 2017
Type of thesis Master's thesis
Thesis status Thesis finished and defended successfully (DUO). Thesis finished and defended successfully (DUO).
Completeness of mandatory entries - All mandatory fields for this Thesis are filled in.
Main topic Automatická extrakce klíčových slov pomocí metod trénovaných bez učitele
Main topic in English Unsupervised methods for automatic keyword extraction
Title according to student Automatická extrakce klíčových slov pomocí metod trénovaných bez učitele
English title as given by the student Unsupervised methods for automatic keyword extraction
Parallel name -
Subtitle -
Supervisor Brychcín Tomáš, Ing. Ph.D.
Reviewer Hercig Tomáš, Ing. Ph.D.
Annotation Tato práce se zabývá různými přístupy extrahování klíčových slov z textových dokumentů. Celkem byly implementovány tři dobře známé metody - TF-IDF, LDA a GloVe (extrakce pomocí reprezentace slov vektory GloVe). Jejich algoritmy byly lehce upraveny tak, aby metody mohly využívat více příznaků než před tím. Byla také navržena vlastní metoda (označena jako ZKEM) kombinující všechny výše zmíněné přístupy a otestována stejným způsobem. Všechny tyto metody byly testovány a srovnány s metodami, účastnících se mezinárodní programovací soutěže SemEval 2010. Nejlepší metoda (vylepšená metoda TF-IDF) dosáhla úspěšnosti 25,95 %. Tento výsledek by stačil na druhé místo v soutěži SemEval.
Annotation in English This thesis deals with different approaches to keyword extraction from text documents. Three well-known methods have been implemented - TF-IDF, LDA and GloVe (keyword extraction by representing words as GloVe's vectors). Their algorithms have been slightly improved so that the methods can use more features. Finally, a new method (denoted as ZKEM), combining all three approaches mentioned above, has been created and properly evaluated in the same way as the others. All methods have been tested and compared with the algorithms participated at international programming competition SemEval 2010. The best method (improved TF-IDF) has achieved 25.95% accuracy. This result would be enough to take second place at SemEval competition.
Keywords Metody extrakce klíčových slov trénované bez učitele, TF-IDF, LDA, GloVE, SemEval 2010
Keywords in English Unsupervised keyword extraction methods, TF-IDF, LDA, GloVe, SemEval 2010
Length of the covering note 72
Language CZ
Annotation
Tato práce se zabývá různými přístupy extrahování klíčových slov z textových dokumentů. Celkem byly implementovány tři dobře známé metody - TF-IDF, LDA a GloVe (extrakce pomocí reprezentace slov vektory GloVe). Jejich algoritmy byly lehce upraveny tak, aby metody mohly využívat více příznaků než před tím. Byla také navržena vlastní metoda (označena jako ZKEM) kombinující všechny výše zmíněné přístupy a otestována stejným způsobem. Všechny tyto metody byly testovány a srovnány s metodami, účastnících se mezinárodní programovací soutěže SemEval 2010. Nejlepší metoda (vylepšená metoda TF-IDF) dosáhla úspěšnosti 25,95 %. Tento výsledek by stačil na druhé místo v soutěži SemEval.
Annotation in English
This thesis deals with different approaches to keyword extraction from text documents. Three well-known methods have been implemented - TF-IDF, LDA and GloVe (keyword extraction by representing words as GloVe's vectors). Their algorithms have been slightly improved so that the methods can use more features. Finally, a new method (denoted as ZKEM), combining all three approaches mentioned above, has been created and properly evaluated in the same way as the others. All methods have been tested and compared with the algorithms participated at international programming competition SemEval 2010. The best method (improved TF-IDF) has achieved 25.95% accuracy. This result would be enough to take second place at SemEval competition.
Keywords
Metody extrakce klíčových slov trénované bez učitele, TF-IDF, LDA, GloVE, SemEval 2010
Keywords in English
Unsupervised keyword extraction methods, TF-IDF, LDA, GloVe, SemEval 2010
Research Plan
  1. Prostudujte metody pro automatickou extrakci klíčových slov z textu. Zaměřte
    se na metody s trénováním bez učitele.
  2. Prozkoumejte dostupné datové kolekce pro testování extrakce klíčových slov.
  3. Navrhněte a implementujte vhodné modifikace základních metod.
  4. Metody otestujte na manuálně anotovaných datech a zhodnoťte výsledky.
Research Plan
  1. Prostudujte metody pro automatickou extrakci klíčových slov z textu. Zaměřte
    se na metody s trénováním bez učitele.
  2. Prozkoumejte dostupné datové kolekce pro testování extrakce klíčových slov.
  3. Navrhněte a implementujte vhodné modifikace základních metod.
  4. Metody otestujte na manuálně anotovaných datech a zhodnoťte výsledky.
Recommended resources dodá vedoucí diplomové práce
Recommended resources
dodá vedoucí diplomové práce
Týká se praxe No
Enclosed appendices -
Appendices bound in thesis graphs, tables
Taken from the library Yes
Full text of the thesis
Thesis defence evaluation Very Good
Appendices
Reviewer's report
Supervisor's report
Defence procedure record -
Defence procedure record file