Tato diplomová práce se zabývá sociální sítí Twitter a obecnou detekcí událostí v reálném čase. Hlavním cílem práce bylo vytvořit systém pro Českou tiskovou kancelář, který bude za pomoci API knihovny sledovat dění na Twitteru, tyto texty dále analyzovat a extrahovat z nich události. Nově detekované události pak bude přijatelnou formou prezentovat uživateli. Podle těchto požadavků vznikl nový systém detekující události na Twitteru, který byl dále podroben několika experimentům k určení optimálních parametrů a k demostraci vlastností programu. Výsledná přesnost byla 50% a úplnost 44,4%, což je pro ČTK přijatelné.
Annotation in English
This master thesis deals with the social network Twitter and a general event detection in real time. The main goal is to create a system for Czech News Agency (ČTK) which will be able to monitor the current data-flow on Twitter, analyze it and extract relevant events. The newly detected events then will be presented to users in an acceptable form. It was thus created a novel original experimental event detection system. Some experiments have been realized in order to find and define optimal system parametrs and to show the performance of the system. The reported precission was 50% and recall was 44,4% which is very interesting for the ČTK.
Twitter, event detection, text classification, binary representation, clustering.
Length of the covering note
59 s. (99 157 znaků)
Language
CZ
Annotation
Tato diplomová práce se zabývá sociální sítí Twitter a obecnou detekcí událostí v reálném čase. Hlavním cílem práce bylo vytvořit systém pro Českou tiskovou kancelář, který bude za pomoci API knihovny sledovat dění na Twitteru, tyto texty dále analyzovat a extrahovat z nich události. Nově detekované události pak bude přijatelnou formou prezentovat uživateli. Podle těchto požadavků vznikl nový systém detekující události na Twitteru, který byl dále podroben několika experimentům k určení optimálních parametrů a k demostraci vlastností programu. Výsledná přesnost byla 50% a úplnost 44,4%, což je pro ČTK přijatelné.
Annotation in English
This master thesis deals with the social network Twitter and a general event detection in real time. The main goal is to create a system for Czech News Agency (ČTK) which will be able to monitor the current data-flow on Twitter, analyze it and extract relevant events. The newly detected events then will be presented to users in an acceptable form. It was thus created a novel original experimental event detection system. Some experiments have been realized in order to find and define optimal system parametrs and to show the performance of the system. The reported precission was 50% and recall was 44,4% which is very interesting for the ČTK.
Twitter, event detection, text classification, binary representation, clustering.
Research Plan
Seznamte se se sociální sítí Twitter, zaměřte se na dostupné API pro automatické poskytování dat.
Prostudujte metody používané v oblasti automatického shlukování a klasifikace textu.
Na základě předchozí analýzy navrhněte systém pro automatické sledování trendů na síti Twitter. Systém umožní sledování nových příspěvků a jejich přiřazování do tříd podle podobnosti tématu. Na základě vlastností vytvořených tříd a jejich změn budou určovány aktuální trendy, které budou vhodným způsobem ukládány a prezentovány.
Systém realizujte a ověřte jeho funkčnost.
Výsledky zhodnoťte a navrhněte případné další rozšíření.
Research Plan
Seznamte se se sociální sítí Twitter, zaměřte se na dostupné API pro automatické poskytování dat.
Prostudujte metody používané v oblasti automatického shlukování a klasifikace textu.
Na základě předchozí analýzy navrhněte systém pro automatické sledování trendů na síti Twitter. Systém umožní sledování nových příspěvků a jejich přiřazování do tříd podle podobnosti tématu. Na základě vlastností vytvořených tříd a jejich změn budou určovány aktuální trendy, které budou vhodným způsobem ukládány a prezentovány.
Systém realizujte a ověřte jeho funkčnost.
Výsledky zhodnoťte a navrhněte případné další rozšíření.