Tato bakalářská práce se zabývá vytvořením programu, který umožňuje automatické vytvoření datasetu obsahujícího komixové bubliny s rozpoznaným textem. Stránky komixů budou nejprve vhodným způsobem segmentovány za využití metod počítačového vidění doplněných o následnou filtraci segmentovaných oblastí. Detekované bubliny jsou posléze vstupem do metody optického rozpoznávání znaků (OCR). Následně jsou informace o komixové bublině doplněny o rozpoznaný text a ve vhodném formátu uloženy do souboru pro další zpracování. V rámci této práce byly provedeny experimenty, které změřily úspěšnost navrženého algoritmu.
Anotace v angličtině
This thesis deals with the creation of a program that allows the automatic creation of a dataset containing baloon texts (comic speech bubbles) with recognized text. The comics pages will be first segmented using computer vision methods complemented by filtering of the segmented regions. Detected bubbles are input to optical character recognition (OCR) method. Moreover, the comic bubble information is aggregated with the recognized text and saved in a file for further processing. The experiments that measured the success rate of the designed algorithm were conducted.
Tato bakalářská práce se zabývá vytvořením programu, který umožňuje automatické vytvoření datasetu obsahujícího komixové bubliny s rozpoznaným textem. Stránky komixů budou nejprve vhodným způsobem segmentovány za využití metod počítačového vidění doplněných o následnou filtraci segmentovaných oblastí. Detekované bubliny jsou posléze vstupem do metody optického rozpoznávání znaků (OCR). Následně jsou informace o komixové bublině doplněny o rozpoznaný text a ve vhodném formátu uloženy do souboru pro další zpracování. V rámci této práce byly provedeny experimenty, které změřily úspěšnost navrženého algoritmu.
Anotace v angličtině
This thesis deals with the creation of a program that allows the automatic creation of a dataset containing baloon texts (comic speech bubbles) with recognized text. The comics pages will be first segmented using computer vision methods complemented by filtering of the segmented regions. Detected bubbles are input to optical character recognition (OCR) method. Moreover, the comic bubble information is aggregated with the recognized text and saved in a file for further processing. The experiments that measured the success rate of the designed algorithm were conducted.
Prostudujte metody pro segmentaci a analýzu obrazu a seznamte se s dostupnými systémy optického rozpoznávání znaků (OCR). Dále se seznamte s formáty datasetů využívaných výzkumnou skupinou NLP.
Navrhněte postup pro detekci bublin v komixových obrázcích.
Navržený postup implementujte a integrujte všechny části do funkčního celku.
Vytvořenou aplikací rozpoznejte text na vybrané reprezentativní množině komixových obrázků. Ve vhodném formátu vytvořte z rozpoznaných textů dataset, který bude dále využíván pro výzkumné účely skupiny NLP.
Vytvořený systém otestujte a kriticky zhodnoťte dosažené výsledky.
Zásady pro vypracování
Prostudujte metody pro segmentaci a analýzu obrazu a seznamte se s dostupnými systémy optického rozpoznávání znaků (OCR). Dále se seznamte s formáty datasetů využívaných výzkumnou skupinou NLP.
Navrhněte postup pro detekci bublin v komixových obrázcích.
Navržený postup implementujte a integrujte všechny části do funkčního celku.
Vytvořenou aplikací rozpoznejte text na vybrané reprezentativní množině komixových obrázků. Ve vhodném formátu vytvořte z rozpoznaných textů dataset, který bude dále využíván pro výzkumné účely skupiny NLP.
Vytvořený systém otestujte a kriticky zhodnoťte dosažené výsledky.