Cílem této diplomové práce bylo ověřit možnost využití knihovny Tesseract OCR (či jiné knihovny) pro optické rozpoznávání znaků v úloze automatického rozpoznávání přídavných látek z fotografií složení potravin. Výstupem práce je mimo jiné mobilní aplikace, která dokáže automaticky rozpoznávat přídavné látky přímo z fotografie složení potraviny. V textu práce je popsána problematika optického rozpoznávání znaků, včetně technik předzpracování obrazových dat a způsobu ověření kvality extrakce. V textu je rovněž uveden detailní popis výsledné implementace a použitých technologií. V závěru diplomové práce jsou kriticky zhodnoceny dosažené výsledky a zmíněna případná budoucí rozšíření.
Anotace v angličtině
The main goal of this work was to prove, whether it was possible to use optical character recognition library Tesseract OCR (or its alternative) in the task of extraction of food additives from food labels. The outcome of this work is, among other things, a mobile application, which is able to automatically extract food additives from photographs of food labels. The thesis describes the techniques of optical character recognition and image data preprocessing. It also contains the detailed description of the final implementation including the overview of used technologies. The achieved results and future possible extensions are discussed at the end of the thesis.
Cílem této diplomové práce bylo ověřit možnost využití knihovny Tesseract OCR (či jiné knihovny) pro optické rozpoznávání znaků v úloze automatického rozpoznávání přídavných látek z fotografií složení potravin. Výstupem práce je mimo jiné mobilní aplikace, která dokáže automaticky rozpoznávat přídavné látky přímo z fotografie složení potraviny. V textu práce je popsána problematika optického rozpoznávání znaků, včetně technik předzpracování obrazových dat a způsobu ověření kvality extrakce. V textu je rovněž uveden detailní popis výsledné implementace a použitých technologií. V závěru diplomové práce jsou kriticky zhodnoceny dosažené výsledky a zmíněna případná budoucí rozšíření.
Anotace v angličtině
The main goal of this work was to prove, whether it was possible to use optical character recognition library Tesseract OCR (or its alternative) in the task of extraction of food additives from food labels. The outcome of this work is, among other things, a mobile application, which is able to automatically extract food additives from photographs of food labels. The thesis describes the techniques of optical character recognition and image data preprocessing. It also contains the detailed description of the final implementation including the overview of used technologies. The achieved results and future possible extensions are discussed at the end of the thesis.
Prozkoumejte možnosti využití anotované kolekce fotografií popisů složení potravin v úloze automatického rozpoznávání přídavných látek z obalů potravin. Pozn.: anotovanou kolekci fotografií student vytvoří v rámci oborového projektu.
Implementujte alespoň základní znalostní bázi nad daty získanými z webu FérPotravina.cz (popř. od jinud) a z výše zmíněné anotované kolekce.
Prozkoumejte možnosti knihovny Tesseract OCR (či vhodné alternativy) pro výše zmíněnou úlohu.
Vytvořte aplikaci umožňující automatické rozpoznání přídavných látek z fotografie složení potraviny.
Proveďte experimenty s vytvořenou aplikací a kolekcí fotografií.
Diskutujte výsledky experimentů a kvalitu navrženého řešení.
Zásady pro vypracování
Prozkoumejte možnosti využití anotované kolekce fotografií popisů složení potravin v úloze automatického rozpoznávání přídavných látek z obalů potravin. Pozn.: anotovanou kolekci fotografií student vytvoří v rámci oborového projektu.
Implementujte alespoň základní znalostní bázi nad daty získanými z webu FérPotravina.cz (popř. od jinud) a z výše zmíněné anotované kolekce.
Prozkoumejte možnosti knihovny Tesseract OCR (či vhodné alternativy) pro výše zmíněnou úlohu.
Vytvořte aplikaci umožňující automatické rozpoznání přídavných látek z fotografie složení potraviny.
Proveďte experimenty s vytvořenou aplikací a kolekcí fotografií.
Diskutujte výsledky experimentů a kvalitu navrženého řešení.