Analýza stran dokumentů hraje významnou roli v procesu jejich elektronického zpřístupnění. Dokonce i v současné době může představovat nelehkou
výzvu pro historické ručně psané dokumenty vzhledem k jejich různorodé
struktuře a možné degradaci kvality. V rámci této práce je vypracován přehled možných metod pro řešení tohoto problému a vytvořena datová sada
složená ze stran ručně psaných kronik. Dále je navržen prototyp systému
pro analýzu stran dokumentů. Segmentace a klasifikace do tříd text, obrázek
a pozadí jsou řešeny označením každého obrazového bodu strany dokumentu
vhodnou třídou. Základem prototypu je plně konvoluční neuronová síť založená na síti U-Net. Nejlepších výsledků bylo dosaženo s prototypem, pro
který bylo nastaveno zpracování celých stran dokumentů, bylo provedeno
váhování chybové funkce a byla automaticky rozšířena trénovací množina.
Anotace v angličtině
Page layout analysis plays an important role in the process of document
retrieval. It can still be a challenging task for historical handwritten documents due to their diverse structure and possible quality degradation. In this
thesis, an overview of possible methods for solving this problem is presented
and a dataset composed of the pages of handwritten chronicles is created.
This thesis also presents a prototype of the system for page layout analysis.
The segmentation and classification into text, image and background classes
are solved as a pixel-labeling problem. The prototype is based on a fully convolutional neural network inspired by U-Net. The best results were achieved
when the prototype was set to the processing of entire pages of documents,
the loss function was weighted and the training set was automatically augmented.
Analýza stran dokumentů hraje významnou roli v procesu jejich elektronického zpřístupnění. Dokonce i v současné době může představovat nelehkou
výzvu pro historické ručně psané dokumenty vzhledem k jejich různorodé
struktuře a možné degradaci kvality. V rámci této práce je vypracován přehled možných metod pro řešení tohoto problému a vytvořena datová sada
složená ze stran ručně psaných kronik. Dále je navržen prototyp systému
pro analýzu stran dokumentů. Segmentace a klasifikace do tříd text, obrázek
a pozadí jsou řešeny označením každého obrazového bodu strany dokumentu
vhodnou třídou. Základem prototypu je plně konvoluční neuronová síť založená na síti U-Net. Nejlepších výsledků bylo dosaženo s prototypem, pro
který bylo nastaveno zpracování celých stran dokumentů, bylo provedeno
váhování chybové funkce a byla automaticky rozšířena trénovací množina.
Anotace v angličtině
Page layout analysis plays an important role in the process of document
retrieval. It can still be a challenging task for historical handwritten documents due to their diverse structure and possible quality degradation. In this
thesis, an overview of possible methods for solving this problem is presented
and a dataset composed of the pages of handwritten chronicles is created.
This thesis also presents a prototype of the system for page layout analysis.
The segmentation and classification into text, image and background classes
are solved as a pixel-labeling problem. The prototype is based on a fully convolutional neural network inspired by U-Net. The best results were achieved
when the prototype was set to the processing of entire pages of documents,
the loss function was weighted and the training set was automatically augmented.