Hlavním cílem této práce je vytvoření konvoluční neuronové sítě, která bude spolehlivě detekovat specifické objekty v digitálních snímcích. Data, na kterých byla síť trénována, jsou rozdělena do dvou skupin. Cílové snímky (třída 1) jsou snímky, které obsahují pornografii, konkrétně odhalená ženská prsa. Necílové snímky (třída 0) pornografii neobsahují. V první části práce je vysvětlena základní problematika konvolučních neuronových sítí. To zahrnuje například popis jejich struktury, jednotlivých vrstev a algoritmu učení. V praktické části je popsáno několik různých architektur konvolučních sítí. Pro implementaci byl vybrán framework CNTK. Nejlepších výsledků dosahovaly sítě se třemi a pěti konvolučními vrstvami, které byly natrénovány na množině s přibližně osmi tisíci vzorky. V rámci práce byly vytvořeny i webové stránky, které slouží k uživatelskému testování.
Annotation in English
The main objective of this master thesis is to create a convolutional neural network for detection of specific objects in digital images. The dataset is divided into two classes (target and non--target) and each image has to fit into one class. Target images (class 1) should contain a pornography, naked women's breasts specifically, non-target images (class 0) should not. In the first part, basic features of convolutional neural networks (CNN) are presented. That includes structure of nets, description of layers and learning algorithm. The second part examines various architectures of CNNs. These architectures are implemented using CNTK framework. The most promising results were achieved with architecture with three and five convolutional layers and approximately eight thousand training samples. Also a web page was created for user testing.
Keywords
neuron, neuronové sítě, konvoluční neuronové sítě, učení s učitelem, detekce objektů, zpracování obrazu, CNTK,
Hlavním cílem této práce je vytvoření konvoluční neuronové sítě, která bude spolehlivě detekovat specifické objekty v digitálních snímcích. Data, na kterých byla síť trénována, jsou rozdělena do dvou skupin. Cílové snímky (třída 1) jsou snímky, které obsahují pornografii, konkrétně odhalená ženská prsa. Necílové snímky (třída 0) pornografii neobsahují. V první části práce je vysvětlena základní problematika konvolučních neuronových sítí. To zahrnuje například popis jejich struktury, jednotlivých vrstev a algoritmu učení. V praktické části je popsáno několik různých architektur konvolučních sítí. Pro implementaci byl vybrán framework CNTK. Nejlepších výsledků dosahovaly sítě se třemi a pěti konvolučními vrstvami, které byly natrénovány na množině s přibližně osmi tisíci vzorky. V rámci práce byly vytvořeny i webové stránky, které slouží k uživatelskému testování.
Annotation in English
The main objective of this master thesis is to create a convolutional neural network for detection of specific objects in digital images. The dataset is divided into two classes (target and non--target) and each image has to fit into one class. Target images (class 1) should contain a pornography, naked women's breasts specifically, non-target images (class 0) should not. In the first part, basic features of convolutional neural networks (CNN) are presented. That includes structure of nets, description of layers and learning algorithm. The second part examines various architectures of CNNs. These architectures are implemented using CNTK framework. The most promising results were achieved with architecture with three and five convolutional layers and approximately eight thousand training samples. Also a web page was created for user testing.
Keywords
neuron, neuronové sítě, konvoluční neuronové sítě, učení s učitelem, detekce objektů, zpracování obrazu, CNTK,
Prostudujte perspektivní metody detekce objektů v digitálních snímcích, zejména s přihlédnutím k identifikaci obsahu scény. Seznamte se především s technikou konvolučních neuronových sítí a příbuzných paradigmat hlubokého učení.
Navrhněte a implementujte (za použití existujících knihoven pro práci s konvolučními neuronovými sítěmi jako např. CNTK, Theano, TensorFlow apod.) klasifikační systém, který bude spolehlivě identifikovat pornografické scény.
Důkladně popište architekturu a implementaci vytvořeného systému tak, aby bylo možné pokračovat v budoucnu v jeho rozvoji.
Vyhodnoťte objektivně dosažené výsledky a vše řádně zdokumentujte.
Research Plan
Prostudujte perspektivní metody detekce objektů v digitálních snímcích, zejména s přihlédnutím k identifikaci obsahu scény. Seznamte se především s technikou konvolučních neuronových sítí a příbuzných paradigmat hlubokého učení.
Navrhněte a implementujte (za použití existujících knihoven pro práci s konvolučními neuronovými sítěmi jako např. CNTK, Theano, TensorFlow apod.) klasifikační systém, který bude spolehlivě identifikovat pornografické scény.
Důkladně popište architekturu a implementaci vytvořeného systému tak, aby bylo možné pokračovat v budoucnu v jeho rozvoji.
Vyhodnoťte objektivně dosažené výsledky a vše řádně zdokumentujte.