Tato diplomová práce se zabývá semántickou segmentací obrazu z kamery
auta pomocí hlubokých neuronových sítí. Aktuálně nejlepší model aplikující
sémantickou segmentaci na Cityscapes datasetu DeepLabV3+ byl kompletně
re-implementován s použitím frameworků Keras a TensorFlow. Tento model
byl předtrénován na ImageNet datasetu a poté byl transformován pomocí Cityscapes datasetu k tvorbě sémantické segmentace. Kvalita tohoto modelu byla
ověřena pomocí validačního setu ze Cityscapes datasetu, na kterém model dosáhl
výkonosti 73.55% IoU. Na závěr byl model přetrénován pomocí KPIT datasetu, aby vytvářel sémantickou segmentaci obrazu ze zadní kamery v autě,
na které je čočka zvaná rybí oko. Na KPIT datasetu bylo provedeno několik
experimentů. Nejlepší model dosáhl výkonosti 59.26% IoU na validační sadě.
Anotace v angličtině
The diploma thesis deals with the problem of semantic segmentation of automotive images using a deep neural networks. DeepLabV3+, the state-of-the-art model on Cityscapes dataset, was re-implemented using Keras and TensorFlow
frameworks. The model was pretrained on the ImageNet dataset and then using a
transfer learning was transformed to perform a semantic segmentation on the Cityscapes dataset. The performance of the model was verified on the validation
set of Cityscapes dataset, the model achieved the performance of 73.55% IoU.
In the end, the model was fine-tuned using the KPIT dataset to perform semantic segmentation of fish eye camera automotive images. A few experiments
were executed on the KPIT dataset. The best model achieved a performance
of 59.26% IoU on the validation set.
Deep neural networks, convolutional neural networks, DeepLab, semantic segmentation
Rozsah průvodní práce
53 s.
Jazyk
AN
Anotace
Tato diplomová práce se zabývá semántickou segmentací obrazu z kamery
auta pomocí hlubokých neuronových sítí. Aktuálně nejlepší model aplikující
sémantickou segmentaci na Cityscapes datasetu DeepLabV3+ byl kompletně
re-implementován s použitím frameworků Keras a TensorFlow. Tento model
byl předtrénován na ImageNet datasetu a poté byl transformován pomocí Cityscapes datasetu k tvorbě sémantické segmentace. Kvalita tohoto modelu byla
ověřena pomocí validačního setu ze Cityscapes datasetu, na kterém model dosáhl
výkonosti 73.55% IoU. Na závěr byl model přetrénován pomocí KPIT datasetu, aby vytvářel sémantickou segmentaci obrazu ze zadní kamery v autě,
na které je čočka zvaná rybí oko. Na KPIT datasetu bylo provedeno několik
experimentů. Nejlepší model dosáhl výkonosti 59.26% IoU na validační sadě.
Anotace v angličtině
The diploma thesis deals with the problem of semantic segmentation of automotive images using a deep neural networks. DeepLabV3+, the state-of-the-art model on Cityscapes dataset, was re-implemented using Keras and TensorFlow
frameworks. The model was pretrained on the ImageNet dataset and then using a
transfer learning was transformed to perform a semantic segmentation on the Cityscapes dataset. The performance of the model was verified on the validation
set of Cityscapes dataset, the model achieved the performance of 73.55% IoU.
In the end, the model was fine-tuned using the KPIT dataset to perform semantic segmentation of fish eye camera automotive images. A few experiments
were executed on the KPIT dataset. The best model achieved a performance
of 59.26% IoU on the validation set.
Deep neural networks, convolutional neural networks, DeepLab, semantic segmentation
Zásady pro vypracování
1. Seznamte se s state-of-the-art metodami sémantické segmentace.
2. Proveďte rešerši existujících obrázkových databází z oblasti automotive vhodné pro trénování hlubokých neuronových sítí a jednu zvolte pro účely trénování a testování.
3. Vyberte vhodnou metodu sémantické segmentace a proveďte její implementaci.
4. Natrénujte vybraný model sítě na zvolené databázi.
5. Porovnejte dosažené výsledky s ostatními existujícími přístupy.
Zásady pro vypracování
1. Seznamte se s state-of-the-art metodami sémantické segmentace.
2. Proveďte rešerši existujících obrázkových databází z oblasti automotive vhodné pro trénování hlubokých neuronových sítí a jednu zvolte pro účely trénování a testování.
3. Vyberte vhodnou metodu sémantické segmentace a proveďte její implementaci.
4. Natrénujte vybraný model sítě na zvolené databázi.
5. Porovnejte dosažené výsledky s ostatními existujícími přístupy.
Seznam doporučené literatury
Chen, L. C., Zhu, Y., Papandreou, G., Schroff, F., & Adam, H. (2018). Encoder-decoder with atrous separable convolution for semantic image segmentation. In Proceedings of the European conference on computer vision (ECCV) (pp. 801-818).
Chollet, Francois. Xception: Deep Learning with Depthwise Separable Convolutions. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (2017).
M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele, The Cityscapes Dataset for Semantic Urban Scene Understanding, in Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.
Seznam doporučené literatury
Chen, L. C., Zhu, Y., Papandreou, G., Schroff, F., & Adam, H. (2018). Encoder-decoder with atrous separable convolution for semantic image segmentation. In Proceedings of the European conference on computer vision (ECCV) (pp. 801-818).
Chollet, Francois. Xception: Deep Learning with Depthwise Separable Convolutions. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (2017).
M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele, The Cityscapes Dataset for Semantic Urban Scene Understanding, in Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.