V posledních letech se rozšířilo používání automatických sledovacích zařízení nazývaných fotopasti. Tyto zařízení slouží ke sběru informací potřebných ke sledování různých ekosystémů. Se získáním velkého množství dat dochází k časovému zatížení výzkumníků a k potřebě nových způsobů jak tyto data zpracovávat. V této diplomové práci se budeme zabývat použitím umělé inteligence a počítačového vidění jako nástroje k efektivnímu zpracování obrazů z fotopastí. V rámci této práce jsme se zúčastnili soutěže, z které bude k dispozici dataset obrazů zvířat vyskytujících se v národním parku ve střední Africe. V této práci využijeme modelů konvolučních neuronových sítí a Vision tranformeru pro získání klasifikovaných obrazů. Nejlepší výsledky byly dosaženy použitím ensemblu Vision tranformer modelů a dalších metod zpracování obrazu.
Anotace v angličtině
In recent years, the use of automatic surveillance devices called camera traps has become widespread. These devices are used to collect information needed to monitor different ecosystems. With the acquisition of a large amount of data, there is a time burden on researchers and the need for new ways to process this data. This diploma thesis is dealing with the use of artificial intelligence and computer vision as a tool for effective processing of images from camera traps. In this thesis, we participate in the competition, from which an image dataset of animals occurring in a national park in Central Africa is available. To obtain classified images, we use convolutional neural network models and the Vision Transformer. The best results are achieved using an ensemble of Vision Transformer models and other image processing methods.
classification, computer vision, camera traps, convolutional neural network, Vision Transformer
Rozsah průvodní práce
42 s.
Jazyk
AN
Anotace
V posledních letech se rozšířilo používání automatických sledovacích zařízení nazývaných fotopasti. Tyto zařízení slouží ke sběru informací potřebných ke sledování různých ekosystémů. Se získáním velkého množství dat dochází k časovému zatížení výzkumníků a k potřebě nových způsobů jak tyto data zpracovávat. V této diplomové práci se budeme zabývat použitím umělé inteligence a počítačového vidění jako nástroje k efektivnímu zpracování obrazů z fotopastí. V rámci této práce jsme se zúčastnili soutěže, z které bude k dispozici dataset obrazů zvířat vyskytujících se v národním parku ve střední Africe. V této práci využijeme modelů konvolučních neuronových sítí a Vision tranformeru pro získání klasifikovaných obrazů. Nejlepší výsledky byly dosaženy použitím ensemblu Vision tranformer modelů a dalších metod zpracování obrazu.
Anotace v angličtině
In recent years, the use of automatic surveillance devices called camera traps has become widespread. These devices are used to collect information needed to monitor different ecosystems. With the acquisition of a large amount of data, there is a time burden on researchers and the need for new ways to process this data. This diploma thesis is dealing with the use of artificial intelligence and computer vision as a tool for effective processing of images from camera traps. In this thesis, we participate in the competition, from which an image dataset of animals occurring in a national park in Central Africa is available. To obtain classified images, we use convolutional neural network models and the Vision Transformer. The best results are achieved using an ensemble of Vision Transformer models and other image processing methods.
Zvolený algoritmus otestujte na vhodném benchmarkovém datasetu.
Zhodnoťte dosažené výsledky.
Seznam doporučené literatury
[1] He, Kaiming, et al. Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. p. 770-778.
Zbytek doporučené literatury bude dodán vedoucím DP.
Seznam doporučené literatury
[1] He, Kaiming, et al. Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2016. p. 770-778.
Zbytek doporučené literatury bude dodán vedoucím DP.
Přílohy volně vložené
-
Přílohy vázané v práci
grafy, tabulky
Převzato z knihovny
Ano
Plný text práce
Hodnocení z obhajoby práce
Velmi dobře
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Cíl práce,
Postup,
Soutěž - klasifikace z fotopastí
Ukázka dat, rozbor dat, rozdělení dat,
Augmentace,
Modely,
Metody pro zlepšení klasifikace,
Výsledky,
Jak byly obrázky normalizovány? Jaké jsou standardní metody normalizace obrázků pro neuronové sítě?
Proč jsou data z fotopastí tzv. single-label? Neměly by od principu být multi-label? Vysvětlete rozdíl mezi těmito variantami a popište, jak se musí modifikovat architektura sítě, aby bylo možné řešit multi-label klasifikaci?
Lze použít ztrátovou funkci kategorické křížové entropie pro úlohu multi-label klasifikace?