Neuronové sítě jsou dnes dominantním nástrojem pro mnoho úloh v oblasti strojového učení a umělé inteligence. Avšak pro dosažení vysoké přesnosti řešení dané úlohy je potřeba velké množství anotovaných dat pro trénování sítě, což může být časově náročné a drahé. Tato bakalářská práce se zaměřuje na využití lidské interakce při trénování neuronových sítí (tzv. human-in-the-loop přístup) s cílem umožnit neuronové síti se učit nové věci v reálném čase a rychle a flexibilně reagovat na nové situace. Výsledná metoda umožňuje adaptivní dotrénování libovolných vzorků a tříd v reálném čase na neuronové síti pro klasifikaci záměru. Tento proces je uskutečněn prostřednictvím interaktivního hlasového dialogu a Sentence Transformeru. Síť pro klasifikaci záměru byla vytvořena pomocí transfer learningu pro efektivnější trénování a zlepšení schopnosti generalizace. Celý systém je navržen tak, aby byl snadno použitelný a mohl být nasazen na zařízení s omezenými výpočetními zdroji, jako je Raspberry Pi.
Anotace v angličtině
Neural networks have become a dominant tool for many tasks in the field of machine learning and artificial intelligence. However, achieving high accuracy in solving a given task requires a large amount of annotated data for network training, which can be time-consuming and expensive. This bachelor's thesis focuses on utilizing human interaction in the training of neural networks (the human-in-the-loop approach) to enable the network to learn new things in real-time and to quickly and flexibly respond to new situations. The resulting method allows for real-time fine-tuning of samples and classes using a voice dialogue and Sentence Transformer on a neural network for intent classification. The intent classification network was created using transfer learning for more efficient training and improved generalization ability. The system is designed to be easily deployable and can be deployed on devices with limited computing resources, such as Raspberry Pi.
Klíčová slova
dopředná neuronová síť, Human-in-the-loop, Sentence-Transformer, Transfer learning, Fine-tuning, klasifikace záměru, Raspberry Pi
Klíčová slova v angličtině
Feedforward neural network, Human-in-the-loop, Sentence-Transformer, Transfer learning, Fine-tuning, Intent classification, Raspberry Pi
Rozsah průvodní práce
71
Jazyk
CZ
Anotace
Neuronové sítě jsou dnes dominantním nástrojem pro mnoho úloh v oblasti strojového učení a umělé inteligence. Avšak pro dosažení vysoké přesnosti řešení dané úlohy je potřeba velké množství anotovaných dat pro trénování sítě, což může být časově náročné a drahé. Tato bakalářská práce se zaměřuje na využití lidské interakce při trénování neuronových sítí (tzv. human-in-the-loop přístup) s cílem umožnit neuronové síti se učit nové věci v reálném čase a rychle a flexibilně reagovat na nové situace. Výsledná metoda umožňuje adaptivní dotrénování libovolných vzorků a tříd v reálném čase na neuronové síti pro klasifikaci záměru. Tento proces je uskutečněn prostřednictvím interaktivního hlasového dialogu a Sentence Transformeru. Síť pro klasifikaci záměru byla vytvořena pomocí transfer learningu pro efektivnější trénování a zlepšení schopnosti generalizace. Celý systém je navržen tak, aby byl snadno použitelný a mohl být nasazen na zařízení s omezenými výpočetními zdroji, jako je Raspberry Pi.
Anotace v angličtině
Neural networks have become a dominant tool for many tasks in the field of machine learning and artificial intelligence. However, achieving high accuracy in solving a given task requires a large amount of annotated data for network training, which can be time-consuming and expensive. This bachelor's thesis focuses on utilizing human interaction in the training of neural networks (the human-in-the-loop approach) to enable the network to learn new things in real-time and to quickly and flexibly respond to new situations. The resulting method allows for real-time fine-tuning of samples and classes using a voice dialogue and Sentence Transformer on a neural network for intent classification. The intent classification network was created using transfer learning for more efficient training and improved generalization ability. The system is designed to be easily deployable and can be deployed on devices with limited computing resources, such as Raspberry Pi.
Klíčová slova
dopředná neuronová síť, Human-in-the-loop, Sentence-Transformer, Transfer learning, Fine-tuning, klasifikace záměru, Raspberry Pi
Klíčová slova v angličtině
Feedforward neural network, Human-in-the-loop, Sentence-Transformer, Transfer learning, Fine-tuning, Intent classification, Raspberry Pi
Zásady pro vypracování
Nastudujte problematiku klasifikace neuronovými sítěmi - seznamte se s nejpoužívanějšími typy sítí a naučte se pracovat s knihovnami Keras a PyTorch.
Seznamte se s katedrální platformou Speechcloud a naučte se používat služby pro rozpoznávání a syntézu řeči.
Navrhněte neuronovu síť pro klasifikaci záměru ("intentu") ze vstupní promluvy.
U vybraných kategorií (záměrů) navrhněte řešení pro vygenerování odpovědi.
Prozkoumejte možnosti automatického přetrénování klasifikátoru na nových datech.
Vyvinutou metodu včetně hlasové interakce aplikujte na reálnou robotickou entitu.
Zásady pro vypracování
Nastudujte problematiku klasifikace neuronovými sítěmi - seznamte se s nejpoužívanějšími typy sítí a naučte se pracovat s knihovnami Keras a PyTorch.
Seznamte se s katedrální platformou Speechcloud a naučte se používat služby pro rozpoznávání a syntézu řeči.
Navrhněte neuronovu síť pro klasifikaci záměru ("intentu") ze vstupní promluvy.
U vybraných kategorií (záměrů) navrhněte řešení pro vygenerování odpovědi.
Prozkoumejte možnosti automatického přetrénování klasifikátoru na nových datech.
Vyvinutou metodu včetně hlasové interakce aplikujte na reálnou robotickou entitu.
Seznam doporučené literatury
Bishop, C. (1995). Neural networks for pattern recognition. Oxford University Press, USA.
Chen, Q., Zhuo, Z., & Wang, W. (2019). BERT for Joint Intent Classification and Slot Filling. CoRR, abs/1902.10909. http://arxiv.org/abs/1902.10909
Gennaro, G. D., Buonanno, A., Girolamo, A. D., Ospedale, A., & Palmieri, F. A. N. (2020). Intent Classification in Question-Answering Using LSTM Architectures. CoRR, abs/2001.09330. https://arxiv.org/abs/2001.09330
Seznam doporučené literatury
Bishop, C. (1995). Neural networks for pattern recognition. Oxford University Press, USA.
Chen, Q., Zhuo, Z., & Wang, W. (2019). BERT for Joint Intent Classification and Slot Filling. CoRR, abs/1902.10909. http://arxiv.org/abs/1902.10909
Gennaro, G. D., Buonanno, A., Girolamo, A. D., Ospedale, A., & Palmieri, F. A. N. (2020). Intent Classification in Question-Answering Using LSTM Architectures. CoRR, abs/2001.09330. https://arxiv.org/abs/2001.09330
Přílohy volně vložené
-
Přílohy vázané v práci
ilustrace, grafy, schémata, tabulky
Převzato z knihovny
Ano
Plný text práce
Hodnocení z obhajoby práce
Výborně
Přílohy
Posudek(y) oponenta
Hodnocení vedoucího
Záznam průběhu obhajoby
Motivace,
Human in the loop,
Zpětnovazební hlasové učení,
Použité technologie, SpeechCloud,
Experimentální testování, Výsledky,
Jakým způsobem je v práci implementováno přidání nové klasifikační třídy?
Jaké výhody nabízí human-in-the-loop přístup oproti klasickému offline tréninku sítí? Jaké jsou jeho limity?
Jakým způsobem Sentence Transformer agreguje vektorovou reprezentaci od každého tokenu?
Za jakých okolností obecně nelze dosáhnout 100% přesnosti klasifikace?