Tato práce popisuje možné techniky modelování vícehlasé hudby použitím kombinace rekurentních neuronových sítí a Omezených boltzmanových strojů. Tato kombinace umožnila rozpoznat temporální závislosti v mnohodimenzionálních sekvencích včetně harmonie.
První kapitola popisuje úlohu generování hudby v širších souvislostech, definuje základní pojmy a reprezentace dat. Další kapitoly představují pravděpodobnostní modely používané pro generování hudby v plné obecnosti. Předposlední kapitola se zabývá trénováním popsaných modelů pomocí gradientních metod v kombinaci s kontrastivní divergencí a zpětnou propagací v čase. Poslední část práce řeší implementaci a ohodnocení LSTM-RBM modelu.
Anotace v angličtině
This thesis focuses on the possible techniques of modelling polyphony music using the combination of Recurrent Neural Network and Restricted Boltzmann Machine. Such a combination allows to distinguish the temporal dependencies in high-dimensional sequences along with high-level harmony learning.
The first chapter describes the task of music generation in a wider context and defines basic data representations. The following two chapters intruduce probabilistic models used for Polyphonic Music Generation in a general context. The second to last chapter deals with training the described models using gradient methods in the combination of Contrastive Divergence and Backpropagation Through Time. The last chapter of the thesis resolves the implementation and evaluation of the LSTM-RBM model.
Tato práce popisuje možné techniky modelování vícehlasé hudby použitím kombinace rekurentních neuronových sítí a Omezených boltzmanových strojů. Tato kombinace umožnila rozpoznat temporální závislosti v mnohodimenzionálních sekvencích včetně harmonie.
První kapitola popisuje úlohu generování hudby v širších souvislostech, definuje základní pojmy a reprezentace dat. Další kapitoly představují pravděpodobnostní modely používané pro generování hudby v plné obecnosti. Předposlední kapitola se zabývá trénováním popsaných modelů pomocí gradientních metod v kombinaci s kontrastivní divergencí a zpětnou propagací v čase. Poslední část práce řeší implementaci a ohodnocení LSTM-RBM modelu.
Anotace v angličtině
This thesis focuses on the possible techniques of modelling polyphony music using the combination of Recurrent Neural Network and Restricted Boltzmann Machine. Such a combination allows to distinguish the temporal dependencies in high-dimensional sequences along with high-level harmony learning.
The first chapter describes the task of music generation in a wider context and defines basic data representations. The following two chapters intruduce probabilistic models used for Polyphonic Music Generation in a general context. The second to last chapter deals with training the described models using gradient methods in the combination of Contrastive Divergence and Backpropagation Through Time. The last chapter of the thesis resolves the implementation and evaluation of the LSTM-RBM model.