Hlavním cílem práce je vytvořit snadno ovladatený software v programovacím jazyce Java, pomocí kterého budou speciálně vyškolení pracovníci (tzv. transkribeři) přepisovat zvukové záznamy řeči do textové podoby. Program pracuje s rozsáhlými PCM daty ve formátu WAV. Umožňuje jejich segmentaci na kratší úseky, přehrání různou rychlostí a přiřazení textu. Dokumentace v první části seznamuje o podobných dostupných programech a o teoretickém principu realizace. Další část naznačuje postup při implementaci, předevšim způsob vykreslení zvukové vlny, přehrávání zvuku a exportování dat do XML souboru. V příloze dokumentace je obsažena stručná uživatelská příručka s popisem ovládání aplikace.
Anotace v angličtině
The main goal of this bachelor thesis is to implement the transcription software through which it would be easy to assign text to the selected part of an audio file in the WAV format. This process will not be automated but realised by people. Their work could be later used for training of automatic speech recognition systems. The application is written in Java programming language and uses Swing toolkit for its graphical user interface. The theoretical part of this text deals with competitive software accessible on the Internet, storage of sound in the computer and graphical visualization of sound. The second part of the thesis concerns the design and implementation of an application such as playing a sound in Java or saving data into the XML format.
Klíčová slova
transkripce,zvuková vlna,XML,Java,WAV,PCM
Klíčová slova v angličtině
transcription,audio waveform,XML,Java,WAV,PCM
Rozsah průvodní práce
42 s.
Jazyk
CZ
Anotace
Hlavním cílem práce je vytvořit snadno ovladatený software v programovacím jazyce Java, pomocí kterého budou speciálně vyškolení pracovníci (tzv. transkribeři) přepisovat zvukové záznamy řeči do textové podoby. Program pracuje s rozsáhlými PCM daty ve formátu WAV. Umožňuje jejich segmentaci na kratší úseky, přehrání různou rychlostí a přiřazení textu. Dokumentace v první části seznamuje o podobných dostupných programech a o teoretickém principu realizace. Další část naznačuje postup při implementaci, předevšim způsob vykreslení zvukové vlny, přehrávání zvuku a exportování dat do XML souboru. V příloze dokumentace je obsažena stručná uživatelská příručka s popisem ovládání aplikace.
Anotace v angličtině
The main goal of this bachelor thesis is to implement the transcription software through which it would be easy to assign text to the selected part of an audio file in the WAV format. This process will not be automated but realised by people. Their work could be later used for training of automatic speech recognition systems. The application is written in Java programming language and uses Swing toolkit for its graphical user interface. The theoretical part of this text deals with competitive software accessible on the Internet, storage of sound in the computer and graphical visualization of sound. The second part of the thesis concerns the design and implementation of an application such as playing a sound in Java or saving data into the XML format.
Klíčová slova
transkripce,zvuková vlna,XML,Java,WAV,PCM
Klíčová slova v angličtině
transcription,audio waveform,XML,Java,WAV,PCM
Zásady pro vypracování
Cílem projektu je vyvinout snadno ovladatelný software, pomocí kterého budou speciálně vyškolení pracovníci (tzv. transkribeři) přepisovat zvukové záznamy řeči do textové podoby. Program tedy bude pracovat s rozsáhlými PCM daty (ve formátu WAV), bude umožňovat "rozsekání" signálu na kratší úseky, přehrávání těchto úseků (různými rychlostmi) a přiřazení textu k těmto úsekům. Další vlastnosti a požadované schopnosti budou specifikovány během konzultací.
Seznamte se s open-source softwarem Transcriber 1.5.1, prostudujte pečlivě jeho funkce a vstupně-výstupní formáty, rámcově se seznamte také s dalšími dostupnými produkty tohoto typu.
Navrhněte a implementujte software podle výše uvedené specifikace podle standardů Open Source v Javě.
Vyvinutý software opatřete podrobnou dokumentací, včetně srozumitelné stručné uživatelské příručky.
Cílem projektu je vyvinout snadno ovladatelný software, pomocí kterého budou speciálně vyškolení pracovníci (tzv. transkribeři) přepisovat zvukové záznamy řeči do textové podoby. Program tedy bude pracovat s rozsáhlými PCM daty (ve formátu WAV), bude umožňovat "rozsekání" signálu na kratší úseky, přehrávání těchto úseků (různými rychlostmi) a přiřazení textu k těmto úsekům. Další vlastnosti a požadované schopnosti budou specifikovány během konzultací.
Seznamte se s open-source softwarem Transcriber 1.5.1, prostudujte pečlivě jeho funkce a vstupně-výstupní formáty, rámcově se seznamte také s dalšími dostupnými produkty tohoto typu.
Navrhněte a implementujte software podle výše uvedené specifikace podle standardů Open Source v Javě.
Vyvinutý software opatřete podrobnou dokumentací, včetně srozumitelné stručné uživatelské příručky.