Ve své práci jsem se snažila přiblížit význam digitalizace v současnosti, rozebrat principy převodu textu z papírové verze do digitální, a představila faktory, které ovlivňují kvalitu OCR převodu. Součástí práce je prakticka ukázka převedení papírové knihy do digitálního formátu v komerčním softwaru FineReader Abbyy 11, který je doplněn videonávody na přiloženém DVD. Zmíním výhody i nevýhody programu, možnosti převodu do jednotlivých typů souboru od editovatelných (docx, rtf) po needitovatelné (pdf, djvu, epub ad.), schopnost se programu "učit se" vytvořit si vlastní uživatelské vzory pro rozpoznání textu. Výsledkem by měl být vlastní digitální text.
Anotace v angličtině
In my work I tried to approach the importance of digitalisation currently disassembled principles of converting text from paper to digital versions, and presented the factors that affect the quality of OCR conversion. The work includes practical demonstrations convert paper books into digital format in commercial software Abbyy FineReader 11, which is accompanied by video on the DVD. I will describe the advantages and disadvantages of the program, the possibility of transferring into different types of editable file (docx, rtf) after non-editable (pdf, djvu, epub d.) The ability of the program to "learn" - create your own custom patterns for text recognition. The result should be their own digital text.
digitizing text, OCR software, Abbyy FineReader 11, manual, optical character recognition, libraries for the blind
Rozsah průvodní práce
31 s.
Jazyk
CZ
Anotace
Ve své práci jsem se snažila přiblížit význam digitalizace v současnosti, rozebrat principy převodu textu z papírové verze do digitální, a představila faktory, které ovlivňují kvalitu OCR převodu. Součástí práce je prakticka ukázka převedení papírové knihy do digitálního formátu v komerčním softwaru FineReader Abbyy 11, který je doplněn videonávody na přiloženém DVD. Zmíním výhody i nevýhody programu, možnosti převodu do jednotlivých typů souboru od editovatelných (docx, rtf) po needitovatelné (pdf, djvu, epub ad.), schopnost se programu "učit se" vytvořit si vlastní uživatelské vzory pro rozpoznání textu. Výsledkem by měl být vlastní digitální text.
Anotace v angličtině
In my work I tried to approach the importance of digitalisation currently disassembled principles of converting text from paper to digital versions, and presented the factors that affect the quality of OCR conversion. The work includes practical demonstrations convert paper books into digital format in commercial software Abbyy FineReader 11, which is accompanied by video on the DVD. I will describe the advantages and disadvantages of the program, the possibility of transferring into different types of editable file (docx, rtf) after non-editable (pdf, djvu, epub d.) The ability of the program to "learn" - create your own custom patterns for text recognition. The result should be their own digital text.
digitizing text, OCR software, Abbyy FineReader 11, manual, optical character recognition, libraries for the blind
Zásady pro vypracování
1. Odůvodněte význam digitalizace v současnosti.
2. Rozeberte obecné principy převodu textu z tištěné do digitální podoby.
3. Představte faktory podílející se na kvalitě OCR převodu.
4. Popište postup digitalizace textu v programu FineReader Abbyy 11.
5. Vytvořte videonávody k popsanému postupu, které budou umístěné na přiloženém DVD.
Zásady pro vypracování
1. Odůvodněte význam digitalizace v současnosti.
2. Rozeberte obecné principy převodu textu z tištěné do digitální podoby.
3. Představte faktory podílející se na kvalitě OCR převodu.
4. Popište postup digitalizace textu v programu FineReader Abbyy 11.
5. Vytvořte videonávody k popsanému postupu, které budou umístěné na přiloženém DVD.
Seznam doporučené literatury
SOBOTKA, Zdeněk a Martin SOBOTKA. Základy číslicového zpracování
obrazu. Praha: Dům techniky ČSVTS, 1990. ISBN 80-02-00736-0.
SOBOTKA, Zdeněk a Martin SOBOTKA. Počítačová analýza
a rozpoznávání obrazu. Praha: Dům techniky ČSVTS, 1990.
ISBN 80-02-00739-5.
ABBYY FineReader: User's Guide for ABBYY FineReader 11:
uživatelská příručka k aplikaci FineReader 11. 1. vyd.
ABBYY software: 2011. 110 s. Dostupné z http:
//www.abbyy.com/fr11guide_cz.pdf
Seznam doporučené literatury
SOBOTKA, Zdeněk a Martin SOBOTKA. Základy číslicového zpracování
obrazu. Praha: Dům techniky ČSVTS, 1990. ISBN 80-02-00736-0.
SOBOTKA, Zdeněk a Martin SOBOTKA. Počítačová analýza
a rozpoznávání obrazu. Praha: Dům techniky ČSVTS, 1990.
ISBN 80-02-00739-5.
ABBYY FineReader: User's Guide for ABBYY FineReader 11:
uživatelská příručka k aplikaci FineReader 11. 1. vyd.
ABBYY software: 2011. 110 s. Dostupné z http:
//www.abbyy.com/fr11guide_cz.pdf