Diplomová práce v programu, specializaci Inteligentní počítačové systémy.
Implementujte multiplatformní knihovnu, která rastrový obraz získaný vyfotografováním ručně napsaného textu převede na textovou reprezentaci (textový soubor). Berte v úvahu psací i tiskací písmena i text, který není psaný latinkou (t.j. např. hebrejsky nebo v kombinaci kanji, katakany a hiragany). Vytvořená knihovna musí být použitelná bez trénování uživatelem, nicméně je možné použít data třetích stran. V tom případě se snažte vyhnout licencím, jako je např. GPL, které znemožňují použití v proprietárních aplikacích.
Knihovna musí splňovat tyto požadavky:
- implementace v C++;
- dostupná pro Windows, Linux a Android v podobě hlavičkových souborů a staticky i dynamicky linkovaných knihoven;
- API alespoň přibližně kompatibilní s některou z existujících knihoven pro OCR. Vhodná je např. knihovna Tesseract, která je dostupná pro výše zmíněné platformy;
- výstupem bude rozpoznaný text v kódu UTF-8 nebo UNICODE.
Součástí řešení bude porovnání výsledků ze stejných vstupních dat s alespoň jednou z volně dostupných knihoven nebo programů pro OCR. Zároveň by řešení mělo obsahovat libovolný program demonstrující použitelnost. Jako demonstrační program může být použit i již existující software nebo jeho úprava.
Téma vypsal: Prof. Ing. Václav Matoušek, CSc. (UC 309)
Externí téma:Vypsáno pro akademický rok 2014/2015 dne: 2013-05-07
Zadáno komu: (Nedokončené)