Popis tématu

Diplomová práce v oboru Inteligentní počítačové systémy.

Rozpoznání textu v rastrovém obrazu

Implementujte multiplatformní knihovnu, která rastrový obraz získaný vyfotografováním ručně napsaného textu převede na textovou reprezentaci (textový soubor). Berte v úvahu psací i tiskací písmena i text, který není psaný latinkou (t.j. např. hebrejsky nebo v kombinaci kanji, katakany a hiragany). Vytvořená knihovna musí být použitelná bez trénování uživatelem, nicméně je možné použít data třetích stran. V tom případě se snažte vyhnout licencím, jako je např. GPL, které znemožňují použití v proprietárních aplikacích.

Knihovna musí splňovat tyto požadavky:
- implementace v C++;
- dostupná pro Windows, Linux a Android v podobě hlavičkových souborů a staticky i dynamicky linkovaných knihoven;
- API alespoň přibližně kompatibilní s některou z existujících knihoven pro OCR. Vhodná je např. knihovna Tesseract, která je dostupná pro výše zmíněné platformy;
- výstupem bude rozpoznaný text v kódu UTF-8 nebo UNICODE.

Součástí řešení bude porovnání výsledků ze stejných vstupních dat s alespoň jednou z volně dostupných knihoven nebo programů pro OCR. Zároveň by řešení mělo obsahovat libovolný program demonstrující použitelnost. Jako demonstrační program může být použit i již existující software nebo jeho úprava.

Téma vypsal: Prof. Ing. Václav Matoušek, CSc. (UC 309)

Externí téma:
  • Firma (kontaktní osoba) je vedoucím práce,
  • Kontaktní osoba: Pavel Studený,
  • Firma: Skype,

Vypsáno pro akademický rok 2014/2015 dne: 2013-05-07

Zadáno komu: (Nedokončené)

Aktualizováno 0