Diplomová práce v oboru Ostatní / Nespecifikováno.
Cílem této práce je vytvoření automatického shlukování textových dokumentů (tištěné či ručně psané), které jsou dostupné pouze ve skenovaném (obrazovém) formátu. Výsledkem by měla být funkční metoda, která bude rozdělovat dokumenty do různých skupin. Každá skupina by měla ideálně obsahovat dokumenty, které spolu souvisejí: vypadají podobně a reprezentují stejnou třídu: např. ručně psané poznámky, faktury, emaily, formuláře, atd..
Diplomantův úkol bude v první řadě prozkoumat dostupné metody využitelné pro shlukování obrazových dokumentů (případně obrázků obecně) a další metody s učením bez učitele (tzv. unsupervised). Následně dle dohody s vedoucím práce implementuje některé metody s cílem maximalizovat úspěšnost na zvolené datové sadě. Očekává se rovněž i kritická analýza použitelnosti.
Téma vypsal: Ing. Jiří Martínek, Ph.D. (UN 337)
Vypsáno pro akademický rok 2023/2024 dne: 2023-04-26
Toto téma je zatím volné. Pokud o téma máte vážný zájem, vyplňte prosím následující formulář, kterým si téma zamluvíte (všechny položky jsou povinné).