Diplomová práce v programu, specializaci Ostatní / Nespecifikováno.
Klasifikace textu obecně je jednou ze základních úloh zpracování přirozeného jazyka (natural language processing - NLP). Úkolem automatické kategorizace dokumentů je přiřadit třídu danému dokumentu. Často je dokument označen, tak že patří do více tříd (např. zpráva ekonomická zahraniční nebo zpráva ze sportu: fotbal zahraniční apod.). Mluvíme pak o vícetřídní klasifikaci.
Úkolem bude prozkoumat moderní architektury a modely založených na umělých neuronových sítích a některé z nich využít pro vícetřídní klasifikaci (kategorizaci) dokumentů v českém, případně i jiném jazyce.
Bližší informace poskytne vedoucí práce na první schůzce.
Téma vypsal: Ing. Jiří Martínek, Ph.D. (UN 337)
Vypsáno pro akademický rok 2022/2023 dne: 2022-04-20
Zadáno komu: Václav Honzík (Rezervované)