Popis tématu

Diplomová práce v programu, specializaci Ostatní / Nespecifikováno.

Vícetřídní automatická kategorizace dokumentů

Klasifikace textu obecně je jednou ze základních úloh zpracování přirozeného jazyka (natural language processing - NLP). Úkolem automatické kategorizace dokumentů je přiřadit třídu danému dokumentu. Často je dokument označen, tak že patří do více tříd (např. zpráva ekonomická zahraniční nebo zpráva ze sportu: fotbal zahraniční apod.). Mluvíme pak o vícetřídní klasifikaci.

Úkolem bude prozkoumat moderní architektury a modely založených na umělých neuronových sítích a některé z nich využít pro vícetřídní klasifikaci (kategorizaci) dokumentů v českém, případně i jiném jazyce.


Bližší informace poskytne vedoucí práce na první schůzce.

Téma vypsal: Ing. Jiří Martínek, Ph.D. (UN 337)

Vypsáno pro akademický rok 2022/2023 dne: 2022-04-20

Zadáno komu: Václav Honzík (Rezervované)

Aktualizováno 0