Témata projektů

Popis tématu

Diplomová práce v oboru Softwarové inženýrství.

Výběr atributů pro klasifikátory textových dokumentů

Seznamte se s různými metodami pro výběr atributů při klasifikaci textů, tj. optimální výběr těch slov (kolokací, n-gramů, itemsetů), které jsou pro kategorizaci dokumentů nejpřínosnější. Porovnejte různé způsoby, implementujte algoritmy výběru atributů a analyzujte dosažené výstupy – zejména vliv míry redukce dimenze prostoru atributů na úspěšnost klasifikace, z pohledu různých textových kolekcí i různých přístupů ke klasifikaci.

Téma vypsal: Prof. Ing. Karel Ježek, CSc. (UC 308)

Externí téma:
  • vedoucí: Ing.Jiří Hynek, PhD , jiri.hynek@insite.cz,
  • externí firma je vedoucím práce,

Vypsáno pro akademický rok 2006/2007 dne: 2006-05-10

Zadáno komu: (Nedokončené)