Diplomová práce v programu, specializaci Softwarové inženýrství.
Seznamte se s různými metodami pro výběr atributů při klasifikaci textů, tj. optimální výběr těch slov (kolokací, n-gramů, itemsetů), které jsou pro kategorizaci dokumentů nejpřínosnější. Porovnejte různé způsoby, implementujte algoritmy výběru atributů a analyzujte dosažené výstupy – zejména vliv míry redukce dimenze prostoru atributů na úspěšnost klasifikace, z pohledu různých textových kolekcí i různých přístupů ke klasifikaci.
Téma vypsal: Prof. Ing. Karel Ježek, CSc. (UC 308)
Externí téma:Vypsáno pro akademický rok 2006/2007 dne: 2006-05-10
Zadáno komu: (Nedokončené)