Diplomová práce v programu, specializaci Softwarové inženýrství.
Seznamte se s různými přístupy ke klasifikaci textových dokumentů – pravidlové, lineární, líné (paměťové) metody. Implementujte některé jednodušší metody vždy jako představitele některého z možných přístupů ke klasifikaci (např. pravidla, rozhodovací stromy, naivní Bayes, kNN). Identifikujte silné a slabé stránky jednotlivých přístupů a na vzájemně porovnatelných experimentech ověřte vhodnost použití různých metod na různých textových kolekcích.
Téma vypsal: Prof. Ing. Karel Ježek, CSc. (UC 308)
Externí téma:Vypsáno pro akademický rok 2006/2007 dne: 2006-05-10
Zadáno komu: (Nedokončené)