Témata projektů

Popis tématu

Diplomová práce v oboru Softwarové inženýrství.

Speciální i časem prověřené metody klasifikace textů

Seznamte se s různými přístupy ke klasifikaci textových dokumentů – pravidlové, lineární, líné (paměťové) metody. Implementujte některé jednodušší metody vždy jako představitele některého z možných přístupů ke klasifikaci (např. pravidla, rozhodovací stromy, naivní Bayes, kNN). Identifikujte silné a slabé stránky jednotlivých přístupů a na vzájemně porovnatelných experimentech ověřte vhodnost použití různých metod na různých textových kolekcích.

Téma vypsal: Prof. Ing. Karel Ježek, CSc. (UC 308)

Externí téma:
  • vedoucí: Ing.Jiří Hynek, PhD , jiri.hynek@insite.cz,
  • externí firma je vedoucím práce,

Vypsáno pro akademický rok 2006/2007 dne: 2006-05-10

Zadáno komu: (Nedokončené)