Bakalářská práce v oboru Softwarové inženýrství.
1. Prostudujte metodu pro klasifikaci textu Naive Bayes, prostudujte zpusoby generovani n-gramu (sekvenci po sobe jdoucich slov) a itemsetu (mnozin soucasne se vyskytujicich slov) z textovych dokumentu.
2. Vhodnym zpusobem navrhnete rozsireni metody Naive Bayes o n-gramy a itemsety. Navzene reseni zduvodnete.
3. Na zaklade vaseho navrhu implementujte aplikaci ve vhodne zvolenem programovacim jazyce. Potrebnou pozornost venujte optimalizaci kodu.
4. Srovnejte jednotlive vliv itemsetu a n-gramu na uspesnost klasifikace, pokuste se vyuzit prednosti itemsetu a n-gramu spolecne k dosazeni co nejlepsich vysledku kalsifikace textu.
Podrobnosti: http://www.kiv.zcu.cz/research/groups/text/
Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)
Vypsáno pro akademický rok 2005/2006 dne: 2006-01-24
Zadáno komu: Štěpánek Petr (dokončeno: 2007-05-16)