Popis tématu

Bakalářská práce v oboru Softwarové inženýrství.

Rozsireni klasifikacni metody Naive Bayes pomoci n-gramu a itemsetu

1. Prostudujte metodu pro klasifikaci textu Naive Bayes, prostudujte zpusoby generovani n-gramu (sekvenci po sobe jdoucich slov) a itemsetu (mnozin soucasne se vyskytujicich slov) z textovych dokumentu.

2. Vhodnym zpusobem navrhnete rozsireni metody Naive Bayes o n-gramy a itemsety. Navzene reseni zduvodnete.

3. Na zaklade vaseho navrhu implementujte aplikaci ve vhodne zvolenem programovacim jazyce. Potrebnou pozornost venujte optimalizaci kodu.

4. Srovnejte jednotlive vliv itemsetu a n-gramu na uspesnost klasifikace, pokuste se vyuzit prednosti itemsetu a n-gramu spolecne k dosazeni co nejlepsich vysledku kalsifikace textu.

Podrobnosti: http://www.kiv.zcu.cz/research/groups/text/

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Vypsáno pro akademický rok 2005/2006 dne: 2006-01-24

Zadáno komu: Štěpánek Petr (dokončeno: 2007-05-16)

Aktualizováno 0