Popis tématu

Ostatní v oboru Informatika (Bc).

Rozpoznání tématu WWW stránek pomocí metod ST a NB

Na KIV je v souvislosti s doktorandským studiem vyvíjen systém pro automatickou filtraci WWW stránek na základě analýzy jejich textového obsahu.

Celý systém je vytvářen v jazyce Java a je složen z modulů realizujících různé akce. Jedním z modulů, který je potřeba vytvořit a otestovat, je klasifikátor WWW stránek, který by měl fungovat na základě kombinace klasifikační metody Naive Bayes a algoritmu Sufix Tree (upřesní zadavatel). Práci je nutné realizovat tak, aby mohla být použita jako modul i jako samostatný program a je k ní určitě potřeba vytvořit alespoň jednoduché grafické rozhraní. Klasifikační metoda Naive Bayes ani algoritmus Sufix Tree nejsou složité.

Práce je určena pro 1 nebo 2 studenty, kteří jsou schopni nastudovat potřebné materiály, dotáhnout práci do fungující podoby a kteří dokáží pružně reagovat na vzniklé podněty. Požadována je průběžná spolupráce se zadavatelem.

Podrobnosti: http://www.kiv.zcu.cz/research/groups/text/

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Vypsáno pro akademický rok 2005/2006 dne: 2005-03-22

Zadáno komu: Štěpánek Petr (dokončeno: 2006-01-05)

Aktualizováno 0