Popis tématu

Bakalářská práce v oboru Softwarové inženýrství.

Analýza a statistiky WWW stránek

1. Prostudujte soucasne vlastnosti a moznosti systemu umoznujicich generovat statistiky z textovych dokumentu.

2. Vhodnym zpusobem zvolte zpusob ulozeni velkeho mnozstvi textovych dat, ktera budete dale zpracovavat a analyzovat. Svoji volbu zduvodnete.

3. Na zaklade poznatku z bodu 1 navrhnete a ve zvolenem jazyce implementujte vlastni system pro analyzu textovych dokumentu. Patricnou pozornost venujte optimalizaci vasi implementace. Jednotlive funkce musi podavat pokud mozno uplne informace o ulozenem textu. K dispozici musi byt take moznost potrebne informace z vaseho systemu vyexportovat tak, aby byly pripadne vyuzitelne v dalsich aplikacich.

4. Svuj system otestujte z hlediska pametovych a casovych naroku, popiste jeho pripadne nedostatky a navhrnete zpusob jejich reseni. Navrhnete moznosti dalsiho rozsireni vasi aplikace.

Podrobnosti: http://www.kiv.zcu.cz/research/groups/text/

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Vypsáno pro akademický rok 2005/2006 dne: 2006-01-24

Zadáno komu: Milan Balcar (dokončeno: 2007-05-16)

Aktualizováno 0