Popis tématu

Ostatní v oboru Informatika (Bc).

Stahování WWW stránek založené na pravidlech

Náplní práce je návrh a implementace programu, který podle popsaných pravidel umožní automatické stahování dokumentů z webu. Cílem práce je automatizované získání rozsáhlých kolekcí textových dat z webu.

Preferovaný jazyk C++, Java. Práce musí být využitelná jako knihovna i samostatný program.

Bližší informace mtoman@kiv.zcu.cz

Podrobnosti: http://www.kiv.zcu.cz/research/groups/text/

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Vypsáno pro akademický rok 2004/2005 dne: 2005-04-04

Zadáno komu: Trégl Jan (Dokončené)

Aktualizováno 0