Bakalářská práce v oboru Softwarové inženýrství.
1. Seznamte se s vlastnostmi textových kolekcí.
2. Navrhněte XML formát pro textové kolekce.
3. Vytvořte program, který bude převádět kolekce mezi plain formátem, používaným v Text Mining Group, a navrženým XML formátem.
4. Implementujte jednoduchý algoritmus rozdělení textu na věty.
5. Implementujte uživatelské prostředí pro tvorbu a úpravu textových kolekcí. Funkce: přidávání, ubírání, prohlížení dokumentů, spojování anotovaných kolekcí, výpis statistik o kolekci.
Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)
Vypsáno pro akademický rok 2005/2006 dne: 2006-02-08
Zadáno komu: Martin Širajch (dokončeno: 2006-05-20)