Popis tématu

Bakalářská práce v oboru Softwarové inženýrství.

Úprava textových kolekcí

1. Seznamte se s vlastnostmi textových kolekcí.
2. Navrhněte XML formát pro textové kolekce.
3. Vytvořte program, který bude převádět kolekce mezi plain formátem, používaným v Text Mining Group, a navrženým XML formátem.
4. Implementujte jednoduchý algoritmus rozdělení textu na věty.
5. Implementujte uživatelské prostředí pro tvorbu a úpravu textových kolekcí. Funkce: přidávání, ubírání, prohlížení dokumentů, spojování anotovaných kolekcí, výpis statistik o kolekci.

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Vypsáno pro akademický rok 2005/2006 dne: 2006-02-08

Zadáno komu: Martin Širajch (dokončeno: 2006-05-20)

Aktualizováno 0