Popis tématu

Bakalářská práce v oboru Softwarové inženýrství.

Zmapovani situace v oblasti rozpoznavani jazyka textovych dokumentu

1. Prostudujte soucasne aplikace schopne automaticky urcovat jazyk textovych dokumentu. Popiste jejich vlastnosti a pokud mozno popiste i jejich princip.

2. Vytvorte vhodnou datovou kolekci dokumentu v ruznych (predevsim evropskych) jazycich.

3. Zvolte nektere z vybranych aplikaci a srovnejte jejich uspesnost pri detekci jazyka na vami vytvorene datove kolekci.

4. Na zaklade vasich poznatku z predchozich bodu popiste problemy, ktere je potreba v teto oblasti prekonavat a ktere zapricinuji chybnou detekci jazyka. Zamyslete se nad problemy vznikajicimi v pripade dokumentu psanych ve vice jazycich. Pokuste se navrhnout vhodne reseni nalezenych problemu.

Podrobnosti: http://www.kiv.zcu.cz/research/groups/text/

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Vypsáno pro akademický rok 2005/2006 dne: 2006-01-24

Zadáno komu: Jan Voříšek (dokončeno: 2007-05-16)

Aktualizováno 0