Bakalářská práce v oboru Softwarové inženýrství.
1. Prostudujte soucasne aplikace schopne automaticky urcovat jazyk textovych dokumentu. Popiste jejich vlastnosti a pokud mozno popiste i jejich princip.
2. Vytvorte vhodnou datovou kolekci dokumentu v ruznych (predevsim evropskych) jazycich.
3. Zvolte nektere z vybranych aplikaci a srovnejte jejich uspesnost pri detekci jazyka na vami vytvorene datove kolekci.
4. Na zaklade vasich poznatku z predchozich bodu popiste problemy, ktere je potreba v teto oblasti prekonavat a ktere zapricinuji chybnou detekci jazyka. Zamyslete se nad problemy vznikajicimi v pripade dokumentu psanych ve vice jazycich. Pokuste se navrhnout vhodne reseni nalezenych problemu.
Podrobnosti: http://www.kiv.zcu.cz/research/groups/text/
Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)
Vypsáno pro akademický rok 2005/2006 dne: 2006-01-24
Zadáno komu: Jan Voříšek (dokončeno: 2007-05-16)