Popis tématu

Diplomová práce v oborech Softwarové inženýrství, Inteligentní počítačové systémy, Informační systémy.

Sofistikované supervizované a nesupervizované metody strojového učení pro extrakci sentimentu

1. Proveďte základní teoretický rozbor zpracování textu a jeho přípravu pro extrakci příznaků a rozeberte použití n-gramů pro pozdější použití při strojové klasifikaci dokumentů.
2. Prostudujte modely Bag of Words, TF-IDF a word2vec, Deep Learning and Convolutional Neural Network s důrazem na moderní postupy s word2vec.
3. Prostudujte použití algoritmů strojového učení GloVe, fastText, případně dalších spolu s využitím volně dostupných předtrénovaných word2vec datasetů.
4. Seznamte se s moderními knihovnami strojového učení pro zpracování přirozeného jazyka.
5. Navrhněte a implementujte extrakci sentimentu využívající supervisované a nesupervizované metody z vybraných knihoven z bodu 4.
6. Proveďte rozbor jednotlivých přístupů a postupů a porovnejte výsledky klasifikace dokumentů pomocí různých metod.

Podrobnosti: https://docs.google.com/document/d/1Ub0HiErsrdDpJ1igJhowcfRvNFghN2Qyf7mk7t6TLJA/edit?usp=sharing

Téma vypsal: Doc. Ing. Roman Mouček, Ph.D. (UN 325)

Vypsáno pro akademický rok 2018/2019 dne: 2018-03-22

Zadáno komu: (Smazané)

Aktualizováno 0