Popis tématu

Bakalářská práce v oboru Informatika (Bc).

Využití duplicitních otázek na Stackoverflow pro učení reprezentace významu dotazů.

Cíle práce bude využít offline kopie Stackoverflow (https://archive.org/details/stackexchange) pro trénování modelů reprezentace významů dotazů. Pro řešení úlohy se bude využívat model Siamských sítí založený na rekurentních neuronových sítích. Implementace modelu v nástroji Tensorflow bude dodána vedoucím práce.

Případné úspěšné řešení bude publikováno na (méně významné) mezinárodní konferenci a bude dobrý základem pro další výzkumnou spolupráci s katedrou.

Předběžné body zadání:
1) Seznamte se se základními principy hlubokého učení, neuronových sítí a nástroje Tensorflow. Naprogramujte jednoduché úlohy v nástroji Tensorflow.
2) Seznamte se s formátem dat použitých v offline kopii Stackoverflow a extrahujte duplicitní otázky.
3) Prozkoumejte dodaný model Siamských sítí a nasaďte jej na data ze Stackoverflow.
4) Změřte úspěšnost a proveďte kritické zhodnocení dosažených výsledků.

Téma vypsal: Ing. Miloslav Konopík, Ph.D. (UN 334)

Vypsáno pro akademický rok 2019/2020 dne: 2019-04-05

Zadáno komu: Jan Pašek (Zadané)

Aktualizováno 0