Popis tématu

Bakalářská práce v oboru Informatika (Bc).

Vícejazyčný transfer learning pro úlohu sumarizace v češtině

Cílem práce je porovnat a vyhodnotit různé volně dostupné systémy pro strojový překlad z hlediska jejich vhodnosti pro úlohy vícejazyčného transfer learningu. Transfer learning je technika, která umožňuje využít znalosti získané při řešení jedné úlohy v jednom jazyce pro řešení jiné úlohy v jiném jazyce. Práce se zaměří na překlad mezi češtinou a angličtinou a na úlohu sumarizace dokumentů v českém jazyce s využitím anglického modelu pro sumarizaci. Práce bude obsahovat následující kroky:

* Rešerše existujících systémů pro strojový překlad založených na neuronových sítích.
* Výběr nejvhodnějších systémů pro experimentální část práce a jejich instalace a nastavení.
* Příprava dat pro testování kvality překladu a sumarizace (výběr vhodných korpusů překladů a sumarizací apod.).
* Provedení experimentů s různými kombinacemi systémů pro strojový překlad a modelů pro sumarizaci a vyhodnocení jejich výsledků pomocí automatických metrik.
* Analýza zjištěných silných a slabých stránek jednotlivých systémů a modelů a formulace doporučení pro jejich další využití nebo vylepšení.

Téma vypsal: Ing. Miloslav Konopík, Ph.D. (UN 334)

Vypsáno pro akademický rok 2023/2024 dne: 2023-04-13

Zadáno komu: Václav Tran (Rezervované)

Aktualizováno 0