Bakalářská práce v oboru Informatika (Bc).
Cílem práce je porovnat a vyhodnotit různé volně dostupné systémy pro strojový překlad z hlediska jejich vhodnosti pro úlohy vícejazyčného transfer learningu. Transfer learning je technika, která umožňuje využít znalosti získané při řešení jedné úlohy v jednom jazyce pro řešení jiné úlohy v jiném jazyce. Práce se zaměří na překlad mezi češtinou a angličtinou a na úlohu sumarizace dokumentů v českém jazyce s využitím anglického modelu pro sumarizaci. Práce bude obsahovat následující kroky:
* Rešerše existujících systémů pro strojový překlad založených na neuronových sítích.
* Výběr nejvhodnějších systémů pro experimentální část práce a jejich instalace a nastavení.
* Příprava dat pro testování kvality překladu a sumarizace (výběr vhodných korpusů překladů a sumarizací apod.).
* Provedení experimentů s různými kombinacemi systémů pro strojový překlad a modelů pro sumarizaci a vyhodnocení jejich výsledků pomocí automatických metrik.
* Analýza zjištěných silných a slabých stránek jednotlivých systémů a modelů a formulace doporučení pro jejich další využití nebo vylepšení.
Téma vypsal: Ing. Miloslav Konopík, Ph.D. (UN 334)
Vypsáno pro akademický rok 2023/2024 dne: 2023-04-13
Toto téma je zatím volné. Pokud o téma máte vážný zájem, vyplňte prosím následující formulář, kterým si téma zamluvíte (všechny položky jsou povinné).