Popis tématu

Diplomová práce v oboru Ostatní / Nespecifikováno.

Porozumění textu - hledání koreferencí

Textová koreference je běžně chápána jako užití různých jazykových prostředků (zájmen, synonym, zobecňujících substantiv aj.), které odkazují na jiné větné celky. Prostředky textové koreference jsou svou povahou vágní a určení koreferovaného členu pouze na základě kontextu je problematické, proto se v naší práci soustředíme prozatím jen na zájmena - více zde: https://ufal.mff.cuni.cz/pdt2.0/doc/manuals/cz/t-layer/html/ch08s03.html

Např. Martin je nejlepším hráčem WoW. Přesto jsem _ho_ porazil.

V tomto příkladu je koreference zájmeno ho. Cílem metody je poznat, že toto zájmeno odkazuje na podstatné jméno Martin.

Současné metody zpracování přirozeného jazyka (textových dat) často zpracovávají text po větách. Pokud se ve větě vyskytne koreference, je do značné míry komplikované odvodit správný význam věty. Hledání a nahrazování koreferencí tento problém eliminuje.

Vaším úkolem bude vyzkoušet existující metody na česká data. Dále dle doporučení vedoucího vybranou metodu (metody) vylepšit.

Téma vypsal: Ing. Ondřej Pražák (UN 335)

Vypsáno pro akademický rok 2022/2023 dne: 2021-04-09

Rezervace tématu

Toto téma je zatím volné. Pokud o téma máte vážný zájem, vyplňte prosím následující formulář, kterým si téma zamluvíte (všechny položky jsou povinné).

Jméno a příjmení:

Studijní číslo: Email:

Aktualizováno 0