Popis tématu

Diplomová práce v oborech Softwarové inženýrství, Informační systémy, Medicínská informatika, Informatika a její specializace - Medicínská informatika, Informatika a její specializace - Zpracování přirozeného jazyka, Softwarové a informační systémy - Informační systémy, Softwarové a informační systémy - Robustní softwarové systémy, Softwarové a informační systémy - Softwarové inženýrství.

Anotování rozpoznaného textového obsahu ve snímcích

CS: Anotování rozpoznaného textového obsahu ve snímcích

EN: Annotation of recognized textual content in images


Zásady pro vypracování:

1. Seznamte se s formátem DICOM, nástroji a formáty pro OCR a s legislativou ochrany osobních údajů.

2. Analyzujte technologie vhodné pro multiplatformní aplikaci s GUI pro efektivní/hromadné (před)zpracování velkého počtu snímků uživatelem.

3. Navrhněte vlastní software pro zobrazení náhledů a realizace revize snímků -- rozpoznaný text, hodnocení/klasifikace na úrovni dané oblastí i celého snímku.

4. Software implementujte s důrazem na předpokládané velké objemy dat a perzistentní uložení dat revize ve strojově zpracovatelné podobě.

5. Software důkladně otestujte a proveďte validaci na netriviální datové sadě.

6. Proveďte kritické zhodnocení a diskuzi dosažených výsledků.=========================================

Cílem je podpora a zjednodušení vytváření nebo revize anotací v obrazových datech (zejména osobních údajů). Vstupem mohou být obrazové dokumenty bez jakýchkoliv anotací, ale také dokumenty včetně souboru s anotacemi pro porovnání, validaci nebo určení úplnosti/kvality de-identifikace.

Ve snímku se může objevit jakýkoliv text. Je potřeba uchovat jeho pozici (souřadnice a velikost oblasti), text, nebo klasifikaci textu jako je datový typ (číslo, datum, čas, text) nebo kategorie (např. text, osobní údaj), případně detailně včetně třídy jako jsou jméno, příjmení, rodné číslo, datum (narození, vyšetření), věk ....

Pro detaily mne, prosím, kontaktujte emailem. Konkrétní zadání a rozsah připravíme až společně (s možnými zájemci) po osobní schůzce dle typu práce (oborový projekt, bakalářská práce, diplomová práce). Na téma není automatický nárok.

Téma vypsal: Ing. Petr Včelák, Ph.D. (UN357)

Vypsáno pro akademický rok 2023/2024 dne: 2022-04-12

Zadáno komu: Jaroslav Hrubý (Zadané)

Aktualizováno 0