Popis tématu

Oborový projekt v oborech Softwarové inženýrství, Informační systémy, Medicínská informatika.

Anotace snímků (více témat)

Cílem je podpora a zjednodušení manuálního vytváření nebo revize metadat (zejména osobních údajů) v obrazových datech. Vstupem mohou být obrazové dokumenty bez jakýchkoliv anotací, ale také dokumenty včetně souboru s anotacemi pro porovnání, validaci nebo určení kvality anonymizace/de-identifikace.

Ve snímku se může vyskytnout obecně jakýkoliv text. Je potřeba uchovat jeho pozici (souřadnice a velikost oblasti), text, nebo klasifikaci textu jako je datový typ (číslo, datum, čas, text) nebo kategorie (např. text, osobní údaj, jméno, příjmení, rodné číslo, datum narození, ...).


Rámcové úkoly:

1. Prohlížeč -- software umožní přehlednou práci se zobrazením snímků a případně i vrstev. Možnost přepnout zobrazení jen náhledů (v různém rozlišení).

2. Formát anotací -- návrh a vytvoření rozšiřitelného formátu pro trvalé uchování anotací souboru.

3. Tvorba anotací -- software umožní označit pozice a vytvořit/doplnit anotace (text v obrázku, pozice, rozměry, význam nebo klasifikace textu) v rámci snímku nebo jeho vrstev. Veškeré anotace bude ukládat do textového souboru ve vhodném formátu. Software umožní načíst existující soubor a editovat jej.

4. Porovnání anotací -- software umožní načíst další soubor s anotacemi a provést jejich porovnání. Porovnání bude možné u všech typů anotací -- text, pozice nebo rozměry (s určitou tolerancí), klasifikace (dle určených klasifikačních tříd) a to pro snímek jako celek, ale i pro jednotlivé vrstvy samostatně. Vhodně zvolený způsob vizualizace snímku a anotací.

5. Stanovení metrik -- software umožní (předdefinovanou konfiguraci) přímý výpočet metrik (confusion matrix, sensitivity, specificity, accuracy, ...) na základě porovnání dvou souborů anotací: (1) skutečnost (např. po manuální korekci) a (2) zjištěných (např. po provedení OCR a dalšího zpracování snímků).

6. Export dat -- tvorba výstupů v určených textových, tabulkových nebo obrazových formátech (CSV, XLS/ODS, PNG, ...). Např. jen anotace nebo snímky včetně doplněných anotací.

7. Generování (pseudo)-náhodných dat pro anotace různých typů (jména, datum, čas, věk, telefon, bankovní účet, ...) a tvorbu snímků.

Pro detaily mne, prosím, kontaktujte emailem. Konkrétní zadání a rozsah připravíme až společně (s možnými zájemci) po osobní schůzce dle typu práce (oborový projekt, bakalářská práce, diplomová práce). Na téma není automatický nárok.

Téma vypsal: Ing. Petr Včelák, Ph.D. (UN 357)

Vypsáno pro akademický rok 2022/2023 dne: 2022-05-11

Rezervace tématu

Toto téma je zatím volné. Pokud o téma máte vážný zájem, vyplňte prosím následující formulář, kterým si téma zamluvíte (všechny položky jsou povinné).

Jméno a příjmení:

Studijní číslo: Email:

Aktualizováno 0