Popis tématu

Bakalářská práce v oborech Informatika (Bc), Informační systémy (Bc).

Anotace snímků (více témat)

Cílem je podpora a zjednodušení vytváření nebo revize anotací v obrazových datech (zejména osobních údajů). Vstupem mohou být obrazové dokumenty bez jakýchkoliv anotací, ale také dokumenty včetně souboru s anotacemi pro porovnání, validaci nebo určení úplnosti/kvality de-identifikace.

Ve snímku se může objevit jakýkoliv text. Je potřeba uchovat jeho pozici (souřadnice a velikost oblasti), text, nebo klasifikaci textu jako je datový typ (číslo, datum, čas, text) nebo kategorie (např. text, osobní údaj), případně detailně včetně třídy jako jsou jméno, příjmení, rodné číslo, datum (narození, vyšetření), věk ....


Rámcové úkoly:

1. Prohlížeč -- software umožní přehlednou práci se zobrazením snímků a případně i vrstev. Možnost přepnout zobrazení jen náhledů (v různém rozlišení).

2. Formát anotací -- návrh a vytvoření rozšiřitelného formátu pro trvalé uchování anotací souboru.

3. Tvorba anotací -- software umožní označit pozice a vytvořit/doplnit anotace (text v obrázku, pozice, rozměry, význam nebo klasifikace textu) v rámci snímku nebo jeho vrstev. Veškeré anotace bude ukládat do textového souboru ve vhodném formátu. Software umožní načíst existující soubor a editovat jej.

4. Porovnání anotací -- software umožní načíst další soubor s anotacemi a provést jejich porovnání. Porovnání bude možné u všech typů anotací -- text, pozice nebo rozměry (s určitou tolerancí), klasifikace (dle určených klasifikačních tříd) a to pro snímek jako celek, ale i pro jednotlivé vrstvy samostatně. Vhodně zvolený způsob vizualizace snímku a anotací.

5. Stanovení metrik -- software umožní (předdefinovanou konfiguraci) přímý výpočet metrik (confusion matrix, sensitivity, specificity, accuracy, ...) na základě porovnání dvou souborů anotací: (1) skutečnost (např. po manuální korekci) a (2) zjištěných (např. po provedení OCR a dalšího zpracování snímků).

6. Export dat -- tvorba výstupů v určených textových, tabulkových nebo obrazových formátech (CSV, XLS/ODS, PNG, ...). Např. jen anotace nebo snímky včetně doplněných anotací.

7. Generování (pseudo)-náhodných dat pro anotace různých typů (jména, datum, čas, věk, telefon, bankovní účet, ...) a tvorbu snímků.

a další

Pro detaily mne, prosím, kontaktujte emailem. Konkrétní zadání a rozsah připravíme až společně (s možnými zájemci) po osobní schůzce dle typu práce (oborový projekt, bakalářská práce, diplomová práce). Na téma není automatický nárok.


Téma vypsal: Ing. Petr Včelák, Ph.D. (UN357)

Vypsáno pro akademický rok 2023/2024 dne: 2022-04-12

Zadáno komu: (Smazané)

Aktualizováno 0