předchozí - ÚVOD - následující

Počítačové vidění

Počítačové vidění je disciplína, která se snaží technickými prostředky aspoň částečně napodobit lidské vidění. Pro počítačové vidění je typická snaha porozumět obecné trojrozměrné scéně, např. takové, jakou zahlédnete při pohledu z okna do zahrady. Postupy počítačového vidění jsou značně složité, s těžištěm v interpretaci obrazových dat, která jsou nejčastěji reprezentována symbolicky. Jádrem pokročilejších postupů jsou znalostní systémy a techniky umělé inteligence. Této části počítačového vidění se říká vyšší úroveň. Druhou částí je nižší úroveň.

Cílem nižší úrovně je analyzovat vstupní dvojrozměrná obrazová data číselného charakteru a najít kvalitativní symbolickou informaci potřebnou pro vyšší úroveň. Pro nižší úroveň se také používá název zpracování obrazu počítačem.

Předmětem zpracování a případné rozpoznání obrazu je obrazová informace o reálném světě, která do počítače vstupuje nejčastěji televizní kamerou. Počítačové vidění řeší úlohu vytvoření explicitního popisu fyzikálních objektů v obraze.

Ve zpracování obrazu se dá rozlišit několik úrovní. Na nejvyšší úrovni jde o proces porozumění. Představme si např. úlohu automatického vyhodnocení rentgenového snímku srdce. Zpracování je jednat ovlivněno cílem - snahou najít chorobu zasaženou část srdeční stěny včetně možných příčin onemocnění, a na druhé straně souhrnem předběžných znalostí a zkušeností v této problematice.

Postup zpracování a rozpoznávání obrazu se daří rozložit do posloupnosti základních kroků:

- snímání a digitalizace a uložení obrazu v počítači
- předzpracování
- segmentace obrazu na objekty
- popis objektů
- porozumění obsahu obrazu (klasifikace objektů)

Při posuzování algoritmů počítačového vidění se berou v úvahu jejich časové a paměťové požadavky.

Snímání a digitalizace

Při snímání se převádějí vstupní optické veličiny na elektrický signál spojitý v čase i úrovni. Vstupní informací může být jas (z TV kamery, scanneru), intenzita rentgenového záření, ultrazvuk, tepelné záření aj. Snímat se může v jednom nebo více spektrálních pásmech. Pro barevné snímání stačí tři spektrální složky - červená, zelená a modrá.

Digitalizací se převádí vstupní spojitý signál odpovídající monochromatickému obrazu do diskrétního tvaru. Vstupní analogový signál je popsán funkcí f(i,j) dvou proměnných - souřadnic v obraze. funkční hodnota odpovídá např. jasu. Vstupní signál je vzorkován a kvantován. výsledkem je matice přirozených čísel popisujících obraz. Jednomu prvku matice se říká obrazový element (picture element - pixel). Z hlediska zpracování obrazu jde o dále nedělitelnou jednotku.

Existují i jiné možnosti reprezentace vstupního obrazu v počítači. Častým případem je popis obrazu koeficienty dvourozměrné Fourierovy transformace. výhodou je to, že Fourierovu transformaci lze převést okamžitě optickými prostředky již před digitalizací.

Předzpracování obrazu

Cílem je potlačit šum a zkreslení vzniklé při digitalizaci a přenosu dat. Jindy se předzpracování snaží zvýraznit určité rysy obrazu podstatné pro další zpracování. Příkladem může být hledání hran v obraze, tj. obrazových bodů (pixelů) s vysokými hodnota velikosti gradientu obrazové funkce.

Segmentace

Asi nejtěžší krok postupu zpracování je segmentace, která dovolí v obraze najít objekty. Za objekty se považují ty části obrazu, které nás z hlediska dalšího zpracování zajímají. Při segmentaci se tedy zhusta využívá znalosti interpretace obrazu (sémantika).

Popis nalezených objektů

Lze je popsat buď kvantitativně pomocí souboru číselných charakteristik a/nebo kvalitativně pomocí relací mezi objekty. Způsob popisu objektů je ovlivněn tím, na co se popis bude používat. Za krajně jednoduchý popis objektů lze považovat např. stanovení velikosti (plochy) objektů, tj. počet jemu odpovídajících obrazových bodů v obraze.

Porozumění obsahu

Ve velmi jednoduchém případě můžeme za porozumění považovat klasifikaci objektů v obraze podle jejich velikosti. jen o málo složitější je klasifikace objektů do několika předem známých tříd, např. na hranaté a kulaté. V obecném případě představuje porozumění interpretaci obrazových dat, o kterých se předem nic nepředpokládá. Porozumění obrazu je potom založeno na znalosti, cílech, tvorbě plánu k jejich dosažení a využití zpětných vazeb mezi různými úrovněmi zpracování.

Příklad

1. jednoduchý - jednoduchá automatická analýza transparentního obrazu buněčného preparátu pozorovaného optickým mikroskopem. Nechť je cíl spočítat buňky a roztřídit je podle tvaru buněčných jader na podlouhlé a ostatní. Úloha je z principu dvourozměrná. Předzpracováním se odstraní případný šum a pro segmentaci lze využít skutečnosti, že buněčná jádra jsou mnohem tmavší než zbytek. Nyní zbývá popsat body obrazu, příslušné každému buněčnému jádru, číselnými charakteristikami a podle nich buňky třídit.

2. složitý systém - porozumění obrazu používané v autonomních vozidlech. Cílem je vybavit terénní vozidlo pohybující s v blíže neomezené krajině bez řidiče. Poměrně dokonalé experimentální verze již byly vytvořeny. Systém analýzy obrazu je jen jeden z mnoha senzorů, na jejichž základě se řídící systém vozidla rozhoduje. Jinými zdroji informací jsou např. radar, laserový dálkoměr, informace o absolutní poloze vozidla odvozená z gyroskopu, digitální mapa. Scéna je trojrozměrná a navíc v čase proměnná. Obrazový systém obvykle pracuje s informací ze dvou kamer, aby pomocí techniky stereovidění mohl odhadovat hloubku objektů ve scéně od pozorovatele. Vozidlo si musí vytvářet a průběžně modifikovat vnitřní model okolního světa.

Aplikace počítačového vidění

Jednou z oblastí využití počítačového vidění je dálkový průzkum země (lesnictví, geodézie, meteorologie, archeologie, ...), lékařské aplikace (rozpoznávání rakovinných buněk, texturní analýza myokardu v echokardiografie, ...), technická diagnostika (defektoskopie a defektometrie prozařování) a aplikace ve výrobě (počitadlo lahví, obsluha textilních strojů).

Podrobnější informace můžete nalézt v [7, 8].

předchozí - ÚVOD - následující