KVU / UF3D
3D fotografie a alternativní techniky ve fotografii

Terminologická poznámka: pojmem "3D" budeme zatím poměrně vágně označovat technologie, kdy divák vybavený speciálními brýlemi vidí obraz tak, jako by jeho jednotlivé prvky vystupovaly před promítací plátno (či televizní obrazovku apod.), případně zapadaly za něj. Později pojem "3D" zpřesníme.

Ortostereoskopie

Ortostereoskopie je základní metodou přípravy 3D snímku, jejímž výsledkem je zcela přirozený 3D vjem (s jistými omezeními). Uvidíme později, že její použití je poněkud limitované a v podstatě má smysl pouze v technické praxi. Je ale užitečné se jí na začátek zabývat.

Cíl: oči by na 3D snímku měly vidět přesně to, co by viděly ve skutečnosti.

Jak toho dosáhnout?

  1. Kamery by zřejmě měly mít stejný zorný úhel jako oči. To se snadno řekne, ale hůře udělá.

    Oko vidí ostře pouze ve velmi malém úhlu, asi 2 stupně. Zbytek vidí s "menším rozlišením". Oko se nicméně mimovolně pohybuje, "těká po okolí", čili dříve nebo později si každou část světa kolem sebe prohlédne nejlepší částí sítnice. Mozek tyto dílčí obrazy skládá dohromady a celkově vnímáme celé okolí ostře. Otázka, co je to "zorný úhel oka", tedy nemá úplně jednoduchou odpověď.

    Zorný úhel lidského oka. Převzato z nasa.gov

    Lepší proto bude vyjít od 3D snímku: jestliže má snímek při dané vzdálenosti pozorovatele zabírat jistý zorný úhel, bude třeba nastavit ohniskovou vzdálenost objektivu na stejný zorný úhel.

    Prakticky si tedy představíme "rám budoucího 3D displeje", kameru umístíme do předpokládané vzdálenosti diváka od displeje a ohniskovou vzdálenost nastavíme tak, aby rám displeje přesně vyplňoval prostor snímku.

    Při ortostereoskopickém snímání volíme takový objektiv a takovou vzdálenost fotoaparátu od scény, aby zorný úhel snímku přesně zabíral předpokládaný, tečkovaně naznačený displej.

    Při sledování ortostereoskopického snímku musí mít divák hlavu v místě, kde byl umístěn fotoaparát. Sleduje-li displej velikosti a umístění předpokládaného při snímání, uvidí fotografovanou scénu stejně velkou, jako by ji sledoval ve skutečnosti.
    Po najetí kurzorem na obrázek je možné srovnat situace při snímání a sledování snímku.

  2. Vzdálenost "mezi kamerami", respektive "mezi středy přední čočky objektivu" musí být stejná jako mezioční vzdálenost. Za průměrnou vzdálenosti se bere hodnota 63 nebo 65 mm, i když se v praxi můžeme setkat s výrazně odlišnějšími hodnotami; z následující grafu je vidět, že se můžeme setkat s meziočními vzdálenostmi od 53 do 71 mm. Ideální ortostereoskopický snímek musíme proto vytvářet pro konkrétního diváka!

    Zastoupení různých meziočních vzdáleností ve vzorku 301 lidí.
    Převzato z japonské knihy Stereoscopic HDTV. Vyšší zastoupení menších meziočních vzdáleností (61 mm, 63 mm) je pravděpodobně dáno tím, že Japonci jsou průměrně menší než Evropané.

  3. Poslední, velmi důležité rozhodnutí, se týká vzájemného natočení optických os kamer. V úvaze opět postupujme pozvolna:
    • Při pozorování 3D snímku mají oči primárně tendenci ostřit na rovinu displeje, a proto i optické osy očí se primárně sbíhají v rovině displeje.
    • Pokud se budou optické osy kamer protínat v rovině snímku, budou mít body v rovině plátna nulovou disparitu, před plátnem pozitivní (kříženou) disparitu, za plátnem negativní (nekříženou) disparitu, což chceme.
    • Pohled z boku na geometrii sledování bodů A, B, C. Bod B je umístěn ve středu pomyslného displeje, bod A před ním, o něco výše, bod C za ním, o něco níže.

      Pohled shora na geometrii sledování bodů A, B, C. Bod B je umístěn ve středu pomyslného displeje, bod A před ním, trochu vlevo, bod C za ním, trochu vpravo. Všimněme si, že mezioční vzdálenost je značně přehnaná (67 cm), abychom mohli názorně sledovat vznik disparity.

      Zobrazení snímků z levé (červená) a pravé (zelená) kamery na 3D displeji. Všimněme si, že obrazy bodu B na snímcích splývají a že obrazy bodů A, C mají vůči sobě opačnou disparitu.

    • Na druhou stranu ale takto natočené kamery zobrazí čtverec v rovině plátna jako lichoběžník, což samozřejmě nechceme. Máme-li v rovině displeje vidět čtverec, není nic jednoduššího, než jej na displej úplně obyčejně vykreslit, tj. snímky pro pravé i levé oko by měly obsahovat stejné čtverce, ne různé lichoběžníky.

      Pohled shora na geometrii sledování čtverce v rovině displeje. Všimněme si, že mezioční vzdálenost je značně přehnaná (67 cm), abychom mohli názorně sledovat vznik lichoběžníkovitosti.

      Zobrazení snímků z levé (červená) a pravé (zelená) kamery na 3D displeji. Všimněme si, že obrazy čtverce nejsou dokonale stejné; obraz z levé kamery je lichoběžník vyšší na levém okraji, obraz z pravé kamery je lichoběžník vyšší na pravém okraji.

      Je třeba si uvědomit, že nehledáme hypotetický obraz na levé a pravé sítnici; tam by byl vznik lichoběžníku přirozený. Hledáme takové snímky L, R, které po zobrazení na plochém 3D displeji (např. ve formě anaglyfického obrazu) vyvolají na levé a pravé sítnici stejný vjem, jako by se oči dívaly na 3D scénu.

      Proč problém vzniká? Běžná kamera má snímač kolmý na optickou osu objektivu. Snímače kamer, jejichž optické osy se kříží v rovině displeje (tzv. konvergující kamery nebo též "toe-in" kamery), jsou proto v navzájem různoběžných rovinách, navíc různých od roviny 3D displeje. Při zobrazení snímků z toe-in kamer na 3D displeji ale jak levý, tak pravý snímek zobrazujeme v rovině 3D displeje, tj. pootočeně vůči situaci při snímání. To je samozřejmě neslučitelné se základním principem ortostereoskopie - tam chceme, aby geometrie snímání byla totožná s geometrií pozorování.

      Pohled shora na geometrii sledování čtverce v rovině displeje. Všimněme si, že mezioční vzdálenost je značně přehnaná (67 cm), abychom mohli názorně sledovat vznik lichoběžníkovitosti.

    • Řešením skutečných odborníků je kipování čili náklon standart. Standarta čili rovina snímače (filmu) se musí naklopit tak, aby byla rovnoběžná s budoucí rovinou 3D displeje. Kipování pro levý a pravý snímek tedy musí být typicky stejné, ale "na opačnou stranu".
    • Pohled shora na geometrii sledování čtverce v rovině displeje s využitím kipování - standarty jsou rovnoběžné s pomyslnou rovinou displeje. Na následujícím obrázku si všimněme, že ačkoliv je mezioční vzdálenost značně přehnaná (67 cm), lichoběžníkovitost nevzniká.

      Zobrazení snímků z korektně nastavené levé (červená) a pravé (zelená) kamery na 3D displeji. Všimněme si, že obrazy čtverce jsou stejné, a proto se čtverec jeví žlutý (červené + zelené světlo = žluté světlo).

    • Ačkoliv je kipování ideálním řešením, musíme připustit, že málokterá kamera (fotoaparát) tuto možnost nabízí. Jistou alternativu proto skýtají tilt-shift objektivy; v praxi je ale i tato metoda těžko použitelná, zejména ve videu.
    • Rozumným kompromisem je proto nastavit roviny snímačů levé i pravé kamery rovnoběžně s rovinou displeje; v praxi tedy nastavit optické osy obou kamer rovnoběžně. Nejjednodušeji se rovnoběžnost nastaví tak, že se vybere jeden vzdálený bod (např. na horizontu) a obě kamery se nastaví tak, aby byl vybraný bod vidět ve středu hledáčku.

      Ohniskovou vzdálenost je třeba mírně zmenšit, tj. zorný úhel zvětšit, aby obě kamery obsáhly celý "rám budoucího 3D displeje". Jistá část snímku z levého (levá část) a pravého (pravá část) se před zobrazením ořízne.

    • Pohled shora na geometrii sledování čtverce v rovině displeje dvěma rovnoběžně orientovanými kamerami. Všimněme si, že zorný úhel se musel podstatně zvětšit (ohnisková vzdálenost zmenšit), aby obě kamery čtverec viděly.

      Plné neoříznuté snímky z levé (červená) a pravé (zelená) kamery na 3D displeji. Je zřejmé, že vhodným výřezem získáme v obou snímcích stejné čtverce na stejných místech, tj. stejný výsledek jako u kipovaných kamer.

    • Představme si, co by se stalo, kdybychom levý a pravý snímek neoříznuli. Nekonečně vzdálený bod (např. hvězda) by se pak zřejmě zobrazil na stejné místo jak v levém, tak v pravém snímku. Po zobrazení na 3D displeji by měl nulovou disparitu, tj. zobrazil by se do roviny 3D displeje.

      Stejnou úvahou dojdeme k tomu, že bod v konečné vzdálenosti by se zobrazil na odlišná místa levého a pravého snímku a po zobrazení na 3D displeji by měl pozitivní (kříženou) disparitu; tj. veškerá 3D scéna by ležela před plátnem. Například čtverec z předchozího příkladu se zobrazí se značnou kříženou disparitou; pokud bychom ji dokázali očima zpracovat (což je dost nepravděpodobné), zobrazil by se čtverec výrazně vystouplý před 3D displejem.

      Zobrazení neoříznutých snímků z levé (červená) a pravé (zelená) kamery na 3D displeji. Kamery jsou orientované rovnoběžně.

      Proces oříznutí levého a pravého snímku se snadno představuje jejich vzájemným posunem; jestliže chceme, aby se jistý bod dostal do roviny plátna, je třeba levý a pravý snímek posunout tak, aby měl příslušný bod nulovou disparitu. "Přečnívající" části snímků se pak mohou skutečně odříznout.

      Snímky z levé (červená) a pravé (zelená) kamery se před zobrazením na 3D displeji mohou vůči sobě posunout. Tím zajistíme, že některé body splynou, tj. že mají nulovou disparitu. Korektně bude na displeji vidět jen ta část obrazu, která je současně vidět jak na levém, tak na pravém snímku, na obrázku jde o červeno-zeleno-žlutý obdélník kolem zobrazovaného čtverce. Zbytek obrazu je možné odříznout, je k nepotřebě.

      Po oříznutí je možné snímky zvětšit tak, aby pokrývaly celou plochu 3D displeje. Na následujícím obrázku je bílou čarou naznačeno, jaká část snímků bude nakonec na 3D displeji zobrazena. Hned také vidíme největší nevýhodu tohoto postupu - část snímků z levé a pravé kamery se odřízne a zůstane nevyužita. Podotkněme, že naše ukázka je značně přehnaná - v praxi je oříznutá část mnohem menší.

      Bílý obdélník naznačuje obraz zobrazený na 3D displeji. Ostatní části snímků se odříznou a zahodí.

Omezení a vlastnosti (orto)stereoskopie

I když jsme se maximálně snažili dosáhnout ortostereoskopického vjemu, přesto není vyhráno. Mimořádně důležitým vjemem, který nám zatím chybí, je pohybová paralaxa. Při mírném pohybu hlavy je divákovi hned jasné, že se nedívá na skutečný svět - místo toho, aby se pohybem hlavy objevovaly nové části scény, scéna se jakoby deformuje a cestuje za divákem. Následující obrázky se snaží vjem ilustrovat, ale čtenář by si jej měl sám vyzkoušet.

Geometrie snímání: dvěma ideálními kamerami (s kipováním a správným objektivem) snímáme pro jednoduchost drátěnou krychli.

Na 3D displeji vidíme dle očekávání mírně odlišné obrazy krychlí; můžeme se přesvědčit, že body na přední a zadní stěně krychle mají vzájemně opačnou disparitu.

Při sledování 3D displeje má divák (naznačeny jsou pouze jeho oči) dokonalý prostorový vjem - vnímá objekt stejně velký jako ve skutečnosti. Po najetí kurzorem na obrázek je objeví, co se stane, mění-li divák pozici hlavy. Přirozené by bylo, aby se krychle natáčela, tj. objevovaly se stěny původně zakryté. Jelikož ale máme k dispozici výhradně snímky ze dvou pevně umístěných kamer, není to možné, a krychle se zdánlivě deformuje.

Efekt můžeme podrobně studovat v simulátoru stereoSim.

V praxi se proto obvykle předpokládá, že divák hlavou nepohybuje. To je akceptovatelné v kině nebo při sledování televize, ale pro interaktivní aplikace (hry, průmyslový design, chirurgické zákroky apod.) jde o zásadní problém.

Je pravda, že jeho řešení existují, například vícepohledový (multiview) displej nebo sledování pozice divákovy hlavy (tracking). Budeme se jimi zabývat později. Teď si ale odneseme poučení, že ortostereoskopie je pouhým dílkem do skládačky pochopení stereoskopie, nikoliv konečným cílem; a z předchozí analýzy plyne, že je dílkem značně omezeným. Budeme se proto dále zabývat kreativním 3D snímáním, kdy cílem nebude vyvolat teoreticky dokonalý 3D vjem, ale 3D vjem uvěřitelný a bezproblémový.

Zpět na hlavní stránku.