Selathco 0.91 generated HTML
Predchozi Obsah )

2. Vytváření souborů MP3

Nejprve musíme mít v počítači uložený digitalizovaný zvuk (hudbu) ve formě souborů .WAV. Ty můžeme získat digitalizací z analogových zdrojů zvukového signálu (nahráním zvuku do počítače např. přes mikrofon) nebo digitální extrakcí ze zvukových CD. Komprimaci zvukových souborů provádí zvláštní program označovaný jako kodér (encoder). Existují i hardwarové kodéry, ale ty jsou méně rozšířené. Standardním zařízením pro tvorbu souboru .MP3 zůstává počítač vybavený softwarovým kodérem. Na kvalitě programu závisí kvalita výsledných .MP3 souborů. Je nutno upozornit, že dostatečnou kvalitou se musí vyznačovat již původní záznam uložený v souborech .WAV. Z nekvalitních nahrávek nelze vytvořit kvalitní hudební soubor formátu .MP3.

Kodérů existuje celá řada. Jejich jádro (kodek - algoritmus podle něhož se soubory kódují a dekódují) většinou vychází z volně využitelných zdrojových kódů schválených Mezinárodní organizací pro standardizaci (ISO). Za nejkvalitnější bývá považován kodek vyvinutý Fraunhoferovým institutem (dále FIIS) a programy od něj odvozené.

2.1. Parametry kodéru

Při kódování lze nastavit mnoho parametrů. Je nutné jim věnovat pozornost, protože mohou značně ovlivnit kvalitu kódování.

  • Bit Rate (rychlost datového toku) - je základní parametr ovlivňující výslednou zvukovou kvalitu .MP3 souboru. Obecně platí, že čím je rychlost datového toku vyšší, tím je výsledný soubor kvalitnější, ale také větší. Obecně přijatou hodnotou považovanou za kvalitu blížící se CD kvalitě je rychlost datového toku 128 kbps. Tato hodnota odpovídá kompresnímu poměru 1:12 a je tak komprimována většina souborů, s nimiž se setkáváme např. na Internetu. Změna této hodnoty závisí na individuálních potřebách každého, kdo se zabývá tvorbou a poslechem .MP3. Vyšší hodnoty (160, 192 kbps) použijeme v případě, že zkreslení je u 128 kbps stále značné a posluchači vadí. Typickým příkladem jsou nahrávky klasické hudby. Při 256 kbps již nikdo rozdíl proti původní nahrávce nepozná, ale kompresní poměr již není tak výhodný. Pokud se jedná o nahrávky méně kvalitní nebo méně náročné (mluvené slovo), můžeme použít nižší bitrate a ušetřit tak místo na disku. Kodéry podporují datový tok v různém rozmezí (8 až 256, resp. až 320 kbps). Celková hodnota bitrate je rovna součtu bitrate všech kanálů.

  • VBR (Variable BitRate) - proměnný datový tok. Na rozdíl od stálého datového toku se hodnota mění s průběhem signálu v závislosti na zvukové obtížnosti. Využívá se faktu, že při nižších hodnotách bitrate se poněkud ztrácejí vysoké kmitočty, na druhé straně nízkým kmitočtům stačí i malá bitrate. Tím, že při výsokých kmitočtech se kóduje s vysokou a při nízkých kmitočtech s malou bitrate, se dosáhne dalšího zmenšení výsledného souboru. Proměnný datový tok podporují jen některé kodéry (např. Xing MP3 encoder).

  • Sample Rate (kmitočet vzorkování) - umožňuje změnit frekvenci vzorkování zvukových dat tak, aby odpovídala kvalitě dat tvořených kodérem. Pokud chceme zachovat kvalitu blížící se CD, je nutné zachovat vzorkování 44,1 kHz. Snížením vzorkovací frekvence získáme sice menší soubor, ale také méně kvalitní výstup. Některé kodéry k nižší bitrate přiřazují automaticky i nižší vzorkovací kmitočet.

  • HQ (High Quality) - pokud kodér umožňuje tuto volbu, je lepší ji vždy používat. Kódování s "vysokou kvalitou" je pomalejší, ale kvalita vytvořených souborů je znatelně vyšší.

  • Stereo mód - kodéry rozeznávají několik druhů kódování stereo signálu. V nastavení stereo je lepší ponechat výchozí nastavení odpovídající různým bitrate. Tabulka 2.1. ukazuje doporučené režimy pro různé hodnoty bitrate pro MP3Enc od FIIS (Mono nahrávkám je samozřejmě zbytečné přiřazovat jakýkoliv druh sterea.)

    bitrate stereo mód
    8000-18000 mono
    18000-96000 intensity stereo
    96000-192000 joint stereo
    192000-256000 stereo


    Stereo režimy

    • Mono - Vytvoří jeden kanál.

    • Dual Channel (dual mono) - Vytváří dva nezávislé mono kanály.

    • Intensity Stereo (IS) - Vysokofrekvenční části signálu jsou smíchány do mono signálu a přenášeny s informací o směru.

    • Joint Stereo (MS) - Využívá korelací mezi kanály. Vytváří součtový (mid) kanál a rozdílový (side) kanál. Dosahuje vyšší kvality zvuku s určitou ztrátou sterea.

    • Stereo - Nevyužívá podobností mezi kanály, ale může přidat jednomu kanálu více bitů než druhému, například když je na jednom kanálu ticho.

2.2. Rychlost kódování

Některé parametry ovlivňují rychlost kódování. Jsou to například:

  • počet kanálů výstupního signálu, signál s jedním kanálem bude kódován dvakrát rychleji, než stereo signál (dva kanály)

  • vyšší samplerate výstupu sníží rychlost kódování

  • rozdíl mezi vstupní a výstupní samplerate sníží rychlost kódování, protože kodér musí provést převzorkování

2.3. Kodéry

V následující části se stručně zmíníme o několika vybraných kodérech. Podrobněji bude probrán MP3Enc od FIIS.

2.3.1. L3Enc

Jedná se o kodér pro DOS od FIIS. Dokáže vytvářet .MP3 soubory s datovým tokem až 256 kbps. Nevýhodou je velice nízká rychlost komprimování (jeden WAV o velikosti asi 50 MB se komprimuje do MPEG Layer-3 128 kbps téměř dvě hodiny). Parametr HQ (high quality) sice rychlost ještě podstatně sníží, kvalita se však zvýší. Výhodou je možnost kódování i na vyšší bitrate (192, 256 kbps), které však způsobí další zpomalení.

2.3.2. MP3Enc v.3.1

MP3Enc byl vytvořen ve FIIS. Existuje ve verzi pro Win 95/NT, Linux, Solaris, Sun, Irix a Alphu. Vznikl jako nástupce původního kodéru L3Enc 2.72. Nevyužívá žádných grafických knihoven, jeho ovládání je velice podobné L3Enc. Novinkou oproti jeho předchůdci je například libovolná bitrate.

Kodér může zpracovat formáty AIFF, AIFF-C, WAV/RIFF, .SNDplain PCM datové soubory. Zatímco první čtyři musí být v souboru, plain PCM, může být čten ze standardního vstupu prostřednictvím "roury" (pipe).

Program má řadu parametrů. Jejich význam bude vysvětlen v následujícím výčtu:

  • -br - bitrate výstupu, zadává se v bitech za sekundu. Zadaná hodnota je celková bitrate pro všechny kódované kanály, např. při zadání -br 112000 a kódování stereo budou oba kanály sloučeny do jednoho bitstreamu s datovým tokem 112 kbps. Kodér podporuje hodnoty bitrate 8, 16, 18, 20, 24, 32, 40, 48, 56, 64, 96, 112, 128, 160, 192 a 256 kbps. Pro mono signály mohou být použity všechny tyto hodnoty, stereo funguje až od 20 kps.

  • -if - jméno vstupního souboru

  • -of - jméno výstupního souboru

  • -iss - počet bitů na vzorek ve vstupním souboru, implicitní hodnota je 16

  • -nc - počet kanálů ve vstupním souboru, implicitně jsou 2

  • -sr - samplerate vstupního souboru, implicitní hodnota je 44,1 kHz

  • -le - vstupní soubor je little-endian

  • -be - vstupní soubor je big-endian

    Parametry -iss, -nc, -sr-le nebo -be je potřebné měnit, jen pokud je vstup ve formátu plain PCM.

  • -l3wav - uloží jako Microsoft RIFF/WAVE layer-3, což je vlastně .MP3 soubor s hlavičkou .WAV souboru. Při spuštění tohoto souboru Windows zavolají kodek, jehož pomocí se soubor přehraje i ve standardních WAV přehrávačích. Tento kodek je k dispozici např. na internetové adrese www.microsoft.com/ntserver/nts/mediaserv

  • -sti - načítá vstupní data ze standardního vstupu ("roura", pipe)

  • -sto - zapisuje výstupní data na standardní výstup

  • -qual - tento přepínač se používá pro určení poměru mezi rychlostí a kvalitou kódování
    -qual 0 - nejrychlejší kódování s nejnižší kvalitou
    -qual 9 - nejvyšší kvalita kódování (nejpomalejší)

  • -esr - effective samplerate, obvykle kodér vybere výstupní vzorkovací frekvenci 8, 16, 32 nebo 48 kHz.
    Některé zvukové karty nedokáží přehrávat soubory se vzorkovací frekvencí např. 48 kHz. Tímto parametrem lze nastavit jinou výstupní vzorkovací frekvenci.

  • -crc - uloží do souboru ochranu pomocí CRC.

  • -dm - pro kódování pro bitrate v rozsahu od 8 do 18 kbps je nutné mít mono signál. Použitím tohoto přepínače se sloučí vstupní stereo signál do jednoho kanálu a vytvoří mono výstup. Výsledek je vypočítán jako součet levého a pravého kanálu zeslabený o 6 dB.

  • -v - používá se pro rozsáhlejší zprávy o běhu programu

  • -no-is - nepoužívat intensity stereo
Pro usnadnění ovládání vznikly programy fungující jako tzv. front-end tvořící rozhraní pro jednoduché ovládání kodéru ve Windows. Některé grabbery, jako například Audiograbber, umožňují převádět extrahované WAV soubory přímo do MP3 právě prostřednictvím tohoto externího kodéru.

Demo je k dispozici na stránkách FIIS (www.iis.fhg.de). Demo verze je omezena na třicet sekund zvukových dat. V plné verzi je obsažen i program na zpětné dekódování .MP3 do .WAV souborů.

2.3.3. MP3 Compressor

Tento plně 32bitový program je asi třikrát rychlejší než L3Enc a má jednoduché ovládání. Lze komprimovat více souborů najednou, umožňuje smazání .WAV souboru po komprimaci a také odhaduje zbývající čas do ukončení komprese. Obsahuje také komprimaci .WAV do RIFF/WAVE layer-3. Výsledné .MP3 soubory mají datový tok od 8 do 128 kbps mono i stereo. Program umožňuje tato nastavení priority komprimace:

  • Idle - zatěžuje procesor jen tolik, aby nezpomaloval ostatní aplikace

  • Normal - zajišťuje dostatek výkonu pro komprimaci i pro ostatní aplikace

  • Highest - dochází k citlivému zpomalení

  • TimeCriticalPriority - znemožní s počítačem během komprimace jakkoli pracovat

2.3.4. MPEG Layer-3 Producer professional

Jedná se o program od firmy Opticom. Program běží pod Windows 95/NT a je asi 2,5krát rychlejší nez L3Enc. Využívá kodeku od FIIS. Dovoluje tvorbu .MP3 souborů s datovým tokem od 8 do 128 (256) kbps mono i stereo. Zajímavou funkcí je Preview/Prelisten (náhled), kdy se komprimuje prvních 5 sekund a poté se ihned výsledek přehraje. Nevýhodou je, že nepočítá zbývající čas komprese, nejde nastavit priorita a neumí pauzu. Pomocí menu Batch Processor jde komprimovat více souborů najednou a u každého z nich nastavit požadovanou kvalitu výstupu.

2.3.5. Audioactive Production Studio 1.5.4e

Tento kodér pochází z dílny Telos Systems. Kodek v něm obsažený je přímo od FIIS, což svědčí o jeho velmi dobré kvalitě. Co se týče rychlosti, tak jen mírně zaostává za MPEG Layer-3 Producer professional. Umožňuje označení více souborů pro komprimaci, kódování do .WAV, bitrate až do 256 kbps, volbu fast/HQ, preview, nastavení priority běhu aj. Dále za zmínku stojí například automatické zastavení komprese po určitém čase nebo po dosažení určité velikosti souboru a kalkulátor, s jehož pomocí lze zjistit, kolik bude výsledný soubor zabírat po kompresi.

2.3.6. MusicMatch Jukebox

Patří do kategorie programů All in one. Využívá také kodek od FIIS.

Vytváření komprimovaných zvukových souborů ze zvukových CD je velmi jednoduché a velmi rychlé. Stačí pouze CD vložit do mechaniky počítače a vybrat skladby. Je možné skladby převádět přímo do .MP3 nebo do běžných zvukových souborů .WAV, které se dají dále upravovat. Kromě formátu .MP3 je možno komprimovat i do méně rozšířeného formátu .WMA od Microsoftu, který umožňuje vytvářet při stejné kvalitě ještě menší výsledné soubory. Rychlost datového toku výsledných .MP3 souborů lze nastavit až na 320 kbps, je podporován i proměnný datový tok (VBR). Volná verze programu omezuje maximální bitrate u vytvářených souborů na 96 kbps.

Program automaticky podporuje CDDB - internetovou databázi CD, z níž se vypisují údaje o CD a skladbách a zapisují se do souborů. Možností, která u programů tohoto typu nebývá obvyklá, je nahrávání z vnějších zdrojů (LP desky, kazety, mikrofon) přes vstupy zvukové karty. Program dokáže i rozlišovat podle pauz jednotlivé skladby. JukeBox také provádí se skladbami i některé základní zvukové úpravy (fade in, fade out, normalizace) a dokáže zkomprimované soubory zpětně převádět do formátu .WAV.

2.3.7. AudioCatalyst

Tento program kombinuje CD grabber s kodérem firmy Xing Technology. Na jejích stránkách je možné stáhnout demo. Xing MP3 Encoder využívá vlastní velmi rychlý kodek a zavedl možnost kódování s proměnným datovým tokem (viz 2.1.).

2.3.8. BladeEnc

Jedná se o nejznámější freewarový kodér. Bývá často součástí jiných programů pro tvorbu .MP3. Ovládá se z příkazové řádky podobně jako MP3Enc. Umožňuje vytvářet soubory s hodnotami bitrate v rozmezí 32 až 320 kbps. Soubory .MP3 s běžným datovým tokem 128 kbps lze vytvořit jednoduše (bez zadání parametrů) přetáhnutím souboru .WAV na ikonu kodéru. Pro jednodušší práci opět existují front-end programy (např. Razor Blade).

2.3.9. LAME

Tento program používá vlastní psychoakustický model kódování Gpsycho (viz kap. 1.1.2.). Umožňuje kódovat v rozmezí 32-320 kbps a pracuje i s proměnným datovým tokem. Program se ovládá s příkazové řádky.

Při výběru programu je nutné brát v úvahu kromě maximální kvality i další kritéria. Pokud je požadována rychlá práce, je nejlepším programem Xing MP3 Encoder nebo AudioCatalyst. Programy spojující kvalitní kodek od FIIS s praktickým ovládáním jsou Audioactive Production StudioMusicMatch Jukebox. Pokud nechceme vydávat za programy žádné peníze, lze použít BladeEnc či LAME.


Predchozi
Converted by Selathco 0.91 on 21.06.2000 16:14