Bankovní Institut Vysoká Škola Praha
Total Page:16
File Type:pdf, Size:1020Kb
Bankovní institut vysoká škola, a.s. Katedra matematiky, statistiky a informačních technologií Současné formáty pro záznam zvuku Bakalářská práce Autor: Viktor Čapek Informační technologie, MPIS Vedoucí práce: Ing. Bohuslav Růžička, CSc. Praha Leden, 2012 Prohlášení: Prohlašuji, že jsem bakalářskou zpracoval samostatně a v seznamu uvedl veškerou použitou literaturu. Svým podpisem stvrzuji, že odevzdaná elektronická podoba práce je identická s její tištěnou verzí, a jsem seznámen se skutečností, že se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací. V Bavorově dne 8.1.2012 Viktor Čapek Poděkování: Chtěl bych poděkovat vedoucímu práce panu Ing. Bohuslavu Růžičkovi, CSc. za jeho pomoc a trpělivost při zpracování této bakalářské práce. Anotace: Cílem této práce je seznámit čtenáře se základními principy převodu z analogového na digitální signál a základními principy ztrátových i bezeztrátových kompresních algoritmů. Součástí práce je uvedení nejpoužívanějších zvukových formátů a jejich srovnání. Annotation: The aim of this paper is to acquaint the reader with the basic principles of converting from analog to digital signal and the basic principles of the loss and lossless compression algorithms. The work putting the most used audio formats and their comparison. Současné formáty pro záznam zvuku Obsah Úvod .......................................................................................................................................... 3 1. Zvuk a jeho vlastnosti ...................................................................................................... 4 1.1. Lidské ucho a zvuk ...................................................................................................... 6 1.2. Binaurální slyšení ........................................................................................................ 7 2. Číslicová modulace ........................................................................................................... 9 2.1. Modulace PCM .......................................................................................................... 10 2.1.1. Vzorkování ............................................................................................................. 10 2.1.2. Kvantování ............................................................................................................. 11 2.1.3. Kódování ................................................................................................................ 13 2.2. DPCM ........................................................................................................................ 14 2.3. DSD ........................................................................................................................... 14 2.4. Datová sběrnice I2S .................................................................................................... 15 2.5. DVD – Audio ............................................................................................................. 17 2.6. SACD ......................................................................................................................... 18 3. Komprese zvukových souborů ...................................................................................... 20 3.1. Bitrate ......................................................................................................................... 21 3.2. Ztrátová komprese ..................................................................................................... 22 3.3. Sub-Band Coding ....................................................................................................... 23 3.4. Spectral Band Replication.......................................................................................... 24 3.5. Psychoakustický model .............................................................................................. 28 3.5.1. Křivka slyšitelnosti ................................................................................................. 28 3.5.2. Frekvenční maskování ........................................................................................... 29 3.5.3. Časové maskování .................................................................................................. 30 3.6. Bezeztrátová komprese .............................................................................................. 31 4. Zvukové formáty ............................................................................................................ 33 4.3. Ztrátové formáty zvuku ............................................................................................. 33 4.3.1. MPEG-1 Layer3 .................................................................................................... 33 4.3.2. WMA ...................................................................................................................... 35 1 Současné formáty pro záznam zvuku 4.3.3. AAC ....................................................................................................................... 36 4.3.4. OGG Vorbis ....................................................................................................... …36 4.3.5. ATRAC .................................................................................................................. 38 4.3.6. Dolby Digital .......................................................................................................... 39 4.4. Shrnutí ........................................................................................................................ 41 4.5. Bezeztrátové formáty zvuku ................................................................................... 43 4.5.1. FLAC ...................................................................................................................... 43 4.5.2. Apple Lossless ....................................................................................................... 44 4.5.3. Monkey`s audio ...................................................................................................... 45 4.5.4. WavPack ................................................................................................................ 45 4.5.5. MLP ........................................................................................................................ 46 4.5.6. Shrnutí .................................................................................................................... 47 Závěr ...................................................................................................................................... 49 2 Současné formáty pro záznam zvuku Úvod Jak již vyplývá z názvu práce, cílem je seznámit čtenáře se současnými formáty zvuku a jejich použitím, protože v dnešním „digitálním světě“ je potřeba zvuk zaznamenávat, upravovat a reprodukovat. V kapitole 1 jsem se zaměřil na popis zvuku, jeho charakteristiky a šíření a také na vlastnosti lidského ucha a jeho možnosti slyšení a lokalizace zvuku. V kapitole 2 popisuji základní principy převodu analogového zvuku na zvuk digitální. V této kapitole jsem se zmínil hlavně o nejpoužívanější PCM modulaci. V kapitole 3 se snažím popsat principy komprese digitálního zvuku, zaměřuji se zde hlavně na ztrátové komprese, popisuji zde principy psychoakustického modelu a podpásmového kódování, jenž jsou jedny z nejdůležitějších prvků této komprese. V kapitole 4 již zmiňuji nejpoužívanější ztrátové a bezeztrátové formáty zvuku a jejich parametry a vlastnosti. V této kapitole jsem také provedl měření účinnosti komprese bezeztrátových kodeků. V závěru práce uvádím celkové shrnutí této práce. Tato práce by měla čtenářům pomoci ujasnit si základní pojmy a metody v oblasti zpracování zvuku. 3 Současné formáty pro záznam zvuku 1. Zvuk a jeho vlastnosti Zvuk je mechanické vlnění v látkovém prostředí. Rozsah frekvencí tohoto vlnění, které je člověk schopen vnímat, leží v intervalu přibližně od 16 Hz do 20 000 Hz. Někdy literatura uvádí rozsah jen do 16 000 Hz. Je to závislé na kvalitě sluchu a stáří každého jedince. I když je mechanické vlnění mimo slyšitelný frekvenční rozsah, označuje se také jako zvuk (infrazvuk, ultrazvuk). [4] Zvuk s frekvencí nižší než 16 Hz nazýváme infrazvuk a zvuk s frekvencí vyšší než 20 kHz nazýváme ultrazvuk. Děje spojené se vznikem zvuku jeho šířením a vnímáním se nazývají akustika. Zdrojem zvuku může být každé pohybující se těleso. Prostředí, ve kterém se zvuk šíří, nazýváme vodič, může být plynné, kapalné i pevné. Vakuum neboli vzduchoprázdno, je zase dokonalá zvuková izolace. V kapalinách a plynech se šíří jako postupné vlnění podélné, v pevných látkách jako postupné vlnění podélné a příčné. Vlnové délky slyšitelného zvuku jsou v rozmezí od 21 m do 21 mm (21 m = 16 Hz, 21 mm = 16 kHz). Šíření rychlosti zvuku je také závislé na druhu a hustotě prostředí, na teplotě t a vlhkosti vzduchu. Rychlost šíření zvuku ve vzduchu se v běžných podmínkách spočítá podle vzorce: c = 331,8 m/s + 0,6.T [m/s] kde T = teplota vzduchu ve stupních Celsia. Standardizovaná hodnota 340 m/s pak odpovídá teplotě vzduchu 13,6 °C. [2] Při dopadu zvuku na pevnou překážku dochází k částečné absorpci zvukové energie a částečnému odrazu, který závisí na druhu obou prostředí. Intenzita odraženého vlnění I je vždy menší než intenzita na stěnu dopadajícího vlnění I0. a = I0-I / I0 Podíl se nazývá koeficient absorpce zvuku při odrazu