A hangkódolás demisztizált
A hang eloszlatása a videó rögzítésében és az élő események streamingjében
AV emberként állandóan hangkódolásról és kodekekről beszélünk, de mi is az az audio kodek pontosan? Az audiokodek lényegében olyan eszköz vagy algoritmus, amely képes digitális hangfolyam kódolására és dekódolására.
Gyakorlatilag az audio nyomáshullámok, amelyek a levegőn keresztül a fülünkbe kerülnek, folyamatos, analóg jelek. A jeleket egy analóg-digitális átalakító (ADC) nevű eszköz hozza a digitális világba, és örömünkre egy digitális-analóg átalakító (DAC) segítségével ismét visszahúzza őket. A kodek e két funkció között található, és itt számos fontos beállítást lehet beállítani a minőségi hang sikeres rögzítéséhez, továbbításához és rögzítéséhez: kodek algoritmus, a mintavételi ráta, a bit mélység és a bitsebesség.
Audio kodekek
A három leggyakoribb audio kodek a következő: Pulse-Code Modulation (Pulse-Code Modulation)PCM), MP3, és fejlett hangkódolás (AAC). A kiválasztott kodek határozza meg a tömörítést és a felvétel minőségét.
PCM egy olyan kodek, amelyet számítógépekben, kompaktlemezekben, digitális telefonokban és a ritkán használt szuper-audio lemezekben használnak. A PCM forrásjeléből rendszeres időközönként mintát vesznek, és mindegyik minta az analóg hullámforma amplitúdóját képviseli digitális értékként. A PCM a kódolás legalapvetőbb formája, és általában csak az analóg-digitális átalakítási folyamat nyers kimenete.
Megfelelő paraméterek esetén ez a digitalizált hullámforma tökéletesen rekonstruálható analógra a túlsó végén, ezért „veszteségmentes”. Ez a veszteségmentes kodek nagy hűséget biztosít az eredeti hanghoz, de sajnos nem túl gazdaságos, és nagyon nagy fájlokat eredményez, amelyek az élő közvetítéshez nem megvalósíthatók. Azt javaslom, hogy használja a PCM-et digitális ISO-k rögzítéséhez a forrásokhoz, vagy ha erős hang utómunkálatokat végez.
Szerencsére számos más kodek algoritmus közül választhatunk, amelyek képesek tömöríteni a digitális adatokat (a PCM-hez képest), ügyes megfigyelésekkel arra vonatkozóan, hogy az audio hullámformák hogyan viselkednek. A kompromisszum az, hogy ezeket az algoritmusokat veszteségesnek tekintik, mivel nem lehet tökéletesen rekonstruálni az eredeti jelet, de az eredmények még mindig elég jók ahhoz, hogy a legtöbb ember ne tudjon különbséget tenni.
MP3 egy veszteséges algoritmust használó hangkódolási formátum, amely az azonos mintájú digitális információkat sokkal kisebb fájlba tömöríti. Az MP3 a leggyakrabban használt kodek, amikor a fogyasztói hangra hivatkozik a zene és a tárolás céljából. A tartalom streamingjéhez csak az MP3 alkalmazását javaslom, mert kevesebb sávszélességet használ.
AAC egy újabb, veszteséges digitális hangkódolási szabvány. Úgy tervezték, hogy az MP3-tömörítés utódja legyen. Az AAC az MPEG-2 és MPEG-4 specifikációk szabványává vált. Lényegében egy tömörítési kodek, amely jobb hangminőséget nyújt, mint az MP3, miközben fenntartja a hasonló bitrátákat. Javaslom ennek a kodeknek a használatát élő közvetítésnél.
Mintadarabok (kHz)
A mintavételi arány az a szám, ahányszor másodpercenként készül egy hangminta. A mintavételi frekvenciákat Hertz (Hz) vagy Kilohertz (kHz,) egy kHz-ben mérjük, amely 1000 Hz. Például másodpercenként 44 100 minta 44,100 Hz vagy 44,1 kHz formában ábrázolható. A kiválasztott mintaráta meghatározza a reprodukálható maximális frekvenciát, és egy svéd származású mérnök, Nyquist, az 1900-as évek elején megmutatta, hogy a mintavételi aránynak körülbelül a duplájának kell lennie a legmagasabb frekvenciának a munka elvégzéséhez.
Például az átlagos emberi fül képes értelmezni a 20 Hz és 20 kHz közötti frekvenciákat. Az emberi hallás ezen tartományát és az alábbi táblázatot felhasználva láthatjuk, hogy miért a 44,1 kHz-t választották az audio CD-k mintavételi frekvenciájának, és miért tekinthető még mindig nagyon jó aránynak a forrásanyag reprodukálásakor.
Az alábbiakban egy referencia mutatja a maximális frekvenciát az adott mintavételi frekvenciánként:
Számos oka van annak, hogy magasabb mintavételi arányt válasszon, annak ellenére, hogy azt gondolná, pazarlás lenne az emberi hallás tartományán felüli frekvenciák reprodukálása. De az átlagos hallgató a 44,1–48 kHz-t több mint elég jónak tartja a legtöbb célra.
Bit mélység
A mintavételi arány mellett figyelembe kell venni a bitmélységet is. A bitmélység az egyes minták kódolásához felhasznált digitális információbitek száma. Egyszerűen fogalmazva, a bitmélység a „pontosságot” méri. Minél nagyobb a bitmélység, annál pontosabban képes egy jel kommunikálni az aktuális analóg hangforrás amplitúdójával. A lehető legkisebb bitmélység mellett csak két lehetőségünk van a hang pontosságának mérésére: 0 a teljes csendhez és 1 a teljes hangerőhöz. Minél nagyobb a bitmélység, annál pontosabb az ember a kódolt hangjuk felett. Példaként: A CD minőségű hang egy standard 16 bites, amely 216 (vagy 65 536) kötet közül választhat.
A bitmélység rögzített a PCM kódoláshoz, de a veszteséges tömörítési kodekeknél (például MP3 és AAC) a kódolás során kiszámítják, és mintánként változhatnak.
Bitráta
A bitsebesség az időegység alatt feldolgozott vagy továbbított bitek száma. Általában ezt bitek (vagy kilobites) másodpercenkénti számában fejezik ki (gyakran kbps vagy kbits/másodperc). A lineáris PCM esetében a bitsebesség egyszerű számítás.
bitráta = mintavételi sebesség × bitmélység × csatornák
Az olyan rendszerek esetében, mint a Pearl, amelyek lineáris PCM-et kódolnak 16 bites (16-os bitmélységben), ez a számítás felhasználható annak meghatározására, hogy mennyi extra sávszélességre van szükség a PCM-hanghoz. Például egy 44,1 kHz-en 16 bites mintavételezésű sztereó (kétcsatornás) jel esetében a bitsebességet a következőképpen kell kiszámítani (ne feledje, hogy az 1 Hz 1/másodperc, így az egységek kbit/másodperc értéket kapnak).
44,1 kHz × 16 bit × 2 = 1411,2 kbits/másodperc
Eközben a veszteséges hangtömörítési mechanizmusok, mint az AAC és az MP3, kevesebb bitet képesek átvinni (ez az egész céljuk), ezért sokkal kisebb bitsebességet használnak. Általában 96 és 320 kbps közötti értékeket használnak. Ezeknél a kodekeknél, minél nagyobb a bitrátát választja, annál több hely áll rendelkezésre az audio bitek számára mintánként, így annál jobb minőséget fog hallani az audiokódolásban.
Hangminta kodekek, mintavételi arányok és bitsebességek a való világban
Az audio CD-k, amelyek az egyik legnépszerűbb fogyasztói mechanizmus a digitális hang tárolására, 44,1 kHz (20 Hz - 20 kHz, az emberi hallási tartomány) mintavételi frekvenciát és 16 bit bites mélységet használnak. Az értékeket úgy választottuk meg, hogy a lehető legtöbb hangot lehessen beszerezni a CD-n, a jó hanghűség fenntartása mellett.
Amikor a DVD-hez és a későbbi Blu-Ray lemezekhez videó került az audióhoz, új szabvány jött létre. A DVD-k és a Blu-Rays általában lineáris PCM formátumot használnak, 48 kHz (sztereó) vagy 96 kHz (5.1 térhatású) mintavételi frekvenciával és 24 bitmélységgel. Ezeket az értékeket választották ideális választásnak, hogy a hang szinkronban legyen a és a lehető legjobb minőség elérése érdekében az e médiumokban rendelkezésre álló további lemezterületet.
Ajánlásaim
Az audio CD-k, DVD-k és Blu-Ray segítségével a cél egy kiváló minőségű program rögzített formában történő bemutatása az ismétléshez. A tapasztalat célja, hogy kiváló minőségű hangot (és videót) nyújtson anélkül, hogy különösebb aggodalomra adna okot a kapott adathordozó mérete (amennyiben az elfér a lemezen). Ezek a formátumok a lineáris PCM-et használják az általa nyújtott minőség miatt.
Ezzel szemben a mobil médiának és a streaming médiának más célja van - a lehető legkisebb bitrátát használni, miközben továbbra is fenntartja a hallgató számára elég jó hangot. Ehhez az alkalmazáshoz a tömörítéssel rendelkező algoritmusok jobb választás.
Ugyanezeket az elveket alkalmazhatja saját felvételeiben is.
Hangfelvétel készítésekor a videóddal…
Amikor csak lehetséges, a felvétel, amelyet utómunkálatokra vagy a program ISO-ként fognak használni, 48 kHz mintavételi sebességgel és a lehető legnagyobb bitmélységgel (16 vagy 24) PCM kódolást használjon a legjobb minőségű hang eléréséhez. A Pearl esetében a legmagasabb hangminőség elérése érdekében 48 kHz-es PCM kódolást javaslom.
- Tud-e edzeni és feszesíteni a kifeszített bőrt Egészségesen?
- Étrendi ajánlások Élő tölgy akupunktúra; Wellness
- A monovalens élő influenza B vakcinák keresztvédő hatékonysága genetikailag eltérő
- Súlyos ropogtatással a derék szélesebbé és egészségesebbé válik
- Canterbury anya; s 62 kg-os fogyás, miután közölték vele, hogy nem fog; 50 éven túl élek