Vezeték nélküli video adatátviteli módszer, amely többrétegű bitráta-adaptáción és hibakontrollon alapul

Absztrakt

Bevezetés

H.264 szabványos kódsebesség-szabályozási módszer

A H.264 szabvány a legújabb videokódolási szabvány. Nemcsak magas a videó tömörítési aránya, de erős hálózati affinitással is rendelkezik, és alkalmazkodni tud a különböző hálózati környezetek továbbításához. A H.264 funkciója két rétegre oszlik: Video Coding Layer (VCL) és Network Abstraction Layer (NAL). A H.264 hierarchikus felépítését az 1. ábra mutatja. Ez a fejezet a h-re összpontosít. 264 sebességszabályozási módszer, az első fejezetben egyidejűleg, a csatorna becslésének minősége, a H.264 videokódolás és a vezeték nélküli csatorna megváltoztatása alapján, a csatorna minőségének becslése szerint a videokódolás bitsebességének beállítására, hogy a kódolt videofolyam alkalmazkodni tudjon a csatornaváltásokhoz annak érdekében, hogy javuljon a video streaming továbbításának minősége. A bitsebesség-szabályozás hatékony módszer a tömörített videohálózatok alkalmazkodóképességének javítására. Jelenleg sok kutatás folyik a H.264 bitráta-szabályozási módszereivel kapcsolatban. Ez a cikk bitráta-vezérlésre osztja őket kódolási algoritmus alapján és bitráta-vezérlésre a hálózati állapot alapján abból a szempontból, hogy használni kívánják-e a hálózati állapot információit.

H.264 hierarchikus felépítés

A Lagrangian algoritmus figyelembe veszi a halmazt S = (S1, . Sk) mintaértékeinek K információforrás, ahol Sk lehet vektor vagy A skalár. Minden mintaérték Sk kódolható valamilyen kódolási mód kiválasztásával énk = (én1, . énk) a beállított kódolási módban Ok = (Ok1, . OkN). Ezért megfelel a halmaznak Sa mintaértékek közül van egy megfelelő halmaz én = (én1, . énk) kódolási minták. Tekintettel a korlátozott bitsebességre Rc, egy adott forrásminta-szekvenciához kiválasztott kódolási módnak minimalizálnia kell a torzítást a kódolás után, az (1) képlet szerint.

Az (1) képletben, D(S, én) és R(S, én) a kimeneti bitfolyam torzítási fokát és bitrátáját jelöli. Közülük a bitfolyamot kódolják és kvantálják a kódolási mód használatával én a minta kimenetére S.

A gyakorlati alkalmazásokban általában a következő képletet alkalmazzák a kódolási mód kiválasztására.

λ egyenértékben (2) a Lagrange paraméter. A mintához S és a kiválasztott kódolási mód én, a kódolási mód akkor optimális, ha a bitsebesség és a torzítási fok lineáris kombinációja van J(S, én| λ) (Lagrangian költségfüggvény) a legkisebb.

Egy minta figyelembe vétele Sk, figyelembe vehető, hogy a kódolás utáni bitsebesség és torzítási fok csak a megfelelő kódolási módhoz kapcsolódikénk, tehát a következő két képlet igaz:

Ezért mindaddig, amíg az egyes mintákhoz az optimális kódolási módot választják Sk ∈ S külön-külön a J(S, én| λ) könnyen megszerezhető a megfelelő kódolási vezérlés megvalósításához.

A hálózati kódsebesség-állapot állapota alapján a kódolt adatok a fontos mérték szerint különböző típusú keretekre vannak felosztva, attól függően, hogy az állam különböző hálózati átviteli stratégiát fogad el, ez a módszer sok megvalósítással rendelkezik, beleértve:Ba rendelkezésre álló sávszélesség mellett, RTTmondta az oda-vissza késés, PVeszteség- mondta a csomagvesztés mértéke, kállandó, attól függően, hogy milyen választ ad a fogadó végén.

Az irodalom [10] javasolta a csomagvesztés mértékét PVeszteség és a médiafolyam lejátszási sebessége Raz átviteli sebesség előrejelzésére a vevő végén lévő áramot használtuk Ra következő pillanatban a küldés végén, és összehasonlítva a jelenlegi lejátszási sebességgel Relőzményeket a küldő végén, hogy megítélhesse a csatorna minőségét, majd a kódoló QP értékét a következőképpen állítsa be (a QP kódolási paramétereket jelöl):

Minél magasabb a QP érték, annál alacsonyabb a kódolási pontosság, annál elmosódottabb a kép és annál kisebb a kimeneti bitráta; Ellenkezőleg, minél kisebb a QP érték, annál tisztább a kép és annál nagyobb a kimeneti bitráta. Ezt a módszert egyszerűsége és könnyű megvalósítása miatt széles körben tanulmányozták és alkalmazták. Az ebben a cikkben szereplő kódsebesség-szabályozási stratégia a QP értékének beállításával is megvalósul.

H.264 kódsebesség-szabályozás, rétegek közötti tervezésen alapul

Többrétegű kódsebesség-adaptációs és hibakezelési megvalósítási folyamat

A video adatfolyam dekódolásának táblázata

A cikkben szereplő bitráta-szabályozási stratégia úgy valósul meg, hogy időben megszerezzük a csatorna elérhető sávszélességét, majd dinamikusan beállítjuk a H.264 kódolási paramétert (QP). A H.264 szabvány 52 QP-értéket biztosít 0 és 51 között a kódolási folyamathoz. Ha a QP értéke 0, akkor ez a legbonyolultabb kvantálást jelenti, és a kimeneti bitráta meghaladja a 10 Mbps-ot. Amikor a QP maximális értéke 51, ez jelenti a legdurvább kvantálást, és a kimeneti bitráta 100Kbps alatt lehet. A QP minden 6 növekedése esetén a kvantálási lépés mérete megduplázódik. A gyakorlatban a megfelelő QP rugalmasan választható ki a csatorna állapotának megfelelően. A konkrét bitráta-szabályozási séma a következő:

miután a kapcsolat létrejött, a küldő vég kezdi összegyűjteni az eredeti videoadatokat, és tömöríteni (a kódoló alapértelmezett QP-értékét felhasználva, amely ebben a cikkben 23), és küld. Itt kell megemlíteni, hogy a videoszekvencia kezdeti keretének IDR-kerete nem hajt végre kódsebesség-szabályozást, mert kereten belüli kódolást alkalmaz, ami hatással van a későbbi képrekonstrukcióra. Ezután meghívásra kerül a hálózati kártya sebességszerzési funkciója a hálózati kártya átviteli sebességének megszerzéséhez RPHY, és a kezdeti értéke CS = KR ∗ RPHY és KR értéke 0,5.

beolvassa a hálózati kártya átviteli sebességét RPHY minden adatkérelem elküldése után frissítse a QP értéket a következő módszer szerint

Ha (RBitout + V + CS)

Egyébként (RBitout > CS + V)

Hol, RBitout a H.264 kódoló kimeneti kódsebessége, amelyet a kódoló közvetlenül megszerezhet; V sávszélesség-margóként van meghatározva, és az érték ebben a cikkben 0,5 Mbps. Feladata, hogy megakadályozza a QP-érték túl éles változását és a képminőség romlását. Itt a QP alsó határa 23-ra van beállítva a minimális 0 helyett, mert jó videominőség érhető el, amikor a QP 23. Nem szükséges vakon keresni a kisebb QP-értéket, és a QP-érték változása is nagy, ami szintén a kimeneti áram méretének erőszakos oszcillációját fogja okozni, és befolyásolja az átviteli hatást.

állítsa be a vevőt úgy, hogy 10 másodpercenként küldjön egy RR csomagot. A feladó megkapja az RR csomagot, és kivonja a P csomagveszteség mértékét. Állítsa be a értékét KR alábbiak szerint

Ha (P > Pa)

Egyébként (P $$ _R = _R \ ast \ bal (1+ \ alfa \ jobb) $$

Hol Pa és Pb a csomagvesztés mértékének küszöbe, és α a beállítási állandója KR. Ebben a cikkben 5% -ot, 0,5% -ot és 0,1-et veszünk. Ezen algoritmus használatával, ha a hálózati környezet viszonylag stabil és az alapul szolgáló hálózati kártya átviteli sebessége megközelítőleg állandó, akkor az RTCP visszajelzési információi automatikusan beállíthatók KR stabil értékre, így a hálózati csomagveszteség aránya viszonylag alacsony szinten marad. Amikor a csatorna rövid ideig változik, a fizikai réteg sebessége ennek megfelelően változik, és a kimeneti bitsebesség automatikusan növekszik vagy csökken, hogy alkalmazkodjon a csatorna változásához. Amikor a hálózati környezet megváltozik, például változnak a versenyképes üzleti folyamatok, az RTCP visszajelzései automatikusan beállíthatók KR. Ezért ez a több rétegű közös bitráta-szabályozási stratégia hatékonyan figyelembe veszi a rövid távú csatornaváltozásokat és a hosszú távú hálózati környezeti változásokat.

RTP csomagkapszulázási stratégia, rétegek közötti tervezésen alapul

A VCL főként a digitális videó hatékony kodekezéséért és dekódolásáért felelős, magas színvonalú, magas tömörítési arányú, robusztus, osztályozhatósági és egyéb jellemzőkkel rendelkező videokódoló adatfolyamot biztosít [5]. A NAL elsősorban a videokódoló réteg által generált videokódolt adatok különböző átviteli hálózatokba történő megfelelő leképezéséért felelős. Ahhoz, hogy a VCL által generált kódoló video bitfolyam egy meghatározott hálózatban továbbítható legyen, a NAL beágyazza a VCL kódoló adatfolyamát ehhez a hálózathoz és annak átviteli protokolljához. Ily módon a H.264 rugalmasan alkalmazhat különböző kapszulázási módszereket a különböző átviteli hálózatok számára, és javíthatja a hálózat alkalmazkodóképességét. Minden NAL egység egy nyers byte szekvencia betöltésből (RBSP) és egy NAL fejléc információ készletből áll, amely megfelel a videó kódolású adatoknak. A NAL egység szekvenciák felépítését a 3. ábra mutatja.

NAL egység sorrend

Annak érdekében, hogy a H.264 kódolású adatokat kényelmesebbé tegye a hálózati továbbítás érdekében, a legújabb RFC3984 szabvány három terhelési formátumot határoz meg a H.264 RTP kapszulázáshoz, nevezetesen egyetlen NAL egységcsomagot, összesítő csomagot és szilánkos egységet. A hálózati átvitelnél csak a H.264 kódolású adatokat kell különböző terhelési típusokba állítani a tényleges alkalmazási követelményeknek megfelelően, majd az RTP csomagfej használható hálózati továbbításra.

Az SVC réteg kivonására MGS időréteg extrakciós módszert alkalmaztunk. A CIF videoszekvenciához az SVC réteget négy DASH réteghez hozzárendelik. 720p felbontású videó esetén térképezzen 5 DASH rétegre. A létrehozott DASH működési pontok kielégítik az átlagos sebességeloszlást a legalacsonyabb és a legmagasabb szint között. Az irodalomban [1] leírt, prioritás alapú médiaszolgáltatás (PMD) módszert alkalmazzák. A puffer minden felhasználó számára 20 másodperc, a puffer előhívási ideje pedig 6 másodperc. A szimuláció során az összes DASH felhasználó egyszerre kér videót. Az LTE-ben a vezeték nélküli hozzáférési hálózat, az atomkészlet és a hálózati oldal RTT-je 50-60 ms. Figyelembe véve az internet késését, a szimulációban végpontok közötti RTT 100 ms. A TCP hatékonyan képes csökkenteni a gyakori csomagvesztést, és jó teljesítményt nyújt a vezeték nélküli hálózatban.

Összehasonlítottuk a DFSRA algoritmust jól ismert algoritmusokkal a rendszer átbocsátásának maximalizálása, a lekérdezés és az arányos tisztességes ütemezés érdekében. Eközben az irodalomban a hasznosság kapzsiság algoritmusát [8] valósítják meg, ahol a következő segédfunkciót használják:

Ez az arány konvex függvénye, ahola1, a2, a3is statikus érték. A videó és a tömörítési paraméterek különböznek, így ezek az értékek is.

Szimulációs eredmények és elemzés

A javasolt algoritmust a Quainet szimulációs eszközön szimuláltuk. Szimulálják azt a forgatókönyvet, amelyben több DASH kliens dinamikus adaptív hierarchikus videofolyamokat kér egy LTE cellában. CIF videoszekvenciát kémiai sebességgel (1. konfiguráció) és 720p HD videót használtunk nagy sebességgel (2. konfiguráció).

A szimuláció beállítása

A H.264JSVM szoftvert a CIF „News” és „Foreman” videók kódolására használják. Adaptív makróblokk réteg előrejelzés és CABAC kódolás van telepítve. A videó 300 képkockát tartalmaz, az első 240 képkockát HASZNÁLJA, és 10 alkalommal megismétli a videót. A „Foreman” videó egy hosszú videósorozat, amely az első 2400 képkockát 25 képkocka/másodperces képsebességgel használja. A GoP értéke 16. Minden videó szegmens 3 GoP-t tartalmaz. Az alapréteg és az emelőréteg kvantálási paramétereit 40-nek, illetve 28-nak választottuk. Az MGS súlyértékét A-ra állítjuk. A javító réteg 4 MGS rétegbe és 5 időrétegbe van kódolva, és összesen 20 MGS réteget tartalmaz. A videót H.264 referencia szoftver kódolta a szimulációban. A videó tömörítési jellemzőit az 1. táblázat mutatja.

Az értékelési index

A következő QoE indexet használják az átviteli hatás értékelésére. Nagy hatékonyság: A PSNR-t a videó minőségének és magas hatékonyságának értékelésére használják. Lejátszási stabilitás: a lejátszás stabilitásának méréséhez használja a következő indikátorokat.

Közülük a második rész az instabilitási index, a \ (_i ^ \) pedig az én Forgács. A súlyfüggvény történetesen az ϖ(d) = én - d több büntetés a legutóbbi kamatváltozásokért. Pufferszint: A DASH klienseknek elegendő adatot kell letölteniük a megszakítás elkerülése érdekében. Túl sok adat letöltésével kerülje el a hálózati sávszélesség pazarlását is. A játék folytonossága: a fő játék figyelembe veszi a lejátszási határidőt meghaladó darabok számát és az egyes játékleállások hosszát. A megszakítás valószínűségét a megszakítások számának és a teljes játékidőnek a hányadosa adja meg. Tisztesség: a tisztességet az ugyanazt a videót néző különböző felhasználók PSNR-különbségével mérjük.

Szimulációs eredmények és elemzés

Először a javasolt leképezési módszert szimulálják SVC-től DASH-ig. Az SVC rétegtől a DASH rétegig tartó megfelelő módszert térképészeti módszernek nevezzük, amely a feltérképezési módszer javaslatának speciális esetének is tekinthető. A szimuláció során az összes felhasználó 250-350 m-re helyezkedik el a bázisállomástól. A szimuláció ezen része az alapértelmezett PF ütemezési algoritmust használja. A javasolt módszer 50% -kal csökkentheti az üzenet fejlécének általános költségeit. A CIF videó esetében a javasolt módszer legalább 50% -kal, a HD videó pedig legalább 240 kbps-mal növelheti az átviteli sebességet. A felhasználók számának csökkenésével a növekedés nagyobb lesz. Az 1. konfigurációban a felhasználók száma 12; a 2. konfigurációban a felhasználók száma 22 (lásd 4. ábra). Ha a 7 T kisebb, jobb lejátszási minőség érhető el, de a stabilitás gyenge. Azt is láthatja, hogy minél nagyobb a halál, annál nagyobb a puffer. Ez azért van, mert a DPBS jövőbeli darabolt adatblokkokat kér, amikor az aktuális kérelmet instabilnak tartja.

Az egyensúly a hatékonyság és a stabilitás között