吳 偉,卿粼波,王正勇,楊 紅
(四川大學 電子信息學院 圖像信息研究所,四川 成都 610065)
DVC轉碼技術研究
吳 偉,卿粼波,王正勇,楊 紅
(四川大學 電子信息學院 圖像信息研究所,四川 成都 610065)
介紹了分布式視頻編碼(DVC)到傳統視頻轉碼的方案,該轉碼方案適用于移動終端設備之間的視頻通信。著重講述了DVC到H.264的轉碼,針對轉碼過程中復雜度高和時延長等問題,利用DVC解碼端生成的運動矢量來減少H.264編碼的工作量,在幾乎不影響視頻質量的前提下,極大地降低了轉碼的計算復雜度和時間,提高了轉碼效率。同時介紹了DVC轉到其他傳統視頻的方法和方案,最后分析了DVC轉碼在當前移動視頻通信市場中存在的巨大潛能,以及對轉碼技術的未來發展和方向進行了展望。
DVC;H.264;轉碼;移動視頻通信
1.1 DVC的發展
隨著數字視頻的廣泛應用,移動通信設備已由單純的文字或語音通信向多媒體視頻通信發展。尤其是現在4G技術的普及,各種手持移動設備之間的視頻通信日趨頻繁。通常這些終端設備因能耗資源和編碼處理能力有限,而又要保證具有良好的抗誤碼性和壓縮效率,因此要求視頻編碼器簡單易實現。傳統的視頻編碼方案如MPEG、H.26X因需要在編碼端做大量的運動估計,以達到視頻壓縮的目的,編碼端復雜度遠高于解碼端,而無法達到這一要求。于是,分布式視頻編碼(Distributed Video Coding,DVC)技術近年來被提出并得到廣泛研究。在DVC方案中,對視頻間的相關性的挖掘與利用從編碼端被轉移到解碼端,使得各視頻幀獨立編碼,并通過聯合解碼重建視頻序列,將編碼端的復雜度轉移到解碼端,因此對于需要編碼復雜度較低的無線視頻場合適用性很強。而現在手持移動終端設備直接端對端相互視頻通信(如手機和手機之間),編碼端和解碼端都需要達到低復雜度、低成本和低功耗的要求。因此從DVC到傳統視頻的轉碼技術應運而生,對終端設備而言,發送方和接收方都只需進行低復雜度的編碼與解碼計算。
DVC轉碼是在2005年首次被提出[1],但當時只介紹DVC應用于轉碼方面的前景,并沒有在上面做實際工作,2008年則最先實現了從DVC到H.263視頻轉碼的策略[2]。DVC到傳統視頻的轉碼應用于手持移動終端設備之間視頻通信的構架如圖1所示。

圖1 應用于手機之間通信的DVC轉碼
由于DVC與傳統視頻編碼具有互補性,在基站安放一個視頻轉碼器,可以實現在手機終端進行低復雜度編解碼。該轉碼器負責接收DVC視頻流,并對其進行轉換編碼以生成H.26X或者MPEG-X視頻流,接收端將收到的H.26X或者MPEG-X視頻流按照傳統方式進行解碼,最終得到所要的視頻信息。
圖1提供了一個方案,其中發送端和接收端都執行較低復雜度的算法,而把大量復雜工作留給中間作為轉碼器的網絡中心結點。理論上,轉碼器擁有大量資源且沒有電量的限制,不用擔心功耗等問題,但在實際應用中,為了DVC到傳統視頻能實時有效的傳輸,需要對轉碼器執行過程做簡單有效的處理。近年來,國內外學者提出了一些DVC到不同傳統視頻格式[3-5]之間的轉碼,包括H.263、H.264、SVC、AVS、VC-1等。雖然所轉格式不同,但快速轉碼基本思想都是利用DVC解碼端生成的運動矢量加速傳統視頻的編碼,且其基本算法核心都相似。當前主流視頻格式依然是H.264,并且從DVC轉到H.264方案研究甚廣且具有代表性,因此本文主要介紹從DVC到H.264轉碼的基本思想和方法。
1.2 DVC技術要點
分布式視頻編碼理論基于兩大信息理論的,即Slepian-Wolf[6]的理論和Wyner-Ziv理論[7]。這兩個理論指出:利用獨立編碼、聯合解碼的方法對兩個統計相關信源進行壓縮,可以達到與傳統聯合編解碼方法相同的壓縮效率。圖2是分布式視頻編碼系統框圖。其中,編碼端將視頻序列按一定間隔交替劃分為關鍵幀(K幀)和Wyner-Ziv幀(WZ幀),兩種幀交替的間隔由參數GOP(Group of Pictures)指定。其中關鍵幀K幀與傳統視頻編碼中的幀內編碼模式相同,碼流直接傳輸到解碼端。而WZ幀則采用Wyner-Ziv編碼模式,首先將像素域的視頻幀轉換到變換域,常采用的算法是離散余弦變換(Discrete Cosine Transform,DCT),對變換后的數據進行量化,然后經過信道編碼產生校驗位。解碼端先解碼接收到的K幀編碼的碼流,然后將其作為參考幀對WZ幀做邊信息估計。將獲得的邊信息也進行和編碼端相同的DCT變換、量化作為信息位,使用編碼端傳輸過來的校驗位對其進行糾錯解碼。最后對解碼重構后的序列進行IDCT(Inverse DCT)變換獲得最終的重建WZ幀。

圖2 DVC編解碼系統
在該系統中,編碼只進行計算復雜度較低的幀內編碼和信道編碼,而解碼器需要進行幀內解碼、邊信息產生、信道解碼和WZ幀重建。其中,邊信息的產生算法較為復雜,因此該系統編碼端的復雜度要遠低于解碼端。
1.3 H.264技術要點
H.264是目前廣泛應用的數字視頻壓縮標準,其編碼器的功能組成見圖3。從圖3可見, H.264和以前的傳統視頻編碼(如H.261、H.263、MPEG-1、MPEG-4)在大體框架上并沒有什么區別,主要不同是對功能塊的細節方面做了一些改進。

圖3 H.264編碼系統
在H.264視頻編碼中,運動估計計算量最復雜,需要的時間也最長。H.264通過運動估計從之前已編碼的幀中獲得當前編碼塊的預測值。用當前編碼塊的像素值減去其預測值,得到預測殘差,然后對殘差進行編碼,去除了視頻序列間的冗余度實現了對數據的壓縮。其中運動估計過程占據了H.264整個壓縮編碼過程的大約60%~70%[8]。因此如何在確保壓縮圖像質量的前提下,盡可能降低運動估計的復雜度一直是H.264研究的重點和難點。
DVC到H.264視頻的的轉碼框架如圖5所示,DVC解碼是轉碼器的一部分。為了避免轉碼器第二部分即H.264編碼工作的繁重,轉碼器利用DVC解碼生成邊信息過程所獲得的運動矢量來加速H.264的編碼。

圖5 DVC到H.264視頻轉碼器
邊信息生成是DVC解碼端的一部分,它是DVC快速轉碼的中間橋梁,起著至關重要的作用。一般邊信息生成方案有運動補償外推[9],運動補償時域內插[10],基于哈希碼(Hash)時域邊信息生成[11]等算法。MCTI因為利用前后關鍵幀進行預測補償生成邊信息,效果較好,并且運用MCTI生成的運動矢量能在轉碼中直接為傳統視頻編碼提供幫助,因此轉碼中DVC解碼端邊信息生成采用MCTI,具體模型如圖4所示。設需要建立的邊信息幀為Yi,已知其前后相鄰的關鍵幀為Xi-t1和Xi+t2,其中t1和t2表示已知幀與邊信息之間的時間距離。

圖4 基于MCTI邊信息生成
在該算法中,先對后向關鍵幀中的每個分塊在前向關鍵幀中進行運動搜索,得到最佳匹配塊后獲得后向運動矢量MVb,進而得到插值值對應塊的后向運動矢量,有了差值幀每一塊的運動矢量,通過運動補償可以得到一個差值幀Xb,其中尋找最佳匹配塊時,運用絕對誤差和公式
(1)
式中:B代表M×N宏塊,(dx,dy)為運動矢量,fn和fn-1分別為當前幀和前一幀的灰度值。同理對前向關鍵幀做同樣的計算獲得前向運動矢量MVf,然后得到差值幀xf,有了前向運動矢量和后向運動矢量分別對應的補償得到的差值幀后,該算法中假設運動是均勻的,因此中間邊信息幀的計算方式為
(2)
2.1 運動矢量映射
在DVC視頻編碼中,視頻序列分為K幀和WZ幀,而傳統視頻編碼如H.264通常分I幀,P幀和B幀。分布式視頻編碼與傳統視頻編碼幀的編碼方式不同,GOP也不同,因此轉碼工作首先要解決的就是DVC到H.264視頻幀之間的映射和GOP的映射方式。一般傳統視頻編碼的GOP可以和DVC相等,也可以是DVC的若干倍[13]。DVC中K幀利用傳統視頻編碼進行幀內編解碼,它與H.264編碼的I幀一致,因此轉碼時DVC的K幀直接轉到H.264的I幀,不做任何處理。
2.1.1 P幀的映射
根據前文可知,在DVC解碼生成邊信息時會做大量的運動估計,以尋找當前幀各塊的最佳匹配塊而獲得最優的運動矢量。當DVC的GOP大于2時,前后參考幀的間距將大于1,而此時產生的運動矢量將不適用于H.264編碼階段,因為參考幀距離較大時所獲得的運動矢量若用于轉碼器第二部分(H.264編碼)將不夠精確,轉碼盡量要選取上一階段最好的運動矢量。圖6描述了DVC的GOP為4時轉到H.264的GOP為IPPP形式P幀映射的范例[12-20]。

圖6 DVC GOP 4到H.264 GOP IPPP的映射

最后,H.264 GOP為IPPP,P幀與參考幀的間距都為1,而第二步運動矢量都是在間距為2的情況下生成的,因此將得到的矢量V0-2和V2-4各取1/2對應到H.264 P幀的編碼。對于DVC GOP更大的轉到H.264 I11P形式同樣適用,只不過是保存DVC最后解碼階段(即參考幀間距為2)所生成的運動矢量,來幫助轉碼時H.264中P幀的編碼。
2.1.2 B幀的映射
H.264的B幀是雙向預測幀,B幀是同時根據前面和后面的參考幀進行編碼的幀,也是運用運動補償預測技術來完成編碼,其壓縮效果更佳。B幀的映射方式和P幀類似,如圖7所示。圖7介紹了DVC GOP為4時轉到H.264 GOP 為IBIB的大致流程[14,20]。前面兩步和2.1.1節一樣,只不過最后在H.264編碼階段有所不同。因為B幀是雙向預測幀,它需要同時借助前后參考幀編碼,因此前后預測都需要利用DVC最后階段生成的運動矢量。

圖7 DVC GOP為4到H.264 GOP IBIB
2.1.3 P幀和B幀的混合映射
上文分別介紹了P幀和B幀的映射,但實際視頻編碼中P幀和B幀混合的情況居多,性能也較好[14,17-18,20]。圖8展示了DVC GOP為4轉到H.264 GOP為IBBP的范例。

圖8 DVC GOP為4到H.264 GOP IBBP
在此情況下,前面兩步同2.1.1節,H.264編碼時,先利用已解碼的I幀來編碼P3,P3是前向預測幀,離參考幀I0的距離為3,而DVC解碼端兩幀之間做運動估計時距離為2,因此獲得的運動矢量V2-4需要乘以1.5才可以適用于P3幀的編碼。然后編碼B1幀,B1幀是雙向預測幀,需要借助前后參考幀編碼。B1與前向參考幀I0的距離為1,因此需要將DVC解碼端生成的運動矢量V0-2乘以0.5做為B1幀前向運動矢量,而B1與后向參考幀的距離為2,可以直接借用V0-2做為B1幀后向運動矢量來編碼。同理,編碼B2幀時,V0-2乘以0.5作為B2幀后向運動矢量,直接借用V0-2作為B2幀前向運動矢量。
在文獻[2,21-22]中的WZ幀映射到P幀和B幀時,DVC端邊信息生成依舊運用MCTI,不同的是它保存了DVC解碼端每一步生成的運動矢量,在H.264編碼時根據編碼幀與參考幀的間隔與DVC端生成運動矢量的間隔的比例設置權重因子,然后將運動矢量乘以權重因子就是H.264編碼幀對應每一塊的運動矢量,并且在編碼B幀時同時分別利用了DVC解碼端生成的前向運動矢量和后向運動矢量。最后將H.264得到的運動矢量進行優化處理,在視頻質量下降很小的情況下大大增加轉碼的效率。
2.2 減小運動估計搜索范圍
H.264視頻編碼復雜度高的主要原因是編碼端要做大量的運動估計,因為需要尋找當前塊的最佳匹配塊,而對于物體運動量大的,所搜索的范圍將增大,計算復雜度和所花費的時間也將增加。為了減少運動估計的工作量,可以利用DVC解碼端生成邊信息所做的運動估計來減少H.264定位最佳匹配塊的時間。實際工作就是根據DVC解碼端已有的運動矢量,靈活地減少H.264編碼時運動估計的搜索范圍[13-18,20,23-24]。減小搜索范圍將作用于H.264每個宏塊和子宏塊。具體原理如下
A={(x,y)/(x,y)∈(T∩R)}
(3)
式中:A定義的是轉碼器中H.264運動估計需要搜索的范圍;(x,y)是運動估計候選區域;T是H.264單獨編碼時運動估計所需要搜索的范圍;R是轉碼過程中借助DVC解碼端所做運動估計而H.264可以不必搜索的范圍,R的搜索范圍定義為
(4)
(5)
(6)
在式(5)和式(6)中,運動矢量來自DVC解碼端生成的運動矢量(MVx和MVy),各自取運動矢量的二分之一,它們的權重為d,d代表著參考幀的間距(即H.264編碼時當前幀和參考幀的間隔)。另外,為了避免運動估計搜索范圍太小引起轉碼后視頻質量的下降,在這里設置了最小運動估計搜索范圍L。可以綜合考慮轉碼的時間和質量,適當調整L的大小,一般在轉碼視頻PSNR和碼率幾乎不變的情況下可以提高一半的時間。
2.3 模式選擇
在H.264編碼標準中,支持7種不同塊大小的幀間編碼模式。每個宏塊可按照16×16,16×8,8×16,8×8進行分割,如果選擇8×8塊模式,還可按照8×8,8×4,4×8,4×4進行亞分割。圖9直觀地顯示了這7種模式。另外,幀間編碼還采用了直接拷貝模式SKIP和幀內預測模式[25]。當使用率失真優化(RDO)時,需要通過遍歷所有的模式比較已選取RD代價最小的模式[26],雖然編碼效果好,但計算量大耗時長。而在DVC轉碼中,可以運用DVC解碼端已獲得的信息來幫助H.264選擇需要編碼塊的大小,在轉碼視頻質量幾乎不變的情況下,可以大大降低H.264編碼復雜度,即降低轉碼的復雜度,提高轉碼的效率[29]。

圖9 幀間宏塊模式
一般而言,視頻序列運動緩慢或平坦區域一般選擇幀間編碼的幀間模塊(例如16×16,16×8或8×16)或者選擇直接拷貝模式SKIP。另一方面,如果是紋理精細復雜或者是運動劇烈的圖像就選擇比較小的模塊(如4×4)甚至選擇幀內預測模式。
通常用絕對誤差和SAD來判斷相鄰兩幀的相似程度,SAD越大,相鄰兩幀的相似程度越小,說明運動越劇烈;SAD越小,相鄰兩幀的相似性越高,運動越緩慢。在轉碼器中,SAD不需要在H.264編碼時計算,SAD的計算在DVC解碼端運動估計尋找最佳矢量時已經完成,因此只需要對SAD數據進行保存傳遞到H.264編碼時直接利用,來決定H.264編碼時的最佳MV模塊。
一般,SAD值很大時H.264編碼會選擇幀內預測模式,但在有些情況中SAD很大,選擇幀間模式效果反而更好。例如,均勻快速運動中的物體對應的塊會導致SAD變得很大,這種情況,最好模式仍然是幀間模式編碼。因此,需要另外的參數來決定圖像中宏塊的相關性,即運動矢量的大小。
DVC解碼端邊信息實際上是對WZ幀的預測,如果圖像紋理比較平坦或圖像變化緩慢,生成的邊信息也就越好,與WZ幀相似度也就越高,解碼重建WZ幀時邊信息落入WZ幀量化索引值對應的區間內的概率就越大。根據研究發現,邊信息沒有落入解碼后WZ幀量化索引值對應的區間時,所對應的塊的運動劇烈,生成的邊信息的質量較差,因此在轉碼過程中H.264編碼時一般選擇4×4或者幀內模式。
H.264編碼塊模式選擇本質上說是一個決策樹的問題,因此可以根據DVC解碼過程中得到的信息:SAD的值,運動矢量的大小,邊信息落入量化區間的數量3個參數對編碼模式選擇的分塊大小做出選擇。其中模式選擇的閾值確定是最為重要的,為了更準確地劃分決策樹中的閾值,文獻[23-24,27-29]采用了WEKA[30]數據挖掘工具,采用機器學習的方法,輸入大量的訓練數據,得出最好的模式選擇決策樹。WEKA工具的數據序列輸入采用ARFF文件格式,采用ASCII碼,每行為一組訓練數據,包括該次訓練結果以及一系列相關屬性[31]。通過機器學習的方法實現了DVC到H.264的快速轉碼。得到的決策樹如圖10所示。

圖10 模式決策樹結構
第1層,分為低復雜度的模塊和高復雜度的模塊。低復雜度模塊包括{SKIP塊,16×16,16×8,8×16},高復雜的模塊包括{8×8,8×4,4×8,4×4和幀內塊}。
第2層,將上一層低復雜度的模塊又分為兩個分支,即{SKIP,16×16}和{16×8,8×16}。將高復雜度的分支也分為兩個分支,即{8×8,8×4和4×8}和{4×4和幀內塊}。
第3層,繼續將{8×8,8×4和4×8}分為兩個分支:{8×8-4×4DCT,8×8-8×8DCT}和{8×4,4×8}。
在轉碼過程中,將編碼塊按尺寸大小分層做出模式選擇,H.264編碼時可以直接選擇編碼塊的大小,避免了各個大小的塊逐一編碼,與全解全編的轉碼器相比,大大提高了轉碼器的工作效率,且基本保持了原有視頻的質量。尤其對運動宏塊較多,但是運動宏塊包含的細節較少的視頻序列有更好的表現。
文獻[12]提出了一種利用GPU(圖像處理單元)強大的并行計算能力來加速視頻轉碼的算法,在開發GPU通用計算能力的時候,采用NVIDIA公司的CUDA(統一計算設備架構)計算平臺,該算法將視頻轉碼過程中耗時最多、最復雜的運動估計過程轉移到GPU上并行執行,為DVC的轉碼提供了一個新的途徑。文獻[14]測試了DVC在VBR和CBR兩種情況下轉碼到H.264結果,在不同指標下獲得了良好的結果,為DVC在轉碼過程中碼率控制方面提供了新的參考。文獻[15,17]都分別介紹了在轉碼器第一部分(即DVC解碼)來減少轉碼所需要的時間,利用現在計算機資源豐富的多核并行計算來進行DVC解碼,大大降低了DVC解碼所需要的時間,并且可以同時在轉碼器第二部分(H.264編碼)利用DVC解碼獲得的信息進行H.264的快速編碼,實現了整個轉碼器快速轉碼的需求。文獻[19]根據H.264編碼時宏塊的分塊尺寸大小與DVC解碼端邊信息的殘差分布具有很高相關性這一特點,實現了快速的模式選擇編碼算法,在與利用減小運動估計搜索范圍算法融合的情況下,使轉碼時間提高了大約93%。文獻[16,18,20]中介紹了從DVC轉到SVC(可伸縮視頻編碼)的策略,可伸縮視頻編碼有效地解決了之前編碼標準輸出碼流的不靈活性,DVC轉到SVC后,可以適應多種不同信道,使實際應用更加廣泛。文獻[32]實現了從DVC到VC-1的轉碼,提出了最佳矢量匹配選擇(Best Matched Vector Selection,BMVS)算法,BMVS運用了多個參考幀做運動估計,來選擇最佳的運動矢量,突破了以往快速轉碼中為借用DVC運動矢量,都只采用單個參考幀的局限。文獻[33]首次將DVC到傳統視頻的轉碼過程放在云端進行實現,結合了當前熱門的云計算,將DVC的轉碼和云計算有機結合,為DVC轉碼提供了更廣闊的空間。文獻[34]實現了DVC到AVS的轉碼,AVS是國內具備自主知識產權的第二代信源編碼標準,也是數字音視頻產業的共性基礎標準。
隨著人們視頻通信的需要,客戶終端設備在趨向于無線化、便攜式方向發展的同時,也要求其具有對視頻信號進行實時編碼、傳輸等功能。而客戶終端的計算能力和存儲容量等資源又十分有限,因此如何實現終端設備視頻編解碼低復雜度算法一直備受關注,DVC轉碼技術的出現正好解決了這一問題,它綜合了DVC編碼端簡單和傳統視頻編碼技術解碼端簡單的優點,使發送端和接受端都只處理簡單的過程,而將復雜的轉碼過程留給擁有強大計算和存儲能力的網絡中心結點,在手機與手機相互之間視頻通信具有非常廣闊的市場。因此DVC轉碼將是下一階段研究的熱門技術。本文詳細介紹了DVC主要的幾種快速轉碼技術以及DVC其他轉碼方法和方案。就目前來看,DVC快速轉碼還有待深入研究的方面有:
1)DVC到傳統視頻的快速轉碼矢量映射時,P幀和B幀分別只用了單個和前后兩個參考幀進行編碼。而實際傳統視頻編碼中P幀和B幀都可以借用已解碼的多幀進行編碼,這樣解碼圖像效果將更佳。因此對于轉碼中傳統視頻編碼在借用DVC端運動矢量時選擇多參考幀將是下一步研究的方向。
2)DVC轉到其他傳統視頻格式都有良好的實現,目前主要是轉到H.264,還沒有轉到HEVC的,而現在HEVC日趨成熟,在保證相同視頻質量的前提下,HEVC的壓縮率相比H.264提高了一倍左右,大有取代H.264之勢。因此如何實現DVC到HEVC的轉碼還亟待探討。
3)當前,云計算技術已經在互聯網領域得到廣泛應用并成為最熱門技術之一。基于云計算平臺的其他視頻轉碼技術也有提及[35-36],云計算以其高效快速可擴展性強的特點,能為轉碼提供可靠的平臺和空間。因此如何將DVC轉碼和云計算具體結合的應用研究是下一階段研究的熱點和難點。
[1] GIROD B,AARON A,RANE S,et al.Distributed video coding[J].Proceedings of the IEEE,2005,93(1):71-83.
[2] PEIXOTO E,QUEIROZ R L,MUKHERJEE D. Mobile video communications using a Wyner-Ziv transcoder[EB/OL].[2013-12-12].http://image.unb.br/queiroz/papers/vcip_2008_transcoder.pdf.
[3] SCHWARZ H,MARPE D,WIEGAND T. Overview of the scalable video coding extension of the H. 264/AVC standard[J]. IEEE Trans. Circuits and Systems for Video Technology,2007,17(9):1103-1120.
[4] GB/T 20090.2—2006,Information technology-advanced audio and video coding standard:video[S].2006.
[5] KALVA H,LEE J B. The VC-1 video coding standard[J].IEEEMultiMedia,2007,14(4):88-91.
[6] SLEPIAN D,WOLF J. Noiseless coding of correlated information sources[J].IEEE Trans. Inform Theory,1973,19(4):471-480.
[7] WYNER A,ZIV J. The rate-distortion function for source coding with side information at thedecoder [J].IEEE Trans. Information Theory,1976,22(1):1-10.
[8] 殷國炯,薛永林.MPEG-2到H.264轉碼的快速模式選擇算法[J].電視技術,2010,34(1):26-29.
[9] NATáRIO L,BRITES C,ASCENSO J.Visual content processing and representation[M].[S.l.]:Springer Berlin Heidelberg,2006.
[10] WONG C K,OSCAR C A.Fast motion compensated temporal interpolation for video[C]//Proc. SPIE.[S.l.]:SPIE Press,1995:1108-1118.
[11] TOAN N D,GUEESANG L,JUNE Y C. Side information generation using extra information in distributed video coding[C]//IEEE International Symposium on Signal Processing and Information Technology.[S.l.]:IEEE Press,2007:138-143.
[12] CORRALES-GARCíA A,RODRíGUEZ-SáNCHEZ R,MARTíNEZ J L,et al. Hybrid Artificial Intelligence Systems[M].[S.l.]:Springer Berlin Heidelberg,2010.
[13] CORRALES-GARCIA A,FERNANDEZ-ESCRIBANO G,QUILES F J. Mapping GOPS in an improved DVC to H. 264 video transcoder[C]//Proc. Advanced Concepts for Intelligent Vision Systems.[S.l.]:Springer Berlin Heidelberg,2010:22-33.
[14] CORRALES-GARCíA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Variable and constant bitrate in a DVC to H. 264/AVC transcoder[J]. Signal Processing:Image Communication,2011,26(6):310-323.
[15] CORRALES-GARCIA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G. Efficient mobile-to-mobile video communications using a multicore transcoder[C]//Proc. Mobile Multimedia Communications.[S.l.]:Springer Berlin Heidelberg,2012:74-87.
[16] CORRALES-GARCIA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Scalable mobile-to-mobile video communications based on an improved WZ-to-SVC transcoder[M]. [S.l.]:Springer Berlin Heidelberg,2012.
[17] GARCIAAC,ESCRIBANOGF,MARTINEZJL,et al. Mobile video communications based on fast DVC to H. 264 transcoding[EB/OL].[2014-10-10]. http://cdn.intechopen.com/pdfs-wm/33731.pdf.
[18] CORRALES-GARCíA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Temporal scalable mobile video communications based on an improved WZ-to-SVC transcoder[J]. EURASIP Journal on Advances in Signal Processing,2013,2013(1):1-10.
[19] CORRALES-GARCíA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Wyner-Ziv to baseline H. 264 video transcoder[J]. EURASIP Journal on Advances in Signal Processing,2012,2012(1):1-19.
[20] CORRALES-GARCíA A,RODRíGUEZ-SáNCHEZ R,MARTíNEZ J L,et al. Multimedia Communications Using a Fast and Flexible DVC to H. 264/AVC/SVC Transcoder[J]. Journal of Signal Processing Systems,2015,79(3):211-232.
[21] PEIXOTO E,DE QUEIROZ R L,MUKHERJEE D. Mapping motion vectors for Awyner-Ziv video transcoder[C]//Proc. 2009 16th IEEE International Conference onImage Processing. [S.l.]:IEEE Press,2009:3681-3684.
[22] PEIXOTO E, QUEIROZ R L,MUKHERJEE D. A Wyner-Ziv video transcoder[J].IEEE Trans. Circuits and Systems for Video Technology,2010,20(2):189-200.
[23] MARTINEZ J L,KALVA H,FERNANDEZ-ESCRIBANO G,et al. Wyner-Ziv to H. 264 video transcoder[C]//Proc. 2009 16th IEEE International Conference onImage Processing. [S.l.]:IEEE Press,2009:2941-2944.
[24] MARTINEZ J L,KALVA H,FERNANDO W A C,et al. Effiecient WZ-to-H264 transcoding using motion vector information sharing[C]//Proc.IEEE International Conference onMultimedia and Expo.[S.l.]:IEEE Press,2009:1394-1397.
[25] 廖婷,許潔斌,丁月華. H. 264 快速幀間塊模式選擇算法的研究[J].電視技術,2006,30(11):16-18.
[26] ZHOU Z,SUN S J,LEI S M,et al. Motion information and coding mode reuse for MPEG-2 to H.264 transcoding[C]//Proc.IEEE ISCAS. Kobe,Japan:IEEE Press,2005:1230-1233.
[27] MARTINEZ J L,FERNANDEZ-ESCRIBANO G,KALVA H,et al. Wyner-Ziv to H. 264 video transcoder for mobile telephony[C]//Proc.Digest of Technical Papers International Conference on Consumer Electronics.[S.l.]:IEEE Press,2009:1-2.
[28] MARTíNEZ J L,CORRALES-GARCíA A,CUENCA P,et al. Advances in Computational Intelligence[M].[S.l.]:Springer Berlin Heidelberg,2011.
[29] MARTINEZ J L,FERNANDEZ-ESCRIBANO G,KALVA H,et al. Wyner-Ziv to H. 264 video transcoder for low cost video encoding[J].IEEE Trans. Consumer Electronics,2009,55(3):1453-1461.
[30] WITTEN IH,FRANK E.Data mining:practical machine learning tools and techniques[M]. 2nd Ed.[S.l.]:Morgan Kaufmann,2005.
[31] FERNáNDEZ-ESCRIBANO G,KALVA H,CUENCA P,et al. A fast MB mode decision algorithm for MPEG-2 to H. 264 P-frame transcoding[J]. IEEE Trans.Circuits and Systems for Video Technology,2008,18(2):172-185.
[32] LEE J Y,HAN J K,SIM D G. Efficient motion vector selection and mode decision schemes for transcoder between DVC and VC-1[J]. IEEE Trans.Consumer Electronics,2012,58(3):905-911.
[33] 張剛止,陳柏翰,李昌明.基于云端運算DVC到SVC快速轉碼系統[J].International Journal of Science and Engineering,2014,4(2):63-66.
[34] YI A,LIU X,FAN X,et al.Advances in Multimedia Information Processing-PCM 2010[M].[S.l.]:Springer Berlin Heidelberg,2011.
[35] 包盛,段保通,邵鋒軍. 三網融合下基于云計算的實時轉碼技術研究和應用[J]. 電信科學,2011,27(3):12-16.
[36] 張浩,孫淑霞. Hadoop 云計算平臺在視頻轉碼上的應用[J].電腦與電信,2012(12):36-37.
吳 偉(1990— ),碩士生,主研圖像通信、視頻編碼;
卿粼波(1982— ),副教授,主要研究方向為圖像處理、模式識別、多媒體通信;
王正勇(1969— ),碩士生導師,主要研究方向圖像處理、模式識別、多媒體通信;
楊 紅(1983— ),女,博士生,主研圖像通信、視頻編碼。
責任編輯:許 盈
Research of DVC Transcoding Technology
WU Wei, QING Linbo, WANG Zhengyong,YANG Hong
(ImageInformationInstitute,SchoolofElectronicsandInformationEngineering,SichuanUniversity,Chengdu610065,China)
Some typical transcoding techniques from DVC(distributed video coding) to traditional video coding are introduced in this paper, these techniques are well suited for mobile to mobile communication. Especially, the transcoding techniques from DVC to H.264 are introduced in detail, in which the high complexity and long delay for transcoding process is one of the most tough issues. To solve it, the motion vector generated in DVC decoding is made full use to reduce H.264 encoding workload.In this algorithm, the encoding time is decreased and the computational complexity of the transcoder is reduced, which could improve transcoding efficiency under the premise of scarcely affect video quality. In addition, the transcoding methods and programs from DVC to other traditional video coding are also introduced. Furthermore, the application potentials of DVC transcoding in the currently mobile video communications are analyzed. Finally, the challenges and development directions in this filed are pointed out in this paper.
DVC; H.264; transcoding; mobile video communications
國家自然科學基金項目(61201388);高等學校博士學科點專項科研基金項目(20110181120009)
TN919.81
A
10.16280/j.videoe.2015.19.018
2014-11-19
【本文獻信息】吳偉,卿粼波,王正勇,等.DVC轉碼技術研究[J].電視技術,2015,39(19).