鄭州電視臺 夏 晶
視頻信息傳輸中MPEG-2格式分析
鄭州電視臺 夏 晶
當今社會是一個數字信息化社會,數字信息化的一個主要特征就是數字多媒體技術的廣泛應用。多媒體的數字化和網絡化,將數字媒體信息傳播到世界的每個角落,改變了人類接受信息的傳統方式和途徑,打破了人與人之間的時空界限,進而改進了人們的學習、工作和生活方式。隨著信息技術的發展,多媒體技術越來越成為研究熱點。而且人們接觸到的多媒體內容日益豐富,包括文字、聲音圖像和數據,這些多媒體內容擁有龐大的數據量,對通信系統的帶寬和存儲空間提出了較高的要求。尤其是視頻圖像的傳輸,與文字與圖像傳輸相比,視頻圖像具有更加直觀和更加高效的特點,因此,視頻圖像的傳輸問題成為多媒體技術在實際應用中的關鍵問題。
國際范圍內,為了滿足多媒體信息的壓縮要求,在經過了30多年的不懈努力后,視頻壓縮技術已經取得了巨大的成就,適用于不同應用領域的國際編碼標準便應運而生。如靜止圖像的編碼標準JPEG、視頻編碼標準H.264、H.263和活動圖像的編碼標準MPEG-1、MPEG-2和MPEG-4等,而MPEG-7、MPEG-21也正在研究中。這些標準極大地促進了視頻編碼技術的發展。特別是在網絡、計算機和通信方面的發展,對視頻通信業務和視頻壓縮技術提出了新的要求,在保證更好的視頻質量和更高壓縮的同時,對視頻傳輸、碼率控制等方面也提出了更高的要求。
針對視頻傳輸問題,許多研究者提出了不同的壓縮編碼方法,采用控制策略來解決遠程傳輸時的網絡阻塞、信道帶寬限制。比較典型的如H.263的TMN8的碼率控制算法以及H.264JM中的碼率控制算法,其中廣泛使用的是MPEG-2的TM5算法。
1.MPEG-2的設計初衷是為廣播級電視質量(CCIR6601格式)的視音頻信號定義壓縮編碼標準。但最終結果是成為了一個通用的標準,能在很大范圍內對不同分辨率和不同輸出比特率的圖像信號進行有效編碼。MPEG組織于1994年推出MPEG-2壓縮標準,以實現視/音頻服務與應用互操作的可能性。MPEG-2標準是針對標準數字電視和高清晰度電視在各種應用下的壓縮方案和系統層的詳細規定的。MPEG-2不是MPEG-1的簡單升級,而是在系統和傳送方面作了更加詳細的規定和進一步的完善。MPEG-2特別適用于廣播級數字電視的編碼和傳送,被認定為SDTV和HDTV的標準編碼。
2.MPEG-2視頻壓縮原理。MPEG-2的視頻編碼技術主要基于2個概念,即時間相關性與空間相關性。所謂時間相關性指的是物體前后運動的連續性。例如,一扇門的開啟不可能是開、關這2個狀態,而一定是關、微開、開等一系列的連續動作,因此利用前一次的動作可以預測下一次的動作??臻g相關性指的是空間內相鄰物體的色彩和亮度是一個漸變的過程,而非一個突變的過程。稍有一點美術常識的人都知道,白色與黑色之間的過渡是漸進的,而不是突變的。如果將空間每一點及時間上每一幀進行獨立編碼,雖然能夠表達所有的信息,但是帶寬非常大,幾乎沒有那種載體可以經濟地傳送這種信號。另一方面從信息學的角度來看,也包含著大量的冗余信息。數據壓縮正是基于這樣的角度,采用相應的編碼方式將大量的冗余信息去除,保留有用的信息,有效地節約了帶寬。
基于MC+DCT技術的混合編碼器結構如圖1所示。

MPEG-2編碼碼流是變速碼流,而大多數視頻編碼器的輸出信道為恒定位率信道。因此,當MPEG-2壓縮碼流在恒定位率的信道上發送時,需要一個視頻輸出緩沖區來平衡編碼器輸出碼率的波動。視頻編碼器根據信道的傳輸速率、視頻輸出緩沖區的充滿度、編碼幀的類型(I,P和B幀)及其幀圖像復雜度動態調整量化參數來壓縮視頻數據,使得工作與恒定位率信道上視頻編碼器的輸出緩沖區既不產生上溢,也不產生下溢,做到既不丟失視頻數據,又能夠充分利用信道容量。
在實際應用中,視頻碼流的不均勻和網絡帶寬的不穩定,對視頻傳輸和存儲很不利,因此每一個編碼系統都需要碼率控制。碼率控制是視頻質量穩定和可靠傳輸的重要保證,它通過一定的碼率控制策略調整視頻編碼輸出的碼率使它與傳輸帶寬相匹配,而且保證獲取最小的失真,以及良好和穩定的接收質量。根據用戶的網絡接口選中的信道碼率是否穩定,碼率控制可以分為恒定碼率和變碼率2種模式。
1.變碼碼率控制。能在延時短、高增益的視頻網絡中傳輸。在網絡中視頻碼率控制較復雜,一方面為了確保網絡帶寬的高效利用,必須有一種管理機制來監督在指定的帶寬中傳輸。另一方面,在傳輸中由于網絡繁忙會使信道誤碼率增加,會進一步增加傳輸的不可靠性。
2.恒定碼率控制。一般通過調整幀率與各編碼單位的量化步長來實現。它通常由以下4個步驟構成:
(1)幀率調控。選擇視頻序列的傳輸幀率,確定需要編碼的圖像幀。
(2)在當前圖像幀編碼前,預測其目標碼率。
(3)為幀內各編碼單位選擇適當的量化步長,以使該幀輸出碼率盡量接近于目標碼率。
(4)對該幀編碼后,準備編碼下一幀。
對于恒定碼率的碼率控制,一般采用平滑緩存器調整輸出,使碼流以一個穩定的碼率進行傳輸或存儲。其中,TM5碼率控制算法是在保證緩沖器不上溢和下溢的情況下,通過估測每幀圖像的復雜度來分配比特數,同時決定量化參數。最常用的技術是調整一些編碼參數作為緩沖器飽和度函數,如反饋控制等。另外,也可以如前向反饋控制那樣使用當前圖像的活動性,為編碼器提供另一種需要的編碼方式。
對于運動圖像壓縮標準,不管是MPEG-1、MPEG-2、MPEG-4還是H.263,僅詳細規定了壓縮碼流的語法結構和基本壓縮算法,而對算法的實現沒有限定。這種開放式的框架式的標準使得標準既方便了不同產品間的互聯,又允許人們根據應用背景確定不同的編碼策略,以提高編碼效率。其中的碼率控制是編碼策略的重要內容之一。
在多媒體通信中,壓縮視頻流需要在帶寬需求不一致而且需要變化的網絡上傳輸,為了充分地利用提供的網絡資源,并保證用戶獲得最優的質量,在視頻通信系統中需要引入某種流控制機制。
MPEG-2的TM5碼率控制算法是一種優秀的碼率控制算法,由于它引入了復雜度分析、碼率分配、碼率控制、自適應量化等概念方法,從而可以較準確地控制視頻流的輸出碼率。它對普通視頻序列的壓縮效果較好,但由于算法本身的局限而沒有辦法避免一些困難,如MPEG-2的TM5碼率控制算法沒有考慮處理場景切換帶來的問題。同一畫面中宏塊與宏塊之間編碼質量不均勻。自適應量化是對量化參數的調整不適當、不均勻某些參數的過度調節。碼率控制算法前后各個步驟之間并不能有效地一起工作,存在著互相抵消效率的問題,從而導致編碼效率的下降。
MPEG-2的TM5算法是一種有效的碼率控制策略。MPEG-2編碼標準對數字電視、高清晰度電視以及數字電視通信產生較大的影響,TM5算法提出了一個參考的碼率分配策略,盡管該算法能夠較好滿足的視頻編碼,但仍存在一些不足,因此還有改進和完善的空間。