摘 要:H.264作為下一代的視頻編碼標準,擁有優秀的視頻壓縮性能和良好的網絡適應性能。本文分析了將其應用在遠程直播教學領域中所帶來的優勢和問題,并提出了相應實現方案。
關鍵詞:遠程教育 H.264 實時直播教學
隨著ITU-T、MPEG標準組織分別批準了H.264標準,具有較好壓縮性能的H.264視頻編碼壓縮標準得到了業界的廣泛關注,其應用前景非常廣闊。作為ISO/IEC與ITU-T組成的聯合視頻組(JVT)制定的新一代視頻壓縮編碼標準,H.264與以前的任何標準相比,效率要提高一倍,同時具有簡單、直觀的優點,網絡友好的視頻描述,適合交互和非交互式應用(廣播、存儲、流媒體)。
一、264的性能優勢
作為下一代的視頻編碼標準,H.264采用了諸如可變塊大小運動補償、1/4采樣精度運動補償、多參考幀預測和4×4DTC變換等一系列的技術更新和新技術,使得視頻的壓縮效率有了大幅的提高,在相同的圖像質量下所許的碼流量更低。在相同的圖像質量下,H.264所需碼率約為MPEG-2的36%、H.263的51%、MPEG-4的61%。
圖一是H.263,MPEG-2,MPEG-4和H.264壓縮性能的一個比較。圖中橫坐標代表碼率(單位:Kbps),縱坐標代表的是視頻的質量,用視頻亮度分量的信噪比(單位:dB)來表示,dB越高表示視頻質量越好。使用的測試序列是標準測試序列Tempete(CIF,30幀/s)。由圖中我們可以看到,在四個編碼標準中,MPEG-2的編碼效率最低,H.263次之,然后是MPEG-4,編碼效率最高的是H.264。從視頻質量上看,當圖像客觀質量達到31dB時,H.264產生的碼率僅約為350kbps,MPEG-4需要510kbps左右,H.263約為625kbps,MPEG-2則接近1Mbps。

除此之外,H.264的參數集結構和它的NAL單元的設計使得其相較與之前的視屏編碼標準有著更好的網絡環境適應性和容錯糾錯能力。
二、264對于實時直播教學帶來的現實意義
對于遠程直播教學系統來說,H.264標準的應用將為其視頻服務帶來各方面質與量的提升。首先,由于H.264的高壓縮率,在教學直播的過程中,保持原有視頻質量的情況下可以節省近一半的網絡帶寬,從而可以大大節省遠程教學的費用或者擴大辦學的規模,有利于充分發揮遠程教學的優勢,在更大范圍內實現全民教育和終身教育的目標。同時,如果保持原有的網絡帶寬不變,則可以大幅提高教學視頻的品質,提供更大尺寸更清晰的視頻圖像,對于一些對于視頻質量較高的課程如實驗課程等,有利于增加課堂的臨場感,提升教學效果。其次,由于H.264擁有更強的網絡糾錯能力和適應性,在惡劣的網絡環境下相對于以前的編解碼標準來說也能獲得更好的視頻質量和服務保證,有利于處于偏遠地區或網絡環境不好的地區的遠程教學,擴大遠程教學的覆蓋范圍。
三、264在實時教學直播應用中存在的問題
自從該標準在2003年3月正式獲得批準至今,由于其前所未有的壓縮性能和對網絡環境的適應性,一些具體的視頻應用已經逐漸開始的由原來的Mpeg4編解碼標準轉向H.264編解碼標準。在視頻直播、網絡會議等方面已經有一些產品問世,如:國外聲稱已經可以提供基于H.264的會議電視產品的公司有POLYCOM、TANDBERG、VCON、SONY。而在視頻存儲方面,也已經有一些編碼器可以進行編碼轉儲,將一些其它編碼標準的視頻文件轉換成H.264編碼標準格式的視頻文件或將采集的視頻直接壓制成H.264編碼,以獲得視頻畫質的提升或節省存儲空間。有些網站甚至已經開始提供一些H.264編碼格式的電影下載。然而,對于現存的這些視頻會議、網絡直播教學等實時應用,往往其視頻編碼都是使用硬件編碼器,而軟件的編碼器多是應用在非實時領域,如視頻存儲。但是采用硬件編解碼器的網絡實時直播教學應用,其硬件編解碼設備十分昂貴,動輒數千元。這樣的設備,只適合在服務器端使用,客戶端不可能全部具備這樣的條件,所以只能實現直播教學而無法進行師生間的交互。若采用基于軟件編碼器的H.264實時編解則可解決這個問題。使用基于軟件的實施編解碼器之后,客戶端只需要安裝相應編解碼器之后就可以利用計算機CPU的運算能力對視頻信號進行實時編解碼傳輸,從而實現H.264的實時視頻交互。然而,使用軟件編解碼器對視頻信號進行實施編解碼將面臨兩方面的困難,首先因為H.264的高壓縮性能是以巨大的運算量為代價的,而由于H.264是一個新的編碼標準,其編解碼器軟件的發展起步較晚,編解碼器的成熟需要一段時間,部分軟件編碼器尚不能充分發揮計算機的運算性能,其編碼算法也有待進一步改進。此外,即使是使用最好的軟件編碼器,H.264對于計算機的運算能力的要求依然非常巨大,H.264編碼處理的計算量是MPEG-2的十多倍,這也是之前大多數的實施編碼應用都是使用專用的硬件編解碼器的原因。
然而經過這四、五年的發展,這兩方面的問題逐步得到了解決,在軟件方面,以開源項目x264為代表的一些軟件編解碼器,其編解碼算法日趨成熟,并使用MMX、SSE等CPU提供的多媒體指令集,充分發揮了CPU的多媒體運算能力,已經由實驗階段跨入應用階段。另一方面,計算機的硬件性能更是遵循著摩爾定律飛速提升,在CPU方面,主頻已經超過3G,而雙核處理器也日趨成為主流,Intel和AMD公司有計劃在今年底和明年推出四核,甚至八核處理器。在存儲器方面,隨著價格的不斷降低,1G以上的內存以逐步成為臺式PC的主流。可以說,無論從硬件或軟件上來看,使用軟件編解碼器對教學直播視頻進行實時編解碼的條件已經成熟。
四、基于軟件編解碼器的H.264實時編解碼實現方案
鑒于目前的軟硬件技術水平日趨成熟,基于軟件編解碼器的H.264實時編解碼已經可行,現提出一種在微軟DirectShow框架下,H.264視頻編碼傳輸解決方案。如圖二所示:
視頻編碼傳輸過程如圖所示,經過實時采集的原始視頻流通過H.264軟件編碼器進行實時編碼,這里的編碼器可以采用VideoLAN的x264編碼器,此編碼器為開源項目且性能優良。由H.264編碼器輸出的H.264NAL壓縮單元,與來自音頻編碼器的音頻數據流送入MUX多路復用器,MUX根據ISO/IEC 13818-1標準(ITU-T H.222)將音頻與視頻流打包成單一的數據流,送往數據發送器。數據發送器將MUX發來的數據包根據RTP協議再次打包,最后將RTP數據包送往網絡。

在數據的接收端,數據接收器將來自網絡的RTP數據包解包后送往Spliter解復用器,解復用器將數據流重新分解成音頻流和視頻流,送往音頻解碼器和H.264解碼器,經過解碼后的音視頻流即可輸出渲染。
五、小結
H.264作為下一代的視頻編碼標準,無疑將會在視頻編碼領域帶來一場新的革命。積極地將這一標準應用到遠程網絡直播教學中,充分發揮H.264的性能優勢,可以節省網絡教學資源,提升遠程教學的質量,擴大遠程教學的范圍,從而在技術上為遠程教學的普及應用作出貢獻。
參考文獻:
[1]Iain E. G. Richardson. H.264 And MPEG-4 Video Compression Video Coding For Next Generation Multimedia.
[2]H.264 國際標準(JVT-G051).
[3]H.264 / MPEG-4 Part 10 White Paper.