鄭廣寧 魏永靜 田兵 孫麗麗 劉鴻雁
摘要
隨著社會發展向著數字化和信息化邁進,人們工作交流的方式正與時俱進的朝著越來越智能的方向發展,高清視頻會議正應網絡時代的進步開始了領銜會議通信的發展時期,給用戶帶來了的更高品質的服務體驗。高清視頻會議終端產品是高清視頻會議實現的重要組成部分,目前,各品牌的終端服務產品層出不窮,但關鍵技術要升級換代、贏得市場的青睞,并不是一朝一夕的事,需要堅持不懈的鉆研和創新才能有所突破。來本文就高清視頻會議終端產品的關鍵技術展開研究,旨在為行業的持續發展提供借鑒。
【關鍵詞】高清視頻會議 終端 關鍵技術 視頻解碼器 音頻解碼器
1 高清視頻會議終端產品及技術發展現狀
從2006年首款高清視頻會議產品的720P問世,到2008年KEDACOM發布首款1080p高清視頻會議系統,高清視頻理念迅速鋪開,視頻會議系統已經進入到了高清時代。其高保真的畫質和更為流暢的音質能為與會者帶來更優質的視聽體驗和更有效的會議信息交流服務。隨著科學技術的發展和市場需求的變化,高清視頻會議系統在各領域特別是分布廣、部門多、規模大的企業單位得到了極為有效的應用和推廣。目前,高清視頻會議終端產品廠商眾多,但提供的產品也僅僅是基本能滿足市場的需求,在關鍵技術方面還存在著很大的改良和提升空間。雖然高清視頻會議終端產品越來越智能,但究其的本源,還是基于各種優秀的開源解決方案開發出來的,如開源項目WebRTC具有高成熟度、高代碼質量、高品質抗網絡抖動策略以及可跨平臺和完整的音頻處理算法等性能,當前國內包括高清視頻會議在內的視頻通信產品90%以上都是基于該項目開發的。目前,高清視屏會議終端視頻產品的關鍵技術主要是視頻和音頻的效果的控制上。占據主流位置的視頻編解碼器依然是H.264,H.265因計算太過復雜和高昂的專利授權費,發展較為緩慢。Google也貢獻了VPS、VP9等免費視頻編碼器,開源的X264和思科的OpenH264項目成為大多數中小廠家的最為垂青的視頻解碼方案,應用最為廣泛。由于網絡帶寬是有限的,要保證高清視頻的效果就必須在視頻傳輸的抗網絡異常性能上下功夫;音頻編解碼器方面,Google的Opus編碼被公認是對適合網絡傳輸編解碼器,在抗分組丟失、變碼率、VAD等性能上都遠遠超出其它編解碼器,G711、G722、G729、SILK、SPEEX等也都是通用的編解碼器。由于聲音處理的效果會直接影響到用戶的體驗和產品功能的發揮,因此,高清視頻會議終端產品廠商需要特別重視專業的聲學和數字信號處理技術,它們是實現高質量的音頻效果的關鍵。
2 高清視頻傳輸的抗網絡異常技術
高清視頻的主要特點是高圖像分辨率,在一定網絡帶寬的限制下,要實現大量圖像數據的高效傳輸,就必須對視頻進行編碼壓縮,并且根據網絡質量實時優化編碼碼率,以保證高清晰度的圖像質量和流暢的播放效果。這就需要著重對高清視頻傳輸的抗網絡異常技術進行研究。
2.1 網絡分組丟失
高清視頻會議實現的是實時性視頻通話,為符合實時性這一要求,一般都會用到UDP傳輸實時視頻分組的方法,但其缺點在于不能確保傳輸過程中的網絡分組不會丟失。而任何一幀視頻數據的不完整都會使解碼出的視頻圖像出現嚴重的馬賽克,而且馬賽克會直到下一幀完整的關鍵幀傳輸到的時候才會消失。對此,解決這一問題的可行之法就是要統計輸送到解碼器的每一幀數據的完整性。
2.2 快速請求關鍵幀邏輯
高清視頻會議的客戶端會定時發送視頻關鍵幀,如果發送關鍵幀間隔時間太短就會增大碼率,快速請求關鍵幀算法就是解決這一問題可行技術。快速請求關鍵幀的原理就是當解碼器返回解碼錯誤信息時,在查詢到視頻緩存區內沒有關鍵幀后,清空視頻緩存區的同時向對方發送一個關鍵幀請求,對方接收到關鍵幀請求后,立即將下一幀編碼為關鍵幀并發送雖然通過這種方式處理后網絡分組如果丟失依然會造成視頻輕微卡頓,但卡頓時間目前可控制在300~400ms左右,且不會出現馬賽克現象,在網絡分組丟失率不高時,這種技術是非常實用的。
2.3 圖像渲染穩定度
高清視頻會議終端顯示的圖像理論上是視頻解碼器解每出一幀圖像就會立刻顯示一幀出去,但實際上卻會因發送端不穩定,網絡延遲抖動等原因導致連續幾幀圖像之間的渲染間隔抖動嚴重,使視頻畫面時快時慢,顯示效果不穩定。對于這種問題,則需要根據接收到視頻平均幀率來估計出一個穩定的圖像渲染幀率,以繪制出更均勻的圖像,確保時間域圖像的高質量。
3 高清視頻會議終端的音頻控制技術
聲音質量是視頻通信的基本要求,終端設備聲學處理優化如果不到位,就會出現回聲和底噪殘留等聲音質量問題,直接給視頻通信的效果造成不利影響。網絡是高清視頻會議終端產品功能的基礎,但網絡傳送的語音信號由于要經過編碼、壓縮、打包等一系列處理,不可避免的會造成回聲路徑的延遲及其延遲抖動問題,使得語音質量因回聲問題而影響通話雙方的主觀聽感。因此消除回聲技術就顯得十分重要了。目前,應用效果較好的回聲消除算法(AEC)首先是基于揚聲器信號及其產生的多路徑回聲的相關性的,在建立遠端信號的語音模型,并利用該語音模型對回聲進行估計,同時不斷地修改濾波器的系數,使估計值更加逼近真實的回聲,再從輸入信號中減去回聲估計值即可消除回聲。AEC還通過對話筒的輸入與揚聲器過去的值相比較,來達到消除延長延遲的多次反射的聲學回聲的目的。而在通用回聲消除算法基礎上,增加揚聲器端的自適應自動增益控制模塊,能夠通過揚聲器自適應增益控制與回聲消除的有效結合對近端和遠端信號進行同時處理,雙管齊下,更高效的實現回聲消除的目的。這種優化技術對提升視頻通話效果有著明顯成效,值得借鑒和推廣。
4 結束語
隨著高清視頻技術的不斷發展與創新,其在視頻會議領域的應用是時代的需求也是行業發展的必然。高清視頻會議的實現離不開終端產品的大力支持,在這市場需求瞬息萬變的時代,終端產品必須在關鍵技術上不斷突破、持續領先,才能爭得市場的一席之地,贏得與時代爭鋒的發展機會。未來,全數字化將是高清視頻的發展方向,相信終端產品的關鍵技術也會應其發展而實現新的突破。
參考文獻
[1]段震霞.多媒體會議系統設計技術與應用[M].中國建筑工業出版社,2009.
[2]王建.基于SIP的視頻會議系統的設計與實現[D].北京交通大學,2009.
[3]畢厚杰.新一代視頻壓縮編碼標準——H.264/AVC(第二版)[M].人民郵電出版社,2009.
[4]丁國強,羅慶國.高清視頻會議系統技術及組網應用[J].數據通信,2016.