孫志國等
摘要:對農技云平臺中采用的視頻優化算法進行了介紹,在視頻采集、處理、傳輸、呈現等多個環節綜合應用雙三次插值、視頻對象分割、去抖動、降低幀率等多種視頻優化算法可有效提高用戶體驗。
關鍵詞:視頻優化算法;農技云平臺;農技推廣
中圖分類號:S126 文獻標志碼: A文章編號:1002-1302(2014)09-0400-02
收稿日期:2013-12-05
基金項目:國家科技支撐計劃(編號:2011BAD21B01、2013BAD15B02)。
作者簡介:孫志國(1978—),男,副研究員,從事用戶體驗設計(UED)
、知識管理、社會性網絡服務(SNS)
研究。E-mail:sunzhiguo@caas.cn。
通信作者:王文生,博士,研究員,從事信息和網絡技術研究。E-mail:wangwsh@caas.cn。
目前,我國已擁有一支人數超70萬人、覆蓋農業各領域的農業技術推廣隊伍。他們將農業科技送到千家萬戶,為發展現代農業、建設新農村作出了突出貢獻。中國農業科學院農業信息研究所利用移動互聯等現代信息技術,從2010年開始開發基于3G網絡的基層農技推廣信息化服務平臺,用移動云終端武裝基層農技推廣人員,創新農技推廣服務手段,改變傳統的“一張嘴,兩條腿”的農技推廣模式,為農民提供高效便捷、簡明直觀、雙向互動的農技推廣服務[1-6]。目前面向全國的農技云服務平臺開發已經基本完成,已在多個地方開展了示范試驗,示范效果良好,正在實施上線準備工作。本研究對農技云平臺中采用的視頻優化算法進行了介紹,旨在為創新農技推廣服務手段提供依據。
1算法優化需求
1.1提高低帶寬網絡環境下的視頻表現
信息化平臺開始設計時主要在以移動互聯網為基礎的網絡環境上運行,在低帶寬環境下,如果使用通常的視頻處理、傳輸技術將造成視頻傳輸不流暢、視頻傳輸延時等問題,為了在3G等網絡環境下有良好的視頻表現,筆者綜合運用了多種視頻優化算法以提高用戶體驗。
1.2努力降低視頻傳輸流量
在我國現有的3G網絡流量資費情況下,使用3G網絡進行遠程專家視頻咨詢、視頻課件播放所產生的費用較高。我國現有的3家電信運營商的3G網絡流量資費水平基本一致,比如聯通的80元1 GB上網套餐資費在0.078元/MB,通常在線視頻播放6 h將使用完1 GB流量(按每秒消耗流量 50 kB 計算)。解決此類問題的方法主要有視頻降幀、視頻分割、壓縮傳輸等技術的應用及算法的選擇與優化。
1.3提高視頻分辨率
在視頻診斷中,為了使專家能放大病蟲害圖像方便觀察,同時提高低成本、低分辨率拍攝設備的分辨率,可以使用插值算法提高分辨率。
1.4消除拍攝抖動對視頻圖像的影響
現場實時拍攝病蟲害情況時,拍攝抖動是不可避免的,易造成視頻序列模糊,導致專家無法看清病蟲害發生情況,對診斷工作造成影響,可采用視頻去抖動技術解決這一問題。
2視頻優化算法應用
2.1插值算法
2.1.13種基本插值算法及優缺點最近鄰插值算法是最簡單的插值法,取距離待測樣點最近的1個相鄰點的灰度值作為待測樣點的像素值。雙線性插值算法是對最近鄰插值法的改進,待測樣點由4個相鄰點的值通過加權平均計算得出。雙三次插值算法是對雙線性插值的改進,取待測樣點周圍的16 個像素點的灰度值作3次插值進行計算。最近鄰插值算法計算量很小,運算速度較快,但縮放質量差,放大圖像不連續性明顯,縮小時圖像失真。雙線性插值算法計算量稍大,算法較為復雜,縮放后圖像質量高。雙三次插值算法不僅考慮了直接鄰點灰度值對采樣點的影響,還考慮了鄰點間灰度值變化率的影響,因此所求得的待采樣點灰度值更為精確,但計算量最大,算法復雜,速度較慢。
2.1.2雙三次插值算法應用本平臺在專家視頻會診模塊采用了雙三次插值算法,具體程序實現代碼如下:
2.2降低幀率
幀率(frame rate)即每秒顯示幀數(frames per second,fps),高幀率可以得到更流暢、更逼真的畫面。一般來說,當視頻幀率<30 fps時,人可以感受到畫面不連續,將幀率提升至60 fps,可以明顯提升逼真感,一般來說,當幀率超過75 fps時,畫面流暢度提升不明顯。本系統的視頻畫面默認使用30、25 fps 2種幀率,通過降低視頻傳輸的幀率,可以大幅降低流量。在低帶寬環境下,為了保證聲音效果,本系統提供了一鍵降幀方案,將30 fps降為5 fps,配合壓縮傳輸算法,視頻通話即時流量可以從100 kB左右降到5 kB左右。
2.3視頻對象分割算法(video object segmentation algorithm)
視頻分割技術是在靜態圖像分割的技術基礎上發展起來的。靜止圖像的分割算法并不能直接應用于高效的視頻分割,但是視頻分割算法可以借鑒圖像分割算法。MPEG-4代表了基于對象的第二代壓縮編碼技術,在視頻編碼發展史上,MPEG-4第一次把編碼對象從圖像幀拓展到具有實際意義的任意形狀視頻對象,從而實現了從基于像素的傳統編碼向基于對象、內容的現代編碼轉變。視頻對象分割是當前視頻研究的難點。視頻對象分割步驟一般是通過低通濾波、中值濾波、形態濾波先對原始視頻進行簡化以利于分割,然后提取視頻數據的顏色、灰度、紋理、運動、區域、幀差、位移幀差等特征,再基于某種均勻性標準來確定分割原則,根據所提取特征將視頻數據歸類,最后進行相關后續處理,以實現濾除噪聲及準確提取邊界。分割算法大致分為3種:基于空域信息的分割算法、基于時域信息的分割算法、基于時空聯合的分割算法。基于時空聯合的分割算法就是同時利用視頻圖像在空間、時間軸上的信息進行分割,是目前主流的分割算法。目前常見的視頻對象時空聯合分割算法包括閾值算法、分水嶺(watershed)算法等。本平臺研究試用了視頻分割算法,但因實時性較差,還沒有大范圍應用。endprint
2.4壓縮傳輸
在圖像編解碼效率上,H.264算法最為領先,MPEG-4、H.263算法基本相同,MPEG-2算法效率最低。高帶寬時,以上各種編碼算法提供的圖像質量趨同。低帶寬(2M以下)時,采用H.264編解碼效率更高,但H.264編解碼對CPU處理能力的需求大幅度增加(相同帶寬下,H.264編解碼對CPU的占用率是H.263編解碼的6倍以上)。通過綜合研判,本平臺在低帶寬下采用H.264編碼,高帶寬下采用 H.263 編碼,保證了良好的視頻圖像效果。
2.5去抖動算法(video stabilization algorithm)
視頻抖動是指拍攝過程中由于攝像頭存在不一致的運動噪聲而造成視頻序列的抖動、模糊。為了消除這些抖動,本平臺引入了去抖動算法,該算法主要包括3個功能模塊:運動估計模塊、抖動識別模塊、運動補償模塊。運動估計模塊的主要內容是快速有效得到運動矢量,將活動圖像分成若干塊,搜索出每個塊在鄰近幀圖像中的位置,計算出兩者之間空間位置的相對偏移量,這個相對偏移量就是通常所說的運動矢量。抖動識別模塊主要負責對運動估計模塊計算的運動矢量進行程序判斷,超過一定閾值便啟動運動補償模塊。運動補償模塊通過運動矢量對原始圖像幀進行補償,由于每幀都不可避免地會引入一些誤差,如果不采取措施,隨著誤差的累積,后面圖像會出現瑕疵,計算幀間的累積誤差,如果該誤差超過一定的閾值,則將當前幀設定為新的基準幀,用于后續幀的校正補償。算法應用技術路線見圖1。
3結論
本研究介紹了農技云平臺中的視頻類系統中采用的視頻優化算法,在視頻采集、處理、傳輸、呈現等多個環節綜合應用各種視頻優化算法,可有效提高視頻畫面效果,降低帶寬流量,增強用戶體驗。
參考文獻:
[1]王文生. 用現代信息技術突破農業科研創新與推廣瓶頸[J]. 中國農村科技,2012(7):27-28.
[2]張亞迪,李釗,李俊山,等. 視頻對象分割技術研究[J]. 無線電工程,2008,38(10):14-16,37.
[3]王昕. 視頻對象分割技術與應用[J]. 中國有線電視,2011(1):66-68.
[4]劉達. MPEG-4視頻編碼核心思想及關鍵技術研究[J]. 有線電視技術,2004(4):43-47.
[5]宋利,周源華,周軍. 基于運動矢量的視頻去抖動算法[J]. 上海交通大學學報,2004,38(增刊):63-66,72.
[6]符祥,郭寶龍. 圖像插值技術綜述[J]. 計算機工程與設計,2009(1):141-144,193.姚冠新,顧晴. 基于經驗模態分解和支持向量機的農產品價格短期預測[J]. 江蘇農業科學,2014,42(9):402-405.endprint
2.4壓縮傳輸
在圖像編解碼效率上,H.264算法最為領先,MPEG-4、H.263算法基本相同,MPEG-2算法效率最低。高帶寬時,以上各種編碼算法提供的圖像質量趨同。低帶寬(2M以下)時,采用H.264編解碼效率更高,但H.264編解碼對CPU處理能力的需求大幅度增加(相同帶寬下,H.264編解碼對CPU的占用率是H.263編解碼的6倍以上)。通過綜合研判,本平臺在低帶寬下采用H.264編碼,高帶寬下采用 H.263 編碼,保證了良好的視頻圖像效果。
2.5去抖動算法(video stabilization algorithm)
視頻抖動是指拍攝過程中由于攝像頭存在不一致的運動噪聲而造成視頻序列的抖動、模糊。為了消除這些抖動,本平臺引入了去抖動算法,該算法主要包括3個功能模塊:運動估計模塊、抖動識別模塊、運動補償模塊。運動估計模塊的主要內容是快速有效得到運動矢量,將活動圖像分成若干塊,搜索出每個塊在鄰近幀圖像中的位置,計算出兩者之間空間位置的相對偏移量,這個相對偏移量就是通常所說的運動矢量。抖動識別模塊主要負責對運動估計模塊計算的運動矢量進行程序判斷,超過一定閾值便啟動運動補償模塊。運動補償模塊通過運動矢量對原始圖像幀進行補償,由于每幀都不可避免地會引入一些誤差,如果不采取措施,隨著誤差的累積,后面圖像會出現瑕疵,計算幀間的累積誤差,如果該誤差超過一定的閾值,則將當前幀設定為新的基準幀,用于后續幀的校正補償。算法應用技術路線見圖1。
3結論
本研究介紹了農技云平臺中的視頻類系統中采用的視頻優化算法,在視頻采集、處理、傳輸、呈現等多個環節綜合應用各種視頻優化算法,可有效提高視頻畫面效果,降低帶寬流量,增強用戶體驗。
參考文獻:
[1]王文生. 用現代信息技術突破農業科研創新與推廣瓶頸[J]. 中國農村科技,2012(7):27-28.
[2]張亞迪,李釗,李俊山,等. 視頻對象分割技術研究[J]. 無線電工程,2008,38(10):14-16,37.
[3]王昕. 視頻對象分割技術與應用[J]. 中國有線電視,2011(1):66-68.
[4]劉達. MPEG-4視頻編碼核心思想及關鍵技術研究[J]. 有線電視技術,2004(4):43-47.
[5]宋利,周源華,周軍. 基于運動矢量的視頻去抖動算法[J]. 上海交通大學學報,2004,38(增刊):63-66,72.
[6]符祥,郭寶龍. 圖像插值技術綜述[J]. 計算機工程與設計,2009(1):141-144,193.姚冠新,顧晴. 基于經驗模態分解和支持向量機的農產品價格短期預測[J]. 江蘇農業科學,2014,42(9):402-405.endprint
2.4壓縮傳輸
在圖像編解碼效率上,H.264算法最為領先,MPEG-4、H.263算法基本相同,MPEG-2算法效率最低。高帶寬時,以上各種編碼算法提供的圖像質量趨同。低帶寬(2M以下)時,采用H.264編解碼效率更高,但H.264編解碼對CPU處理能力的需求大幅度增加(相同帶寬下,H.264編解碼對CPU的占用率是H.263編解碼的6倍以上)。通過綜合研判,本平臺在低帶寬下采用H.264編碼,高帶寬下采用 H.263 編碼,保證了良好的視頻圖像效果。
2.5去抖動算法(video stabilization algorithm)
視頻抖動是指拍攝過程中由于攝像頭存在不一致的運動噪聲而造成視頻序列的抖動、模糊。為了消除這些抖動,本平臺引入了去抖動算法,該算法主要包括3個功能模塊:運動估計模塊、抖動識別模塊、運動補償模塊。運動估計模塊的主要內容是快速有效得到運動矢量,將活動圖像分成若干塊,搜索出每個塊在鄰近幀圖像中的位置,計算出兩者之間空間位置的相對偏移量,這個相對偏移量就是通常所說的運動矢量。抖動識別模塊主要負責對運動估計模塊計算的運動矢量進行程序判斷,超過一定閾值便啟動運動補償模塊。運動補償模塊通過運動矢量對原始圖像幀進行補償,由于每幀都不可避免地會引入一些誤差,如果不采取措施,隨著誤差的累積,后面圖像會出現瑕疵,計算幀間的累積誤差,如果該誤差超過一定的閾值,則將當前幀設定為新的基準幀,用于后續幀的校正補償。算法應用技術路線見圖1。
3結論
本研究介紹了農技云平臺中的視頻類系統中采用的視頻優化算法,在視頻采集、處理、傳輸、呈現等多個環節綜合應用各種視頻優化算法,可有效提高視頻畫面效果,降低帶寬流量,增強用戶體驗。
參考文獻:
[1]王文生. 用現代信息技術突破農業科研創新與推廣瓶頸[J]. 中國農村科技,2012(7):27-28.
[2]張亞迪,李釗,李俊山,等. 視頻對象分割技術研究[J]. 無線電工程,2008,38(10):14-16,37.
[3]王昕. 視頻對象分割技術與應用[J]. 中國有線電視,2011(1):66-68.
[4]劉達. MPEG-4視頻編碼核心思想及關鍵技術研究[J]. 有線電視技術,2004(4):43-47.
[5]宋利,周源華,周軍. 基于運動矢量的視頻去抖動算法[J]. 上海交通大學學報,2004,38(增刊):63-66,72.
[6]符祥,郭寶龍. 圖像插值技術綜述[J]. 計算機工程與設計,2009(1):141-144,193.姚冠新,顧晴. 基于經驗模態分解和支持向量機的農產品價格短期預測[J]. 江蘇農業科學,2014,42(9):402-405.endprint