屈竹杰
關鍵編碼特征比較
H.265所面臨的挑戰
與之前從H.261到H.264的其他標準相比,H.265的顯著改善不僅表現在幀間壓縮領域,還表現在幀內壓縮方面。由于可變量的尺寸轉換,H.265在塊壓縮方面有很大的改善,但是增加壓縮效率的同時也帶來了一些新挑戰。
困難的場景
視頻編碼是一個復雜的問題,對于內容的依賴性很高。眾所周知,有靜態背景和高亮的低動態場景可以比高動態、黑場的圖片進行更多的壓縮。所以對于像H.264這樣的現代化編解碼器來說首要解決的是最困難的場景/情境。包括:
有細節的關鍵幀:無論怎么計算,壓縮關鍵幀都是非常困難的,特別是當圖像特征豐富的時候(如一片森林)。如果關鍵幀從一個安靜場景開始,低動態上的高效動態預測和補償可以實現整體的有效壓縮,但是如果圖像組之間突然增加了復雜性,編碼器很容易就會遭遇危機。
高動態的“勾邊(crisp)”圖像:預測高度復雜的動態是相當困難的。當它與高空間復雜性混在一起,將會出現持續的比特率飆升和/或越來越多的偽影。
黑暗區域的慢動態:對黑暗區域編碼是一個很大的挑戰,因為眼睛在明亮環境要比黑暗環境更敏感。此外,如果你增加了帶有紋理物體或煙霧或顏色、陰影細微改變的慢動作場景,那么即使使用了自適應量化或類似的優化,也非常容易看到討厭的偽影。
噪聲/紋理:噪聲幾乎是不能被明顯壓縮的。幸運的是眼睛對于平坦區域和黑暗區域等圖像特定區域的紋理和噪音更加敏感,而對于明亮和細節區域的敏感度更低,所以智能的編解碼器可以給這些更有需要的區域多留些預算。盡管如此,去壓縮噪聲內容非常困難,特別是快速移動場景中的噪聲。被壓縮的噪聲很容易被發現,因為在低頻創建了一個丑陋的模型,并干擾了運動估計/補償。降噪并不總是適合或者緊迫的,而且不幸的是,在HEVC規范中,重放期間的噪聲建模和重建繼續成為一個“選項”。
如上所述,H.265在幀內編碼方面效率更高,所以細節區域可以被編碼得更好,在平滑區域和漸變區域也是如此。與H.264相比,H.265的運動估計和壓縮更有效,而且在偽影出現前可以在更低的比特率上操作。好消息是,H.265產生的偽影更加“平滑”,質量的降低也非常協調,即便對非常激進的分辨率/比特率編碼時,也觀感良好。
然而,正如硬幣的兩面,當處理最后兩種問題時,H.265的優勢也會變成弱勢。黑暗區域和噪聲/紋理要求更精確的高頻保留和更小的色階變化。這通常被稱之為編碼的心理優化。
由于H.264使用小的轉換,可以輕松將量化誤差變成特征/細節,雖然與原始內容不同,但是感覺上“近似”。接近原生頻率范圍的誤差生成可以通過小的邊界轉換來阻止,因此也更加可控。而更大轉換的H.265要使用這種方式則會更加復雜。
H.265編碼視頻的存儲依然是個問題,即使藍光光盤協會正在尋求一個能夠在藍光光盤上存儲4K視頻的解決方案。只有至少達到100GB容量的光碟才能存儲H.264編碼的藍光4K電影。而另一方面,即使H.265編碼和芯片部件已經準備就緒,但是仍然缺少支持4K內容的存儲和重放解決方案,并且要能夠兼容現有的藍光標準。這也是H.265發展中的一個主要挑戰。
那么問題又來了,今天,我們應該如何對待H.264和H.265呢?
基于上述原因,在需要編碼特征豐富的關鍵幀和高動態提供低碼率上更平滑質量退化的情況下,好的H.265編碼器要優于好的H.264編碼器。
與此同時,在黑暗區域和有噪聲和紋理的畫面中,一個好的H.264編碼器仍然能夠提供同樣的質量甚至更好的質量。
這并不是說H.264比H.265更好,但是可以看到的是今日的編碼器發展水平還不夠成熟。對于4K來說也是這樣。即使在復雜情況下也要提供高質量的必要性迫使內容提供商愿意在4K媒體流中使用更高的比特率。
一般而言,今天我們用H.264在1080p@3-4Mbit/s上實現的質量可以匹敵H.265在2-2.5Mbit/s上所能實現的。但是困難之處在于需要在壓縮過程中投入更多注意力。例如,很多客戶不能接受某些畫面瑕疵,特別是在大尺寸4K顯示器上進行全屏重放時。
除了質量評估外,H.265的主要問題還在于今日解碼器的一般性能。由于H.265是更強的處理器,所以別指望簡單的固件升級就能夠讓你的設備解碼它。有時候還需要硬件解碼器。未來,市場很多系統芯片都將可以解碼H.265,我們可以看到H.265會出現在iOS和安卓平臺上,但是對于瀏覽器來說還是個問題。
H.265 PK VP9
在H.265大步向前的同時,谷歌VP8的繼任者VP9也已推出,同樣在VP8的基礎上號稱編碼效率提高50%,支持8K內容。VP9是一個開源和免費的規格,是WebM架構的一部分。谷歌已經在Chrome瀏覽器和YouTube中整合支持VP9。
H.265可以抓取16×16個像素“宏塊”,可實現35個幀間預測方向來重建它們。VP9在表面上類似,它同樣可以抓取64×64個超級塊,但是與H.265不同的是,它不一定是平方形式的,所以它可以以64×32或4×8的塊來采樣,實現更大的效益。但另一方面,它只有10個預測模式來重建它們。
兩者都很大程度上簡化了現有這些格式,盡管實現了相近的文件尺寸,有初步的報告認為,H.265有更高的圖像質量,而VP9對于流媒體來說更加可靠。H.265更大的預測模型實現了邊緣可視化,而VP9實施更嚴格的編碼規則,似乎可以讓流媒體更加連貫和可靠。
H.265與VP9的比較有一點類似于HDMI與DisplayPort的比較。后者以版權免費的方式去爭取一席空間,但是前者的無處不在的應用意味著它會有更廣泛的行業支持。這也是之前H.264輕松打敗VP8的原因。
VP9版權免費是一個優勢,但是谷歌最終還是要推動大家來使用它。這是他們面對的一大問題。其最大的成本在于終端用戶觀看視頻方面,但是用戶本身是不需要版權費的,而用于播放視頻的硬件和軟件最直接的定義了它們的視頻格式。幾乎沒有用戶會去選擇重放視頻的格式。谷歌需要讓瀏覽器和重放軟件支持VP9?,F在Chrome和Firefox都支持WebM,但是Safari和Internet還沒有支持。谷歌VP9的主要目標或許在硬件方面多于在軟件方面,現在已經得到多個硬件供應商支持,包括:LG、松下、索尼、三星、東芝、飛利浦、夏普、ARM、英特爾、Nvidia、Qualcomm、MozilIa等行業領袖。但另一方面,所有這些公司都支持H.265,即便是谷歌也會在Chorme上支持H.265,而且YouTube也不排除會支持它??梢哉f,很多公司以及大部分設備都會同時支持兩種格式。這對于大家是個好消息。
有趣的是,第三個壓縮格式也在規劃之中,Xjph.Org基金會開發了“DaaIa”,雖然它還比較遙遠,但是Xiph稱其將是性能超越H.265和VP9的新一代規格。
H.205的未來
高像素數量導致需要更復雜的編解碼器來最小化帶寬需求。持續連接PC或TV,平滑處理4K信號的最小碼流是20Mbit/s,例如Netflix要求用戶的互聯網連接至少提供持續的25Mbit/s帶寬量。20到25Mbit/s代表帶寬的巨大改善,原生的、非壓縮的4K視頻需要在60Mbit/s的帶寬上才會有好的表現。
對于大多數的行業應用來說,H.265就是解決這一問題的答案之一,但是也要付出一定代價:顯著增加的算法復雜性據說需要10倍目前2K部署所用H.264編解碼器的計算能力來支撐,而提供這種能力所需的硅也遠非一個簡單的商品條目。
很多制造商希望在上游芯片和IC技術供應商的努力之下,解決成本和功能不平衡的問題,讓H.265快速取代H.264。就目前來看,H.265在廣電領域已經有比較好的發展。盡管大多數有線和數字電視廣播公司仍然使用MPEG-2標準,但好消息是,一些電視廣播公司在HDTV應用中,已經用H.265代替MPEG-2標準,因為H.265降低了70-80%的帶寬消耗,可以在現有帶寬條件下支持全高清的1080p廣播。與有線電視相比,衛星電視提供商采用H.265更早。H.265可能將成為4K和8K的最終解決方案選擇。在今年的NAB上,NeuLion公司已與LG電子續簽協議,讓LG在其超高清電視機產品系列中集成DivX HEVC解決方案,實現4K視頻流媒體播放。
H.265已經是電視和視頻發展的未來,但是否也會成為專業應用領域的主流規范還存有疑問。因為安防監控領域等專業領域不僅受制于上述挑戰,而且還要看終端用戶臉色。對于項目化的專業用戶和需要監控的一般消費者而言,平安城市、交通監測和銀行監控這類專業用戶需要更加穩定和可靠的系統。他們中大多數已經在使用現有的技術,對于是否采用H.265還心存猶豫,這就需要更長的驗證周期。
另一方面,中小企業和家庭、零售用戶等消費者需要低安裝成本,因此更加傾向于采用新技術?;谶@個原因,H.265可能首先在中小企業應用中獲得成功,并在消費者市場獲得認可。如果H.265標準快速成熟,其壓縮效率比H.264提升50%,它就能夠節省20%的投資,保證更高的性能和更替的網絡及穩定的系統建設成本。