李 建,別紅霞
(1.思科系統(中國)研發有限公司 SVPTG部門,上海 200233;2.北京郵電大學 信息與通信學院,北京 100876)
對主流自適應碼率流媒體技術的分析
李 建1,別紅霞2
(1.思科系統(中國)研發有限公司 SVPTG部門,上海 200233;2.北京郵電大學 信息與通信學院,北京 100876)
伴隨著互聯網多媒體應用的快速增長,尤其是在線視頻業務的不斷發展,傳統的流媒體技術由于其單一的編碼方式難以適應差異化的用戶網絡變化,極大地影響了用戶體驗。分析了當前在線視頻業務面臨的主要問題,同時介紹了新興的自適應碼率流媒體技術的特點和優勢。通過對主流自適應碼率流媒體和傳統流媒體技術的分析和比較,表明對于OTT業務而言,標準化的自適應碼率流媒體技術比傳統的流媒體技術更加有優勢。
HTTP流化;在線OTT視頻;自適應比特率流;MPEG的動態自適應流
隨著互聯網上多媒體應用的快速增長,盡力而為網絡模式上的視頻流化技術得到了廣泛研究。傳統的媒體流化協議,如實時傳輸協議/實時流化協議(Re?al-Time Transport Protocol/Real-Time Streaming Proto?col,RTP/RTSP),在網絡層上一般采用UDP協議而不是TCP協議。這主要是因為TCP中的后退和重傳機制會產生難以忍受的端到端延時,對實時業務影響較大。然而,基于TCP的流化也具有很多優勢:可靠的重傳機制省去了上層錯誤恢復的需要;在實際網絡中,基于TCP的流媒體數據更容易通過防火墻和穿越網絡地址轉換器(Network Address Translator,NAT)。為更廣泛地服務用戶,網絡視頻業務提供商在實踐上更青睞于HTTP協議流化而不是需要布置專用網絡的RTP/RTSP協議流化方式。
但是傳統的視頻流處理模式,如漸進式下載(Pro?gressive Download)和RTSP有一個共同的問題:對于某個給定的視頻,不管在怎樣的網絡中傳遞,它都只能以一個特定的目標比特率編碼(例如,500 kbit/s)。那么,如果選定的目標比特率太高,遇到低速的網絡,整個視頻將不得不被緩存,然后才能播放,導致播放的啟動時間非常緩慢,這在網絡擁塞或利用率高的時候是經常發生的。如果所選擇的比特率過低,那么視頻質量也會相應降低,從而影響了客戶的體驗質量(Quality of Experience,QoE)。
所以,對于在線視頻行業來說,提供一個可靠、持續而且高質量的用戶觀看體驗,是一個嚴峻的課題。隨著越來越多的內容提供商不斷推出高清視頻,但是對應的用戶網絡卻不能持續保持這樣的高數據吞吐量時,使得緩沖大、抖動厲害等視頻質量受損現象變得更加突出。互聯網盡力而為的特征使得端到端的可用帶寬總是隨著網絡狀態波動,而且,網絡流量的自相似性使得波動在多尺度范圍內廣泛存在。小尺度的帶寬波動可以通過在終端引入播放延時或自適應播放抵消,但是更大尺度的帶寬波動(數十秒量級)造成的質量下降則不得不引入新的技術,如自適應比特率流技術(Adaptive Bitrate Streaming,ABR)來克服。自適應比特率流技術能夠幫助用戶,隨著網絡的變化自動地、有效地選擇不同的分辨率/質量。對于每個視頻,自適應比特率流技術將其分解成很多“塊”,每個塊的視頻長度是可以變化的(例如,蘋果的HTTP Live Streaming一般采用10塊),且每個塊都采用多比特率編碼。如果遇到網絡帶寬不足,不能傳送某個比特率時,客戶端將自動請求一個更低的比特率來傳送下一個“塊”。雖然視頻質量會有所下降,但避免了重新緩沖;相反,如果網絡改善的話,客戶會請求更高的比特率來傳送下一塊,視頻質量也將相應地提高[1-2]。
自適應比特流媒體技術,相對于過去傳統的流協議RTP,RTSP等技術而言,是一種新型的互聯網流媒體技術。今天的自適應流媒體技術幾乎專門基于HTTP[3]設計,能夠有效地在大型分布式HTTP網絡中工作。
自適應比特流媒體技術通過實時檢測用戶的帶寬和CPU處理能力,并相應地調整傳遞的視頻流質量。它要求編碼器能夠把一個單源視頻編碼生成多個不同比特率,同時播放器客戶端[4]根據可用的資源[5]在不同的編碼流之間進行切換,逐漸切換到最合適的那個碼率上來。結果:自適應比特流媒體技術,通過適時切換碼流,在減少緩存下溢概率的同時,利用很小的緩沖,實現快速啟動播放,并盡可能爭取為不同網絡都提供最好的播放質量[6],如圖1所示。

圖1 自適應比特率流技術原理圖
就目前的具體實現而言,自適應比特流技術通過HTTP方法傳送視頻流,把視頻源內容編碼成多個不同的比特率,而且每個不同的比特率流進一步被分割成小的幾秒鐘的片段[5]。流媒體客戶端通過一個清單文件了解到存在多個不同比特率的流片段。啟動時,客戶端從最低比特率流開始請求,如果客戶發現下載速度大于該段的比特率,隨后會要求更高的比特率段;后來,如果客戶發現下載速度低于當前段的比特率,它將要求一個更低比特率的段(如圖2所示)。實現中,視頻片段的大小可以根據特定的實現有所不同,通常在2~10 s[5]。

圖2 自適應比特流隨可用帶寬變化示意圖
3.1 Adobe的自適應動態流媒體(AdobeDynamic Streaming)
Adobe的自適應流媒體解決方案是提供給所有帶有Adobe的Flash插件設備的一個基于網絡的服務。該方案中,服務器存儲不同比特率的數據流,在播放過程中,動態選擇不同的質量和編碼大小來適應用戶的帶寬和CPU變化。Adobe的自適應流媒體使用RTMP流協議,支持的視頻編解碼器包括H.264和VP6,其優點是Adobe Flash插件在客戶端廣泛存在。
最新版本的Flash播放器和Flash媒體服務器已經支持在傳統的RTMP以及HTTP上傳輸自適應比特流。基于HTTP流的優勢是可以使用網絡瀏覽器正常的端口進行播放,不需要防火墻對外開放額外的端口;基于HTTP的流也允許視頻片段被瀏覽器、代理器和內容分發網絡(CDN)緩存,大大降低了在源服務器上的負載[7]。
3.2 蘋果的自適應直播流媒體(AppleLivestreaming)
蘋果公司發布了一個客戶端的HTTP自適應直播流媒體解決方案。該方案中,按照預定義的時間長短和視頻質量要求的不同,服務器上的視頻內容會被分成多個片段。服務器對外發布一個播放列表(.m3u8文件)來包含所有可用的視頻片段,這些自適應數據流提供了許多不同的比特率,供客戶端設備與服務器間交互使用。客戶端依據一個秘密的專有算法,在播放視頻時,動態地選擇下載視頻段的視頻質量。蘋果的HTTP自適應直播流媒體采用基于MPEG-2 TS的H.264編碼,已經成為iPhone3和后續新版本(包括iPad)上的一個標準功能[8]。
3.3 微軟的自適應平滑流媒體(MicrosoftSmooth Streaming)
微軟的平滑流媒體技術是由微軟提供的一個自適應的流媒體技術,是對IIS媒體服務的一個擴展。客戶端通過HTTP協議來自適應流媒體[9],目前支持VC-1和H.264編解碼。微軟平滑流媒體技術采用流切換的方法來自適應不同的編碼流,在默認配置下,IIS自適應平滑流媒體對視頻流采用七層編碼,輸出的比特率范圍為300 kbit/s~2.4 Mbit/s。
3.4 MPEG的動態自適應流媒體(MPEG-DASH)
對于視頻生產者,視頻流格式的不兼容和設備規范的差異性,使得視頻內容在跨移動設備上的播放變得困難。專有的客戶端技術已成為一個主要的障礙,迫使生產商提供多個內容來兼容不同的供應商。
為了解決這些挑戰,運動圖像專家組標準(MPEG)提出了動態自適應HTTP流(MPEG-DASH),承諾大大降低流媒體傳輸的復雜性和成本。MPEG-DASH是基于HTTP自適應比特率的流媒體解決方案中唯一的一個國際標準[10],將徹底改變自適應HTTP流的多技術林立的局面,為消費者提供可靠的跨平臺的觀看體驗。
MPEG-DASH是基于3GPPRelease 9自適應HTTP流(AHS)和IPTV論壇發布2的HTTP自適應流發展起來的[10]。相比其他以供應商為中心的解決方案,規范化的MPEG-DASH可以采用通用的部署,大大簡化部署成本,給市場以信心。
因為MPEG-DASH統一的IP視頻流傳輸和消費標準,用戶在各種終端上都將能夠享受到同樣豐富的、充滿活力的用戶體驗,而不會因為其終端的不兼容而被生產商忽視。反過來,生產商由于MPEG-DASH標準的統一性,必須支持格式的數量可以下降到1個,這將大幅降低生產和傳輸成本。并使生產商有更多的資源投入到內容建設上,而不是花錢生產和交付更多的格式。
雖然蘋果公司尚未表示是否會采用MPEG-DASH或繼續精煉自己的自適應流媒體格式(HLS),但隨著MPEG-DASH標準的采用,將極大地滿足設備的擴展性,簡化基礎設施部署的同時保證用戶視頻的觀看質量。
3.5 流媒體技術比較
傳統的流媒體技術和多個主流自適應流媒體的比較如表1所示。該表從音視頻的編碼,流媒體的封裝方式、復用方法和數字版權管理(DRM)等多方面進行了比較,不難看出各種流媒體技術的差異。

表1 主流流媒體技術的比較
采用自適應比特率流(ABR),在任何給定的時間下,該技術能夠自動適應不斷變化的用戶網絡環境和播放條件,從而保證消費者能夠體驗到最高質量的視頻。
雖然基于HTTP的自適應比特率技術(ABR)比傳統的流媒體技術在操作上要復雜些,同時還有額外的編碼成本,甚至還有關于復雜的自適應比特率邏輯和TCP流量控制邏輯之間的競爭作用[11],但是相對于傳統的非HTTP流媒體解決方案需要大規模部署專門的流媒體服務器基礎設施,基于HTTP的ABR可以利用已有的HTTPWeb服務器,運行一個簡單的HTTP服務器軟件,極大地降低了軟件許可成本,方便了部署和擴展。
[1] HODGKINSK.Companies need to do a better job streaming mo?bile video[R].[S.l.]:IntoMobile,2012.
[2] Skyfire.Only 18%using adaptive streaming[R].[S.l.]:Streaming Media,2011.
[3]AKHSHABIS,BEGEN A C,DOVROLISC.An experimental eval?uation of rate-adaptation algorithms in adaptive streaming over HTTP[C]//Proc.Second Annual ACM Conference on Multimedia Systems.New York,USA:ACM Press,2011:220-225.
[4]MUELLER C,LEDERER S,TIMMERER C.DASH at ITEC,VLC plugin,DASH encoder and dataset[EB/OL].[2013-10-10].http:// www-itec.uni-klu.ac.at/dash/wp-content/images/MMSys_DASH_R esearch_AAU.pdf.
[5]MüLLER C,LEDERER S,TIMMERER C.An evaluation of dy?namic adaptive streaming over HTTP in vehicular environments [C]//Proc.the ACM Multimedia Systems Conference 2012 and the 4th ACM Workshop on Mobile Video.Chapel Hill,North Caroli?na:ACM Press,2012:122-125.
[6] GANNES L.The next big thing in video:adaptive bitrate stream?ing[EB/OL].[2013-10-10].http://pro.gigaom.com/blog/how-to-de?liver-as-much-video-as-users-can-take/.
[7]Adobe Systems.HTTP dynamic streaming[EB/OL].[2013-10-10]. http://www.adobe.com/products/httpdynamicstreaming/pdfs/httpdyna micstreaming_datasheet.pdf.
[8]PANTOSR.HTTP live streaming[S].2011.
[9] Microsoft,smooth streaming protocol specification[EB/OL].[2013-10-10].http://msdn.microsoft.com/en-us/library/ff469518.aspx.
[10] ETSI 3GPP 3GPP TS 26.247,Transparent end-to-end pack?et-switched streaming service(PSS);progressive download and dynamic adaptive streaming over HTTP(3GP-DASH)[S].2008.
[11] AKHSHABI S,BEGEN A C,DOVROLIS C.An experimental evaluation of rate-adaptation algorithms in adaptive streaming over HTTP[J].Signal Processing:Image Communication,2012,27(4):271-287.
Analysis on M ainstreams of Adaptive Bitrate Stream ing Technologies
LI Jian1,BIE Hongxia2
(1.Dept.of SVPTG,Cisco Systems(China)R&D Co.Ltd.,Shanghai 200233,China; 2.School of Information and Communication Engineering,Beijing University of Posts and Telecommunications,Beijing 100876,China)
With the rapid growth of Internet multimedia applications,especially the development of online video services, the traditional streaming media technology has a great impact on the user experience,because its single encoding mode is difficult to adapt to the changes of user network.The main problems of the online video business faced are analyzed,and the characteristics and advantages of the emerged adaptive bit rate streaming technology are introduced.Through the analysis and comparison of adaptive bit rate streaming and traditional streaming technology,it is indicated that for online video,particularly OTT video,the standard adaptive bit rate streaming technology,which helps unify infrastructure and consumer electronics configurations,is much superior to the traditional one.
HTTP streaming;online OTT video;adaptive bitrate streaming;MPEG-DASH
TP37
A
?? 京
2013-12-20
【本文獻信息】李建,別紅霞.對主流自適應碼率流媒體技術的分析[J].電視技術,2014,38(12).
李 建(1978-),碩士生,主研多媒體通信、寬帶通信;
別紅霞(1971—),女,教授,博士生導師,主研多媒體通信。