李玉行
[摘要]視頻業務的使用過程中,經常出現視頻圖像卡頓、花屏等問題,根據統計發現其中80%的問題為承載網絡所導致,最主要的原因就是網絡中存在丟包問題。本文將從視頻業務的特征出發探討如何解除網絡丟包問題對視頻業務的不良影響。
[關鍵詞]視頻 網絡 丟包
隨著軍隊信息化建設的不斷加快,視頻業務(如視頻監控、視頻會議等)憑借快捷、便利、靈活、高效等特點取得了快速的發展,在日常辦公、部隊管理、作戰指揮中已經被廣泛的接受和應用,取得了良好的軍事效益和經濟效益。但是在視頻業務的使用過程中,經常出現視頻圖像卡頓、花屏等問題,產生此類問題的因素可能涉及到前端攝像頭、編碼器、網絡、媒體單元、解碼器等,根據統計發現其中80%的問題為承載網絡所導致。本文將從視頻業務的特征出發探討如何解除網絡問題對視頻業務的不良影響。
一、視頻業務網絡特征
通常網絡側引起視頻卡頓、花屏等現象的最主要原因就是網絡中存在丟包,要確定原因在哪里,首先需要了解視頻流量的特點。
1、高帶寬。與語音、數據等業務相比,視頻業務所占帶寬是最高的。一方面單路視頻的分辨率和碼率在不斷提高,一路H.264編碼720P的高清視頻占用2M左右帶寬;與此同時,視頻接入點不斷增加,匯聚起來,也會形成洶涌的干流帶寬。
2、流量突發。依據視頻圖像壓縮算法,視頻流量由一系列的I幀和P幀組成,I幀傳遞一副圖像的完整信息,P幀傳遞每副圖像之間的差異信息。顯然I幀占用更多的IP包,并瞬時形成報文突發,高清視頻相對于CIF格式,此現象會更為明顯。另外,當前各廠家所生產的前端或局端單元普遍沒有采用碼流平滑技術,通常所宣稱的碼率(例如720P,4M/S),實際上是以秒為單位的平均流量大小,但是通過實際抓包分析視頻流量特點,能發現視頻流量的瞬時帶寬,能夠達到28M/S,也就是說峰值流量是平均流量的7倍,如下圖所示。
如下圖示例,當這種帶有突發特征的多路視頻流疊加在一起時就會累積形成更大的突發流量。
3、丟包敏感。由于視頻業務輸出數據的高壓縮比,在報文丟失的影響方面存在放大效應。對于每幀報文,如果出現一個丟包,整幀報文重組都將失敗,如果I幀出現報文丟失,整個1秒鐘的圖像都會受到影響。普通IP業務一般丟包率控制在1%~2%以內,但對于視頻業務來說這個控制指標遠遠不夠,需要考慮更嚴格的0%~0.05%網絡端到端丟包率設計。
二、視頻業務網絡故障技術分析
既然視頻流量具有這樣的特征,那么在網絡傳輸中是否一定會出現丟包呢?解答此問題,需要了解網絡在什么情況下會產生丟包,才能針對給出解決辦法。
1.信道質量差,數據在傳輸過程中出現錯誤。此問題較為常見,通常也較好排查,通過查看網絡設備接口計數器是否存在錯誤報文持續增長,即可定位。
2.網絡端口協商出現問題,例如速率、雙工等模式協商出現異常。此問題經常出現在視頻前端或局端接入網絡處。特別需要注意的是,如果視頻前端或局端配置100M全雙工模式,交換機端口是auto,這時交換機端口上會協商成100M半雙工,在這種情況中網絡就會出現丟包等問題。需要手動把交換機端口設置成100M全雙工,與視頻前端或局端匹配,問題就會得到解決。
3.網絡擁塞。此問題通常較難排查,因為我們通常查看網絡接口帶寬利用率,可能只有30%,但實際上由于視頻流量突發特征,可能端口在瞬時已經產生擁塞并導致了丟包。某些網絡設備在接口計數方面存在缺陷,不能夠直觀顯示出由于網絡擁塞所導致的丟包,導致問題定位排查較為復雜。
基于網絡擁塞較難排查,接下來分析此問題如何處理。
對于傳統網絡設備,基于設備轉發原理,不會在端口入方向產生擁塞,也不會在端口入方向產生擁塞丟包,網絡節點只可能在兩種流量模型(高低速模型和匯聚模型,如下圖所示)才會在端口出方向產生擁塞。高低速模型,指的是從高帶寬端口發送流量到低帶寬端口;匯聚模型指的是多個端口向一個相同速率的端口發送流量。那么是否網絡中只要存在這樣的節點,就一定會出現擁塞丟包。這里分析的是設備接口帶寬,但是網絡中是否產生了擁塞,需要結合實際場景進行分析,需要考慮在每條鏈路上,當前具體傳輸的流量帶寬有多大,峰值有多大,峰值流量持續時間有多長,以此來判斷網絡中是否存在產生擁塞的可能。潛在擁塞點找到了,網絡中可能也確實產生了擁塞,那么網絡設備是否一定會產生丟包。通常網絡設備端口出方向都具備一定的緩存能力,根據設備、板卡類型、軟件版本不同,緩存能力也存在差別。如果瞬時突發流量在端口緩存能力范圍內,那么不會出現丟包情況,突發的流量會暫時緩存起來,待線路空閑時,再將緩存流量發送出去。反之,網絡中就產生丟包。
定位網絡節點是否出現擁塞丟包,可以采用以下兩種方法:1.對于部分網絡設備,可以通過查看接口計數器,觀察discard參數是否持續增長,此參數代表接口擁塞丟包數量。2.對于部分網絡設備,由于芯片限制,不能通過接口計數器直接查看接口是否存在擁塞丟包。此時接口計數器雖然也有discard參數,但是并不能反映實際擁塞丟包情況,此時可以通過抓包來進行分析。
三、視頻業務網絡故障解決方案
通過以上分析,對視頻流量特征有了清晰的認識,也對如何定位視頻承載網丟包問題有了一個明確的處理思路。基于視頻業務網絡問題處理經驗,在業務處理過程中提出以下建議:1.視頻前端或局端支持碼流平滑功能。很多時候,承載網是固定的,給視頻業務提供的帶寬也是確定的,如果能夠支持碼流平滑功能,將極大的提升視頻產品的網絡適應能力。2.視頻流量增強抗丟包功能,建議采用編碼時增加冗余方式來實現。雖然很多視訊產品宣稱支持5%的丟包率,但從實際使用來看,部分前端丟包0.1%情況下,視頻圖像就會出現問題。3.承載網建議采用輕載方式,帶寬利用率建議在40%左右,避免出現鏈路利用率過高導致視頻傳輸性能下降情況。4.網絡質量差的情況下,例如視頻會議網絡中存在丟包場景,可以嘗試拔掉交換機上不必要的網絡連接,保證會議的網絡帶寬,或者在終端設備上設置低接入會議帶寬,保證會議暢通。5.在帶寬資源允許的條件下,保證承載網的帶寬需求,提高視頻業務質量。
結束語:視頻業務的音視頻效果與承載網絡質量緊密相關。在大型視頻業務系統組網中,由于傳輸設備及傳輸線路極為復雜,網絡側引入的問題可能性就更大,丟包、亂序、擁塞等問題時有發生。為檢測網絡質量,人們通常習慣使用Ping命令進行測試,而PRT與ICMP協議原理不同,Ping命令無法測試網絡傳輸PTR碼流的真實情況。處理問題時,首先要采用分段分塊、化繁為簡的方法將測試系統最小化并將故障復現;其次要考慮每一臺網絡設備、每一個設備端口甚至每一根網線所造成的影響;最后要選用專業的測試軟件和測試方法來進行分析,只要理清思路,最終一定能夠準確的定位問題并找到解決問題的方法。