李仁杰,許柳竣熙,劉 屹
(云南廣播電視臺,云南 昆明 650050)
當前,在廣播電視行業,4K技術發展迅速。4K電視信號主要分為未經壓縮的基帶信號和經過壓縮的編碼信號兩大類。壓縮會造成原始數據的信息丟失。壓縮得越厲害,丟失的信息越多。由于制作過程中需要對視音頻內容進行再處理,應盡量避免壓縮造成的數據損失、視音頻質量下降,所以制作域一般使用基帶信號。國家廣播電視總局發布的《4K超高清電視節目制作技術實施指南(2020版)》推薦的4K節目技術參數為3 840×2 160/50P/10 bit,采樣格式為4∶2∶2[1]。一套未壓縮的4K節目信號需要接近10 Gb·s-1的傳輸帶寬,并不適合在網絡中大量分發和遠距離傳輸。傳輸域一般不涉及電視內容的再處理,主要傳輸的是編碼壓縮后的電視信號,編碼格式主要包括AVS2、H265、H264等,一套節目占用的帶寬一般在20 Mb·s-1左右。
圖1為簡化的4K電視信號傳輸網絡。4K電視信號通過總控網絡、電視專網、互聯網分發到有線電視平臺、IPTV/OTT播控平臺、云平臺及其他網絡平臺,用戶通過互聯網(寬帶、4G、5G)、有線電視網絡觀看各平臺播放的4K電視。總控網絡位于4K傳輸網絡的中心,集成了大量的信源設備,承擔了4K信號的編碼、轉碼、協議轉換、衛星接收等功能,負責為不同的平臺和系統提供不同的信號格式和傳輸方式。內網和專網的核心是通過PIM協議(Protocol Independent Multicast,PIM)和IGMP協議(Internet Group Management Protocol,IGMP)搭建的組播傳輸網絡。通過組播分發4K信號,能夠大大減少源端壓力和網絡負載。其他需要穿越互聯網的4K信號則通過RTMP、RTSP、SRT等單播協議進行傳輸。

圖1 4K電視信號傳輸網絡示意圖
IP網絡通過分組交換的傳輸方式實現了通信線路的共享,大大簡化了網絡,節約了資源,但同時也引入了時延、丟包、亂序和抖動的問題。IP傳輸是通過分組存儲轉發實現的。IP網絡中的交換機需要將整個分組存儲到緩沖區,排隊等待著有序地從輸出鏈路輸出。所以分組在傳輸過程中,除了相對固定的傳播時延、存儲轉發時延,還會產生排隊時延。排隊時延取決于當時網絡的擁塞情況。如果分組到達交換設備時設備的緩沖區已滿,設備會丟棄剛到達的分組或者排隊的分組;或是分組在傳輸過程中發生錯誤,交換機對分組進行校驗時發現錯誤,則會丟棄該分組[2]。分組被丟棄簡稱丟包。屬于同一4K信號的不同分組從源端發出,但可能會經由不同的路由到達目的端,導致目的端收到的分組亂序。而時延、丟包、亂序會導致用戶側信號抖動,直觀表現為4K信號馬賽克、花屏、黑屏等。
4K信號傳輸必須經過源端設備、交換設備、傳輸介質。設備和介質故障都有可能導致4K信號異常或斷流。例如,信源設備、交換損壞或性能不足導致輸出的數據錯誤,人為的設備配置錯誤導致信號不符合要求,信號在光纖、雙絞線、電磁波中傳輸時造成的數據丟失或者數據失真等。
視音頻質量監測指的是對解碼后的4K電視節目進行監測,這是一種最常用的監測手段,也是最直觀的監測手段。視音頻質量監測主要是對視頻內容和音頻內容出現的問題進行監測,包括信號中斷、視頻靜幀、黑場、彩條、臺標丟失以及音頻響度異常等。解碼后的4K電視信號可以由監視器直接播放,所以音頻質量監測是搭配畫面監測一起使用的,便于值班員判斷某些監測設備無法識別的異常,例如4K電視信號在基帶側使用4路3G-SDI進行傳輸,由于線序混亂造成的畫面異常。為了減少告警誤差,管理員對每一項監測指標都設置了報警門限,如圖2所示。指標超出門限,系統才發送告警。視音頻質量是影響用戶體驗的最終標準。

圖2 視音頻質量監測指標
總控網絡主要通過組播的方式分發TS over UDP的4K電視信號。TS over UDP即應用層實體根據MPEG2-TS標準對編碼的視音頻數據進行封裝,并使用傳輸層用戶數據報協議(User Datagram Protocol,UDP)提供服務進行通信。TR101-290標準提供了對TS流的三級錯誤監測。為了減少報警信息,只對可能導致TS流無法正確解碼的致命錯誤進行監測,包括同步丟失錯誤、同步字節錯誤、PAT錯誤、連續計數錯誤、PMT錯誤、PID錯誤,傳輸錯誤、CRC錯誤以及CAT錯誤,如圖3所示。每個TS流中可以包含多套節目,每套節目一般包含一個視頻流和多個音頻流,其中每個視頻流或音頻流都通過唯一的PID進行標識。TS流監測能夠提供基于單個視頻流或者音頻流的錯誤告警,而且對于傳輸錯誤相較視音頻質量監測更敏感[3]。

圖3 可能導致TS流無法正確解碼的致命錯誤
3.3.1 交換設備監測
交換設備監測對于故障的定位、診斷和預測有重要意義。交換設備的狀態會直接影響4K信號的傳輸。通常,傳輸介質的故障也能通過交換設備的端口狀態變化獲知。使用簡單網絡管理協議SNMP對網絡中的交換設備進行監測[4],SNMP協議可以提供設備的CPU使用率、內存使用率、設備溫度、光模塊收發功率以及接口當前狀態等重要信息。總控網絡中部署了統一的網絡管理系統NMS(版本SNMPv2c),被管設備啟用SNMP-agent協議,NMS可以向SNMP-agent查詢設備狀態,設備也可以通過SNMP-agent協議向NMS上報trap和inform告警。圖4為交換機的SNMP相關配置。SNMP為交換機基本特性,不需要額外的硬件支持和軟件許可。交換機可以同時使能SNMP所有版本,保證可以和網絡中的不同版本的NMS通信。如果系統有信息安全的相關要求,可使用SNMPv3版本。該版本提供了認證加密和基于用戶的訪問控制。

圖4 交換機SNMP相關配置
3.3.2 網絡性能監測
統計周期內的丟包率,可以監測當前IP網絡的性能[5]。例如,啟用交換機提供的iPCA功能,可以統計某個設備整體的丟包率、兩個設備間直連鏈路的丟包率以及目標IP流在某個網絡區域內的丟包率。IP分組的網絡層頭部和傳輸層頭部攜帶的五元組信息(協議、源地址、源端口、目的地址、目的端口)可以用來唯一標識一個目標IP流。統計設備整體的丟包率,可以快速定位某個交換設備導致的網絡故障。統計設備間直連鏈路的丟包率,可以快速定位連接兩臺設備的物理傳輸介質的故障。統計目標IP流在某個網絡區域內的丟包率,可以測定該區域的網絡性能,適用于4K信號需要穿越外部網絡,或者區域內部的交換機不支持iPCA功能的情況。例如,總控網絡中的流媒體服務器向云平臺推送基于RTMP協議的4K流時,需要穿越業務外網,一旦信號出現異常,通過測定4K流在該區域內的丟包率,可以快速定位故障點。一旦確認業務外網存在網絡故障,相關統計數據可以作為與其他部門協調的依據。
3.3.3 媒體傳輸質量監測
對目標流出現的丟包、抖動、亂序等情況進行監控,需要分析TCP報文、RTP報文等來獲取信息。例如,通過TCP報文的重傳數量計算丟包率,通過RTP報文中的時間戳計算抖動等。可以直接啟用交換機提供的eMDI功能或者通過獨立的監測設備對媒體傳輸質量進行監測。
視音頻質量監測需要讀取4K信號的外層頭部(網絡接口層、網絡層、傳輸層、應用層)信息,對分組數據進行解封裝、重組、解碼之后才能對內容進行分析。而TS流監測和媒體質量監測都只需要對4K信號進行解封裝,并分析外層頭部數據。因此,獨立的視音頻質量監測設備也具備TS流監測和媒體質量監測的功能。
系統中的設備達到時間同步是為了保證告警的準確性,提高告警記錄的可讀性,有利于排除故障。設備時間同步是對IP傳輸質量進行監測的先決條件。4K壓縮信號傳輸系統通過網絡時間協議NTP進行設備時間同步。在時間同步子網中,設備所處的層數代表時間的精確度,層數越低,精確度越高。總控網絡中的主時間服務器直接同步到標準參考時間,時間精確度最高,處在1層。當設備同步到處于N層的另一臺設備,則該設備處于N+1層。設備處于16層代表時鐘未同步。總控網絡中部署了兩臺主時間服務器。一般情況下,與主時間服務器直連的核心交換機通過單播Client/Server模式同步到服務器,其他交換機通過對等體模式,由高層的對等體向低層的對等體同步。網絡末端的主機直接同步最近的交換機,減少NTP報文穿越網絡。圖4為其中一臺核心交換機的NTP配置。該設備配置了三個時鐘源(主時間服務器、對等體、設備本身),并擇優同步到了時鐘精確度最高的主時間服務器,處于時鐘同步子網的2層。一旦主時間服務器失效,設備會擇優同步到其他時鐘源。
當目的端的4K電視節目發生異常,需要逆著傳輸方向一段鏈路一段鏈路地向前排查,或者根據經驗去排查概率較高的故障點。由于4K信號的傳輸線路一般需要經過幾臺甚至十幾臺分組交換設備,會增加故障排查的難度和時間。因此需要設計一個合理的監測部署方式來加快故障排查的速度。對上文提到的三種監測方式進行對比,如表1所示。

表1 三種監測方式對比

圖5 交換機NTP配置
由表1可知,視音頻質量監測除了需要對4K網絡信號進行解封裝外,還要解碼,耗費資源最多、時間最長、成本最高。TR101-290只能監測應用層使用了TS封裝的信號。傳輸信號包含大量TS over IP信號,例如總控網絡中以組播方式傳輸的TS over UDP信號。IP傳輸質量監測不需要增加單獨的監測設備,可以利用傳輸鏈路原本存在的交換機來實現,成本最低。視音頻質量監測成本最高,但有其必要性,IP傳輸質量監測和TR101-290三級錯誤監測主要針對信號在傳輸過程中出現的數據丟失和數據失真問題,TR101-290還能識別流故障,但是無法識別視音頻編碼數據原本就存在的錯誤,這種錯誤是信源設備在對4K信號進行編碼、轉碼等相關操作時導致的,可能是設備性能不足或者人為操作失誤造成的。例如,當信源設備的編碼功能主要依靠GPU,且使用獨立的通道控制輸入輸出,設備編碼能力不足會導致視音頻數據異常但不會影響信號的輸入及輸出。以上情況導致的信號異常不會表現在IP層面和TS層面,因此,IP傳輸監測和TS流監測并不能識別此種信號故障,此時只能依靠視音頻質量監測。
為了盡可能減少成本,且達到最好的監測效果,需要在傳輸線路的所有交換機上都啟用IP傳輸質量監測;在源端和末端部署視音頻質量監測;對于TS流的傳輸,需要在網絡中的重要節點部署TS流監測。
監測管理采用近端監測、分散采集,遠端記錄、集中管理的模式。為了盡可能保證告警的準確性,部署的信號監測設備應當盡可能靠近傳輸線路,避免多余設備和傳輸鏈路引入新的故障。需將監測設備分散部署到網絡的各節點中。監測信號為組播流時,利用組播的泛洪特性,將監測口與傳輸口加入同一虛擬局域網(Virtual Local Area Network,VLAN);監測信號為單播流時,在傳輸交換機配置本地端口鏡像,將4K信號鏡像到同一臺交換機的監測口。
為了對告警數據進行統一記錄和查詢,需建立單獨的管理網絡。傳輸設備和監測設備的日志、告警數據通過管理網絡回傳到遠端的總控系統中,由統一的管理服務器進行記錄和分析。
在4K超高清電視信號傳輸過程中,通過對解碼后的視音頻質量、TS流傳輸質量以及IP網絡傳輸質量進行監測,可以提供全面的報警信息,有利于故障的排查和傳輸鏈路的切換。其中,在IP網絡傳輸質量監測層面,利用傳輸鏈路上的分組交換設備提供設備報警以及網絡性能和媒體傳輸質量的監測,不但節約監測設備的成本,最大程度上簡化網絡結構,同時能夠掌握整個傳輸網絡的變化情況。隨著4K超高清電視信號的發展,通過IP網絡傳輸的未壓縮電視信號的監測也需要增加到現有系統中,提供全信號的監測能力。