薛勇
隨著互聯網技術的快速發展,廣電行業音頻實時傳輸的技術也日益更新。特別是近年來IP技術普遍應用,使得研究IP技術在專業廣電領域實現數字音頻實時傳輸勢在必行。使用低成本、適應局域網網絡環境、高可用性的SIP協議,通過成熟而容易獲得的互聯網寬帶將外場直播的音頻信號高質實時回傳到直播室,是一種高質量、低成本的音頻傳輸手段。
1.光纖:傳輸質量高,安全度較高,通信容量大,抗干擾能力強,但費用高,且必須在有光纖接入點的地方才可以使用。
2.微波:帶寬較大,穩定性較高,但城市里高樓林立,容易受到遮擋,可行性不高。
3.ISDN:用MPEG-1、MPEG-2等編解碼方法,傳輸高質量的音頻(立體聲)。缺點是申請繁瑣,調試也比較復雜,中國電信已經停止新申請布點了。
4.電話線:方便容易獲取,但傳輸質量不高。
5.基于IP的音頻傳輸:IP 傳輸是完全建立在Internet 網絡基礎上的傳輸模式,可以認為是經濟實用且高效的傳輸模式,缺點是延時比較大,有些設備調試比較復雜,需要用電腦進行設置,同時穩定性容易受網絡狀況影響。

圖1 系統連接框圖
6. 3G傳輸:3G和IP在傳輸模式和工作原理上是完全相同的,具有靈活、不受場地限制的優點,對外場傳輸線路幾乎沒有要求。但3G 傳輸方式受制于基站的信號強度和上行速率,在基站附近人數眾多、使用量較大的時候容易受帶寬和基站負荷等各種外在干擾的影響,對于音頻傳輸而言會出現瓶頸現象。
本單位在近年每年都有不少外場活動,實時音頻信號根據具體活動的需求,采取了光纖、ISDN以及電話線來進行回傳。許多活動節目部門需要進行成本核算,因而選取一種既有優秀的傳輸質量,成本又不太高的傳輸方式尤為重要。經過研究和實驗,我們發現基于互聯網的SIP網絡傳輸比較符合我們的要求。
SIP協議是由互聯網工程任務組(IETF)制定的應用層控制協議,主要功能是完成多媒體的呼叫控制,它借鑒了HTTP和SMTP等互聯網上成功的應用層控制協議,是一種基于文本的應用層控制信令協議,獨立于底層協議,可以使用TCP或UDP作為底層傳輸協議。SIP 協議和其他協議一起給用戶提供完整的服務,用于建立、修改和終止IP網上的雙方或多方多媒體會話。SIP協議支持代理、重定向、登記定位用戶等功能,支持移動用戶,與RTP/RTCP、SDP、RTSP、DNS 等協議配合,可支持和應用與語音、視頻、數據等多媒體業務。隨著SIP協議及其應用的不斷完善,3GPP組織已經將SIP作為3G 全IP網絡多媒體子系統(IMS)的控制協議,下一代網絡(NGN)中SIP協議也成為核心協議。
以往基于互聯網進行實時音頻傳輸的方式都存在一些問題,如設置比較繁瑣,需要用電腦對設備的參數進行設置與調整,同時對網絡的要求比較高,如果一方或雙方不在同一個局域網進行傳輸,容易被防火墻阻隔,難以穿透局域網NAT等。
而基于SIP服務的實時網絡音頻傳輸優勢在于其便利性。去到新的直播場地,只要接上寬帶網絡,設備自動登陸SIP服務器,連接成功后,即可連接當前在該服務器上登記注冊地址的另一臺SIP設備進行傳輸。
1.基于SIP服務的音頻傳輸的連接方式
外場信號→ZIP音頻編解碼設備1→【互聯網】→ZIP音頻編解碼設備2→電臺播控室→電臺直播室。系統連接圖如圖1。
2.工作流程
和以往基于IP網絡的實時音頻傳輸點對點直接連接不一樣的是,SIP采取通過第三方服務器的方法獲得連接。
SIP協議采用邏輯帳號與物理地址相分離的方式,先給設備設定名稱,這個作為該設備的邏輯賬號,一個邏輯帳號可以對應若干真實的物理地址,SIP 用戶可以在不同的地方注冊到SIP服務器,將當前物理地址存儲在位置服務器中,因此,即使每次在不同地點直播,也不需要手動設置客戶端的物理地址。
SIP服務器的功能就是接受SIP終端的注冊請求,將用戶的邏輯帳號和物理地址在位置服務器中建立綁定關系,當有對該用戶的呼叫時,從服務器中獲取被叫用戶的物理地址,然后將呼叫請求轉移到被叫用戶。連接流程如圖2。
從流程框圖可以看到,基于SIP服務的實時音頻傳輸方式,設備A和B只需要連接到互聯網,它們會自動連接到服務器,連接成功后,呼叫另一方即可建立連接。將網絡調試、連接工作交給服務器及設備端去自動執行,簡化了技術人員的工作流程,使得易用性大大增加。由于SIP有著這樣的便利性,因此各大廠商也研發出通過SIP協議對音頻進行實時傳輸的設備,用于簡化操作流程。
3.音頻編解碼方式的選擇
采用IP網絡的傳輸,延時較大是它的一個不足之處。因此應該選取合適的編解碼方式盡量減少延時,既要提供高質量的音頻,同時也要保證延時不能太大。我們采用的是AAC-ELD系列通信編解碼。
傳統的窄帶電話僅能傳輸最高3.5kHz的音頻帶寬,而AAC全高清語音系統則能傳輸從14kHz到人耳能聽到的全部音頻頻譜。通過這種方法,我們可以做到利用較小的帶寬得到優秀的音質。AAC系列的全高清語音編解碼器包括低延遲AAC(Low Delay AAC,AACLD)、增強型低延遲AAC(Enhanced Low Delay AAC,AAC-ELD)。
AAC-LD是高品質視頻會議的行業標準,可提供全帶寬、低延遲的音頻編碼。理論上僅有20毫秒的算法延遲,同時為所有類型的音頻信號提供良好的壓縮率和高聲質。
AAC-ELD是AAC-LD的增強型版本,結合了MPEG-4AAC-LD和頻譜復制。AAC-ELD也是所有要求在24kbps低數據速率下擁有全音頻帶寬的延遲敏感型應用的最佳選擇。據統計,AAC-ELD在同樣的碼率情況下,比MP3的延遲要減少三分之一。
AAC-LD和AAC-ELD目前已經用于專業及消費級視頻會議,例如,蘋果的Face Time應用就是基于AACELD。
4.穩定性測試
經過測試和研究,我們使用Telos公司的Z/IP ONE音頻傳輸設備,遠程連接后,音頻傳輸延遲在1秒以內,在可接受范圍內。對于必須使用雙向傳送的節目直播,可使用模擬電話作為返送傳輸,以減少傳輸延時。
在測試中發現,這套系統的性能主要決定因素是網絡狀況,可以根據網絡狀況來選擇設備的編碼碼率,緩沖時間的上下限等,以保證傳輸不中斷。在正常情況下4M Adsl就能夠滿足本系統的要求,傳輸延時一方面取決于設備設定的緩沖時間,另一方面取決于網絡中數據傳輸的延時。
在今年全國兩會期間,深圳廣播新聞頻率先鋒898使用本套系統進行直播音頻的傳輸主路,以數字電話耦合器通過電話線作為傳輸備路,北京直播室使用電信寬帶,深圳直播室通過單位局域網連接,設備連接成功后,10天內持續通電保持連接未有中斷,穩定性還是比較高的。需要注意的是,當處于同一局域網的電腦或網絡設備進行大量的下載時,將會導致網絡波動,延遲增大,嚴重的話甚至會有中斷的情況,因此建議申請的寬帶網絡帶寬由傳輸設備獨享,不要連接其他設備或電腦,以保證播出的安全可靠。
1.彭煥峰:《SIP注冊服務器的研究與設計》,《電腦知識與技術》,2010年第32期。
2.趙軍:《基于互聯網的遠距離音頻傳輸應用》,《中國傳媒科技》,2010年第5期。

圖2 SIP協議連接流程