◆徐亮亮 武 攀 王克育
?
基于AVB技術(shù)的網(wǎng)絡(luò)化音頻系統(tǒng)設(shè)計
◆徐亮亮1武 攀2王克育3
(1.海軍裝備部信息系統(tǒng)局 北京 100841;2. 中國電子科技集團(tuán)公司第二十八研究所 江蘇 210007; 3. 北京英思杰科技有限公司 北京 100081)
本文針對會議場所、指揮控制中心的音頻系統(tǒng)建設(shè)需求,設(shè)計了一種基于AVB技術(shù)的網(wǎng)絡(luò)化音頻系統(tǒng),并將此系統(tǒng)應(yīng)用于工程建設(shè)中,為會議場所、指揮控制中心的大型音頻系統(tǒng)的設(shè)計與建設(shè)提供參考。
AVB;音頻系統(tǒng);網(wǎng)絡(luò)化
隨著數(shù)字信號處理、網(wǎng)絡(luò)技術(shù)的發(fā)展,現(xiàn)代會議場所、指揮控制中心的音視頻系統(tǒng)已向數(shù)字化、高清化、網(wǎng)絡(luò)化、大規(guī)模化方向發(fā)展。數(shù)字化是高清化、網(wǎng)絡(luò)化的基礎(chǔ),雖然高清音視頻并不一定非要是數(shù)字信號,但是數(shù)字信號具有抗干擾性強、易處理的特性,使得高清音視頻越來越多地采用數(shù)字技術(shù)。在音頻系統(tǒng)中,數(shù)字調(diào)音臺和數(shù)字音頻處理器的廣泛使用,使系統(tǒng)不僅具備原來模擬設(shè)備的性能和功能,而且通過數(shù)字化技術(shù)與網(wǎng)絡(luò)的結(jié)合,使音頻系統(tǒng)發(fā)生質(zhì)的變化,系統(tǒng)的處理能力和管理能力大為增加。
采用模擬設(shè)備構(gòu)建大型會議場所、指揮控制中心的音頻系統(tǒng)時,各部位具有音頻處理設(shè)備(如調(diào)音臺、音頻處理器)、模擬話筒、混音器、數(shù)字會議主機、數(shù)字會議話筒、功放和音箱等設(shè)備。當(dāng)部位之間需要交互音頻信息時,需通過音頻傳輸設(shè)備(如音視頻光端機)與安裝在音視頻機房的音頻切換矩陣連接,依賴于音頻切換矩陣實現(xiàn)各部位之間的音頻互通。通過編碼器與解碼器,音頻切換矩陣還負(fù)責(zé)與外部互通音頻信息,以實現(xiàn)各部位與外部之間的音頻信息交互。如上所述,以音頻切換矩陣為核心構(gòu)建的音頻系統(tǒng)如圖 1所示。

圖 1以音頻切換矩陣為核心的系統(tǒng)示意圖
當(dāng)系統(tǒng)規(guī)模較小時,采用上述以音頻切換矩陣為核心的系統(tǒng)可以滿足使用需求。但當(dāng)系統(tǒng)規(guī)模較大時,就暴露出其缺點:首先,需占用各部位的音頻處理設(shè)備上的物理接口與音頻切換矩陣互通信息,如采用模擬調(diào)音臺,還需配合其他設(shè)備使用;其次,接線、連接環(huán)節(jié)較多,給系統(tǒng)集成施工、維護(hù)保障人員帶來較大壓力;再次,采用音頻切換矩陣,擴(kuò)展不便。在實際工程應(yīng)用中,多通道音視頻的管理一直都是一個龐大的工程。大型的音視頻項目若采用模擬調(diào)音臺的方式基本上無法實現(xiàn),即使采用接口矩陣的形式,也無法搭建上千個通道互聯(lián)的網(wǎng)絡(luò)系統(tǒng)。因此,設(shè)計大規(guī)模音視頻系統(tǒng)時,通常尋求網(wǎng)絡(luò)化技術(shù)構(gòu)建音頻系統(tǒng),以增強系統(tǒng)的處理能力、管理能力和擴(kuò)展能力。
采用網(wǎng)絡(luò)化技術(shù)構(gòu)建會議中心、指揮控制中心的音視頻系統(tǒng)時,必須注意的是:音頻系統(tǒng)在多人進(jìn)行遠(yuǎn)程視頻會議、視頻指揮時所扮演的角色無法替代。在這些活動中,顯示的圖像、畫面有卡頓、馬賽克、雪花、抖動等現(xiàn)象出現(xiàn)時,并不會從根本上影響身處異地的多人之間的信息交互,因為可以只依賴音頻進(jìn)行通信而無需視頻。但是,一旦音頻出現(xiàn)各種異常情況,比如斷斷續(xù)續(xù)、尖響等,就會令人非常不悅,甚至導(dǎo)致參與者不能正確理解他人的意圖,從而造成嚴(yán)重后果。唇音同步也是構(gòu)建此類場所內(nèi)音視頻系統(tǒng)時需注意的問題,以保證使用者的用戶體驗。因此,在這些應(yīng)用里,音頻系統(tǒng)是對時間敏感的典型案例。
網(wǎng)絡(luò)音頻系統(tǒng)的核心技術(shù)是能滿足音頻信號在網(wǎng)絡(luò)中傳輸和分配的專用音頻網(wǎng)絡(luò),該網(wǎng)絡(luò)應(yīng)該由一個為業(yè)內(nèi)廠商公認(rèn)的音頻網(wǎng)絡(luò)協(xié)議、支持該協(xié)議的硬件和軟件所組成。在網(wǎng)絡(luò)音頻系統(tǒng)中,各種音頻設(shè)備,如聲源設(shè)備、音頻處理器、調(diào)音臺、功放等均應(yīng)能適用上述專業(yè)音頻網(wǎng)絡(luò)。已有CobraNet、EtherSound等為滿足上述要求而在以太網(wǎng)基礎(chǔ)上開發(fā)的專用音頻網(wǎng)絡(luò)技術(shù),這些技術(shù)完全兼容以太網(wǎng),網(wǎng)絡(luò)音頻的數(shù)據(jù)流可以通過雙絞線按以太網(wǎng)100Base-T標(biāo)準(zhǔn)格式傳輸。
如前所述,音頻系統(tǒng)是對時間要求極為嚴(yán)苛的典型應(yīng)用。以太網(wǎng)絡(luò)是為了保證數(shù)據(jù)的可靠傳輸而制定的一系列標(biāo)準(zhǔn),在數(shù)據(jù)傳輸時可以接受延遲,但是這并不適合音視頻的傳輸。因此,IEEE802.1研究組在普通以太網(wǎng)的基礎(chǔ)上針對數(shù)字化音頻流和視頻流提出了一組協(xié)議——AVB協(xié)議。
AVB的全稱是IEEE802.1 Audio Video Bridging Work Group,簡稱IEEE802.1 AVB WG或者直接叫AVB。它是具有確定的延遲界限和端到端性能保障。AVB相關(guān)的IEEE標(biāo)準(zhǔn)包括:
(1) 802.1AS:針對時間敏感應(yīng)用制定的定時和同步協(xié)議,類似于IEEE1588v2精確時間協(xié)議(Precision Timing Protocol,PTP),節(jié)點間采用主從時鐘同步機制,將主時鐘發(fā)布到所有的網(wǎng)絡(luò)組件進(jìn)行同步,主時鐘依據(jù)最優(yōu)主時鐘算法(Best Master Clock Algorithm,BMCA)來確定;
(2) 802.1Qat:對局域網(wǎng)內(nèi)部的流媒體預(yù)約服務(wù)(Stream Reservation Protocol,SRP),SRP協(xié)議對音視頻流傳輸路徑上的源節(jié)點、目的節(jié)點和交換機進(jìn)行登記,并預(yù)留所需的帶寬資源,如果帶寬允許,則建立音視頻流連接,否則連接建立失敗;
(3) 802.1Qav:對時間敏感的流媒體轉(zhuǎn)發(fā)和堆棧控制協(xié)議;
(4) 802.1BA:音視頻橋接系統(tǒng);
(5) 1722:IEEE1722標(biāo)準(zhǔn)是在橋接的局域網(wǎng)中,針對時間敏感應(yīng)用制定的2層傳輸協(xié)議。AVB在傳輸層采用了IEEE1722標(biāo)準(zhǔn),用以實現(xiàn)AVB流的建立、控制和關(guān)閉;
(6) 1733:IEEE1733標(biāo)準(zhǔn)是在局域網(wǎng)中,針對時間敏感應(yīng)用制定的3層傳輸協(xié)議,該協(xié)議整合了RTP技術(shù),并更新了RTCP對RTP的控制方法,讓RTP充分與AVB適應(yīng),完成想要的結(jié)果;
(7) P1722.1:負(fù)責(zé)AVB設(shè)備的發(fā)現(xiàn)、列表、連接管理和控制遵循1722標(biāo)準(zhǔn)的設(shè)備。
典型AVB網(wǎng)絡(luò)拓?fù)浒珹VB端節(jié)點和AVB橋接器。其中,AVB端節(jié)點分為Talker和Listener兩類。Talker作為“發(fā)送端”,負(fù)責(zé)產(chǎn)生和發(fā)布音視頻流;Listener作為“接收端”,實現(xiàn)音視頻流接收。每個端節(jié)點可以分別作為發(fā)送端或接收端,也可以既是發(fā)送端又是接收端。AVB橋接器就是支持AVB技術(shù)的交換機(ABV交換機),參與AVB網(wǎng)絡(luò)時鐘同步、流預(yù)定和消息排隊處理。
使用標(biāo)準(zhǔn)的802幀,AVB設(shè)備可以識別非AVB設(shè)備并與之通信,但是不能通過非AVB交換機傳送AVB數(shù)據(jù)流。非AVB交換機是AVB流傳輸?shù)倪吔纾鐖D 2所示。

圖 2非AVB交換機不能傳輸AVB數(shù)據(jù)流
在百兆以太網(wǎng)中,AVB技術(shù)最遠(yuǎn)支持7個網(wǎng)絡(luò)Hop的長度下,可以將同步音視頻數(shù)據(jù)的傳送延時限定在2ms之內(nèi)。這樣的傳輸延時達(dá)到了A級傳送標(biāo)準(zhǔn):ITU-T定義的一種ATM(異步傳送模式)傳輸業(yè)務(wù)等級。在此,Hop就是一個“跳”的意思,通俗的解釋就是“每一段”線纜(如超五類雙絞線)稱為一個Hop。當(dāng)系統(tǒng)中的設(shè)備不是直接連接,而是通過一個網(wǎng)絡(luò)中繼設(shè)備DTE(像交換機、路由器之類的網(wǎng)絡(luò)中繼設(shè)備都稱為DTE)互聯(lián)的結(jié)構(gòu)就構(gòu)成了2個Hop,這樣的連接方法可以延長傳送距離。7個Hop就允許AVB發(fā)送端和AVB接收端之間最多存在6臺AVB交換機,如圖 3所示。

圖 3傳輸路徑最多7個Hop
除網(wǎng)絡(luò)Hop限定為7以外,AVB傳輸還需要的一個基本QoS(Quality of Service)保證為:不可以因為網(wǎng)絡(luò)擁堵而丟棄數(shù)據(jù)包。
AVB協(xié)議定義了A類(SR_A)和B類(SR_B)兩種音視頻預(yù)定流。其中:SR_A類幀率為125μs,幀長不超過1171Byte,7跳延遲目標(biāo)為2ms,最大抖動為125μs;SR_B類幀率為250μs,幀長不超過1500Byte,7跳延遲目標(biāo)為50ms,最大抖動為1000μs。不屬于這兩類的流量將被當(dāng)作BE(Best Effort)流量來對待,AVB協(xié)議族推薦75%的帶寬資源分配給音視頻流SR_A和SR_B,剩下的25%分配給BE流量。例如對100Mb/s的網(wǎng)絡(luò)要給非AVB類型的其他數(shù)據(jù)保留25Mb/s的可用帶寬。但是有些廠家在生產(chǎn)設(shè)備時并不嚴(yán)格遵守標(biāo)準(zhǔn),以便充分利用帶寬傳輸音視頻流。
在AVB發(fā)送端和接收端,流媒體數(shù)據(jù)和標(biāo)準(zhǔn)時鐘信號結(jié)合打包形成以太網(wǎng)數(shù)據(jù)包,實現(xiàn)壓縮和非壓縮的音頻視頻流媒體的同步傳輸。
以AVB技術(shù)為核心設(shè)計的大型會議場所、指揮控制中心音頻系統(tǒng),采用商用高性能AVB數(shù)字音頻處理器、服務(wù)器,支持處理、傳輸48kHz采樣率、24位的音頻數(shù)據(jù)格式。各AVB設(shè)備通過支持AVB協(xié)議的交換機構(gòu)建的網(wǎng)絡(luò),互通音頻信息。系統(tǒng)示意圖如圖 4所示。

圖 4以AVB技術(shù)為核心構(gòu)建的系統(tǒng)示意圖
同圖 1相比,在圖 4中,各部位的音頻處理設(shè)備均為支持AVB協(xié)議的數(shù)字音頻處理器。數(shù)字音頻處理器同模擬調(diào)音臺相比,雖然需要將音頻信號經(jīng)過模/數(shù)轉(zhuǎn)換后進(jìn)行處理,再將處理完的信號經(jīng)過數(shù)/模轉(zhuǎn)換,但是借助超大規(guī)模集成電路技術(shù)與數(shù)字信號處理技術(shù),通過軟件編程,在單臺設(shè)備上就可實現(xiàn)混音、壓限、增益調(diào)整、均衡、反饋抑制、回聲消除等功能,而不像調(diào)音臺那樣需壓限器、嘯叫抑制器、回聲消除器等設(shè)備配合使用,簡化了連接關(guān)系,減少了設(shè)備接線。類似于圖 1,各部位的AVB音頻處理器連接混音器、數(shù)字會議主機、話筒、功放等設(shè)備,每臺AVB音頻處理器具有兩個RJ45口:一個AVB網(wǎng)口,用于音頻傳輸;一個以太網(wǎng)口,用于配置于控制。每臺VB處理器通過兩根雙絞線接入AVB網(wǎng)絡(luò)。相應(yīng)地,將AVB網(wǎng)絡(luò)劃分為兩個VLAN:音頻VLAN與控制VLAN。這樣做是為了讓音頻聯(lián)網(wǎng)充分利用網(wǎng)絡(luò)帶寬,盡可能多地傳輸AVB音頻流。根據(jù)各部位的本地音頻系統(tǒng)使用需求,選取可配置輸入、輸出接口數(shù)量的AVB音頻處理器或固定輸入、輸出接口的AVB音頻處理器。
圖 4中,安裝在后臺機房的AVB音頻服務(wù)器類似于AVB音頻處理器,通過兩根雙絞線接入AVB網(wǎng)絡(luò):一根用于音頻聯(lián)網(wǎng),一根用于配置和控制。在千兆帶寬下,AVB音頻服務(wù)器的處理AVB音頻流的能力可達(dá)420×420通道,相當(dāng)于一個超大型音頻切換矩陣。計算如下:以48kHz采樣率、24位音頻計,傳輸1個通道的音頻需要1.152Mb/s的帶寬,1000Mb/s帶寬可傳輸1000/1.152≈868通道,輸入輸出各站一半即868/2=434通道,除去數(shù)據(jù)包幀頭的開銷,可達(dá)420通道輸入和420通道輸出,即為420×420通道。設(shè)備將音頻流均定為A類,并將帶寬全部用于音頻傳輸,沒有嚴(yán)格遵循AVB標(biāo)準(zhǔn)的要求留25%的帶寬用于傳輸其他數(shù)據(jù),因此可以達(dá)到如此之多的通道數(shù)。采用這樣的設(shè)備,通過兩根網(wǎng)線連接減化了系統(tǒng)設(shè)計,也減輕了系統(tǒng)集成施工人員與維護(hù)保障人員的壓力。
圖 4中,AVB擴(kuò)展器與音頻編碼器、解碼器連接,實現(xiàn)系統(tǒng)與外界的音頻交互。AVB擴(kuò)展器只需一根雙絞線接入AVB網(wǎng)絡(luò),即可實現(xiàn)音頻聯(lián)網(wǎng)、配置和控制。這是因為擴(kuò)展器傳輸?shù)囊纛l流少,所占據(jù)的帶寬相對較小,可與配置和控制同時傳輸。在此,AVB擴(kuò)展器并不是必須配置的設(shè)備。選用可配置輸入、輸出接口的AVB音頻服務(wù)器,也可用于連接音頻編解碼器,實現(xiàn)系統(tǒng)與外界的音頻交互;還可連接音頻記錄設(shè)備,實現(xiàn)音頻的回放。
圖 4中的控制臺也通過一根超五類雙絞線接入AVB網(wǎng)絡(luò)的控制VLAN。控制臺安裝音頻系統(tǒng)控制軟件,編輯與監(jiān)控各部位AVB音頻處理器、AVB音頻服務(wù)器、AVB擴(kuò)展器的數(shù)據(jù)輸入、輸出、處理功能等。系統(tǒng)控制軟件包括多用戶管理和日志管理:多用戶管理支持權(quán)限分級,不用用戶按級別賦予不同的權(quán)限,實現(xiàn)人員、崗位的管理;日志管理可記錄、查詢用戶操作,做到操作可追溯。由此保證網(wǎng)絡(luò)化音頻系統(tǒng)的使用安全性和可靠性。
網(wǎng)絡(luò)化也給設(shè)備的安裝帶來自由度,如圖中所示,AVB音頻服務(wù)器、控制臺、AVB擴(kuò)展器等,只需接入網(wǎng)絡(luò)中即可,并不限定在后臺機房中。通常將這些設(shè)備安裝在后臺機房的機柜中,是為了便于集中管理與維護(hù)。也可以根據(jù)需要,在多個部位中(如大廳、機房),配置控制臺,實現(xiàn)集中控制的備份。
AVB音頻服務(wù)器不僅具有強大的音頻流處理能力,還可以實現(xiàn)雙網(wǎng)熱備。每臺AVB音頻服務(wù)器可配置成具有2個AVB RJ45接口和2個以太網(wǎng)RJ45口。如將每個部位的AVB音頻處理器改為可配置輸入、輸出接口的AVB音頻服務(wù)器,則可構(gòu)建雙網(wǎng)熱備以增強全系統(tǒng)的可靠性和抗毀性,顯著提高系統(tǒng)對音頻流的處理能力。但是需要注意的是:AVB技術(shù)并不支持鏈路聚合以提高帶寬。
在實際工程中,AVB網(wǎng)絡(luò)中的AVB交換機均采用千兆交換機。兩臺AVB音頻處理器之間的Hop數(shù)通常為2~4:在部位中配置1臺AVB交換機,部位中的AVB音頻處理器接至本部位的AVB交換機;在后臺機房中配置1臺AVB交換機,與各部位的AVB交換機互聯(lián)。這種情況下,Hop數(shù)為4,如圖 5所示。當(dāng)距離足夠近時(100米以內(nèi)),各部位的AVB音頻處理器可以通過雙絞線直接連至AVB交換機上,此時,兩臺AVB音頻處理器之間的Hop數(shù)僅為2。在這些情況下,不同部位的AVB音頻處理器之間傳輸音頻數(shù)據(jù)的延時連2毫秒都不到,甚至小于1毫秒,足以滿足對時間敏感應(yīng)用的嚴(yán)苛要求。并且,這樣低的延時使得AVB音頻系統(tǒng),配合以高清視頻混合切換矩陣為核心的視頻系統(tǒng)使用時,也能保證達(dá)到唇音同步的要求。

圖 5傳輸路徑Hop示意圖
綜上,采用AVB技術(shù)構(gòu)建的網(wǎng)絡(luò)化數(shù)字音頻系統(tǒng),克服了模擬調(diào)音臺與音頻切換矩陣的種種缺陷,顯著提高了音頻系統(tǒng)的處理能力、管理能力與擴(kuò)展能力。
CobraNet以及EtherSound等同步傳送協(xié)議,它們都是基于二層結(jié)構(gòu)的數(shù)據(jù)流,這在很多的功能和管理上都存在著先天的不足,況且這只是解決了音頻的傳送,其中沒有視頻傳送的解決方案。同這些兩層傳輸技術(shù)相比,AVB技術(shù)具有以下特點:
(1) 系統(tǒng)的延時降低至2ms以內(nèi);
(2) 系統(tǒng)的傳輸質(zhì)量有QoS保證,包括軟件和硬件均支持;
(3) AVB作為流媒體的一個載體,可以傳送包括壓縮和非壓縮等多種音視頻流媒體,并能保證同步傳輸,突破以往的瓶頸;
(4) 多達(dá)256種不同格式的音視頻數(shù)據(jù)流(包括采樣頻率)可以在同一個網(wǎng)絡(luò)中共存?zhèn)鬏敚ゲ桓蓴_;
(5) 支持其他三層協(xié)議的高級功能。
因此,AVB在三層協(xié)議下傳輸同步的專業(yè)音/視頻信號,并將傳輸延時壓縮到微秒級,將是下一代流媒體文件傳輸?shù)臉?biāo)準(zhǔn)之一,無論在專業(yè)還是民用領(lǐng)域,都會越來越廣泛地使用。
需要注意的是:盡管AVB可以支持三層路由,這并不意味著它可以發(fā)送到Internet公網(wǎng)中去,或者架構(gòu)在Internet架構(gòu)下的VPN上去。這是因為遠(yuǎn)距離傳輸?shù)幕鶞?zhǔn)時鐘延時問題沒有根本得到解決,網(wǎng)絡(luò)直徑依然無法超過7個Hop。在Internet公網(wǎng)上傳輸音視頻,還需依賴于音視頻壓縮技術(shù),采用編、解碼器,通過網(wǎng)絡(luò)傳輸IP碼流實現(xiàn)。但是,在為會議場所構(gòu)建本地音頻系統(tǒng)時,并不建議采用音視頻編解碼技術(shù),因為這類技術(shù)產(chǎn)生的音頻傳輸延時會達(dá)到幾百毫秒,比AVB技術(shù)大得多,在一些對延時要求高的應(yīng)用中難以勝任。
隨著支持AVB技術(shù)的數(shù)字音頻處理器、交換機、有源音箱等設(shè)備不斷涌現(xiàn),在大型會議中心、指控中心、購物商場、游樂園等場所的音視頻系統(tǒng)建設(shè)中,會越來越多地采用AVB技術(shù)構(gòu)建音視頻系統(tǒng),充分利用AVB音視頻系統(tǒng)為設(shè)計人員、集成施工人員與維護(hù)保障人員來帶的便利。本文所介紹的AVB音頻系統(tǒng)已在工程項目中使用,可為大型音頻系統(tǒng)的建設(shè)提供參考和幫助。
[1]梁華.音視頻會議系統(tǒng)與大屏幕顯示技術(shù)[M].中國建筑工業(yè)出版社,2012.
[2]王彤,趙琳,何鋒.航空電子音視頻傳輸AVB以太網(wǎng)絡(luò)[J].電光與控制,2016.
[3]張冬蓮.大數(shù)據(jù)音視頻記錄設(shè)備[J].指揮信息系統(tǒng)與技術(shù),2013.
[4]兆翦.高性能媒體數(shù)據(jù)流傳輸解決方案AVB[J].音響技術(shù),2009.
[5]AVB Resource Guide,Biamp Systems.