陳周烽
(廣州珠江數碼集團有限公司,廣東 廣州 510010)
DRA音樂頻道的技術設計
陳周烽
(廣州珠江數碼集團有限公司,廣東 廣州 510010)
DRA是近年來興起的國產音頻技術,在聲音的編碼效率和還原效果上具有一定的優點。詳細介紹了DRA的算法,并依據廣州有線DRA自辦音樂頻道的設計與實現,介紹了這一新興的音頻編碼技術在廣電行業的應用。
DRA;自適應時頻分塊技術;視音頻同步;私有數據描述符
DRA是《多聲道數字音頻編解碼技術規范》的簡稱,是中國企業于2004年開發的一項數字音頻編解碼技術[1-2]。2007年1月被批準成為中國電子行業標準(標準號SJ/T11368—2006);2009年被國家標準化管理委員會批準為數字音頻編解碼技術國家標準(標準號GB/T22726—2008),同年被國際藍光DVD組織納入藍光DVD標準體系中。DRA音頻標準具有解碼復雜度低、壓縮效率高、音質好等優點,可廣泛應用于數字音頻廣播、數字電視、移動多媒體、激光視盤機、網絡多媒體以及在線游戲、數字電影院等領域[3-5]。
音頻壓縮技術分為無損壓縮及有損壓縮兩大類。按照壓縮方案的不同,又可將其劃分為時域壓縮、頻域壓縮(變換壓縮、子帶壓縮),以及多種技術相互融合的混合壓縮等。各種不同的壓縮技術,其算法的復雜程度、音頻質量、算法效率(即壓縮比例),以及編解碼延時等都有很大的不同。各種壓縮技術的應用場合也因之而各不相同。
目前國際上主流音頻壓縮算法所采用的基本理論框架如圖1所示。

DRA音頻壓縮算法基于人耳的聽覺特性對聲音信號進行量化和比特分配,屬于感知音頻編碼和變換編碼的路線(頻域壓縮)。該算法采用了全新的自適應時頻分塊技術(ATFT),可從10多個窗口長度中選擇1個最適合當前音頻信號特征的窗口,以實現對音頻信號的最優分解。算法中最鮮明的技術特色在于可變分辨率濾波器組和熵編碼模塊[2]。DRA算法還實現了量化與熵編碼的獨立優化,進一步提高了量化與熵編碼的性能。
DRA音頻標準的最大特點是用很低的解碼復雜度實現了國際先進水平的壓縮效率。在自適應時頻分塊方法、靈活的碼書選擇等關鍵技術方面具有創新性。由于DRA技術編解碼過程的所有信號通道均有24 bit的精度容量(常見的CD音頻格式是16 bit,更好些的在20 bit左右),故在碼率充足時能提供超出人耳聽覺能力的音質,其主要技術性能指標達到了國際先進水平。算法參數指標如表1所示。
廣州有線在設計DRA音樂頻道時,沒有簡單地采用傳統的廣播音頻方式,而是考慮通過單個節目頻道的帶寬播發來實現。要求在播放高品質音樂的同時,有同步背景圖案或者高清視頻伴流,為用戶提供良好的視聽體驗。為了豐富聲音品質,頻道除了提供主打的DRA音頻外,還提供標準的MPEG-2音頻和細節豐富的DTS音頻,并預留AC-3音頻的位置。用戶可通過機頂盒遙控器上的“聲道”選項按鈕依次進行選取。DTS流和DRA流從機頂盒送出后,經過用戶的功放器解碼輸出。DRA節目頻道同時要求預留CA接口,待市場成熟后進行收視保護加擾。

表1 DRA算法指標
DRA頻道的節目制作在早期是比較麻煩的,主要是當時國內外的非編廠家都還沒有集成DRA相關的音頻技術。經過一段時期的發展,現階段的制作平臺在收錄采集和非編合成上對DRA的音頻格式均可輕松實現處理。這里簡單介紹其中的關鍵技術。
在收錄采集環節,如果直接通過拾音器和DRA編碼設備進行音頻節目的生產,成本是相當大的,也需要建立專門的錄音室。更經濟的做法是把WAV音頻格式轉換成DRA音頻格式。WAV音頻屬于PCM編碼,其優點是聲音基本接近原聲,近似無損,缺點是碼率過大,直接作為電視伴音不合適。采用WAV音頻格式轉碼的另一個好處是目前絕大多數的音樂用CD存儲,即WAV格式,音樂節目來源容易,在轉換成DRA音頻后的品質仍能保持相當高的水準。當然,即使是DTS格式來源的音頻節目,也最好先轉換成WAV格式,再編碼成DRA音頻。
非編處理環節經歷過兩個階段,DRA產業剛起步時由于當時的非編系統不支持DRA音頻和視頻的同步合成,只能在播發平臺上對視頻內容和音頻內容設置相同的播出循環時間,實現視頻流和音頻流的假同步,一致性效果并不理想。隨著DRA應用的發展,目前均可實現DRA音頻與視頻的同步混合處理,在播發平臺上也不需要過多復雜的設置。
廣州有線在非編系統上設計了6路DRA音軌,分別對應前中置和環繞的5路音道和1路低音。DRA頻道節目制作完成后,剩下的工作就是編排節目單以及上載到播發平臺進行播出了。
根據設計的思路,DRA的播發平臺需要解決視音頻的播放、視音頻的同步和授權加擾等問題。
2.3.1 視音頻的播放
播放問題比較容易處理,一些傳統的視頻服務器就可以滿足。廣州有線采用的就是國內某品牌的視頻服務器。設計上采取主備配置方式,使用1臺播控服務器控制2臺視頻服務器的模式(播控服務器出現異常時,不會影響后臺的視頻服務器),同時在平臺拓撲中引入ASI二切一以及ASI信號分配器等關鍵冗余設備,以提供2路以上的節目流,方便后續的授權加擾、應急墊播、信號調度等處理應用。這樣的技術架構既可以滿足雙路在線熱備份要求,又保證了上載到主備視頻服務器節目素材內容的一致性。另外要求平臺軟件必須具備獨立的PSI/SI信息的封裝播發能力,目的是為了業務操作靈活(如在PSI表中插入一些標識描述符,SDT表和EIT表的節目內容更新方便等)。
具體系統架構如圖2所示,其中虛線為網線,實線為ASI信號線。
在日常的運營維護中,有幾個方面需要注意:
1)要考慮節目播發環節和授權加擾環節的獨立性,盡量用模塊化、功能化的方式區別隔離,以方便實際生產過程中的維護和應急處理。譬如TS流信號的連接主要依靠ASI分配器和BNC接口,CA的連接主要依靠交換機和以太網口,兩者互不干擾。
2)要重視播出視頻軟件的質量。平臺往往會有許多擴展的應用,例如在EIT表中插入廣告單,多種音頻編碼標準(如AC-3,DTS,DRA等)的使用等,這些都給播發軟件的編寫帶來新的問題。
3)網絡安全。由于DRA節目素材大多都是通過以太網的方式上傳到視頻服務器。播發平臺與制作平臺網絡的互聯互通很容易造成病毒感染、黑客攻擊等問題。在交叉點的位置安裝防火墻,定期更新系統補丁和安裝殺毒軟件是必要的。
2.3.2 視音頻的同步
根據前面制作平臺的介紹,播發平臺視音頻同步的解決相應地也經歷了2個階段。在不同階段的變化調整主要體現在播控軟件上,即通過對定制軟體的設計修改,結合復用硬件設備實現。

在早期階段,由于節目生產環節的DRA處理技術還不成熟,需要將視頻軌與DRA和DTS等音頻軌分開處理,分別制作,生成1路視頻流,幾路音頻流的情況(音、視頻流各自擁有獨立的業務ID和音視頻PID),然后導入視頻服務器對應的不同通道,設置相同的播出循環時間后播放(即1個通道播放視頻業務,另幾個通道播放音頻業務),形成假同步的狀態;再將播發出來的音頻業務流和視頻業務流送進復用器進行節目包復用,合成具有1路業務ID、1個視頻PID、幾個音頻PID的單頻道節目流,并且復用器在混包的同時要插入相關的音頻格式描述符。
具體在播控軟件上的PSI/SI信息設置如表2所示。

表2 原DRA播控軟件參數設置表
其中音頻業務類型的通道并不需要播發實際的視頻包,也無PCR(即雖然設置了PID,但無相關的包送出),只播發業務ID和音頻包。
還有一點要特別注意,將多路音頻包和視頻包送進復用器時,要解決音頻格式描述符的問題。因為DRA音頻格式和DTS音頻格式往往在PMT表中以私有數據的形式標識(Stream_type 0x06),同時要求生成相關的格式描述 Format_identifier:0x44524131 和 0x44545331。 其中,0x44524131和0x44545331為16進制的ASCII碼,代表對應的大寫字母DRA1和DTS1。廣州有線早期的播控軟件沒有生成私有音頻描述符的功能,需要通過在復用器的設置,插入相應的PSI標識信息,完成音頻格式的識別。
隨著非編技術的不斷發展,在節目生產環節就可以直接將多路音頻和視頻合成,達到即時同步的目的。播發平臺只需要提供1路通道,設置1路業務ID,1個視頻ID,幾個音頻ID即可,無須再采用復用設備對播發的多格式音頻包進行復用。具體實現上,可根據音頻業務的需要,要求播控軟件在同一個節目流上至少允許設置幾個的音頻PID(廣州有線要求至少能設置3路以上)。這個一般需要通過視頻服務器廠家對播控軟件進行定制才能實現。
具體在播控軟件上的PSI/SI信息設置如表3所示。

表3 現DRA播控軟件參數設置表
為了在PSI信息中封裝進相關音頻格式信息,播控軟件額外設計了PSI表的配置選項Audio2和Audio3。這只是軟件的具體表現方式而已,是為了方便音頻節目的識別和機頂盒接收進行的特殊定制,目的是標識DRA和DTS音頻軌道,利于在軟件后臺合成對應的格式描述符(描述符代碼同上)。
從第2種改進的方式可以看出,其大大減少了節目通道的占用,提高了播出服務器的使用率,省去了復用設備和相關配置操作,具有更高的播出和維護效率。
由于DRA節目采用的是頻道方式,因此其加擾過程與一般的數字電視節目頻道是一樣的,主要是對視頻包和音頻包的加擾。
在加擾架構上,也是采用典型的主備熱機方式。將DRA節目流通過ASI分配器分別送入主備加擾器進行加密,然后再接入二選一設備輸出,以保證安全播出。在加擾模式上,可以單密、同密或多密。廣州有線的做法是預留同密加擾接口。現時期廣州有線共有2個DRA音樂頻道,由于尚處于市場培育階段,暫時都還沒有進行授權加擾。
2.5.1 機頂盒的接收
由于DRA是以數字電視節目頻道的方式送入網絡的,機頂盒的接收與普通電視節目接收并無太大區別,唯一的不同就是多音頻格式的選取如何在電視屏幕上呈現。這就必須通過前面播發平臺封裝的PSI格式描述符來實現。機頂盒發現節目流中含有該描述標識,則按下遙控器的“聲道”按鈕時,機頂盒軟件在電視屏幕的左下角呈現一個三位選項的圖標界面,如圖3所示。

選擇“MPEG音頻”時,與正常的數字電視節目一樣,將音頻流送入機頂盒的解碼器正常解出MPEG伴音。選擇“DTS音頻”或者“DRA音頻”時,機頂盒通過其背板后的SPDIF接口透傳送出,不作處理。
2.5.2 機頂盒輸出音頻的接線方式
考慮機頂盒的成本和接線的方便,在DRA音頻和DTS音頻的輸出上,采用銅軸的SPDIF接口(SPDIF是Sony和Philips數字音頻接口的簡稱,接線如圖4所示),送出的信號經用戶接入功放器后,就可以收聽高質量的DRA音頻了。當然,前提是功放器要集成DRA解碼。更高級別的機頂盒可以提供光纖接口,應用范圍也更加廣泛。

廣州有線現有2個DRA音樂頻道,頻道名稱分別為《DRA 5i經典》和《DRA 5i流行》。在頻道的運營上,目前主要是以測試推廣為主。通過與華南地區多家唱片公司、各大影院的合作,播放唱片DRA格式的音樂、電影原聲帶,提供唱片封面背景或電影海報視頻(有時是一些風光片),形成隱性的唱片和影訊廣告,收取上游合作方的費用。同時積極嘗試開展資訊方面的合作,在頻道播放高品質背景伴音下,提供機場、火車站等交通樞紐的班次信息、天氣預報、股票金融資訊等。但是DRA格式的音樂畢竟是個新的東西,與Dolby和DTS等國際知名的大公司比,在市場的認可度和成熟度上差距還較大,因此目前尚處于市場的培育初期。
長期以來,全球數字音頻的核心技術基本掌握在發達國家各大公司手中,他們研發或聯合研發了相關的音頻標準,并擁有大量技術專利。在DRA研發前,中國企業由于沒有自主音頻技術,只能繳納高額專利費。據統計,中國每年在數字音頻領域需要交納的知識產權許可費就高達近百億元。今天,DRA成為行標、國標,不單單是完成中國在數字音視頻領域擁有自主知識產權的歷史使命,而是站在全新起點上肩負更重的歷史責任。在引領產業化發展上任重道遠,要將產業化和應用結合起來,實現從芯片設計、整機生產、衍生品開發等系列完整的數字音頻產業鏈。
廣電行業的發展與科學技術的進步是分不開的。從早期的模擬點歌到今天的多路、多格式的數字化音樂時代,音頻編解碼技術的發展起到了舉足輕重的作用。我們歡迎新技術的不斷涌現,尤其樂于看見國產技術的興起,讓中國的產品在世界上具有更強更好的競爭力,但是也必須認識到其中的差距。在國際認知度和市場占有率上,民族的DRA還有很長的路要走。
[1] 朱勤偉.DRA技術在數字電視中的應用[J].電視技術,2009,33(1):18-23.
[2] 馬文華,曾慶煜.DRA算法及其實時解碼器設計[J].電視技術,2009,33(5):36-39.
[3]SJ/T 11368—2006,多聲道數字音頻編解碼技術規范[S].2006.
[4] 吳鳳燕,劉守訓,王翾.基于DRA和AAC的MDCT/IMDCT預回聲抑制比較[J].電聲技術,2010,34(7):65-68.
[5] ISO/IEC 13818-7,Generic coding ofmoving pictures and associated audio information-Part7:Advanced Audio Coding(AAC)(end)[S].2003.
Technical Design for DRA Music Channel
CHEN Zhoufeng
(Digital Group Co.,Ltd,Guangzhou Pearl River,Guangzhou 510010,China)
DRA is a rising domestic audio technology in recent years.It has some advantages in the coding efficiency and the reduction effect.The DRA algorithm preliminary is discussed in this paper.By the running music channel in Guangzhou Cable TV,the new audio coding technology applications in broadcasting industry is introduced.
DRA;ATFT;video and audio synchronization;descriptor private data
TN948
A
1002-8692(2011)12-0045-04
任健男
2011-03-25