劉 越,章文輝
(中國傳媒大學 信息工程學院,北京 100024)
隨著全國高清頻道數量的不斷增多和相關政策的發布,人們已經完全迎來了高清時代。高清視頻無疑帶來了更逼真的視覺享受,如何獲得更高的聽覺享受,也將逐漸成為另一研究課題。
數字音頻數據流可以通過電纜線單獨傳輸,也可嵌入在數字視頻SDI流每一行的HBI(行逆程)中的輔助數據空間中傳輸。數字視頻嵌入音頻,并非單獨傳輸音頻數據,而是將音頻數據按照一定格式封裝成數據包,在視頻信號的輔助數據空間內傳輸。這樣不僅解決了視頻、音頻不同步的問題,也大大節省了傳輸路線和裝配成本。但是,對于電視臺、影像公司、電影制作公司等傳媒公司,常常需要單獨對數字音頻進行監控和測量。所以,如何實現嵌入數字音頻的解嵌和分析,也得到越來越多的關注。
鑒于上述問題,筆者設計了基于SMPTE299M標準的HDTV嵌入數字音頻分析軟件。突破傳統基于硬件的系統設計,采用軟件從HD-SDI抓包文件中提取出一幀音頻數據,實現非實時分析和檢測,對系統測試、理論研究、實踐教學有著重要意義。
AES/EBU數字音頻接口標準規定,音頻數據以2的補碼進行編碼,接口可以對取樣頻率為48 kHz、44.1 kHz和32 kHz,量化比特數為24,20和16的數字音頻信號進行實時傳輸,并提供輔助信息。
數字聲音的數據按照幀劃分,每個數據幀(frame)為64 bit,分為兩個子幀,即Sub-frame 1和Sub-frame 2。每個子幀中的前4 bit為前置碼,用于子幀、幀和塊的同步和識別。每個子幀的后4 bit(V,U,C,P)為輔助數據,各比特位所代表的功能如表1所示[1-4]。

表1 輔助數據[5]
每192個音頻幀(frame)構成1個音頻塊(block)。有3種前置碼X,Y和Z,Z標志每個音頻塊的開始。每個音頻塊中,除了第1個音頻幀的Sub-frame 1的前置碼用Z標識外,其余各幀的Sub-frame 1的前置碼都為X;所有Sub-frame 2的前置碼都用Y表示[6]。AES/EBU音頻與音頻數據包之間的關系如圖1所示。

高清隔行掃描行、場定時關系如圖2所示。

高清隔行掃描系統,每幀圖像共1125 行。有效視頻區1080 行,數字場消隱區45行。其中,第21~560行為第1場有效視頻區,第584~1123 為第2場有效視頻區;第1124 行、1125 行和l~20行為第1場數字場消隱區,第561~583行為第2場數字消隱區。
HD-SDI信號里,除了有效視頻信號之外,在視頻信號消隱區里還包含其他信息[8],如有效視頻的起始點SAV和終止點EAV、行數信息LN、冗余校驗碼CRC、輔助數據ANC等信息。數字音頻信號嵌入在分量數字視頻格式有效行的輔助數據區中。行消隱期間的取樣708個取樣字,在標準中用“SAV”和“EAV”予以界定。音頻信號嵌入在輔助數據ANC內[7]。
HD-SDI即高清串行數字接口,用于傳輸高清視頻。HD-SDI信號由亮度數據流和兩個色差數據流復用而成,針對4∶2∶2的樣點結構,亮度信號取樣頻率為13.5 MHz,兩個色差信號取樣頻率為6.75 MHz,以10 bit進行量化,所以基本碼率為1485 Mbit/s。其數據流結構如圖3所示(T為取樣周期)。

嵌入到視頻數據中的音頻包有2種:音頻控制包(Audio Control Packet,ACP)、音頻數據包(Audio Data Packet,ADP)[9]。高清音頻數據包支持24位,不存在音頻擴展包。音頻數據包的長度是固定的,且每個包只包含每個音頻組中4個通道的各1個音頻數據。高清音頻數據包中還包含一些額外的數據和糾錯數據。
音頻數據包只在色差數據流(Cb/Cr)的行附屬數據空間傳輸。在由源視頻格式定義的切換點之后的一行所在的附屬數據空間內,不插入音頻數據包。音頻數據包結構如圖4所示,由附屬數據標志(ADF)、數據標志符(DID)、數據塊序號(DBN)、數據計數(DC)、用戶數據字(UDW)及校驗和(CS)組成[6]。

每4個音頻數據構成1個音頻組,每個音頻組都對應1個音頻控制包。1個給定的音頻組中的全部音頻通道應具有相同的取樣頻率、取樣相位和同步/異步狀態,這些控制信息都包含在音頻控制包內。
音頻控制包應當每場傳輸一次,因為隔行掃描2場為一幀,所以每幀HD-SDI傳輸2次音頻控制包。音頻控制包在Y并行數據流視頻切換點(Video Switching Point)之后第二行的行附屬數據空間內傳輸。音頻數據包結構如圖5所示,由附屬數據標志(ADF)、數據標志符(DID)、數據塊序號(DBN)、數據計數(DC)、用戶數據字(UDW)、校驗和(CS)組成[6]。

軟件設計的系統框圖如圖6所示。大體分為3部分:音頻控制包和音頻數據包的提取;音頻控制包和音頻數據包格式的分析;音頻數據的提取和取補[9]。

為驗證本文所述分析的可行性,按照圖6所示的流程,利用C語言編程實現。數據源采用一幀HD-SDI抓包文件,成功實現分析任意行音頻數據包和音頻控制包的格式,取出音頻個數、采樣頻率和嵌入的音頻通道數。實驗結果如圖7所示。

HD-SDI數據量很大,1幀畫面有400多萬個數據。限于軟件處理速度,該實驗采取實時讀取、分析的設計思路。每讀取一行便分析一行,對需要的數據進行處理、顯示、存儲,不需要的數據則直接跳過。音頻數據包和音頻控制包以附屬數據標志(ADF)即000,3FF,3FF為標志。音頻數據包嵌入在輔助數據空間中,所以編程實現直接跳過有效視頻區。音頻控制包只嵌入在視頻切換點之后的第2行的行附屬數據空間。以1125 /50/2∶1系統為例,切換點在第7行及第659行,所以只需在Y并行流的第9行及第571行的行附屬數據空間內尋找音頻控制包。同時,實驗采用多線程技術,以提高效率。
本文提出的基于SMPTE299的HD-SDI嵌入音頻分析軟件實現簡單,通用性強。隨著高清數字廣播電視的逐步發展和高清電視的不斷普及,對嵌入音頻的分析和研究,也將占據越來越重要的地位。雖然限于軟件的處理速度,只能進行靜態分析,但其對理論研究、實驗教學、系統測試都具有重要意義,對于高清數字電視的發展與變革也有一定推動作用。
[1]王明臣,姜秀華,張永輝.數字電視與高清晰度電視[M].北京:中國廣播電視出版社,2003.
[2]姜秀華,張永輝.數字電視廣播原理與應用[M].北京:人民郵電出版社,2007.
[3]Society of Motion Picture and Television Engineers.SMPTE292M-1998 Bit-Serial digital interface for high-definition television systems[S].1998.
[4]國家廣播電影電視總局.GY/T 162-2000高清晰度電視串行接口中作為附屬數據信號的24比特數字音頻格式[S].2000.
[5]SMPTE.ANSI/SMPTE 299M-199724 -Bit digital audio format for hdtv bit-serial interface[S].1997.
[6]HARDING P,SHERRATT R,GUY C.Convergence of standard defi?nition(SD)and high definition(HD)SDI for audio multiplexing and de-multiplexing by implementing modular design[C]//Proc.2004 IEEE International Symposium on Consumer Electronics.[S.l.]:IEEE Press,2004:541-544.
[7]姜秀華,柴劍平,林正豹,等.現代電視原理[M].北京:高等教育出版社,2008.
[8]李寧.HD-SDI信號的特征及檢測方法的提案[J].現代電視技術,2004,(8):35-42.
[9]謝元祿,張春,王志華.基于SMPTE272M標準的音頻加解嵌系統設計[J].電視技術,2008,32(7):10-23.