王飛飛,孫志遠
(平頂山學院 河南 平頂山 467000)
隨著便攜式嵌入式系統的發展,嵌入式多媒體技術正在影響并改變著人們的日常生活,多媒體音頻編碼解碼技術也越來越受到關注和重視[1-2]。筆者提出了一種MP3音頻解碼通過軟件方式在嵌入式系統上實現的解決方案。該方案以目前比較高效的MP3解碼算法為基礎,靈活的取代了基于DSP的硬件解碼方案,在低消耗處理器資源的前提下,實現能與硬件解碼相媲美的效果。從而節省了研發或購買DSP芯片的費用,還可以方便快捷的兼容MPEG新提出的解碼標準,這是該方案最重要的現實意義。
目前國外在MP3軟解碼方面的研究有兩大成果,一個是開源MP3解碼項目mpg123,一個是開源嵌入式MP3解碼庫libmad。這兩個開源項目中使用的解碼算法參考了很多國際學術論文。前者被廣泛用于播放器軟件,例如Mplayer,千千靜聽等;后者則更加適用于嵌入式系統,已經被成功移植到Symbian手機系統上。
MP3解碼主要包括以下過程:預處理(Preprocessing)、霍夫曼編碼(Huffman decoding)、反量化(Requantization)、重排列 (Reordering)、立體聲解碼 (Stereo decoding)、混迭消除(Alias reduction)、反離散余弦變換(IMDCT transform)、頻域轉換 (Frequency inversion)、子帶合成濾波 (Synthesis filter bank),最后生成聲卡可以直接讀取的PCM采樣[3]。MP3解碼流程具體如圖1所示。

為了在ARM處理器下快速穩定的運行解碼器,除了浮點轉化為定點的策略,還要根據硬件特點進一步進行程序優化:首先減小運算強度,利用位移操作代替乘除運算,通常需要乘除以2的冪次方都可以用左右移n位來完成,比如3×8等價于 3<<3;利用乘法代替乘方運算,ARM核中內建有乘法器,因此可以通過乘法運算來代替調用C庫函數乘方運算以節約函數調用開銷;利用與運算代替求余運算。通常and指令比%操作效率要高;使用內聯函數,ARM下支持C語言inline關鍵字,這時的函數直接在調用處代碼展開,省去了函數調用開銷,不過它的缺點是代碼量增加;使用寄存器變量,CPU對寄存器的存取要比對內存的存取快得多,因此為變量分配一個寄存器,將有助于代碼的優化和運行效率的提高。
避免除法,ARM指令集中沒有除法指令,其除法是通過調用C庫函數實現,一個32位的除法通常需要20~140個時鐘周期。因此,除法是程序效率的瓶頸,應盡量避免使用。用查表法代替計算,在CPU資源緊張而內存資源富裕的情況下,可以用空間來換取運行速度,例如在反離散余弦變換算法中需要頻繁的計算正弦和余弦函數值,可以預先將函數值計算出來以常量放到內存里,需要計算時直接通過內存地址提取 需要的值[4-5]。
在對現有算法進行研究的基礎上[6-9],筆者設計出一個性能優良、結構靈活、可移植性強的MP3軟解碼器。解碼器主要包括以下模塊:解碼器引擎初始化,緩沖區輸入輸出控制,幀解碼模塊,注銷解碼器引擎等。

用MP3文件初始化解碼器,初始化過程中,解碼器讀取每一幀的幀頭信息而不對數據進行解碼,快速計算出該文件的播放時間,并根據文件大小以秒或分鐘為單位內建解碼位置索引。解碼位置索引的目的是為了快速的根據時間定位待解碼數據在文件中的位置。

考慮到嵌入式系統內存較小的情況,解碼器輸入緩沖區定義為8 kB,這樣既可以流暢的解碼數據,又不會暫用很大緩沖區內存,解碼引擎以bit為單位讀取數據,所以輸入控制應該實現快速讀取緩沖區中1個或多個bit數據的操作。
對于文件形式的MP3數據,在解碼器輸入緩沖區上層內建一個文件緩沖結構,減少系統IO操作次數,首先將文件中一部分待解碼數據讀入文件緩沖,當解碼引擎發出數據請求時,由文件緩存向解碼器輸入緩沖區寫入數據。
文件緩沖提供以下操作:
文件緩沖創建:以打開的文件指針創建文件緩沖區,返回緩沖結構指針。
緩沖區注銷:釋放緩沖區創建時的在堆中申請的內存,并關閉打開的文件指針。
緩沖區結束判斷:當緩沖區讀取指針到達緩沖區結尾時,eof被復制為真,返回eof的值。
獲取緩沖區操作錯誤:每次操作中,若出現錯誤error被賦值為對應的錯誤值,否則賦值為0。返回error的值。
讀取指定大小的內容:從緩沖區當前讀取位置,讀取指定大小的字節,并返回讀取到的數據開始位置指針。
對于以流形式的MP3數據,當解碼引擎發出數據請求時,直接由數據流緩存向解碼器輸入區寫入數據。


數據流緩存提供的功能有以下幾點:
初始化:該功能申請堆中的一塊內存,用于以后存放緩存數據。
注銷:負責釋放初始化時申請的內存。
寫入數據:向緩存的當前寫入位置后寫入指定大小的數據。
跳過指定大小數據:將當前讀取位置移動到指定位置。
獲取錯誤信息:返回操作過程中產生的錯誤信息。
幀同步:將讀取位置跳轉到下一幀開始位置。該操作的主要算法是每次讀取緩存11個比特,若這些比特全為1,則把其當做下一幀的開始位置。通過研究可知,該種算法并不能準確判斷下一幀的開始,但這種算法不進行幀頭解碼,也不會漏掉數據。從時間和空間上講,都是一種比較好的選擇。
解碼引擎以幀為解碼單位,每次輸出一幀的解碼輸出結構,結構中包括pcm數據、長度、采樣率、聲道數,播放時間等信息。



該模塊為解碼引擎核心模塊,按照順序完成預處理、霍夫曼編碼、反量化、重排列、立體聲解碼、混迭消除、反離散余弦變換、頻域轉換、子帶合成濾波,最后生成聲卡可以直接讀取的PCM采樣。
從系統設計的角度上,該模塊又可以劃分為幾個小模塊:浮點計算模塊、幀預處理模塊、霍夫曼解碼模塊、層解碼模塊、濾波合成模塊。
該模塊負責釋放解碼器申請的內存,刪除解碼器內建的播放索引,復位緩沖區。在解碼完成后調用。
解碼器提供了簡潔而功能強大的調用接口,主要包括初始化、注銷、單幀解碼、IO控制、解碼時間控制幾個方面,具體如表1所示。
本文根據MPEG官方文檔,詳細剖析了MP3幀解碼的算法及其優化,并在上述基礎上設計軟件解碼器接口,在ARM平臺上實現了軟件解碼器。本解碼器具有無浮點計算、引入文件緩存機制、內建解碼位置索引等優點。但是也存在一定的局限性:如時間精度低,解碼器沒有實現網絡功能,但是提供了流解碼接口,如果需要播放網絡上的MP3文件,需要在解碼器的上層設計網絡引擎。

表1 解碼器外部調用接口Tab.1 External call interface of decoder
[1]林福宗.多媒體技術基礎[M].2版.北京:清華大學出版社,2008.
[2]馬華東.多媒體技術原理及其應用[M].北京:清華大學出版社,2008.
[3]宋奇剛,魏小義.Huffman解碼器的設計及在MP3解碼中的應用 [EB/OL]. (2007-03-09).http://www.eeworld.com.cn/xfdz/2007/0309/2847.html.
[4]Zurell K.嵌入式系統C程序設計[M].艾克武,等譯.北京:機械工業出版社,2002.
[5]周立功.單片機實驗與實踐[M].北京:北京航空航天大學出版社,2004.
[6]李國輝.基于ARM的MP3播放器設計與實現[J].現代電子技術, 2011, 34(16):1-2.LI Guo-hui.Design and implementation of MP3 player based on ARM[J].Modern Electronics Technique,2011,34(16):1-2.
[7]汪永好,周延森.基于嵌入式Linux的MP3播放器的設計與實現[J].計算機工程與設計,2009,30(17):3948-3949.WANG Yong-hao,ZHOU Yan-sen.Design and implementation of MP3 player based on embedded Linux[J].Computer Engineering and Design,2009,30(17):3948-3949.
[8]石銳,代天然,周雷.基于arm的容損失MP3流媒體終端的設計與實現[J].重慶工學院學報:自然科學版,2009,23(8):104-107.SHI Rui,DAI Tian-ran,ZHOU Lei.Design and implementation of loss-tolerant MP3 stream player based on ARM[J].Journal of Chongqing Institute of Technology:Natural Science,2009,23(8):104-107.
[9]徐英欣.基于ARM的多通道專業MP3播放器設計 [J].微計算機信息,2008,24(14):143-144.XU Ying-xin.Design of multiple channels of professional MP3 player based on ARM[J].Microcomputer Information,2008,24(14):143-144.