羅 天
(作者單位:國家新聞出版廣電總局二八一臺)
再談新媒體音頻格式
羅 天
(作者單位:國家新聞出版廣電總局二八一臺)
簡單來說,音頻格式就是對聲音文件的編碼和解碼格式,由于人耳的生理結構的局限性,通常最大帶寬為20 kHz。目前,有兩類主流的音頻格式,分別是無損格式和有損格式,如WAV、APE等是無損格式音頻;MP3、Windows Media Audio(WMA)、Ogg Vorbis(OGG)和AAC等是有損格式音頻。
新媒體技術;互聯網;音頻格式;無損壓縮;有損壓縮
當前,互聯網已經融入到人們日常生活的方方面面,互聯網音視頻已逐漸成為新媒體的重要組成部分,音視頻技術的發展直接關系到新媒體的成長。作為新媒體從業者,熟悉掌握常用的音視頻格式,是一項基本要求,本文就目前互聯網流行的部分音頻格式進行淺敘。
音頻格式就是對聲音文件的編碼和解碼格式,通常最大帶寬為20 kHz,采用線性PCM編碼。其的特點為:要在計算機內播放音頻文件,也就是對聲音文件來一次模數轉換,通常由量化過程和采樣過程組成。
當前,比較流行的音頻分類為無損格式和有損格式。無損格式又分為無損非壓縮格式和無損壓縮格式,有損格式一般通指有損壓縮格式。無損非壓縮格式的代表為常見的CD格式和抓軌后的WAV格式;無損壓縮格式主要指APE格式和FLAC格式等;有損壓縮格式較多較流行,主要有MP3、WMA、0GG和AAC等。
2.1無損音頻格式
無損音頻格式為沒有壓縮或者壓縮比很小的音頻文件,與初始錄音數據一致或者基本一致,一般分為無損非壓縮音頻格式和無損壓縮音頻格式。目前,持有網絡視聽許可證的大多數網站(以下簡稱持證網站)由于網絡帶寬和資源因素,基本都只提供有損壓縮格式的音頻,所以采用的相關系統更支持有損壓縮格式。
2.1.1無損非壓縮音頻格式-CD格式
CD格式是指用于存儲CD的格式文件,也有人稱之為CD音軌。一般的CD格式是近似無損的,因而最接近原聲,雖然現在被很多MP3文件取代,但是對于一些音樂發燒友來說,CD仍然是首選。CD光盤既可以在DVD等設備中播放,也可以借助計算機的光驅通過軟件來播放。由于單純的CD容量很大,不易在互聯網傳播,目前互聯網上一般提供Wave和APE格式下載(后文提及)。
2.1.2無損非壓縮音頻格式-WAV格式
WAV是美國Microsoft公司開發的一種聲音文件格式,與CD格式一樣,具有接近原聲的效果,目前網絡上部分網站有提供抓軌為WAV格式的音樂文件。
2.1.3無損壓縮音頻格式-APE格式
APE是一種壓縮音頻格式。但是值得一提的是,這是一種接近無損的壓縮格式。容量很大的WAV音頻文件可以通過專有軟件壓縮成APE,同樣的,APE也可以通過專有軟件還原成WAV,最后再刻錄成CD。由于壓縮后的APE文件容量要比WAV文件小很多,極大地方便了網絡傳播。此外,通過軟件解壓縮還原以后得到的WAV文件與解壓前的源文件基本一致。所以APE被稱為“無損音頻壓縮格式”。
2.1.4有損壓縮音頻格式-MP3格式
這是目前最流行的壓縮格式,雖然有部分的壓縮失真,音質上比WAV和CD,甚至是APE都有所不足,但是它的壓縮比很高,編碼后文件體積非常小,易于傳播和攜帶,所以對于普通受眾而言,這個優點極大地彌補了之前提到的不足。
2.1.5有損壓縮音頻格式-WMA格式
WMA格式也是由美國Microsoft公司開發,它的優點是壓縮率比MP3高,且內置了版權保護技術,同時對網絡流的支持更好,可以更方便地在網絡上播放,而且由于Windows操作系統默認支持,可以直接播放。
2.1.6有損壓縮音頻格式-0GG格式
0GG是一種開源有損壓縮格式。它是免費、沒有專利限制的。在開源軟件越來越受到關注的今天,0GG為新媒體音頻技術提供了一個很好的選擇。
2. 1.7 有損壓縮音頻格式-AAC格式
AAC是一種高壓縮比的音頻算法,壓縮比通常為18∶1~20∶1。因為采用多聲道和使用低復雜性的表述形式,在音質方面比很多傳統編碼格式更加優秀。蘋果電腦和蘋果手機的流行,大大提高了AAC格式的知名度。AAC格式能夠支持48個音軌,15個低頻(LFE)音軌,5.1多聲道支持,更高的采樣率(最高可達96 kHz)以及多種語種的兼容能力。
2.1.8有損壓縮音頻格式-RA格式
RA格式壓縮率比較高,所以文件很小,但是音質就得不到保證,特別適合在網絡傳輸速度較低的條件下使用,早些年多用于網絡電臺,近年隨著帶寬的不斷提升,采用率有所下降。
2.1.9有損壓縮音頻格式-MIDI格式
MIDI對于經常玩電子音樂的用戶來說應該再熟悉不過,最早是為了在電子樂器上記錄樂手的演奏,方便重放,之后伴隨引入了電腦MIDI的聲卡后,MIDI才變為一種音頻格式。
2.1.10各類音頻編碼技術的中英文參照
不同的編碼技術會設計到一些底層的編碼方式,這個太過于專業,本節就按照不同的算法和縮略語把這些編碼方式的中英文對照列舉一二。
PCM:脈沖編碼調制,Pulse Code Modulation。ADPCM:自適應差分脈沖編碼調制,Adaptive Differential Pulse Code Modulation。SB-ADPCM:子帶-自適應差分脈沖編碼調制,Subband Adaptive Differential Pulse Code Modulation。LPC:線性預測編碼,Linear Predictive Coding。CELPC:碼激勵線性預測編碼,Code Excited Linear Predictive Coding。VSELPC:矢量和激勵線性預測編碼,Vector Sum Excited Linear Predictive Coding。RPELTP:規則脈沖激勵長時預測,Regular Pulse Excited-Long Term Predictive。LDCELP:低時延碼激勵線性預測,Low Delay-Code Excited Linear Predictive。 MPE:多脈沖激勵,Multi-Pulse Excited。
由于篇幅原因,以上只是列舉了部分互聯網上較為流行的音頻格式。新媒體技術發展這么多年,日新月異,音頻格式層出不窮,但大都可歸為無損和有損這兩大類,如還有FLAC格式的無損音頻格式;有損音頻格式還有AMR(人聲、通話、手機錄音)、MPC等多種格式。
[1]APE[EB/OL].[2016-08-31]http:// baike.sogou.com/v49241.htm