999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

音頻壓縮質量對聽覺感知影響的研究

2017-12-14 07:45:29夏陽
教師博覽 2017年11期
關鍵詞:信號音樂實驗

夏陽

(浙江師范大學,浙江金華 321004)

音頻壓縮質量對聽覺感知影響的研究

夏陽

(浙江師范大學,浙江金華 321004)

為了能更好地解決數字音頻信號相關存儲與傳輸問題,數據壓縮逐漸成為當代數字音頻處理中一個重要的研究方向。人耳的聽覺對不同壓縮比的音頻質量有著顯著的感知差異,通過不同的實驗法組合發現,被試不能分辨出112及以上比特率編碼的音頻,但是能分辨出96kBit/s、80 kBit/s、64kBit/s、56kBit/s編碼的音頻,且對80及以下比特率編碼的音頻表現出厭煩。由此可見,對音頻進行編碼的最佳方案是112 kBit/s。

音頻;MP3;聽覺感知

音頻作為視聽媒體中不可或缺的一部分,具有重要地位。當音頻信號傳遞到人耳時,人耳有一套復雜的聽覺感知系統,能夠將聲音信號轉變為大腦的腦電信號,并將接受的復雜信息簡化為人們本身所需要的信息。人們對人耳聽覺系統信息處理機制的研究涉及多個學科的領域,涵蓋了生理學、認知心理學、信息科學、計算機科學、物理聲學等。

到目前為止,人們對聽覺信息處理機制的研究已經取得了一定的成果,但仍存在一些未解決的問題,例如,在數字音頻信號傳輸時,人們常對于音頻的大小和質量產生困惑。眾所周知,聲音信號的數據量是非常大的,要使實時處理和傳輸這些龐大的數據成為可能,必須對音頻數據信息進行處理。近幾年來,在網絡流媒體、數字廣播、移動設備等領域,數字音頻信號處理得到了廣泛的應用。為了能更好地解決數字音頻信號相關存儲與傳輸問題,數據壓縮逐漸成為當代數字音頻處理中一個重要的研究方向。

在諸多的壓縮標準中,MP3壓縮格式以其優越的性能以及品質與算法復雜度的極佳折中,成為當前PC、網絡、PDA上最為流行的音頻格式。移動設備終端的計算能力和存儲容量都是有限的,但是過多地壓縮音頻質量將會影響到人們對事物整體信息的感知與判斷。[1]因此,如何在不影響聽覺感知的基礎上盡可能大地壓縮音頻成為研究的一個重要領域。

人耳作為音頻信號的接收者,它具有一定的主觀性,盡管物理聲學信號是客觀存在的,但在人的聽覺系統反應上會有一定的偏差。因此深入地研究人的聽覺系統,研究音高、音強和音色對主觀感知的影響是十分必要的。這就是交叉學科——心理聲學的研究范疇。

本次實驗主要為探尋MP3的不同壓縮方式是否對聽覺質量產生影響,特選取MP3中常見的一些壓縮的比特率,探究編碼和未編碼的音頻片段是否在聽覺感知上有差異,探究不同壓縮程度的音頻是否對人的主觀感知有影響,以期選擇出最優的MP3壓縮方案。

一、基礎理論

1.聽覺曲線

聲音的單位能量由響度來表示,響度由單位面積上的聲壓比對數來計算。

由于人耳的結構復雜,不同頻率的聲音傳遞到耳朵會有不同的共振。圖1為人耳在相同響度下對不同頻率的聲音的共振程度。最下方的虛線表示在安靜時人的聽覺閾值曲線,上方四條實線分別表示在20、40、60、80分貝下的聽覺曲線。從圖1可以看出,頻率為2kHz~6kHz的聲音共振較為明顯,可以繼而推出人耳對這個頻率段的聲音較其他頻率段為敏感。[2]

圖1 聽覺曲線以及相同響度下的曲線

2.雙耳效應

當人們將一根手指按在一只耳朵上,會感覺到明顯的響度變小了。這說明兩只耳朵都和響度相關。1947年,Shaw、Newman和Hirsh發現,事實上雙耳的聽覺閾限要比單耳的聽覺閾限低了大約3dB。[3]這個結果的產生不是在實際的室內聲源中,而通常是在開放聲場的消聲室中。同時,有國外的研究還發現,聲音射入的方向是影響響度的一個重要因素。圖2顯示了在標準水平面的不同入射角產生的不同結果。顯然,響度本身是受入射方向影響的,對不同的受試者來說,最大變化可達10dB;除此之外還顯示了明顯的頻率相關性,在高頻(5kHz)時有更大的效應。

圖2 響度入射方向的相關性

響度受到入射方向影響可以理解為兩個不同的進程:(1)從聲源到耳朵的聲學信號轉換;(2)事實上的雙耳的相加。第一個進程是物理層面的,它包括面對著聲源耳朵的壓力結構、背對著聲源耳朵的頭部陰影效應(聲影區)等。第二個進程是心理物理層面的,它描述了耳朵受入射影響變化的響度等級如何與雙耳的壓力響度等級相結合。2006年,Sivonen和Ellermeier利用相加的法則發現,雙耳最大的增益達到3dB。[4]

3.音頻壓縮編碼技術

最近二十年來,有不少音頻壓縮編碼技術被制定出來,如MPEG-1 Layer3、MPEG-2 AAC、Dolby實驗室的AC-3、微軟的WMA等,其中,MPEG音頻標準系列占據了音頻壓縮技術的主流地位。MP3是MPEG-1的副產品,20世紀90年代由德國柏林工業大學的Fraunhofer Gesellschaft研究所研制,是到目前為止最為普及的音頻壓縮格式。它采用了子帶分解、分析濾波器組、轉換域編碼、熵編碼、動態比特分配、非同一量化編碼和心理聲學分析等技術,支持32kHz、44.1kHz和48kHz采樣頻率下對16比特PCM信號進行編碼,同時,提供單聲道、立體聲道、兩個獨立雙聲道和聯合立體聲等四種音頻聲道模式。[5]

圖3 MP3編碼流程圖

圖3所示為MP3編碼流程。如圖所示,音頻信號由兩種方式進行編碼,第一種方式數據先進入多相濾波器,然后經過MDCT變換得出頻譜系數;第二種方式數據先進行快速傅立葉變換,然后通過psychoacoustics分析,將psychoacoustics分析后的聲學參數和第一種方式輸出的頻譜系數進行量化和霍夫曼編碼;第二種方式進行聲學分析后可以得出信號掩蔽比,最終由兩者形成相應的比特信息流。

二、編碼和未編碼的音頻對人的聽覺感知的影響

1.被試

柏林工業大學聲學專業大學生30人,其中男生15名,女生15名,年齡在24~31歲,聽力正常。被試單獨進入測試房間,在計算機支持下的ABX測試中進行獨立的選擇和評價。

2.實驗材料

實驗采用60個音頻文件,分為30組,每組2個音頻文件,均采用WAV格式(PCM,16 Bit,44.1 kHz)。每組的兩個音頻各自包含相同的爵士樂片段(大約30秒),其中第一個音頻未編碼,第二個文件用112 kBit/s的MPEG Layer-3方法進行編碼。

3.實驗方法

傳統的信號檢測法無法改變原始音頻,因而在本研究中無法采用。為了達到目的,本研究借助計算機的編程實現,采用迫選法(Forced Choice Method)。而迫選法要求被試必須至少聽兩段音頻片段,因此在本研究中采用ABX測試法。

ABX測試方法如下:從兩段音樂庫中隨機抽取一對音頻信號A[n]、B[n](n為不大于原始音樂庫中音樂數目的任意正整數),再隨機地把A[n]、B[n]分配給A和B,然后在A、B中隨機選出一個作為X。測試者可以任意地反復回放A、B或X,最后給出判斷:X是A還是B。

4.實驗程序

本實驗在小型的混響房間的筆記本電腦上運行,電腦裝載了ABX軟件。被試逐個單獨進入房間然后對音頻用ABX方法進行判斷。實驗采用STAX Lambda SR-202-Stereo專業測試耳機。在實驗過程中允許被試自由調節音頻的響度。每個被試測試18次。

5.實驗參數

一次有n次過程的ABX測試等于一個n階p=0.5的伯努利實驗(Bernoulli Experiment)。概率k和n的關系如下所示:

圖4中顯示了n=18時的離散概率。當時,適用以下公式:

以此類推所求的概率為:

圖4 n=18時的離散概率

當n=18以及p=0.5時得到以下數值:5%的波動范圍應該被看作是一個明顯差異的界限。在表1中,有超過13次的嘗試都在5%以內,只有5次的偶然命中率超過了這個數值(見圖4)。

表1 不同次數下的離散概率

6.實驗結果與分析

對實驗結果進行描述性統計分析發現:有6名被試達到13次及以上的正確次數,而其余24名被試均未達到標準(見表2)。因此可見,即僅有20%的被試能正確分辨兩者的區別,而其余80%的被試未能正確分辨兩者的區別。

對實驗結果進行單樣本T檢驗發現:T=-5.572,P<0.001,即30名被試的平均正確次數11.20與正確次數13之間存在顯著性差異。由此可見,被試并不能分辨出112 kBit/s編碼的音頻。

表2 ABX測試的正確率

三、不同壓縮質量的音頻對人的聽覺感知的影響

1.被試

柏林工業大學聲學專業大學生40人,其中男生20名,女生20名,年齡在25~32歲,聽力正常。被試單獨進入測試房間,在計算機支持下的ABC/HR測試中進行獨立的選擇和評價。?

2.實驗材料

實驗采用在第一個實驗中使用過的爵士樂片段(s0),將其進行編碼,形成8個比特率的MPEG Layer-3編碼片段:320kBit/s(s1),224kBit/s(s2),160kBit/s(s3),112kBit/s(s4),96kBit/s(s5),80kBit/s(s6),64kBit/ s(s7)和56kBit/s(s8),共18組,每組9個音頻文件。

3.實驗方法

本實驗采用ABC/HR方法。ABC/HR測試方法如下:在程序上呈現三個測試刺激源(a,b,c),其中參數刺激已被標明,同時提供兩個未標識的刺激材料,這兩個未標識的刺激材料中一個是重復的參數,一個是已經改變的版本。在測試中,被試需要確定,這兩個未標識的刺激材料中的哪一個是已經改變的版本。除此之外,被試還需要測主觀的干擾度,這主要通過一個控制器來定量確定(5-感覺不到;4-感覺到,但不令人厭煩;3-稍微有點令人厭煩;2-令人厭煩;1-很令人厭煩討厭)。如果被試選擇已經改變的版本,其主觀評判的值為正值;如果被試選擇未被改變的版本,其主觀評判值為負值。

4.實驗程序

本實驗在小型的混響房間的筆記本電腦上運行,電腦裝載了ABC/HR軟件。被試逐個單獨進入房間然后對音頻用ABC/HR方法進行判斷。實驗采用STAX Lambda SR-202-Stereo專業測試耳機。每個被試測試162次。

5.實驗結果與分析

對實驗結果進行描述性統計分析發現:100%的被試能夠在兩個未編碼的刺激中識別出56 kBit/s的音樂、64 kBit/s的音樂、80kBit/s的音樂;85%的被試能夠在兩個未編碼的刺激中識別出96kBit/s的音樂;而112kBit/s的音樂、160Bit/s的音樂、224kBit/s的音樂、320kBit/s的音樂識別正確率分別為18%、13%、10%、5%。

將112kBit/s、160kBit/s、224kBit/s、320kBit/s音樂的實驗結果進行單樣本T檢驗發現:T(112kBit/s)=-4.130;T(160kBit/s)=-6.430,p<0.005;T(224kBit/s)=-9.579,p<0.005;T(320kBit/s)=-11.695,p<0.005;即40名被試的平均正確次數M(112kBit/s)=11.25,M(160kBit/s)=10.88,M(224kBit/s)=9.92,M(320kBit/s)=9.42與正確次數13之間均存在顯著性差異。由此可見,被試并不能分辨出112 kBit/s、160kBit/s、224kBit/s、320kBit/s編碼的音頻。

將96kBit/s的音樂的實驗結果進行單樣本T檢驗發現:T(96kBit/s)=1.010,p>0.01;即40名被試的平均正確次數M(96kBit/s)=14.50與正確次數14之間并不存在顯著差異。由此可見,被試能分辨出96 kBit/s編碼的音頻。

進一步對平均值進行分析發現:在80 kBit/s達到了標度值“稍微有點令人厭煩”,由此可以確定質量的損害;在96kBit/s差異度的平均值為3.56,在標度值“感覺到,但不令人厭煩”附近,由此可以看出,在這個標度值上僅僅有一個變化,但是沒有質量的損害生成(見表3)。

表3 不同比特率的音樂

四、分析與討論

音頻壓縮技術,其實質就是對經過采樣量化的PCM信號進行處理,力求壓縮后的音頻數據量最小化,并同時達到所謂的“透明音質”,即解碼后的輸出信號與原先的輸入信號不可分辨。本實驗發現,被試不能分辨出112、224、320比特率編碼壓縮的音頻,但是能分辨出96kBit/s、80 kBit/s、64kBit/s、56kBit/s編碼壓縮的音頻,且對80及以下比特率編碼的音頻表現出厭煩。由此可見,經過112、224、320比特率編碼壓縮的音頻,都達到了“透明音質”的標準,均為音頻壓縮編碼可以采用的比特率。但是,音頻編碼的中心思想為用最小的比特存儲聲音信號,使之達到透明聲音信號標準。[6]因此,在音頻編碼壓縮上應該有個最佳壓縮方案,即達到透明聲音信號標準的最小比特值,本實驗發現,這個值為112 kBit/s。

[1]蔣學鑫.MP3實時編解碼系統的研究與開發[D].電子科技大學,2007,(4).

[2]Weinzierl S,Ellermeier W,Hellbrück J.Handbuch der Au?diotechnik[M].Springer Verlag,2007,(42).

[3]Shaw W A,Newman E B,Hirsh I J.The difference between monaural and binaural thresholds[J].Journal of Experimental Psy?chology,1947,(37):229-242.

[4]Sivonen VP,Ellermeier W.Directional loudness in an an?echoic sound field,head related transfer functions,and binaural summation[J].J Acoust Soc Ame.2006,(119):2965-2980.

[5]李琳.音頻感知編碼模型及關鍵技術的研究[D].中國科學技術大學,2008,(5).

[6]李琳琳.數字音頻感知編碼的心理聲學模型[J].經驗與交流,2008,(6).

夏 陽(1984—),男,浙江金華人,浙江師范大學助教,研究方向為音頻技術、影視聲音。

責任編輯 李杰杰

猜你喜歡
信號音樂實驗
記一次有趣的實驗
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
做個怪怪長實驗
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
圣誕音樂路
兒童繪本(2017年24期)2018-01-07 15:51:37
音樂
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
基于LabVIEW的力加載信號采集與PID控制
主站蜘蛛池模板: 成人在线欧美| 日本一区二区不卡视频| 成人无码区免费视频网站蜜臀| 青草视频在线观看国产| 精品少妇人妻av无码久久| 免费国产不卡午夜福在线观看| 男女男免费视频网站国产| 国产青青操| 国产人成网线在线播放va| 国产福利在线观看精品| 手机在线国产精品| a级毛片一区二区免费视频| 91色爱欧美精品www| 日韩小视频网站hq| 国产成人啪视频一区二区三区 | 亚洲欧洲日韩国产综合在线二区| 久久亚洲AⅤ无码精品午夜麻豆| 少妇精品久久久一区二区三区| 99精品福利视频| 找国产毛片看| 久久成人免费| 国产第三区| 9久久伊人精品综合| 国产欧美日韩免费| 色噜噜综合网| 在线免费a视频| 谁有在线观看日韩亚洲最新视频 | 伊在人亚洲香蕉精品播放| 好吊色妇女免费视频免费| 精品国产www| 国内精品视频区在线2021| 一级全免费视频播放| 国产女人18毛片水真多1| 亚洲第一成人在线| 中文字幕久久精品波多野结| 久久黄色一级片| 美女免费黄网站| 无码视频国产精品一区二区| 欧美成人a∨视频免费观看| 国产亚卅精品无码| 欧洲亚洲欧美国产日本高清| 91亚洲精品第一| 中文字幕在线永久在线视频2020| 香蕉eeww99国产精选播放| 国产成人三级在线观看视频| 999精品视频在线| 日韩国产无码一区| 国产91特黄特色A级毛片| 理论片一区| 国产情侣一区| 亚洲男人天堂网址| 99久久性生片| 欧美日韩另类在线| 国产欧美网站| 国产色伊人| 在线看AV天堂| 国产理论精品| 精品国产Av电影无码久久久| 国产精品一区在线麻豆| 中国国产高清免费AV片| 亚洲午夜天堂| www.国产福利| 亚洲成a∧人片在线观看无码| 亚洲精品视频在线观看视频| 亚洲欧洲自拍拍偷午夜色| 国产无码制服丝袜| 亚洲精品中文字幕无乱码| 日本精品中文字幕在线不卡| 久久精品中文字幕少妇| 亚洲国语自产一区第二页| 看看一级毛片| 黄色免费在线网址| 亚洲AV电影不卡在线观看| 国产一级毛片网站| 国产av剧情无码精品色午夜| 午夜日b视频| 真实国产乱子伦高清| 97成人在线观看| 波多野结衣久久精品| 欧美日韩激情在线| 免费看av在线网站网址| 亚洲精品视频免费观看|