999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Gammatone濾波的美爾倒譜失真測度

2009-04-29 00:00:00
科教導刊 2009年23期

摘要在語音質量評價方法中,與PESQ(語音質量感知評價)相比,Mel-CD失真測度計算量較小,是一種簡便有效的評價方法。但在某些情況下MFCC未能有效地表現出語音質量的真實情況。針對這種問題,提出了一種新的改進算法——美爾Gammatone濾波倒譜系數。利用Gammatone濾波器組對基底膜進行仿真的方法,代替Mel譜中的三角濾波器,提高與主觀評測的相似度,降低對于共振峰的頻移敏感度, 增強了客觀測度在噪聲環境中提取共振峰參數的能力。實驗表明,所提算法能有效提高與MOS值的相似度。

關鍵詞語音質量評價 美爾倒譜 Gammatone濾波

中圖分類號:TN912.3文獻標識碼:A

語音質量就是指復制語音的保真度和可理解性,即從對話中提取信息的能力。在通信系統的語音交流系統中,評價系統性能優劣的一個重要指標就是系統傳輸語音的質量。為了適應通信技術和服務發展的要求,研究靈活、可靠、準確的語音質量評價系統成為國內外學者努力的目標。

國際通行的測量移動通信系統語音質量的手段主要有兩種:主觀MOS評價和客觀評價。主觀MOS評價采用ITU-TP.800和P.830建議書,主觀評定成績是語音質量最真實的反映,但不能通過儀表測量得出,測試環境比較難于構建。為了彌補主觀評價的不足之處,用機器自動評價語音質量的客觀評價方法應運而生。雖然從20世紀40年代起就開始客觀評價研究的探索,但直到20世紀80年代以后,隨著聽覺生理和聽覺心理方面的研究成果逐步應用到客觀評價中,客觀評價方面的工作才取得突破。

Mel是心理聲學中音調的計量單位。Kubichek將Mel倒譜系數(Mel frequency cesptral coefficient, MFCC)作為語音特征參數應用于客觀評價,提出Mel-CD測度。與PESQ(語音質量感知評價)相比,Mel-CD失真測度計算量較小,是一種簡便有效的評價方法。MFCC考慮了人耳對頻率的非線性感知特性,但MFCC本身是同態解卷積的處理,將其作為語音質量客觀評價中的語音特征描述時并沒有很好地符合聽覺生理模型以及感知特性。但是,由于在MFCC特征提取方法中,由于通常采用三角形濾波器組進行頻域濾波,相鄰頻帶之間的頻譜能量相互泄露很嚴重,對于反映共振特性是不利的,而且其頻帶的劃分是基于中心頻率按Mel刻度均勻分布,也不完全符合聽覺特性中臨界帶的概念。

針對Mel-CD存在的問題,本文根據心理聲學原理,基于語音頻率和強度非線性感知特性,應用Johannesma提出的Gammatone濾波器提取語音特征參數,得到一種新的基于Gammatone濾波的美爾倒譜失真測度,為方便描述,本文將這種測度的譜特征記為美爾Gammatone濾波倒譜系數(Mel frequency Gammatone filter banks Cesptral Coefficient,MGCC)。并以MGCC作為特征參數得到一種新的語音質量客觀評價方法——美爾Gammatone濾波倒譜失真測度(Mel Gammatone filter banks Cepstral Distance measure, MG-CD)。

1 美爾倒譜系數

典型的基于輸入-輸出的語音質量客觀評價主要由語音信號預處理、特征參數計算、失真計算/判斷模型三部分組成,如圖1所示。核心部分在于特征參數計算、失真計算及判斷模型,不同的客觀測度主要區別在于這兩個部分。

音調是聽覺分辨聲音高低時,用于描述這種感覺的一種特性,客觀上用頻率表示音調,主觀上音調的單位用Mel標度。

Mel-CD是建立在人對聲音信號頻率所產生音調感知特性的基礎上,對語音信號提取Mel域上的特征描述,得到失真量計算所需要的特征參數,通過合適的判斷模型,將失真量與MOS值相對應。MFCC的實現流程如圖1所示。

圖1 美爾倒譜系數計算

其中,圖1中的頻率彎折、濾波和log|*|和DCT單元為Mel域上語音感知功能的實現,是MFCC計算中的核心部分。

2 基于Gammatone濾波的美爾倒譜失真測度

Mel-CD算法中所采用的MFCC考慮了人耳對頻率的非線性感知特性,但MFCC本身是同態解卷積的處理,將其作為語音質量客觀評價中的語音特征描述時并沒有很好地符合聽覺生理模型以及感知特性,并且在MFCC特征提取方法中,由于通常采用三角形濾波器組進行頻域濾波,相鄰頻帶之間的頻譜能量相互泄露很嚴重,對于反映共振特性是不利的,而且其頻帶的劃分是基于中心頻率按Mel刻度均勻分布,也不完全符合聽覺特性中臨界帶的概念。

本文采用的MCCG的提取也采用圖1所示算法框架,但在算法的具體處理方法上則對MFCC的提取過程進行了針對性的改變。

基于Gammatone濾波的美爾倒譜系數的具體計算過程描述如下:

(1)時頻變換。

對經過預處理后的第幀語音幀做FFT變換獲得頻譜,并計算短時能量譜。

(2) 模擬頻率感知的非線性特性。

按式(1),完成從頻率坐標到 Mel尺度坐標的變換.

(1)

式(1)描述了音調的 Mel尺度與聲音的物理頻率之間的關系,其中的單位為 Hz。

(3)模擬基底膜上的頻率響應特性。

由于MFCC中通常采用三角形濾波器組進行頻域濾波,相鄰頻帶之間的頻譜能量相互泄露很嚴重,對于反映共振特性是不利的。對此,本文采用Johannesma提出的Gammatone濾波器來替代MFCC中的三角形濾波器。Gammatone濾波器只需要很少的參數就能很好地模擬聽覺實驗中的生理數據,能夠體現基底膜尖銳的濾波特性。

Gammatone濾波器用一個因果的沖激響應函數Gammatone函數來描述其濾波器特性,這個沖激函數最早用以描述貓的聽神經的生理學沖激響應數據的特性。Gammatone函數的時域表達式為:

(2)

其中:t<0時u(t)=0,t>0時u(t)=1;參數,為Gammatone濾波器的等價矩形帶寬(等價矩形帶寬:對于同樣的白噪聲輸入,和指定的濾波器通過一樣能量的矩形濾波器的寬度,簡稱ERB),它同Gammatone濾波器中心頻率的關系是,參數是為了讓Gammatone函數更好地與生理數據相符而引入的參數;n為Gammatone濾波器的階數,各種研究表明,n=4的Gammatone濾波器就能很好地模擬基底膜的濾波特性;參數為Gammatone濾波器的初始相位。

由于Gammatone函數為沖激響應函數,因此直接將Gammatone函數進行Fourier變換,即可得到Gammatone濾波器的頻率響應特性。不同中心頻率下的4階Gammatone函數的時域波形如圖2(a)所示,對應的幅頻響應曲線如圖2(b)所示。其中圖2(a)的虛線表示Gammatone函數的包絡,的值表示t=0到振動包絡達到最大值所需要的時間;圖2(b)的幅頻響應曲線采用的是對數頻率橫坐標。

(a) Gammatone函數的時域波形

(b) Gammatone函數的幅頻曲線

圖2 不同中心頻率下的Gammatone函數時域波形和幅頻響應曲線

觀察圖2(b)可發現Gammatone函數的幅頻響應曲線具有以下特征:Gammatone函數是一個最大幅度出現在中心頻率位置的帶通濾波器,不同中心頻率的Gammatone濾波器具有不同的帶寬;帶通濾波器中心頻率兩側都具有較陡的邊沿,表明Gammatone濾波器具有尖銳的頻率選擇特性。這些幅頻響應特征與基底膜的濾波特性是一致的。更加集中了臨界帶中心頻率附近的語音特征,而且兩邊過渡圓滑。不同的人在發同一音時,頻譜結構的差異主要表現在共振峰的偏移。采用上述濾波器就有效地補償了這種偏移對話音特征提取的影響,從而增強了其在提取非特定人語音特征時的頑健性。臨界帶濾波器組中心頻率和帶寬的選擇,

(4) 強度-響度變換模擬。

為使變換函數既符合聽覺感知特性,對濾波器組輸出進行求對數處理:

(4)

(5) 去相關

對做離散余弦變換DCT(Discrete Cosine Transform),最終得到美爾譜系數:

(5)

式中, 表示系數的第階,,一般取 12~15。

經過DCT處理后,各個系數分量之間不具有相關性,有利于提高客觀評價的準確性和可靠性。

在MGCC特征的實現過程中,(2),(3)和(4)分別實現了頻率彎折、帶通濾波和非線性壓縮變換的功能。因此,所得到的MGCC是符合聽覺感知分析的語音特征參數。

3 實驗與結果

為了檢驗改進后算法的性能,本文將MGCC特征參數取代Mel-CD測度中的MFCC,本文將這種測度方法記為MG-CD。實驗通過將PESQ,Mel-CD和MG-CD用于不同干擾條件下通信系統的語音質量的客觀評價,并比較3種客觀評價的性能。實驗中所使用的原始語音材料為MOS測試用語音數據庫(軍用標準 SJ 208522 2002)中的語音文件。

實驗中的主觀評價MOS值則按音質MOS評價法(軍用標準 SJ 207712 2000)由一組聽評者給出。失真條件由無線通信中不同調制方式、不同干擾樣式及不同程度干信比條件決定,共6組測試。客觀評價的性能一般以客觀 MOS值與主觀 MOS值之間的相關程度和預測誤差衡量。主客觀評價的相關性采用 Pearson相關系數描述,如式 (7)所示,相關系數越接近 1,客觀評價估計語音質量的準確性越高。

(7)

式中:為某一段原始語音信號在第種實驗條件(噪聲、時延、誤碼等) 下的MOS;為客觀評分;和分別為二者的算術平均值。M是數據點的數目。

預測誤差用標準估計偏差表示,見式(8)所定義。越小,反映預測偏差越小,客觀評價測度的波動越小。

(8)

在不同調制方式、不同干擾樣式及不同(下轉第167頁)(上接第164頁)程度信干比的無線通信測試環境下進行6 組評測實驗,并將評分結果與已知主觀MOS評分值代入式(7) 進行計算,得到PESQ 、Mel-CD和MG-CD與客觀評分的相關度r,結果如圖3 所示。

圖3 PESQ,Mel-CD和 MG-CD實驗相關度比較

從圖3中可以看出,在6組測試中MG-CD的主客觀相關值一直大于0.9,最高達0.968,最低為0.905左右,現出相當高的評價準確性。

表1是它們各自的相關系數及標準偏差。從相關系數可以看出,MG-CD在與主觀聽覺感知的吻合性上, 高于Mel譜失真測度。其次,MG-CD的標準偏差在這三者中是最小的,這就證實了提出的MG-CD所采用的Gammatone濾波器所具有的對語音譜結構的差異不敏感的分析。

表1 評價實驗的平均主客觀相關值和平均估計偏差

4 結論

本文針對Mel-CD中采用的MFCC用于語音質量客觀評價時出現的問題,提出一種改進算法MGCC,在Mel進行語音特征參數提取時使用Gammatone濾波器來代替美爾倒譜系數提取過程中的三角濾波器。通過實驗驗證,該算法降低由于采用三角濾波器而造成對共振峰的頻移的敏感性,與PESQ和Mel-CD相比有更高的平均主客觀相關值,相似度更高,能更好地反映語音信號在人耳中的變換特性及聽覺心理的感知特性。

參考文獻

[1]陳國,胡修林,張蘊玉等. 語音質量客觀評價方法研究進展[J]. 電子學報,2001.9(5).

[2] Mean Opinion Score(MOS)terminology ITU-T Recommendation P.800.1 July, 2007

[3] DavissB,MermelsteinP. Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences [J]. IEEE Trans. on Acoust, Speech, Sign- al Processing,1980,28(4):3572336.

[4] KUB ICHEK R. Mel-cepstral distance measure for objective speech quail- ty assessment[C], Proc.IEEE Pacific Rim Conference on Communi- cations, Computers, and Signal Pro- cessing. Piscataway: IEEE Press,1993:125~128

[5] ITU2T Rec. P. 862 O2001 , Perceptual evaluation of speech quality( PESQ) : an objective method for end-to-end speech quality assessment of narro- wwband telephone networks and speech codec[S]

[6] Johannesma PIM. The pre-response stimulus ensemble of neurons in the cochlear nucleus[C]// Proc of the Symposium on Hearing Theory. Eind- hoven, Netherlands:IPO, 1972:58~69.

[7] 趙力. 語音信號處理[M]. 北京:機械工業出版社,2003:54.

[8] Glasberg BR, Moore BCJ. Derivation of auditory filter shapes from notched noise data [J].Hearing Res- earch,1990,47(1):103-108

主站蜘蛛池模板: 99成人在线观看| 天堂av综合网| 91欧洲国产日韩在线人成| 久久婷婷色综合老司机| 原味小视频在线www国产| 亚洲人成影院在线观看| 九色视频在线免费观看| www亚洲精品| 免费人成在线观看成人片 | 国产精品人莉莉成在线播放| 久久美女精品国产精品亚洲| 亚洲va欧美va国产综合下载| 伊人国产无码高清视频| 国产成人AV综合久久| 久久精品人人做人人爽97| 这里只有精品免费视频| 98超碰在线观看| 国产一级做美女做受视频| 国产高潮视频在线观看| 欧美亚洲欧美| 色婷婷啪啪| 黄色成年视频| 日韩午夜伦| 日本三级欧美三级| 亚洲资源在线视频| 国产免费久久精品99re丫丫一 | 在线观看无码av五月花| 久久国产拍爱| 91精品啪在线观看国产| 四虎成人精品| 国产福利小视频在线播放观看| 欧美a√在线| 乱人伦视频中文字幕在线| aⅴ免费在线观看| 国产免费观看av大片的网站| 99尹人香蕉国产免费天天拍| 国产在线观看人成激情视频| 一区二区三区高清视频国产女人| 中国国产高清免费AV片| 99re在线观看视频| 亚洲午夜片| 欧美第二区| 麻豆国产原创视频在线播放 | 国产导航在线| 精品国产www| 伊人久久大香线蕉影院| 久久久亚洲色| 色综合a怡红院怡红院首页| 欧美日韩国产高清一区二区三区| 国产成人无码AV在线播放动漫 | 久久黄色一级视频| 自偷自拍三级全三级视频| 亚洲成人播放| 精品国产成人av免费| 99精品免费在线| 色九九视频| 亚洲高清在线天堂精品| 免费无遮挡AV| 国产情侣一区二区三区| 国产91小视频在线观看| 一本综合久久| 有专无码视频| 久久精品无码国产一区二区三区| 亚洲清纯自偷自拍另类专区| 91视频日本| 熟妇丰满人妻| 四虎成人免费毛片| 无码综合天天久久综合网| 这里只有精品在线播放| 久久精品人人做人人综合试看| 亚洲一本大道在线| 精品伊人久久久久7777人| 黄色免费在线网址| 国产乱码精品一区二区三区中文 | 欧美亚洲国产一区| 欧美a在线看| 国产麻豆另类AV| 色婷婷狠狠干| 大学生久久香蕉国产线观看| 欧美啪啪视频免码| 色婷婷综合激情视频免费看| 亚洲三级色|