999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高階最優(yōu)LPC 根值篩選的共振峰估計算法研究

2022-07-10 04:55:38龍華蘇樹盟
通信學報 2022年6期
關鍵詞:信號檢測

龍華,蘇樹盟

(昆明理工大學信息工程與自動化學院,云南 昆明 650031)

0 引言

共振峰檢測是降低高質量語音比特率任務的前提,在多種語音信號處理場景中[1-3],共振峰頻率的精確估計是必要的。實現(xiàn)共振峰頻率精確估計的方法包括倒譜法、線性預測(LP,linear prediction)分析法[4]、經(jīng)驗模態(tài)分解(EMD,empirical mode decomposition)希爾伯特黃變換(HHF,Hilbert-Huang transformation)非線性模型法[5]和深度學習法[6]。其中,倒譜法實現(xiàn)簡單但是缺乏系統(tǒng)所需的準確性[7];HHF 模型針對語音的非平穩(wěn)特性以高時間分辨率可靠地提取語音信號共振峰,但EMD過程中算法復雜度較高,影響了檢測的速度,降低了檢測的有效性;深度學習法輸入語音片段進行模型訓練,基于特定數(shù)據(jù)集訓練可以得到較好的結果,但受數(shù)據(jù)集影響較大,導致泛化能力較低。LP分析技術公式化語音信號的本質模型,在聲道建模中運用廣泛[8],一個p階的全極點濾波器通常在8≤p≤20的范圍內適用于語音[9],短時語音的線性預測系數(shù)(LPC,linear prediction coefficient)對應的系統(tǒng)頻譜包含與共振峰頻率相關的聲道共振頻率值,LPC 提取共振峰的普遍問題是不能從語音中正確、穩(wěn)定地提取共振峰頻率[10],并且存在去除共振峰的偽根困難以及線性預測極點交互兩大問題。傳統(tǒng)線性預測共振峰估計(TLP-FE,traditional linear prediction-formant estimation)方法[8]在保留共振峰和LP 響應幅度譜基本形狀的前提下,減小p的取值,犧牲信號擬合的精度以去除大部分和激勵有關的頻譜特征(基音諧波與共振峰諧波),減少偽根數(shù),降低線性預測極點交互,帶來的問題是限制了共振峰提取的精度。在傳統(tǒng)方法的基礎上,文獻[11]依據(jù)相同音素、不同語音幀間共振峰的連續(xù)性構建相鄰幀間的峰值向量完備組合矩陣,通過求取滿足相鄰幀的峰值組合中歐幾里得距離最小的譜峰根值的方法來防止共振峰的混疊,采用變階LPC 的方式保證LPC 共振峰提取的精確度,這種方法在共振峰提取上過濾了基音及共振峰諧波,但是高階次、高精度地求取共振峰僅在少部分語音幀中得以體現(xiàn)。

此外,LPC 加權方案在共振峰提取中獲得了較好的性能,近些年提出的加權方案包括穩(wěn)定加權線性預測(SWLP,stabilized weighted LP)[12]、擴展加權線性預測(EWLP,extension weighted LP)[13]、功率加權線性預測(PWLP,power weighted LP)[14]及數(shù)據(jù)驅動加權線性預測(DWLP,data-driven weighted LP)[15]。文獻[14]對語音信號離散傅里葉頻率集合中的共振頻率部分進行分離,加重共振頻率對應譜幅值,提出一種功率加權LPC 的共振峰估計(PWLP-FE,power weighted LP-formant estimation)算法,此算法強調語音信號的主要頻譜成分,對消除極點交互帶來的峰值混疊具有較好的效果。目前,已有的LPC 共振峰檢測算法均存在LP 偽根難以去除的問題,PWLP-FE 算法改變了原始語音的語音波形消除極點交互,但仍然無法有效地去除高階LP 偽根,在共振峰頻率精確估計的性能上存在較大誤差。

為解決現(xiàn)有LPC 共振峰估計存在的LPC 偽根干擾、LPC 極點交互的問題及降低共振峰檢測的誤差,本文首先增大p的取值,提高線性預測系統(tǒng)頻譜對語音信號的擬合程度,在不同階次下分析語音信號共振峰頻率的計算精度,并且引入語音數(shù)字共振模型[8,10]來約束不同階次線性預測共振峰根幅值范圍;然后通過匹配階次的根幅值來篩選線性系統(tǒng)根值的方法來減少偽根數(shù);最后結合功率加權來消除極點交互,解決諧波產(chǎn)生的干擾,提出一種高階最優(yōu)LPC 根值篩選的共振峰估計(HOLP-FE,high order optimality LP-formant estimation)算法。實驗結果顯示,相比于最近提出的PWLP-FE 算法,本文提出的HOLP-FE 算法可以有效消除高階次下的極點交互及濾除混疊頻率,能更加精確地提取出語音信號的共振峰頻率。

1 LPC 共振峰檢測

1.1 功率加權LPC

功率加權是對原始語音在頻域上進行幅值加權修正,使語音信號的主要頻譜成分更具區(qū)分度。信號能量大(譜峰)的區(qū)域比信號能量小(譜谷)的區(qū)域線性預測譜和信號譜匹配更好[16],語音能量大的區(qū)域比語音能量小的區(qū)域對語音頻率的加權更多,進而語音譜峰處對應的頻率取值的區(qū)分度更加清晰。

功率加權LPC 是對功率加權修正的信號進行LP 分析并通過語音信號估計線性時變系統(tǒng)模型參數(shù)的過程。不同的語音離散時間模型對應著不同的線性時變系統(tǒng),在線性時變系統(tǒng)模型h(n) 中輸入激勵信號值u(n)后,輸出的語音采樣信號值為

在語音離散時間模型中,模型當前的輸出是模型當前的所有輸入激勵信號以及模型過去的輸出語音采樣信號的線性組合,輸入與輸出之間的時域關系表示為

其中,n表示信號采樣點數(shù),p表示時變線性系統(tǒng)的極點階數(shù),q表示時變線性系統(tǒng)的零點階數(shù),ai表示模型極點系數(shù),bl表示模型零點系數(shù),G表示模型增益因子。

在時變線性系統(tǒng)模型中,模型h(n)的傳遞函數(shù)為

其中,H(z)為語音信號的系統(tǒng)函數(shù),S(z)為語音采樣信號s(n)的頻域表達式,U(z)為激勵信號u(n)的頻域表達式。語音采樣清音及鼻音濁音在聲道傳輸函數(shù)中同時包含零點和極點[17-18],語音采樣非鼻音濁音在聲道傳輸函數(shù)中模型簡化只包含極點,相應的時變線性系統(tǒng)模型參數(shù)中的零點系數(shù)bl全為0,聲道模型為自回歸(AR,auto-regressive)全極點模型,并且當時變線性系統(tǒng)數(shù)字濾波器的極點階數(shù)p足夠大時,可以采用全極點模型來擬合所有的語音。

對采樣語音信號做線性分析構建LP 方程,求解LPC 方程,得到語音信號的線性預測系數(shù)ai[16],同時ai也對應AR 模型方程的實數(shù)根及共軛復根。

1.2 共振峰檢測約束及語音信號修正

相較于文獻[11]提出的最小化相鄰幀間峰值向量完備組合矩陣歐幾里得距離,以及通過極點交互因子搜索頻譜極點角局部極大值[19]求譜峰值,從語音數(shù)字共振的整體頻率貢獻角度引入數(shù)字共振模型約束,定位譜峰峰值的搜索由局部改進至整體,有效避免了局部搜索步距界定繁雜的計算及峰值帶寬與局部搜索邊界失配造成的局部峰值定位失誤。

LPC 共振峰檢測依據(jù)LPC 原理確定匹配階次的AR 模型極點系數(shù),以極點系數(shù)頻域特性確定對應的峰值頻率及峰值帶寬。共振峰檢測的數(shù)字共振模型是濁音聲道傳輸函數(shù)的穩(wěn)態(tài)形式[8,10],描述的是與共振峰頻率相對應的數(shù)字共振器的頻域貢獻。將AR 模型傳遞函數(shù)寫成關于共振峰頻率Fi以及譜峰帶寬Wi穩(wěn)態(tài)數(shù)字共振級聯(lián)形式為

式(4)中,當p取8 階或9 階時,j的取值為{1,2,3,4},對應4 個譜峰共振器,可從這4 個譜峰頻率值Fj中找到滿足且Wj<700 Hz 的3 個共振峰F1、F2和F3,并用這3 個頻率值作為數(shù)字共振約束參數(shù)。

為提高語音信號譜峰區(qū)分度[14],結合功率加權原理將原始語音信號s′(n) 修正為s′(n),用于共振峰檢測的修正信號改變語音原始波形;結合功率加權和LPC 做共振峰檢測,修正的信號s′(n) 為

修正的信號s′(n) 的波形不同于s′(n),將s′ (n) 信號作為LP 的輸入可得到更具頻率區(qū)分特性的LPC根值。

2 高階根值篩選的LPC 共振峰估計算法

高階根值篩選的LPC 共振峰估計算法流程如圖1 所示。在對語音信號做共振峰估計時,需要對語音信號做預處理端點檢測等前期處理,預處理對語音信號進行預加重,削減低頻信息以降低基頻對共振峰檢測的干擾,增強高頻信息以增加高頻譜線的幅值區(qū)分度,端點檢測有效地隔離無話段,進而對有話段做進一步的LP 分析。

圖1 高階根值篩選的LPC 共振峰估計算法流程

本節(jié)首先對有話段做線性預測分析及低階數(shù)字共振模型根值約束分析,求解高階LPC 根值及數(shù)字共振模型根約束閾值,然后以約束閾值得到約束條件下的共振峰根值,最后定位、平滑修正連續(xù)語音信號共振峰。

2.1 求解高階LPC 峰值頻率

低階線性預測僅保留了語音信號LP 響應幅度譜的基本形狀,提高線性預測階次增大了信號的擬合度,消除低階線性擬合帶來了共振峰擬合精度的犧牲。

信號線性預測分析中,LPC 對應AR 模型的極點系數(shù)ai,其與時變線性系統(tǒng)傳輸函數(shù)根值zi間的關系[16,20]為

由式(6),依據(jù)ai求解共軛復根zi

其中,αi與βi分別表示共軛復根zi的實部與虛部。

共軛復根zi 對應的頻率 fi 及帶寬 wi在頻率域f中的位置關系為

聯(lián)立式(6)和式(8),得到LP模型的頻率域H(f)

在H(f) 中,存在關于fi的式(10)成立,即功率加權后的譜峰為共振峰值點。

由式(7)求得單位圓內的根幅值γi為

聯(lián)立式(7)、式(8)和式(11)可得

利用式(12)得到高階線性預測的系數(shù)a對應的譜峰頻率值fi及譜峰帶寬值wi,在譜峰頻率值fi中包含共振峰頻率值、共振峰諧波頻率值及基音諧波頻率值,需要在所有譜峰頻率值中加入約束來濾除諧波,定位出前3 個共振峰頻率值。

2.2 線性預測根值的數(shù)字共振模型約束

AR 模型在取較低的階次時,有效地隔離了大部分和激勵有關的頻譜特征,濾除了頻譜中的諧波分量,避免了極點交互作用,獲得了低擬合精度的LPC 根值,求解得到滿足式(4)的3 個譜峰參考頻率F1、F2和F3。

采用數(shù)字共振模型確定的參考頻率作為約束對zi進行篩選,定義根幅值閾值變量為γ且0<γ< 1,前三共振峰為fk且k={1,2,3}。結合式(11),滿足γi>γ的zi的實部與虛部分別為

由式(12)可知,關于根幅值閾值變量γ的LPC譜根值頻率f i(γ)為

引入數(shù)字共振頻率約束,從高階擬合的f i(γ)中定位關于根幅值閾值變量γ的3 個共振峰頻率f k(γ)為

在高階次下,求滿足3 個峰值在數(shù)字共振約束下總體誤差最小的根幅值篩選閾值γ′。此時,γ′與線性預測的階次相關。

2.3 高階根值篩選

結合式(11)以及式(16)篩選高階LPC 對應的zi,得到滿足γi>γ′的實部與虛部分別為

由式(12)得到高階次下3 個共振峰頻率f'i為

區(qū)分峰值頻率對應第k共振峰fk

求解連續(xù)共M幀的語音共振峰及帶寬,第m(0≤m≤M-1)幀語音信號s m(n)的共振峰頻率為f k(m),聯(lián)立式(11)、式(12)、式(17),求得第m幀語音信號s m(n)的第k共振峰對應的帶寬wk(m)。同一個音素對應的共振峰頻率值是連續(xù)的,采用wk(m) 作為判決對共振峰頻率進行中值平滑求解,滿足式(20)或式(21)的f k(m-1)和f k(m+1)。

進行中值平滑處理修正f k(m),如式(22)所示,得到連續(xù)語音每一幀最終的共振峰頻率。

3 實驗及其分析

為了抑制基頻譜線幅度值,降低基頻對共振峰檢測的干擾,并且抵消聲門脈沖引起的高端頻譜幅度下跌,對語音信號進行預加重處理來提升信號高頻,強調聲道部分的頻譜,得到頻率特性平坦、共振峰頻率特性接近的信號。實驗對共振峰頻率已知的連續(xù)合成單元音語音進行共振峰估計,對語音端點檢測的有話段的音素進行逐幀估計。

3.1 實驗條件

本節(jié)指定反映聲道信息及聲帶振動信息的共振峰頻率和基音頻率參數(shù)合成參考語音[21],使用共振峰頻率確定的合成語音來驗證共振峰提取算法的準確性。信號選取[a]、[i]、[u]這3 個元音的連續(xù)合成信號,指定3 個元音的基音頻率均為140 Hz,3 個元音的共振峰帶寬相同,前3 個共振峰對應帶寬分別為150 Hz、200 Hz、250 Hz,前3 個共振峰頻率值元音[a]分別為906 Hz、1 359 Hz、2 609 Hz,元音[i]分別為328 Hz、2 421 Hz、2 890 Hz,元音[u]分別為406 Hz、765 Hz、2 312 Hz。其中,音頻采樣頻率為8 000 Hz,幀長為25 ms,幀移為1 ms,共計161 幀。

本文實驗選取合成元音[a]的語音信號分析數(shù)字共振根值約束下的根判定閾值、共振峰根值分布,選取合成元音[a]對應的多幀平均值分析共振峰頻率預測誤差,以整體連續(xù)包含3 個元音的合成語音分析算法穩(wěn)健性及誤差分布。

3.2 數(shù)字共振根值約束下的根判定閾值

通過實驗計算AR 模型取不同階次時共振峰根幅值的范圍,分析本文引入的數(shù)字共振根幅值約束下的根幅值閾值與階次的匹配性,如圖2 所示。

圖2 根閾值與階次關系

圖2(b)是圖2(a)中10~24 階根閾值與階次關系的放大圖。如圖2(a)所示,采用傳統(tǒng)方法求取3 個共振峰頻率時,階次低于10 時設置閾值為0,高于10 時設置閾值為0.9,粗略區(qū)分共振峰峰值對應的根以及非共振峰峰值對應的根,傳統(tǒng)方法偽根濾除時,誤差較大。如圖2(b)所示,在高階次時共振峰根幅值與偽根根幅值區(qū)分度較小,線性預測階次增大,峰值擬合精度增大,根幅值篩選閾值也有所增大,或高于0.9 或低于0.9,故不能以固定的傳統(tǒng)標準來衡量。由圖2(b)可知,由于功率加權突出了頻譜峰值的幅值,同階次時引入功率加權與不引入功率加權下數(shù)字共振約束根幅值閾值大小不同,小于19 階時,引入功率加權下數(shù)字共振根幅值閾值較大,大于19 階時則相反;不引入功率加權需要更加精確的閾值來篩選根值。

3.3 共振峰根值分布比較

線性預測多項式的共軛復根對應單位圓上所有的零極點,靠近單位圓上的極點是聲道系統(tǒng)函數(shù)頻率響應譜峰峰值對應的根,單位圓上根幅值大于根幅值閾值的極點是共振峰峰值對應的根,在圖3中分別為“所有根”“峰值根”“最終根”。是“峰值根”但不是“最終根”的根值是由聲道諧振作用、聲門脈沖形狀、傳輸效應等多因素產(chǎn)生的,即偽根。對不同階次 PWLP-FE[14]所提功率加權LPC 共振峰檢測以及本文提出的LPC 共振峰檢測HOLP-FE 的根值分布進行分析,探究2 種方法共振峰提取對偽根識別的效果。

圖3 不同方法LPC 共振峰檢測根值分布

對不同方法LPC 共振峰檢測根值分布進行分析可以看出,線性預測的根值數(shù)目與線性預測的階數(shù)相同;對根進行篩選,滿足共振峰條件的根小于或等于LPC 階數(shù)的一半,說明提高線性預測階次產(chǎn)生更多難以辨認的偽根。在此基礎上,比較PWLP-FE 和PWLP-FE+HOLP-FE 的共振峰在單位圓上的分布,如圖3(a)所示,PWLP-FE 在9 階LPC 時能夠正確地篩選出共振峰對應的根值點;如圖3(b)和圖3(c)所示,PWLP-FE 在15 階及18階線性預測時將第一共振峰以及第二共振峰對應的根值誤判為第二共振峰以及第三共振峰對應的根值,并且第一共振峰根值點篩選錯誤;如圖3(d)、圖3(e)和圖3(f)所示,PWLP-FE+HOLP-FE 對線性預測根值的篩選更精確,將滿足條件的根鎖定在更小的范圍,并且在所討論LPC 的不同階次上均能夠正確地找出共振峰對應的根值點,解決了PWLP-FE在高階時不能較好地辨認偽根的問題。

3.4 共振峰頻率及頻譜包絡比較

本節(jié)計算單獨一幀合成語音的共振峰頻率,通過估計圖4中單幀語音在不同階次線性預測時的前三共振峰,比較TLP-FE、PWLP-FE、HOLP-FE 以及PWLP-FE+HOLP-FE 的前三共振峰分布,分析不同階次下這4 種方法檢測共振峰受峰值混疊的影響情況。

圖4 語音波形及頻譜

圖5 對4 種方法的9 階LPC 頻譜包絡及共振峰峰值分布進行了分析。從圖5 中可以看出合成信號語音頻譜的幅度趨勢,所比較的4 種方法均較平滑且有4 個明顯峰值的LPC 譜包絡線,在共振峰峰值附近不存在相互混疊的峰值。這4 種方法均能正確地找出LPC 譜包絡的峰值點,區(qū)別在于PWLP-FE對信號進行了加權,改變了原本信號的LPC 譜包絡結構,譜峰值中心點相較于HOLP-FE 以及TLP-FE產(chǎn)生偏差。

圖5 9 階頻譜包絡及共振峰峰值分布

圖6 對4 種方法的15 階LPC 頻譜包絡及共振峰峰值分布進行了分析。從圖6 中可以看出,15階比9 階LPC 包含更多的頻譜細節(jié),在傳遞函數(shù)幅頻響應中,第一個尖峰峰值前及第三個尖峰峰值后出現(xiàn)了平緩的峰值,產(chǎn)生了混疊程度較低、數(shù)量較少的混疊峰值。圖6(a)為TLP-FE 的共振峰檢測方法,此檢測方法將頻率為332 Hz 的基音諧波誤判為第一共振峰,將頻率為799 Hz 的第一共振峰及頻率為1 324 Hz 的第二共振峰誤判為第二共振峰及第三共振峰;圖6(b)為PWLP-FE 的共振峰檢測方法,此檢測方法將頻率為366 Hz 的基音諧波誤判為第一共振峰,將頻率為839 Hz 的第一共振峰及頻率為1 360 Hz 的第二共振峰誤判為第二共振峰及第三共振峰;圖 6(c)和圖 6(d)分別為HOLP-FE 和PWLP-FE+HOLP-FE 的共振峰檢測方法,此2 種檢測方法濾除332 Hz 及366 Hz 的基音諧波,實現(xiàn)了3 個共振峰的正確判定。

圖6 15 階頻譜包絡及共振峰峰值分布

圖7 對4 種方法的18 階LPC 頻譜包絡及共振峰峰值分布進行了分析。相較15 階譜包絡,最大的不同在于18 階LPC 包絡中包含更多的幅頻響應頻譜細節(jié),存在更多并且混合程度更大的混疊峰值。4 種方法在18 階時對3 個共振峰判定情況與15 階LPC 頻譜包絡分析近似,但值得注意的是,HOLP-FE 以及PWLP-FE+HOLP-FE 有效地濾除了另外2 種方法所不能濾除的混疊峰值。

圖7 18 階頻譜包絡及共振峰峰值分布

3.5 共振峰頻率預測誤差分析

實驗計算不同方法共振峰頻率檢測相對誤差,一方面,通過同階次下不同方法相對誤差值的大小來分析不同方法估計共振峰的精度;另一方面,通過相同方法不同階次下相對誤差值的大小分析不同信號擬合度下共振峰提取的精度。

表1、表2 及表3 中的數(shù)據(jù)為TLP-FE、PWLP-FE、HOLP-FE 以及PWLP-FE+HOLP-FE 共振峰檢測方法檢測合成語音信號的3 個共振峰、、的頻率值及總體值相對合成信號共振峰頻率值F的相對誤差,數(shù)據(jù)表示的相對誤差值直觀地體現(xiàn)了HOLP-FE 相對其他方法在共振峰檢測精確度上的優(yōu)勢,分析共振峰頻率相對合成信號共振峰參考頻率的誤差可知,相對誤差值越小,共振峰檢測精確度越高。

表1 9 階共振峰頻率預測誤差分析

表2 15 階共振峰頻率預測誤差分析

表3 18 階共振峰頻率預測誤差分析

當p=9時,代表取較低的線性預測階次。對于,TLP-FE 和HOLP-FE 的誤差值相等,PWLP-FE和PWLP-FE+HOLP-FE 的誤差值相等;4 種方法的誤差值相對較大,處在-26%到-24%之間,但是HOLP-FE 的誤差絕對值最小,比PWLP-FE 的誤差絕對值小0.5%。

當p=15時,代表取較高的線性預測階次。對于,PWLP-FE 比TLP-FE 的誤差絕對值小0.4%,二者的誤差值較大,處在-64%到-61%之間;PWLP-FE+HOLP-FE 比HOLP-FE 的誤差絕對值小4.4%,二者的誤差值較小,處在-12%到-7%之間;4 種方法的誤差值最小的是PWLP-FE+HOLP-FE,誤差值為-7.4%。

對于TLP-FE 和PWLP-FE 來說,雖然后者共振峰提取改進的優(yōu)勢是每個共振峰檢測的相對誤差絕對值總是小于前者,但是在高度線性擬合下后者的相對誤差仍然保持在較高的水平,已經(jīng)不能再應用于共振峰檢測。

對于HOLP-FE 和PWLP-FE+HOLP-FE 來說,二者的相對誤差均保持在較低的水平,并且PWLP-FE+HOLP-FE 的相對誤差總是小于HOLP-FE。

當p=18時,代表取更高的線性預測階次。不同方法各個共振峰提取的精度與p=15時大致相近,仍然處在較低水平。

結合表1~表3 比較相同方法各個共振峰在不同階次下的提取精度。對于TLP-FE 和PWLP-FE來說,共振峰的提取只在取較低階次時能夠適用于共振峰檢測,在高階次時預測誤差較大而不再適用。對于HOLP-FE 和PWLP-FE+HOLP-FE 來說,在取較低階次時,其各個共振峰提取的精度可與TLP-FE 和PWLP-FE 持平;在取較高階次時,其各個共振峰提取的相對誤差較取較低階次時均有所降低,并且保持在較低水平;在取更高階次時,其各個共振峰提取的相對誤差與取較高階次時相接近,處在較低水平。

總體上,相較于TLP-FE和PWLP-FE,HOLP-FE和PWLP-FE+HOLP-FE 在p=15和p=18時各個共振峰的提取相對誤差均明顯減小,這表明HOLP-FE通過提高線性預測階次實現(xiàn)了共振峰提取精度的提升。

3.6 算法穩(wěn)健性分析

本節(jié)對多幀合成連續(xù)單元音語音進行共振峰檢測,通過實驗計算不同方法在不同階次下共振峰檢測的相對誤差絕對值的平均值,如圖8 所示,分析不同階次下不同方法在多幀語音下共振峰提取的穩(wěn)健性。

圖8 線性預測不同階數(shù)連續(xù)語音共振峰預測誤差

對比實驗的4 種方法,當線性預測階次取9 階到12 階時,4 種方法預測誤差值相差不大且均處在較低水平。9 階時,TLP-FE、PWLP-FE、HOLP-FE的誤差值幾乎相同并且小于PWLP-FE+HOLP-FE;10 階到12 階時,PWLP-FE+HOLP-FE 有較好的穩(wěn)健性,線性預測誤差處在較低水平。當線性預測階次取13 階到21 階時,TLP-FE 和PWLP-FE 的誤差值急劇增大,算法不穩(wěn)健,HOLP-FE 和PWLP-FE的誤差值始終在0.2 以下,說明多幀語音下共振峰提取算法是穩(wěn)健的。當線性預測階次取6 階到8 階和22 階到24 階時,4 種方法都不能有效提取共振峰,這時,共振峰提取的線性預測階次超出線性預測階次的限制范圍,算法不具備穩(wěn)健性。

3.7 連續(xù)多幀語音不同階次下模型誤差分布分析

通過實驗對多幀合成連續(xù)單元音語音進行共振峰檢測,計算各幀語音相對誤差的絕對值,繪制不同階次下各種方法共振峰檢測概率分布,如圖9所示,比較連續(xù)語音下TLP-FE、PWLP-FE 及PWLP-FE+HOLP-FE 模型共振峰提取的整體性能。

圖9 不同階次下各種方法共振峰檢測概率分布

由圖9 可知,3 種模型在9 階時語音共振峰預測誤差概率分布相重合,即在9 階下3 種模型的性能是相當?shù)摹WLP-FE+HOLP-FE 通過提高線性預測階次去除偽根、消除極點交互帶來的峰值混疊來提升整體共振峰提取的性能,圖9 中,“12 階PWLP-FE+HOLP-FE”曲線峰值點概率分布值高于“9 階PWLP-FE”且“12 階PWLP-FE+HOLP-FE”曲線峰值點共振峰預測誤差值低于“9 階PWLP-FE”,這表明PWLP-FE+HOLP-FE 在12 階時的模型性能優(yōu)于PWLP-FE;“18 階PWLP-FE +HOLP-FE”曲線比“12 階PWLP-FE+HOLP-FE”曲線更加“高瘦”,這表明PWLP-FE+HOLP-FE 在18階時的預測誤差分布更小且更集中,對應模型性能更優(yōu);“22 階PWLP-FE+HOLP-FE”曲線峰值分布概率減小、峰值誤差值更大且誤差區(qū)間有較長的“拖尾”,性能大幅度下降,這表明本文算法的總體性能不是隨階次提升而線性增長的,在階次穩(wěn)健范圍內取較高階次是實現(xiàn)模型整體最優(yōu)性能的關鍵。

4 結束語

本文對基于LPC 共振峰檢測的算法做出改進,研究提高線性預測階次對提取共振峰的影響,針對提高線性預測階次帶來的多偽根以及多極點交互的問題,最小化含語音數(shù)字共振模型約束共振峰提取誤差,分析線性預測階次與根幅值篩選閾值的關系。采用數(shù)字共振約束下的根幅值反饋的方式獲取匹配高階次的低誤差率篩選閾值來去除偽根,并且結合功率加權突出頻譜峰值的幅值,消除共振峰提取過程中的極點交互,實現(xiàn)精準有效的共振峰提取。實驗表明,在高階次時,所提算法相較于最近提出的功率加權LPC 共振峰檢測算法能更精確穩(wěn)定地提取出語音信號的共振峰頻率。

猜你喜歡
信號檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
“幾何圖形”檢測題
“角”檢測題
完形填空二則
孩子停止長個的信號
小波變換在PCB缺陷檢測中的應用
基于LabVIEW的力加載信號采集與PID控制
主站蜘蛛池模板: 亚洲欧美日韩另类在线一| 十八禁美女裸体网站| 欧美一区中文字幕| a网站在线观看| 国产女人在线视频| 青青草91视频| 欧美日韩91| 亚洲精品欧美日韩在线| 国产成人精品在线1区| 欧美成人A视频| 福利国产微拍广场一区视频在线| 亚洲AV无码一区二区三区牲色| 久久五月天国产自| 高清精品美女在线播放| 久久夜色精品| 亚洲AⅤ综合在线欧美一区| 国产亚洲美日韩AV中文字幕无码成人| 人人看人人鲁狠狠高清| 不卡色老大久久综合网| 岛国精品一区免费视频在线观看| 欧美午夜理伦三级在线观看| 夜夜高潮夜夜爽国产伦精品| 国内精自视频品线一二区| 欧美va亚洲va香蕉在线| 欧美成人aⅴ| 高清无码手机在线观看| 国产高颜值露脸在线观看| 国产真实乱人视频| 国产精品无码久久久久AV| 国产成人无码综合亚洲日韩不卡| 91福利免费视频| 五月天久久婷婷| 国产乱子伦精品视频| 亚洲午夜综合网| 99精品高清在线播放| 99尹人香蕉国产免费天天拍| 四虎永久在线精品国产免费| 亚洲综合18p| 精品人妻AV区| 在线观看免费人成视频色快速| 亚洲国产欧美自拍| 无码中文字幕乱码免费2| 久久国产高清视频| 亚洲国产中文精品va在线播放| 欧美日韩一区二区三区在线视频| 妇女自拍偷自拍亚洲精品| 亚洲中文在线视频| 亚洲综合欧美在线一区在线播放| 亚洲aⅴ天堂| 2021精品国产自在现线看| 国产69囗曝护士吞精在线视频| 国产呦视频免费视频在线观看| 国产成人免费高清AⅤ| 日韩精品免费一线在线观看| 色欲国产一区二区日韩欧美| 精品国产三级在线观看| 国产视频久久久久| 午夜小视频在线| 亚洲国产黄色| 1024你懂的国产精品| 伊人中文网| 欧美午夜在线观看| 日本人妻丰满熟妇区| 毛片最新网址| 国产黄网站在线观看| 国产成人久视频免费| 国内精品久久久久久久久久影视 | 麻豆精品在线播放| 国产丝袜无码一区二区视频| 国产精品九九视频| 91尤物国产尤物福利在线| 视频一区视频二区中文精品| 91偷拍一区| 免费jizz在线播放| 制服丝袜国产精品| 国产精品冒白浆免费视频| 国产在线欧美| 日韩区欧美区| 成人福利在线看| 日韩精品久久久久久久电影蜜臀| 一级全黄毛片| 国产美女人喷水在线观看|