999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于主成分的頻譜迭代稀疏化語音增強方法

2024-06-29 00:53:52董嫻邵玉斌杜慶治龍華馬迪南
四川大學學報(自然科學版) 2024年3期

董嫻 邵玉斌 杜慶治 龍華 馬迪南

摘 要: 針對現有頻譜稀疏化方法在復雜環境語音增強上性能不佳的問題,提出一種基于主成分分析的迭代頻譜稀疏化方法. 首先,對輸入信號的語譜圖進行二維中值濾波處理,得到行分量頻譜和列分量頻譜;對包含語音主音的行分量頻譜序列進行主成分分析(PCA),以去除噪聲部分并保留主要語音結構;然后聯合列分量頻譜序列和縮放因子進行混合重構原信號,并采用動態縮放因子實現對列分量頻譜噪聲的有效控制. 在此基礎上,利用稀疏化對噪聲的抑制作用,對頻譜進行多次稀疏化,以減弱噪聲. 實驗結果表明,該方法增強了不同類型噪聲下語音的信噪比,包括White、Pink、Babble、Volvo 和Factory 等五種噪聲,輸入信噪比為15 dB,所提方法的信噪比分別提升了13. 89 dB,11. 97 dB,5. 65 dB,5. 26 dB 和4. 73 dB,該方法在其他信噪比下也能有效地抑制噪聲和保留有效特征信息,并減少因背景噪聲引起的語音失真.

關鍵詞: 語音增強; 多維度頻譜分析; 譜稀疏化; 主成分分析

中圖分類號: TN912. 3 文獻標志碼: A DOI: 10. 19907/j. 0490-6756. 2024. 033007

1 引言

在自動語音識別(Automatic Speech Recognition,ASR)系統中,語音增強是一個必不可少的過程,語音信號處理在其中發揮著重要作用. 語音增強是指對被污染的語音信號進行處理,減少噪聲的干擾,改善噪聲環境下的語音質量,從而增強語音的可懂度和主觀聽覺質量[1]. 對于聽覺受損的人群來說,語音增強技術旨在提升人工耳蝸在噪聲環境中的語音清晰度,以解決困擾多數聽障人群聽不清的難題[2]. 為了提高語音識別系統在噪聲環境下的性能,通常在時域或頻域上進行處理,以抑制語音失真和引入的人工噪聲. 譜減法[3]、基于統計模型的語音增強算法[4]和信號子空間算法[5]等等都是廣泛使用的幾種經典語音增強算法.

在語音增強算法中,基于短時譜估計的增強算法[6]因其效率高、計算簡單且易于處理而被廣泛使用,比如用含噪信號的頻譜減去估計的噪聲頻譜來得到純凈的語音頻譜的譜減法. 該方法易于實現的同時大大削弱了信號中的噪聲,但是存在一個明顯的缺點就是譜減法的有效性很大程度上依賴于準確的噪聲估計,噪聲的隨機性增加了噪聲估計的困難,大多數情況下當噪聲估計的不夠準確,就會引發“音樂噪聲”和失真等問題. 有關統計模型的方法是將語音增強納入基于最優準則的統計假設估計問題,比如維納濾波[7]、最小均方誤差方法和最大后驗方法. 一般假設語音信號和噪聲信號是統計獨立的,且分別服從特定的分布,而統計模型的難點在于模型參數的魯棒估計;信號子空間算法是一種基于語音信號子空間和噪聲子空間正交假設的方法,然而在短時情況下從信號子空間中估計純凈語音信號是非常不精確的[8]. 最近提出的多項式矩陣特征值分解算法(PolynomialMatrix Eigenvalue Decomposition, PEVD)[9]不依賴于信號假設和噪聲估計,在信號失真較小的情況下顯著提高了可懂度和降噪效果,然而,該方法在非平穩噪聲環境下無法適應聲學場景的變化.基于迭代約束非負矩陣分解(Iterative ConstrainedNon-negative Matrix Factorization, ICNMF)[10]的語音增強方法解決了非平穩噪聲環境下語音增強性能不佳的問題. 通過調整噪聲和語音的基向量權重最小化維納濾波器估計誤差,顯著提高語音的質量和可懂度,由于需要提供對語音和噪聲樣本必要統計的精確估計,算法運行時間較長且計算成本較大. 基于壓縮感知矩陣的主列群正交化(Dominant Columns Group Orthogonalization ofthe Sensing Matrix, DCGOSM)[11]語音增強方法通過計算噪聲和語音樣本的列貢獻,對感知矩陣中的語音主導列向量進行迭代加速信號重構大大減少語音恢復時間,有效避免噪聲分量,從而在重構信號中降低了噪聲.

本文針對復雜環境下語音信號的質量和清晰度容易受到噪聲的污染,且難以從噪聲中提取有用的語音信號等問題提出了一種提高語音質量的頻譜稀疏化語音增強方法. 該方法首先對語音信號的語譜圖進行二維中值濾波分析,獲取包含語音主要結構的行分量頻譜和列分量頻譜,然后把基于主成分分析(Principal Component Analysis,PCA)的低秩近似應用于行分量頻譜的連續譜分量. 稀疏化的目的在于強調頻譜結構中的重要譜分量,例如包含來自元音的諧波結構和靠近共振峰區域的主要諧波,并去除頻譜中不太突出的部分,使得背景噪聲和一些更細微的諧波被衰減. 而清音的結構與噪聲類似,在時頻域中沒有明顯的差異,對清音的增強難度較大,因此本文僅對濁音部分采用稀疏化的方法進行增強處理. 實驗結果表明,本文算法在多種噪聲環境下的噪聲消除性能優于其他語音增強方法的性能,并且不依賴于噪聲的估計和原始語音的先驗知識.

本文在第2 節將介紹語音信號多維頻譜中值濾波分離行分量和列分量的原理、主成分分析,討論頻譜稀疏化對噪聲的抑制作用以及在此基礎上提出的多次迭代稀疏化方法的有效性;第3 節解釋語音增強算法輸出的語音質量以及噪聲的評估方法;第4 節是對所提算法的實驗總結以及仿真結果分析.

2 基于PCA 的頻譜稀疏化方法

2. 1 多維度頻譜分析

輸入信號x ( t ) 經過采樣并分幀后,由短時傅里葉變換

主站蜘蛛池模板: 日韩欧美网址| 国产91精品调教在线播放| 国产麻豆aⅴ精品无码| 在线亚洲精品自拍| 波多野结衣无码AV在线| 日韩在线视频网站| 99视频在线看| 亚洲三级电影在线播放| 人人爽人人爽人人片| 韩国自拍偷自拍亚洲精品| 114级毛片免费观看| 自拍中文字幕| 国产真实乱子伦精品视手机观看 | 粉嫩国产白浆在线观看| 热re99久久精品国99热| 波多野结衣爽到高潮漏水大喷| 国产91在线免费视频| 欧洲亚洲一区| 国产成人一区免费观看| 成人综合在线观看| 久久黄色小视频| 在线一级毛片| 免费观看无遮挡www的小视频| 一级做a爰片久久免费| 毛片视频网| 免费日韩在线视频| 免费无遮挡AV| 久99久热只有精品国产15| 日韩人妻少妇一区二区| 欧美激情福利| 亚洲三级影院| 高潮毛片无遮挡高清视频播放 | 国产1区2区在线观看| 五月婷婷综合网| 伊大人香蕉久久网欧美| 日韩激情成人| 久久天天躁夜夜躁狠狠| 亚洲国产欧美自拍| 在线无码九区| 国产成人欧美| 久青草国产高清在线视频| a天堂视频| 51国产偷自视频区视频手机观看 | 亚洲AⅤ永久无码精品毛片| 77777亚洲午夜久久多人| 日韩美一区二区| 国产亚洲欧美日韩在线一区| 国产成人无码AV在线播放动漫 | 亚洲国产综合自在线另类| 久久免费成人| 手机在线免费不卡一区二| 亚洲国产日韩一区| 久久香蕉国产线看观| 久久亚洲精少妇毛片午夜无码| 欧美国产日韩一区二区三区精品影视| 黑人巨大精品欧美一区二区区| 亚洲日本在线免费观看| 91在线视频福利| 亚洲国产成人精品一二区| 久久99国产视频| 国产99视频在线| 亚洲视频无码| 一本综合久久| 亚洲欧美色中文字幕| 亚洲日本中文综合在线| 中文字幕在线不卡视频| 不卡午夜视频| 亚洲黄网在线| 国产鲁鲁视频在线观看| 日韩在线视频网站| 91蜜芽尤物福利在线观看| 欧美五月婷婷| 欧美特黄一免在线观看| 国产精品私拍99pans大尺度| 欧洲在线免费视频| 日a本亚洲中文在线观看| 91久久大香线蕉| 不卡的在线视频免费观看| 成年A级毛片| 精品伊人久久久香线蕉| 欧美激情综合| 婷婷激情五月网|