趙長昊


摘? 要:對于信息處理過程來說,信號分析是非常關鍵的一項技術,早期處理主要依托于傅里葉變換,可是其也只能是針對頻域實施分析,這就使信號分析不夠全面,想要改變這一狀況,就需要將時域窗融入到小波變換當中,從而有效提升信號分析處理效果。和普通的信號相比較而言,語言信號的復雜性更高,存在更加明顯的局部稀疏性特征,而這點剛好和小波處理特點相吻合,所以在語言信號處理過程中合理運用小波分析技術體現出非常明顯的積極作用。
關鍵詞:小波分析;語音信號;處理;應用
引? 言
小波分析作為一種新的時頻分析方法,實現了泛函數、傅里葉分析調和分析以及數值分析之間的完美結構,成為繼傅里葉變換分析方法后,另一個重要的信號分析方法,受到很多研究人員的研究,在理論和應用上得到了極大地擴充。語音信號作為一種典型的非平穩信號類型,應用小波分析對應的效果要相比傳統的方法具有更顯著優勢,目前已取得了顯著的成果?;诖?,本文重點分析小波分析在語音信號處理中的應用。
1 基本原理
小波分析是一種強有力的信號分析工具,它是時間和頻率的局部變換,能有效地從信號中提取信息。例如,在信號的高頻域部分,運用小波分析可以取得較好的時間分辨率;在信號的低頻域部分,則取得較好的頻率分辨率;在提取識別特征前,用小波進行預處理,能夠選取語音信號的有用信息,并且有效抑制無關信息對信號識別所產生的干擾。
2 當前語音識別技術的難點
目前,國內已有科大訊飛、云之聲等為代表的高新技術企業以及高校、科研院所等單位,在語音識別技術研究領域取得了不少成果,但是依然面臨著產業化發展的技術瓶頸,主要表現在以下幾個方面:(1)語音識別系統的適應性差;(2)高噪聲環境下語音識別進展困難;(3)如何把語言學、生理學、心理學方面的研究成果量化、建模并用于語音識別,還需深入研究[1];(4)我們對人類的聽覺理解、知識積累和學習機制以及大腦神經系統地控制機理等分面的認識還很不清楚;(5)若將語音識別系統商品化,還有識別速度、拒識問題以及關鍵詞/句檢測技術等細節問題需要解決。
3 小波分析在語音基音周期檢測中的應用
語音基音周期是語音信號識別中的重要參數,對后期信號識別處理意義重大。聲門在閉合時引發了語音信號銳變,使得周期檢測效果不佳。而小波分析具有較好的頻率分辨率,尤其是在時域上。據此,對語音信號進行小波分析,在多尺度下對應系數模值的極大值就會出現在銳變位置,因此能夠很容易檢測出聲門閉合時間,然后結合聲門開啟時間的統計就能便捷地計算出語音基音周期。
在小波分析的多分辨分析中,基音頻率在50-500赫茲時,可通過逐級逼近方式對頻率精確聚焦,由此得到對應音頻特征的提取。對于提取基音周期而言,一般采用小波變換中的奇異點檢算法。
基音周期檢測的具體步驟為:選取光滑函數的一階導數作為母小波;進行峰值點檢測來估計語音基音周期。在實際中,小波分析方法檢測范圍較大,應對場景多,應用也越來越普及[2]。
4 小波分析在語音信號去燥和增強中的應用
當前,語音信號壓縮編碼主要采用離散小波變換,其步驟為:以重構誤差以及信噪比最大化為選擇標準來確定對應的小波類型;進行小波分解,盡可能將信號分解到較少子系數空間以提升壓縮效率;分解后,可設定閾值選擇小波系數以實現裁剪;小波系數編碼。在編碼過程中,將部分含有較少信息的信號分量去除,實現最小化小波系數。雖然存在一定程度的信號損失,但由于人們對缺失部分不敏感,因此依舊能夠獲得很好的效果。
其主要依據是:小波變換特別是正交小波變換具有很強的去數據相關性的能力,它能使信號的能量在小波域集中于一些大的小波系數;而噪聲的能量卻分布于整個小波域內,因此經小波分解后,信號的小波系數幅值要大于噪聲的小波系數幅值,幅值較大的小波系數一般以信號為主,而幅值較小的在很大程度上是噪聲。于是,采用閾值去噪的方法可以把信號系數保留,而使大部分噪聲系數減少為零。
4.1 語音信號的小波增強的閾值選擇
無論是使用小波變換對語音信號增強或者是壓縮的,閾值的選擇都是關鍵。壓縮時:閾值過大,信號會有較大的失真;閾值過小,則壓縮的意義不大。去噪時:閾值過大,雖然可以減少信號中的噪聲,會除去信號的一部分能量,重構信號也會有較大的失真;閾值過小,則重構信號中將包含過多的噪聲分量,達不到去噪的目的[3]。
小波分析進行消噪處理一般有3種方法:默認閾值消噪處理、給定閾值(軟閾值或硬閾值)消噪處理、強制消噪處理。小波變換后傳統的閾值處理方法有硬閾值(hard shrinkage)和軟閾值(soft shrinkage)處理方法。采用硬閾值,就是把絕對值小于閾值的小波系數設為0,其他的系統不變;采用軟閾值就是用小波系數的絕對值減去小于的小波系統設為0。一般來說,硬閾值比軟閾值處理后的信號更加粗糙。
4.2 小波對語音信號去噪的仿真結果和分析
本列中對原始信號加入高斯白噪聲,去噪時用小波‘sym6執行分解,使用啟發式閾值選擇(heursure),然后再通過軟閾值方法去噪。去噪效果如圖1所示。從圖像中可以看出,增強后的語言信號很光滑,基本不含噪聲分量,顯示了原始信號的大量信息,但是也去掉了原信號的一些細節信息,而且想要提高去噪時的效果通過改變小波基或者提高層數,其改進的效果不大,所以傳統的小波去噪的算法還存在很大的改進空間,但是其前景不容小覷。
5 小波分析在語音信號壓縮編碼中的應用
壓縮編碼是語音信號處理中的重要組成部分,其重點是降低語音信號編碼速率。目前,方法主要分為波形編碼、參數編碼以及混合編碼等。波形編碼設計簡單,精度高,但數碼率較高,壓縮效率低。參數編碼雖然能顯著降低數碼率,但復雜度高,精度也難以保證。混合編碼則結合了上述兩類方法的優勢,有效改善了數碼率和精度。
基于小波變換的編碼方式本質是一種變換域編碼方式,主要將輸入的信號離散化和正交化處理,然后量化編碼系數進行壓縮。典型的小波變換編碼框圖如圖2所示。
上述的符號2表述為小波系數分解。通過上述流程,小波分析編碼可實現平滑和細節的信號描述形式。然后對平滑信號進一步分解,在整個變換域中獲得完全的重疊正交變換過程。從矢量的角度可知,K空間中,有限子集映射,因此經過編碼處理后可得到矢量化映射碼,而復雜度降低可通過二叉樹來實現。
當前,語音信號壓縮編碼主要采用離散小波變換,其步驟為:以重構誤差以及信噪比最大化為選擇標準來確定對應的小波類型;進行小波分解,盡可能將信號分解到較少子系數空間以提升壓縮效率[4];分解后,可設定閾值選擇小波系數以實現裁剪;小波系數編碼。在編碼過程中,將部分含有較少信息的信號分量去除,實現最小化小波系數。雖然存在一定程度的信號損失,但由于人們對缺失部分不敏感,因此依舊能夠獲得很好的效果。
結束語
總而言之,小波變換作為一種新的信號處理手段,是繼傅里葉變換后的另一重要的信號變化方式。本文探討了小波變換基本理論,并綜述了小波變換在音頻信號處理中的具體應用,如小波分析在語音基音周期檢測、語音信號去燥和增強、語音信號壓縮編碼的應用等,以此為相關研究人員提供參考。
參考文獻
[1]楊建斌,陶薪竹.基于小波框架方法的信號重構[J].高校應用數學學報A輯,2019,34(03):364-372.
[2]洪民江.基于小波變換的語音信號去噪算法研究[D].南京郵電大學,2018.
[3]張瑞博.時頻分析在語音信號增強中的應用[D].重慶郵電大學,2018.
[4]陳妙.湍流信道中語音信號自適應小波快速去噪技術研究[D].電子科技大學,2018.