摘 要: 針對目前沖擊聲識別系統穩健性較差問題,提出一種基于貝葉斯壓縮感知(BCS)的沖擊聲識別方法。該方法基于BCS模型,根據訓練樣本構造傳感矩陣;基于稀疏系數的分布特性設計分類算法完成目標識別;將提出的方法與傳統分類算法的識別結果做了對比和分析。實驗結果表明: 提出的方法能夠對識別相似沖擊聲進行精確分類,識別精度和抗噪性均優于SVM和GMM分類算法。
關鍵詞: 沖擊聲; 壓縮感知; 觀測矩陣; 特征提取
中圖分類號: TN911.7?34 文獻標識碼: A 文章編號: 1004?373X(2013)17?0052?03
0 引 言
近年來,針對沖擊聲的自動目標識別研究越來越受到人們的重視,例如,農業中對害蟲種類、數量和其不同成長期的識別;工業中機械設備的狀態監測和故障診斷;軍事中對艦船、直升機和坦克等目標的類型和地理位置識別。這類聲音的識別不同于以往的語音識別,例如考慮到背景聲音的復雜性,識別系統需要具有更強的抗噪性和更高的識別精度。
沖擊聲目標識別技術,一般采用k近鄰(kNN)、高斯混合模型(GMM)、支持向量機(SVM)[1]分類方法,可以選擇相關訓練樣本中少數支撐向量去整體特性化測試樣本,但是無法對每個測試樣本進行自適應的選擇最佳支撐。文獻[2]提出了壓縮分類(Compressed Classification)的概念,將新出現的壓縮感知理論(Compressed Sensing,CS)應用于目標分類,即直接對壓縮樣本進行分類。目前CS已經成為一種用少量訓練樣本去表示測試信號的熱點理論[3],在目標的識別分類中表現出很大的優越性,因此本文選取矩形板沖擊聲作為研究對象,實現了基于壓縮感知的沖擊聲分類,并將其與kNN、GMM和SVM分類算法比較。
1 CS理論
針對傳統意義上的測量算子并非總是可以或者穩定地實現信號的超分辨率稀疏表示問題,文獻[4?5]中 Candes和D L Donoho等學者研究表明測量算子可以穩定地實現信號的超分辨率稀疏表示,該理論指出,當信號具有稀疏性或可壓縮性時,通過采集少量的信號投影值就可實現信號的準確或近似重構。
2 CS用于沖擊聲信號目標識別
2.1 隨機投影
隨機投影是近年來出現的一種有效的數據降維方法,它具有計算復雜度低和距離保持特性的優點。在每個傳感器節點,將[n]維的高維信號通過隨機投影矩陣[Φ]投影到低維子空間,投影矩陣需滿足約束等距性(Restricted Isometry Property,RIP)條件,獨立同分布的隨機矩陣被證明能以較高概率滿足 RIP條件,如高斯隨機矩陣和伯努利隨機矩陣[6]。相對于傳統的數據降維方法 PCA而言,隨機投影的計算代價只跟PCA中矩陣相乘所需的計算代價相同,而省去了PCA中計算協方差矩陣和進行特征分析所需的計算代價,適合在資源有限的傳感器節點上實現。
2.2 稀疏表示與求解
壓縮感知理論的一個重要研究內容是稀疏基的構造問題,稀疏基的選擇對信號表示的稀疏性有直接影響。在信號壓縮應用中,稀疏基可以選擇多種標準基(如Fourier、Wavelet、Curvelet和Gabor基)構造[7]。但是在目標識別應用中,稀疏基需由訓練樣本構成,測試樣本表示為稀疏基的線性組合。可利用的訓練樣本數量充足時,將測試樣本僅僅表示為與該測樣本同類型的訓練樣本的線性組合,因此,測試樣本基于全體訓練樣本的線性組合實際上只依賴于部分訓練樣本,滿足壓縮感知中對信號稀疏性的要求。通過求解最優化問題得到稀疏表示的系數向量,基于該系數向量可以實現對測試樣本的有效識別。
2.3 基于稀疏表示的分類方法
本文提出的壓縮分類沖擊聲目標識別方法,首先利用壓縮感知的隨機投影對傳感器數據進行壓縮,然后利用稀疏表示對壓縮采樣數據進行分類與識別。
3 實驗結果與分析
3.1 沖擊聲樣本數據庫
3.2 實驗結果比對及分析
考慮到MFCC是目前使用最廣泛的聲音特征提取方法,具有良好的聲音識別性能,但MFCC對噪聲較敏感,在噪聲環境聲音識別中的表現不佳,所以本文提出的算法將MFCC與BCS相結合,達到了良好的抗噪效果。
圖1是對于3種不同的矩形板沖擊聲提取MFCC特征,進而應用BCS算法進行識別分類,比較了CS分類器與kNN、SVM以及GMM的性能。從圖1可以發現,在噪聲環境中CS分類器識別精度高于kNN和GMM,近似于SVM。
實驗中,在相同的訓練數據和測試數據情況下,采用SVM方法的矩形板沖擊聲目標識別的平均錯誤識別率為9.01%;本文方法的平均錯誤識別率為3.12%,可以看出BCS識別方法明顯優于SVM方法。SVM這種非參數技術利用少數訓練樣本去特性化測試樣本,然而,這種方法不適用于每個測試樣本的支撐。而BCS能夠自適應的從訓練集合中選擇相關的稀疏表示矢量,因此其識別性能要優于SVM。其次,BCS方法考慮了壓縮采樣過程中的噪聲,因而具有更好的魯棒性。
圖2給出了不同樣本下的BCS算法和kNN算法的識別率,在少量樣本時,BCS算法得到的平均識別率明顯高于kNN算法。隨著樣本數的增加,識別性能趨于穩定。
表2列出了CS分類器在壓縮比為0.5時的混淆矩陣,顯示每種材料正確識別和錯誤識別材料的百分比數。由混淆矩陣可見,對于玻璃和鋁容易產生誤判,主要是因為這兩種矩形板在各個方向上的力學性能和物理性能指標都有相同的特性,導致兩者區分度不大。
4 結 論
本文在研究沖擊聲信號稀疏性的基礎上,提出了一種新的基于CS的目標識別方法,該方法采用所有目標的訓練樣本構造傳感矩陣,基于BCS模型求解待測試樣本的稀疏系數矢量;根據稀疏系數矢量判定待識別目標類型。實驗中采用了3類沖擊聲目標數據,平均識別率可以達到93%,說明了本文方法的有效性和CS在目標識別方面的應用潛力。接下來的研究中,將實現不同大小以及不同形狀的矩形板沖擊聲的識別,探索減少計算復雜度的CS分類算法。
參考文獻
[1] CRISTIANINI N, TAYLOR J S.支持向量機導論[M].李國正,王猛,曾華軍,譯.北京:電子工業出版社,2004.
[2] DAVENPORT M, DUARTE M, WAKIN M, et al. The smashed filter for compressive classification and target recognition [C]// Proceedings of SPIE Computational Imaging V. San Jose, California, USA: SPIE, 2007: 326?330.
[3] CANDES E J, ROMBERG J, TAO T. Robust uncertainty principles: exact signal reconstruction from highly incomplete frequency information [J]. IEEE Transactions on Information Theory, 2006, 52(2): 489?509.
[4] CANDES E, WAKIN M B. An introduction to compressive sampling [J]. IEEE Signal Processing Magazine, 2008, 25(2): 21?30.
[5] DONOHO D L. Compressed sensing [J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289?1306.
[6] CANDES E J, TAO T. Decoding by linear programming [J]. IEEE Transactions on Information Theory, 2005, 51(12): 4203?4215.
[7] PEARLMUTTER B A, POTLURU V K. Sparse separation: principles and tricks [C]// Proceedings of Independent Component Analyses, Wavelets, and Neural Networks. Orlando, FL, USA: SPIE, 2003:1?4.