劉 杰 張福生 馮 達(dá)
(91388部隊(duì)92分隊(duì) 湛江 524022)
目前暴露潛艇的主要特征是聲波信號。潛艇在水下的噪聲主要可以分為機(jī)械噪聲、水動力噪聲和螺旋槳噪聲,其中在潛艇常用的低速隱蔽工況下,機(jī)械噪聲通常是其水噪聲的主要來源[11~12]。所以研究潛艇噪聲源識別對于保證潛艇隱身性是至關(guān)重要的。而且,當(dāng)機(jī)器出現(xiàn)故障時(shí),其振動和聲信號特征一定會發(fā)生變化,所以通過對噪聲源的識別定位研究,能夠更好地對機(jī)器進(jìn)行狀態(tài)檢測及故障診斷[2]。
由于潛艇機(jī)械設(shè)備異常復(fù)雜,在實(shí)際使用中,對其進(jìn)行狀態(tài)檢測及故障診斷非常麻煩,一般情況下都是通過使用大量的測量傳感器對設(shè)備實(shí)行實(shí)時(shí)監(jiān)測,但是傳感器各測量值之間必然存在相關(guān)性以及隨機(jī)誤差的影響,在使用中極不方便[6~8]。基于統(tǒng)計(jì)理論的線性判別分析算法(LDA)和主成分分析算法(PCA)[1],通過對大量樣本數(shù)據(jù)進(jìn)行分析建模,克服了傳統(tǒng)的基于機(jī)理模型的監(jiān)測診斷方法的缺點(diǎn)[3,11]。
線性判別分析算法是基于Fisher準(zhǔn)則尋找一組將高維樣本投影到低維空間的最佳的判別投影向量,使所有的投影樣本類內(nèi)離散度最小且類間離散度最大。主成分分析算法就是使用較少的綜合變量來代替原始數(shù)據(jù)中較多的變量,綜合變量之間互不相關(guān),從而減少變量之間的冗余,同時(shí)最大限度的保持原始數(shù)據(jù)的信息。LDA算法是直接以分類為目的的特征提取方法,所以在噪聲的分類識別中要優(yōu)于PCA算法。
在直接使用LDA算法進(jìn)行噪聲特征提取的時(shí)候可能存在小樣本問題,導(dǎo)致無法建立正確的噪聲識別模型,所以本文先采用PCA對樣本進(jìn)行降維,再使用LDA進(jìn)行模型的建立[4~5]。建立模型后,通過將待測信號投影到模型空間上,再與已有的數(shù)據(jù)樣本庫進(jìn)行比較,確定噪聲信號類別,達(dá)到狀態(tài)檢測及故障診斷的目的。
PCA是1901年由Pearson提出的一種多變量統(tǒng)計(jì)分析技術(shù),是一種最優(yōu)的正交線性變換,能夠?qū)⑿盘枖?shù)據(jù)在一個較低維的空間進(jìn)行處理,目前廣泛應(yīng)用于信息壓縮。
設(shè)樣本信號集X=(x1,x2,…,xN),xi(i=1,2…,N)表示X中第i個信號向量,N表示樣本數(shù)目,M表示xi的維數(shù)。求解X的總體散度矩陣ST:


使用奇異值分解方法求解ST的特征值λi(i=1,2,…,M)及其對應(yīng)的特征向量(主元)φi(i=1,2,…,M)。λi值的大小是按降序排列,即λ1≥λ2≥…≥λM,λi值越大表示對應(yīng)的主元φi的貢獻(xiàn)度越大。
主元數(shù)目n(n≤M)通過交叉檢驗(yàn)法或主元貢獻(xiàn)率累積和百分比ξ(CPV)的方法確定。本文采用CPV方法,其中ξ=0.9,取使式(2)成立的最小值L為n:

最后確定的主元組成的矩陣就是PCA投影子空間WPCA= (φ1,φ2,…,φn)。

圖1 PCA和LDA對兩類問題投影子空間求解的比較[1]
LDA的原理就是尋找一個投影方向,所有樣本在這個方向的投影能夠?qū)崿F(xiàn)類間離散度最大化和類內(nèi)離散度最小化,即能夠使同類樣本盡量聚集,不同類樣本盡量分開。LDA是以分類為目的的特征提取方法,所以在識別分類別中要優(yōu)于PCA,圖1給出了PCA和LDA分別在兩類問題上求解投影子空間的情況。
從中可以看出,經(jīng)過LDA投影后的子空間分類能力明顯好于經(jīng)PCA投影后的子空間。
因?yàn)長DA使用的是Fisher準(zhǔn)則函數(shù),所以LDA也稱為Fisher線性判別分析Fisher準(zhǔn)則函數(shù)為

樣本類間離散度矩陣Sb定義為


樣本的類內(nèi)離散度矩陣Sw定義為


如果Sw是非奇異的,投影矩陣WLDA定義為

WLDA=w{i|i=1,2,…,}m相當(dāng)于通過式(7)求解:

其實(shí)質(zhì)就是求解S-1wSb的特征值問題,WLDA= {wi|i=1,2,…,m}就是由最大的m(m≤n)個特征值對應(yīng)的特征向量組成,n表示樣本維數(shù),m表示W(wǎng)LDA的投影維數(shù),m的大小一般通過實(shí)驗(yàn)確定。
當(dāng)N≥n時(shí),即樣本的數(shù)量不小于樣本的維數(shù)時(shí),Sw是非奇異的,但是在N<n時(shí),Sw很可能是奇異的,這樣就無法對Sw求逆,即存在小樣本問題。為了克服這種缺陷,本文先使用PCA對原始樣本集進(jìn)行降維,從而保證Sw的非奇異性。
圖2給出了使用線性判別分析算法進(jìn)行噪聲識別的整個流程。
設(shè):
l為測量傳感器的個數(shù);
ai(i=1,2,…,l)為第i個測量傳感器測量的參數(shù)個數(shù);
m為每一個樣本信號的維數(shù),m=a1+a2+…+al;
n為潛艇機(jī)械噪聲源的個數(shù);
ki(i=1,2,…,n)為第i個機(jī)械噪聲源包含的信號數(shù)量(不同工況下的信號);
N:樣本信號的數(shù)量,N=k1+k2+…+kn。
噪聲訓(xùn)練樣本集X∈RN×m,首先根據(jù)式(1)和式(2)確定WPCA矩陣,對WPCA矩陣進(jìn)行LDA運(yùn)算,得到WLDA矩陣,最后得到算法模型矩陣W=WTPCA·WTLDA。

圖2 基于LDA的噪聲識別流程圖
得到算法模型后,再將待測信號與已知信號庫(機(jī)械設(shè)備正常工況下的噪聲信號和所有已知故障情況下的噪聲信號)中所有信號分別投影到識別分類模型上一一進(jìn)行相似度計(jì)算和比對,最后根據(jù)相似度的大小確定待測信號的類型,從而達(dá)到噪聲源的定位和故障診斷的目的。
相似度的計(jì)算可以采用歐氏距離、馬氏距離和歸一化互相關(guān)系數(shù)(Normalized Cross-Correlation,NCC)等方法。本文使用NCC計(jì)算相似度δ,計(jì)算公式如下:

x和y表示兩個不同的信號向量,n表示向量的維數(shù),0<δ≤1表示互相關(guān)系數(shù),即相似度,當(dāng)x=y(tǒng)時(shí),δ=1,表示兩個完全相同的特征向量。δ越大表示兩個信號的相關(guān)性越大。
利用四臺機(jī)械設(shè)備模擬潛艇噪聲源,通過改變設(shè)備的工況來模擬機(jī)械的故障噪聲,每臺設(shè)備使用四種不同的工況,共采用五個測量傳感器,每一個傳感器取四個參數(shù)作為特征值,這樣組成的訓(xùn)練樣本集為16×20的矩陣。采用另外四臺機(jī)械設(shè)備,每臺設(shè)備使用十種不同工況模擬待測噪聲信號。實(shí)驗(yàn)結(jié)果如圖3所示。m表示LDA模型的投影維數(shù),P表示在不同m下的模型識別率:

從結(jié)果看,剛開始P隨著m的增加有明顯的提升,當(dāng)m=6時(shí)P取得最大值0.825,隨著m的進(jìn)一步增加,P有所下降,但趨于穩(wěn)定,這是因?yàn)長DA是一種提取信號分類特征信息的算法,m值越大,會引入其他的干擾信息,m值過小,則不足以提取足夠的分類信息。

圖3 LDA模型識別率與投影維數(shù)的關(guān)系
通過改變訓(xùn)練樣本集中機(jī)械設(shè)備的數(shù)量和每臺設(shè)備使用的工況數(shù)量進(jìn)行實(shí)驗(yàn),測試影響LDA算法模型識別分類效果的主要因素。實(shí)驗(yàn)結(jié)果如圖4和圖5所示。

圖4 LDA模型識別率與訓(xùn)練集機(jī)械設(shè)備數(shù)量的關(guān)系

圖5 LDA模型識別率與訓(xùn)練集每臺設(shè)備使用的工況數(shù)量的關(guān)系
N表示訓(xùn)練集機(jī)械設(shè)備的數(shù)量,K表示訓(xùn)練集每臺設(shè)備使用的工況數(shù)量,其中在圖4中K=4;圖5中N=4;從實(shí)驗(yàn)結(jié)果可知識別率P與N和K成正相關(guān)關(guān)系,在N或K達(dá)到一定值后,P都會趨于穩(wěn)定。在所有實(shí)驗(yàn)中LDA模型的投影維數(shù)m都是取最優(yōu)值。
使用LDA算法得到的算法模型一旦確定后,可以將其存儲起來,在以后的使用中直接進(jìn)行調(diào)用,不需要重新計(jì)算,使用比較方便。LDA的實(shí)質(zhì)是一種以分類為目的的特征提取方法,其模型的生成與訓(xùn)練樣本信號的類型沒有本質(zhì)的聯(lián)系,所以,使用其他信號(比如水面艦噪聲信號等)建立的算法模型,也可以用于潛艇的機(jī)械噪聲信號識別中,具有較好的通用性。
從實(shí)驗(yàn)中可以看出,LDA模型的分類識別能力主要受到訓(xùn)練樣本集規(guī)模的影響,樣本集中信號類別數(shù)越多(即噪聲源越多)以及每一個噪聲源包含的信息類型越多,在計(jì)算LDA類間協(xié)方差矩陣和類內(nèi)協(xié)方差矩陣的時(shí)候就能夠得到更多的分類信息,其分類識別能力就越強(qiáng)。此外,在實(shí)際使用中,已知信號庫中不可能包含每臺機(jī)械設(shè)備噪聲源的所有故障信息,從而影響實(shí)際的使用效果,所有,下一步的研究重點(diǎn)是需要在模型中加入拒識功能,提高算法的分類識別能力。
[1]A.M.Martinez and A.C.Kak.PCA versus LDA[J].IEEE Trans.On Pattern Analysis and Machine Intelligence,2001,23(2):228-233.
[2]高明杰,呂志強(qiáng),章林柯.多元統(tǒng)計(jì)分析在潛艇噪聲源識別中的應(yīng)用[J].船海工程,2009,38(1):93-97.
[3]邊肇棋,張長水,張學(xué)工.模式識別[M].北京:清華大學(xué)出版社,2000:87-112.
[4]章林柯,崔立林.潛艇機(jī)械噪聲源分類識別的小樣本研究思想及相關(guān)算法評述[J].船舶力學(xué),2011,15(8):940-947.
[5]楊德森.水下航行器噪聲分析及主要噪聲源識別[D].哈爾濱:哈爾濱工程大學(xué),1998:13-26.
[6]姚耀中,林立.潛艇機(jī)械噪聲控制技術(shù)綜述[J].艦船科學(xué)技術(shù),2007,29(1):21-26.
[7]余桐奎.基于多輸入/輸出模型的噪聲源分離方法研究[D].哈爾濱:哈爾濱工程大學(xué),2009:10-21.
[8]孔建益,李公法,侯宇.潛艇振動噪聲的控制研究[J].噪聲與振動控制,2006:1-4.
[9]施引,朱石堅(jiān),何琳.艦船動力機(jī)械噪聲及其控制[M].北京:國防工業(yè)出版社,1990:122-147.
[10]劉萍,廖廣銳.高噪聲背景下的語音識別系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)與數(shù)字工程,2009(7).
[11]方開泰.實(shí)行多元統(tǒng)計(jì)分析[M].上海:華東師范大學(xué)出版社,1986:54-71.
[12]俞孟薩,黃國榮,伏同先.潛艇機(jī)械噪聲控制技術(shù)的現(xiàn)狀與發(fā)展概述[J].船舶力學(xué),2003,7(4):110-120.