摘要: 神經網絡的非線性映射特性、信息的分布存儲、并行處理和全局優化能力,特別是其高度的自組織和自學習能力,使其成為故障診斷的一種有效方法,已在許多實際系統中得到了成功的應用。神經網絡技術的出現,為故障診斷問題提供了一個新的解決途徑,特別是對于在實際中難以建立數學模型的復雜系統,神經網絡更顯示了其獨特的作用。應用神經網絡進行故障診斷主要是應用神經網絡產生的殘差并進行殘差分析以及用神經網絡進行故障模式識別。
關鍵詞: 徑向神經網絡 故障診斷 觀測器
一、徑向神經網絡
在眾多的神經網絡中,徑向神經網絡是一種結構簡單、訓練速度快并且具有最佳逼近性能的多層前向神經網絡。多年來,人們對徑向神經網絡進行了大量的研究,并成功地應用于故障診斷領域。主要原因有:
(1)它能存儲有關過程的知識,直接從歷史故障信息中學習,可以根據對象歷史數據訓練網絡,然后將此信息與當前測量數據進行比較,比確定故障的類型。
(2)它具有濾除噪聲即在噪聲的情況下得出正確結論的能力,可以訓練人工神經網絡來識別信息,使其在噪聲環境中有效地工作。
(3)它具有很強的非線性逼近能力。
(4)它具有分辨故障原因及故障類型的能力。
徑向神經網絡(Radial Basis Function Neural Network,RBFNN)是20世紀80年代提出的一種以函數逼近理論為基礎的前向神經網絡,其設計思想就是將徑向基函數(RBF)應用于神經網絡作為激勵函數。不同于BP網絡的全局逼近性能,RBF是一種局部逼近網絡,對于每個訓練樣本,它只需對少量的權值進行局部的修正,因此速度很快,具有最佳的逼近性能。RBF神經網絡的機構與多層前向網絡結構類似,其拓撲結構如圖所示。
RBF神經網絡是由輸入層、隱含層和輸出層構成的三層前向神經網絡。第一層為輸入層,由信號源節點組成,其單元個數是由所描述問題的需要決定的;第二層為隱含層,是由一組徑向基函數構成的非線性映射層,這樣就將輸入矢量直接映射到隱含層空間,當徑向函數的中心確定以后,這種映射關系也就確定了;第三層為輸出層,提供從隱單元空間到輸出空間的一種線性變換。其中隱含層是網絡的核心,隱含層神經元的變換函數是一種局部分布的對中心點徑向衰減的非線性函數,利用徑向基函數作為隱含層神經元的基構成隱含層空間,實現輸入矢量到輸出矢量的映射變換。這里主要研究以高斯函數為變換函數的徑向基神經網絡。
RBF神經網絡的輸入與輸出之間可認為是一種映射關系:f(x):R →R
其中式中,i=1,2,…,n為隱含層節點數,n(y ,…,y ,…, y )∈R 表示神經網絡的輸出,x∈R 為網絡輸入矢量,w∈R 表示輸出權值,g∈R 為徑向基函數,g 表示隱層第i個神經元的輸出值,w 表示第i個神經元到輸出層第j個神經元的權值。
式中,m ∈R 為徑向基神經元的中心,r ∈R為徑向基神經元的寬度,‖.‖表示2-范數或歐式距離。
徑向基神經網絡的權值、中心與寬度是徑向基神經元的三個重要參數。構造和訓練一個RBF神經網絡的就是要是網絡通過學習,確定出每個隱層神經元基函數的中心m 、寬度r 及隱層到輸出層的權值w,從而可以完成所需的輸入到輸出的映射。RBF網絡的三部分參數在映射中所起的作用是不同的。隱含層的徑向基函數完成的是從輸入空間到隱含層空間的非線性映射,而隱含層到輸出層的權值是實現從隱含層空間到輸出空間的線性映射,所完成的任務不同,決定了參數的訓練方法和策略不同。
徑向基神經元網絡的學習可以看成是誤差準則下,以誤差函數f(x)為目標函數的無約束最優化問題。
式中,x表示網絡的三個待求的參數(中心、權值與寬度);y 為網絡輸出,y 為期望輸出,N為樣本總數。
對于解決無約束最優化問題,通常采用迭代的方法進行計算,在給定初值x 后,按照等式
逐步修改直至收斂于解,其中為迭代步數,a 為學習速度,p 代表搜索方向。當用上式進行迭代時,函數f(x)應該在每次迭代時都減小。研究結果顯示,最簡單的下降方向就是沿負梯度的方向,此時
式中,g 為f(x)在x 處的梯度,這樣我們就得到了最速下降的優化算法:
有上面的推導可以看出,算法的關鍵是梯度的計算,下面給出梯度的計算公式。為了便于推導計算,將RBF網絡的數學模型表示如下:
式中,s=1,2,L,h為輸出變量的個數;i=1,2,L,n為隱含層的個數;j=1,2,L,N(N為樣本總數);k為迭代步數;y 為第s個輸出;w 為輸出層的權值;m 為神經元的中心;r 為神經元的寬度;x(j)為輸入樣本。
定義如下的誤差函數:
式中,y 為網絡輸出,y 為期望輸出。
根據上述式子,輸出權值的梯度為: =-e (k)Q (k)(11)
具體步驟為:
(1)隨即給定一組參數x ∶m ,r ,w ,并給定迭代終止精度ε的值。
(2)令RBF網絡隱含層數目n=n ,n =l+m為任意小的正整數(其中l和m分別表示系統輸入輸出的維數)。
(3)根據所給定的樣本,利用梯度法計算網絡的三個參數值,根據參數值計算網絡的輸出。
(4)根據樣本數據和網絡輸出計算誤差e(n),如果‖e(n)‖≤ε轉到下一步,否則讓n=n +△n(其中n >0為整數),判斷是否n≤n (n 為預先設置的最大隱含層數目),滿足條件則轉上一步,否則轉下一步。
(5)記錄此時的n,m ,r ,w ,則得到RBF網絡隱含層的數目、網絡的中心、寬度和權值。
上述是基于最速度下降梯度法的徑向神經網絡算法可以看出,網絡結構的構建與參數調整可以同時完成,具有學習時間短、計算量小等特點。
二、神經網絡觀測器的建立
通常情況下,非線性系統的狀態空間模型可以表示如下:
x(k+1)=f(k,x(k))+g(k,x(k))u(k)+v(k)(14)
y(k+1)=h(k+1,x(k+1)+σ(k+1))(15)
式中,k為離散時間變量;x(k)∈R 為狀態變量;u(k)∈R 為輸入變量,y(k)∈R 為輸出向量;f:R →R ,h:R →R 為映射函數;v(k)和σ(k)分別為噪聲和模型不確定性函數。
根據RBF網路的最佳逼近性能,可以建立神經網絡辨識模型,對于任意小的ε,存在RBF網絡逼近于系統的實際輸出:
e=‖y -y ‖<ε(16)
式中,y 為網絡輸出,y 為期望輸出,ε為輸出殘差。當無故障時,殘差信號由狀態估計的誤差和噪聲所決定,如果狀態估計的誤差足夠小,則殘差通常趨近于零。當傳感器故障時系統的狀態方程變為:
x(k+1)=f(k,x(k))+B(k,x(k))u(k)+v(k)(17)
y(k+1)=h(k+1,x(k+1))+σ(k+1)+D (k)(18)
式中,D ∈R 為傳感器故障分配矩陣,此時輸出殘差r(k)發生了很大的變化,所以根據殘差向量的改變進行傳感器的故障監測與隔離。
在構造出系統的觀測器之后,就可以將其用于系統的故障隔離。在本文中神經網絡觀測器是作為一個無故障的正常的模型來使用。基于神經網絡的故障診斷系統結構如圖所示:
三、故障診斷
基于神經網絡的系統故障診斷的基本思想就是建立系統的辨識模型,根據模型輸出和實際系統輸出的殘差進行故障檢測與隔離,所以建立系統的辨識模型是研究的重點與核心。
針對于傳感器,使用如下的方法來進行故障診斷;
由于神經網絡具有很強的自學習能力,因此可以通過學習來獲得傳感器測量值,從而為故障診斷提供有效的信息。
首先,應用傳感器組中的任一個輸出信號和系統輸入作為神經網絡的輸入信號,將所有傳感器的輸出信號作為神經網絡的輸出信號,構成輸入樣本集合,應用RBF網絡離線訓練如下m個神經網絡模型:
y (k)=F [y (k),u(k)],i=1,2,…,m(19)
然后應用神經網絡觀測器可獲得m組,,…,,其中=[,,…,] 是第i個觀測器得到的,網絡的輸入和訓練時的輸入相同。在系統正常運行條件下,也即無故障時,接近系統傳感器輸出y 。當第i個傳感器故障而其余的m-1個傳感器正常運行時,由第i個神經網絡觀測器所得的傳感器的輸出估值將會偏離的輸出估值,而其他神經網絡觀測器的輸出則不受影響,仍接近實際輸出。那么利用下面的邏輯檢測實現傳感器故障診斷。
定義閥值ε >0,j=1,2,…,m,計算判別函數。
式中,y 為第i個傳感器測量值,為由第i個傳感器的測量值獲得的第j個傳感器輸出的估計值。則有下面的邏輯:
四、小結
徑向神經網絡具有最優的逼近性能,可以精確地對系統進行辨識。利用神經網絡觀測器進行系統故障診斷,需要建立精確的神經網絡辨識模型。在精確模型的基礎上可完成對系統的故障診斷,這種抗干擾能力很強,對不確定、非線性系統有很好的效果。
(指導老師:何曉薇教授)
(作者系中國民航飛行學院飛行技術學院研究生)
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。”