摘要:比較了當前基于案例推理故障診斷中的幾種主流算法,并對這幾種算法的有效性進行了實例分析,分析結果表明采用改進的灰色關聯度算法進行案例匹配具有較好的分辨率,可以顯著區分案例的優先次序。
關鍵詞:故障診斷; 案例推理; 灰色關聯理論
中圖分類號:TP301.6文獻標志碼:A
文章編號:1001-3695(2008)05-1352-03
在基于案例推理的故障診斷系統中,案例匹配是其核心步驟。案例匹配算法的優劣會直接影響到故障診斷的準確性。一個性能良好的檢索算法不但可以快速進行故障診斷,并且要求能夠得出相對準確的解。如果匹配算法能夠得出近似的診斷結果,但無法最大限度地區分各案例與故障的相似程度,也不能稱為一個優秀的匹配算法。
案例的檢索就是在案例庫中依據案例的征兆向量尋找與當前故障最相似的案例。案例檢索可以分為以下幾個步驟[1]:故障描述、案例搜索、案例的比較過濾、案例匹配、檢索結果的排列和選擇。
完成上述初步檢索后,所得到的案例已經大大減少。對于檢索結果的案例集合,本文采用灰色關聯理論和歐幾里得距離相結合的方法,計算當前故障征兆向量與各個案例向量之間的相似度。
為消除不同量綱對指標值的影響,進行案例匹配計算之前需要對S和s0中的元素進行歸一化處理。本文采用向量歸一化法,即
對于案例檢索,無疑案例匹配是其核心部分。案例匹配可以分解為兩個步驟:故障與案例的單個指標相似度計算;綜合各個故障征兆相似度的指標復合相似度計算。
已有的文獻表明,當前案例檢索的匹配算法應用最廣泛、最近幾年使用和研究較多的大致有三類:傳統的最近相鄰檢索算法、基于余弦函數的相似度計算方法以及灰色關聯度的相似度計算方法。
本文對這三種匹配算法進行實例計算,并對這三種算法的實用效果進行比較。進行以下幾種算法討論時,假設系統已經完成了候選案例的生成以及當前征兆、候選案例征兆集合的歸一化處理。
1最近相鄰案例匹配算法
2灰色關聯度相似度計算方法
灰色關聯分析作為一種系統分析技術,是分析系統中各因素關聯程度的方法,或對系統動態過程發展態勢的量化分析方法。其基本思路是根據系統動態過程發展態勢來判斷其關聯程度。
2.1灰色關聯度計算相似度方法
灰色關聯度的相似度計算方法通過計算當前故障與候選案例對應征兆指標的灰色關聯系數即局部相似度,再采用取局部相似度平均值的方法計算總體相似度。
根據灰色關聯理論[2,3],局部相似度計算式如下:
當前故障和候選案例的故障征兆集合包含多個征兆指標,通過式(1)計算出了單個征兆相似度。由于單個相似度的信息過于分散,不便于比較,有必要將各個關聯系數集中為一個值,以一個集中的值來反映兩個向量的總體相似度。求平均值便是信息集中處理的一種方法。因此,相似度的一般表達式為
4相似度計算方法的實例比較
本文利用文獻[4,5]中提供的數據對本章中討論的幾種案例匹配算法進行實例計算,對幾種方法進行比較。
4.1算法的計算結果
在對各類方法計算前需要進行數據歸一化處理。為使各種方法比較的條件一致,本文采用統一的向量歸一化方法對當前故障和候選案例進行歸一化處理。下面對以下六種方法進行比較:普通最近相鄰算法、最近相鄰歐幾里得距離算法、普通灰色關聯度算法、改進的灰色關聯度算法、普通余弦函數算法、改進的余弦函數算法。
4.2計算結果分析
對于兩個計算例子,例1的數據離散度較小,通過簡單的目測觀察案例數據與故障數據,故障值與案例值相差不大;例2數據的離散度大,故障值與各案例值之間有較大差距??梢耘袛啵簩τ诶?,相似度值比較接近1;例2的相似度結果與1有一定距離。
1)最近相鄰算法這里討論兩種最近相鄰算法,即傳統的最近相鄰算法和歐幾里得距離算法。
從局部相似度函數來說,兩種算法均采用同樣的計算方法。兩種算法均有一個弱點,即指標取值范圍對計算結果影響較大,且不容易確定。對于一般故障來說,指標的取值范圍并沒有確定的邊界。例如本文的兩個例子均沒有給出指標取值范圍,本文在計算時對指標進行歸一化處理,用歸一化處理后的結果數據計算相似度時,用1作為取值范圍來計算。
從計算結果來看,采用歐幾里得距離的計算結果與傳統的最近相鄰算法計算結果相比,兩個計算例子均顯示五個案例,與故障的相似度之差很小,算法的分辨率很低。用歐幾里得距離的算法得到的相似度彼此之間值的差別相對較大,能夠更好地將不相似的案例區分出來,有較好的分辨率。
2)余弦函數算法本文討論的兩種余弦函數算法是文獻[1]提出的余弦函數相似度算法和一種用灰色關聯度計算局部相似度,并采用余弦函數計算整體相似度。
對于普通余弦函數算法,通過當前故障和案例的兩個權重向量的夾角余弦函數和局部指標的相似度來計算兩向量的整體相似度。對于故障征兆向量,確定每個征兆對于診斷當前故障的重要度是很困難的,即無法取得比較合理的權重向量,本文在進行計算時,假設故障的征兆權重向量與各案例的權重向量相同。局部相似度計算采用了與最近相鄰算法相同的方法,同樣存在指標取值范圍對最終結果的影響。而且從余弦函數的物理意義來看,當夾角小于30°時,余弦函數值變化非常緩慢,不利于將不相似的案例區分開。
改進后的余弦函數算法計算向量夾角時,用歸一化后的向量與灰色相似矩陣中的相似向量進行比較?;疑嗨葡蛄渴菤w一化后的數據進行灰色關聯度計算的數據,這兩種向量不是同類向量。用這兩類向量來計算余弦函數是不恰當的,用這兩個向量的夾角或者投影來表征案例與故障的相似度也是不合理的。從投影的幾何意義上來講,余弦函數的取值為[0,1],投影值的取值則不一定落在[0,1]上。
對于計算結果,普通余弦函數算法的計算結果與最近相鄰算法的各案例相似度值比較接近。
3)灰色相似度算法普通的灰色關聯度算法用各指標的灰色關聯度來表示指標的局部相似度,再將各局部相似度加權平均得到總體相似度。改進的局部灰色關聯算法在計算指標的局部相似度時將權重納入到比較環境的計算中,加上權重更能反映指標決定相似案例的重要程度。
計算結果的比較顯示,灰色相似度的兩種算法與其他四種算法相比具有較好的分辨率。其中改進的灰色關聯度計算相似度比傳統的灰色相似度計算方法有更優的分辨率。結合兩個例子的數據特點和六種算法的計算結果,改進后的灰色相似度算法計算相似度具有與實際情況比較接近的結果。
5結束語
本文分析了幾種常見的相似度算法以及其改進算法,并通過兩個例子進行了案例匹配計算。計算結果說明采用案例推理進行故障診斷時,改進的灰色相似度算法的計算結果具有較好的分辨率,在進行智能故障診斷時,可以用于案例推理中的案例匹配。
參考文獻:
[1]GUPTA K M, MONTEZEMI A R. Empirical evaluation of retrieval in case-based reasoning systems using modified cosine matching function[J]. IEEE Trans on Systems, Man and Cybernetics: Part A, 1997,27(5):601-612.
[2]嚴智淵.灰色關聯分析與應用[M].南京:江蘇科學技術出版社,1989:1-15.
[3]鄧聚龍.灰色系統論理教程[M].武漢:華中理工大學出版社,1990:53-63.
[4]賀曉,劉景寧,李淑霞.基于灰色關聯理論的案例推理在故障智能診斷系統中的應用[J].中國機械工程,2004,15(22):2022-2026.
[5]王東,劉懷亮,徐國華.案例推理在故障診斷系統中的應用[J].計算機工程, 2003,29(12):10-12.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”