趙永亮,于 倩,鄧 博,韓麗君
(西安九天數智信息科技有限公司,陜西西安 710086)
飛機、艦船等復雜武器裝備的開發設計和加工投產的周期較長,通常要達數十年甚至更長。在部署至相關單位后,服役時間可達到20~40 年。因此,武器裝備的需求方對其研發機構的要求為在提供武器裝備的同時,仍必須配套有對應的技術支持水平和裝備維修能力。
武器裝備具有復雜性和獨特性。通常其結構復雜,而且均是根據用戶需求進行定制的產品,因此在武器裝備服役期間會存在眾多不確定的問題,而且不可避免地會出現故障[1-2]。所以,進行武器裝備的故障診斷和檢測對提升武器裝備的質量水平有重要意義。
傳統的故障診斷方法為建立解析數學模型,通過分析其輸出信息確認故障是否發生。因此該方法只能在裝備發生故障后才能進行維修,這顯然無法滿足武器裝備維修的需要。同時當前武器裝備運行狀態變量較多,數學模型無法挖掘武器裝備中包含的隱藏信息,所以解析數學模型并不適用武器裝備的故障檢測。而當前武器裝備系統的復雜性也對故障檢測技術提出了更高的要求,隨著人工智能、模式控制等理論的發展,使用知識圖譜技術與神經網絡可對復雜武器系統故障進行判斷,知識圖譜技術可表達復雜系統變量間的關系。該文基于知識圖譜技術構建了裝備故障檢測模型,且具有較強的現實意義。
知識圖譜技術最早由谷歌公司提出,其作用是從文本數據中對感興趣的信息進行提取。因此知識圖譜可抽象為一種語義網絡[3-6],結構如圖1 所示。實體部分為知識圖譜的基礎單元,實體通常代表知識文本,例如裝備名稱、結構名稱、部件名稱等。實體通常也有較多屬性,例如性能、參數及特點等,屬性值為屬性對應的具體數值。關系用來描述兩個實體間的隱藏關系,通過關系可觀測到兩個相鄰實體之間的關聯。

圖1 知識圖譜結構簡圖
在該文模型中,其將復雜武器裝備的部件作為實體的節點。由于武器裝備結構復雜,所以每個實體之間的影響并非只受單一因素影響,因素通常是多方面的。因此文中使用多層次的知識圖譜,每次只對一個層次的知識圖譜進行分析,多層次知識圖譜的簡要結構如圖2 所示。

圖2 多層次知識圖譜結構簡圖
知識圖譜實現流程,如圖3 所示。知識圖譜的構建需要經過3 個主要步驟,分別是信息提取、知識融合及質量評估。

圖3 知識圖譜實現流程
1)信息提取:通常采集到的數據的存在形式多樣,數據可能以文本、聲音或圖像多種形式存在,這些直接的數據樣本無法被知識圖譜模型使用。因此需要對信息進行抽取操作,即構建“實體-關系-實體”這樣的結構。常用的信息提取方法為對句法進行依存關系分析,即建立句法詞典對句法成分進行分析,進而對有用信息進行提取。
2)知識融合:進行提取后的信息可以被知識圖譜所使用,但由于來源數據的多樣性,因此實體之間可能會存在重復、不確定、雜亂的內容。例如實體“發動機”和“動力裝置”可能指代的物體是相同的,這時就需要對單詞進行去重處理,最終整理成為結構相同、內容不重復、格式正確的內容輸入至知識圖譜中。
3)質量評估:即對知識圖譜的準確性進行估計,通常會采用多種性能指標計算方法。若計算得到的性能指標值較高,則證明通過知識圖譜得到的檢測結論可行度較高。
在使用知識圖譜進行故障檢測時,其使用貝葉斯模型計算每個推理好的故障原因的后驗概率,最終得到概率最大的故障原因。貝葉斯概率的推導如下所示:
設離散集合U=[x1,x2,…,xn,C],離散集合中的元素C為故障發生的多個可能原因,屬于故障類型變量。而這些原因可能由多個因素導致,因此可將多個樣本組成集合并表示為:

因此,xn為故障屬性變量值,由概率學知識可知,故障發生的概率為[7-8]:

式(2)左邊的概率P為條件概率,式(2)右邊為貝葉斯概率的詳細計算值。在式(2)中,P(x1,x2,…,xn|cj)是樣本值為Yi時故障cj發生的概率,P(cj)為故障cj發生時的全概率,P(x1,x2,…,xn)為屬性值的聯合概率。可對式(2)繼續推導得到:

由式(3)可知,使用貝葉斯理論推導故障發生概率即對P(x1,x2,…,xn|cj)進行計算。計算該先驗概率的方法眾多,該文使用樸素貝葉斯理論進行計算,其拓撲圖如圖4 所示。

圖4 貝葉斯拓撲圖
由樸素貝葉斯網絡拓撲可知,每個故障屬性xn之間的關系均是獨立的,而概率值是通過故障發生的數量之比求得的。首先對P(cj)進行計算,假設樣本數據共有N個,發生故障的數據數量為,則概率值應為:

使用上述方法即可對樣本Yi的故障值概率進行計算,概率值的最大值對應的故障原因為系統推測的故障原因。
在數據量較大的情況下,該文使用貝葉斯理論進行貝葉斯神經網絡的構建,其通常由輸入層、隱藏層以及輸出層組成[9-12]。貝葉斯網絡用作樣本的訓練和樣本的測試模型,其構建的貝葉斯網絡模型如圖5 所示。

圖5 貝葉斯網絡模型
該文的貝葉斯模型需要提出約束函數,進而使模型的求解收斂,選用的約束函數為:

在式(7)約束函數中,比例系數α、β的值根據貝葉斯網絡自調節理論可設置為:

該文以知識圖譜模型為基礎,結合貝葉斯理論進行故障的診斷以提高模型性能。最終建立的算法模型由3 個模塊組成,分別是多層次知識圖譜模塊、狀態檢測模塊以及故障診斷模塊,算法模型如圖6所示。首先對各個裝備的在線數據進行獲取,通過武器裝備正常工作時的歷史數據進行狀態的判斷;然后構建多層次的知識圖譜進而對各個因素之間的深度關聯路徑進行計算,通過設定判斷系數從而對系統是否正常工作進行判斷;最終基于知識圖譜對故障的癥狀進行查找,通過樸素貝葉斯理論對故障的原因進行分析,從而得到故障發生的原因。

圖6 該文算法模型流程
各個模塊具體的工作過程和關鍵參數設置如下:
1)多層次知識圖譜模塊:如1.1 節介紹的知識圖譜相關知識,首先建立信息提取模塊,數據獲取使用爬蟲模型即可完成。獲取數據后進行知識融合,進行知識融合時需要確定融合系數,該文確定的融合系數W可表示為:

式中,Q為采集數據來源的置信度,cf為圖譜相鄰實體的置信度。Esim與Resim分別為文本相似度和關系相似度,使用融合關系系數可將不確定信息轉換為確定的格式正確信息。
2)狀態檢測模塊:在裝備正常工作時,知識圖譜的所有關系均不會發生變化。在裝備出現故障時,知識圖譜的相關系數將會出現較大的改變,因此需要對改變值進行檢測閾值設定,即需要增加判定因子R,以對系統當前的穩定狀態進行判斷[13-16],R可定義為:

當R的值為1時,此時裝備為正常工作狀態;當R的值不為1時,啟動故障診斷模塊并進行故障檢測。
3)故障診斷模塊:故障診斷模塊的具體流程:當系統狀態檢測模塊檢測到故障時,對故障的變量值進行初步確定。然后建立多層次知識圖譜模型,尋找可能出現故障的所有原因,并使用樸素貝葉斯理論計算故障發生的概率值。最終故障概率檢測公式為:

該文實驗數據來自于某大型裝備的工作流程,基于這些原始數據組成相對應的知識圖譜仿真系統,再對裝備的知識圖譜進行構建。該裝備的部分過程變量值如表1 所示。

表1 過程變量值
該裝備的部分故障變量值如表2 所示。

表2 故障變量值
同時在數據樣本數量的選擇中,使用500 個樣本作為貝葉斯網絡的訓練樣本,使用200 個樣本作為網絡的驗證樣本。
首先進行模型有效性驗證,通過裝備的相關信息可知,當設備功耗發生突變時,即可能是電路短路造成的。因此過程變量A2 與故障變量值C4 是依次對應的,向貝葉斯模型輸入過程變量A2,模型最終的訓練結果如表3 所示。

表3 有效性驗證結果
由表3 可以看出,當系統檢測到A2 狀態時,輸出的故障原因有4 個,C4(電路短路)的概率為89.1%。因此系統最終判斷故障狀態為電路短路,這符合實際情況,故該文模型可以有效地對裝備狀態改變引起的故障進行判斷。以上為單個狀態改變引起的故障,而在現實裝備中的故障通常是由多個狀態引起的。此時也需要對數據的質量進行把控,數據包含的內容越完整,則檢測的結果越準確。
接下來進行模型準確率的實驗,文中選取的對比算法為BP 神經網絡、判決樹算法以及支持向量機算法。這些算法均是常見的故障檢測算法,對比算法檢測結果如表4 所示。

表4 對比算法檢測結果
由表4 的結果可看出,該文算法測得的準確率在對比算法中為最高的。相比其他算法,文中算法準確率提高了2.5%、4.2%和5.6%。證明該文算法故障判斷準確率較高,說明文中構建的算法模型可對復雜武器裝備的故障進行判斷。
武器裝備因其復雜的結構會產生極大的不確定性,傳統的故障診斷方法通過分析數學模型的輸出信息確認故障是否發生,但這無法滿足武器裝備維修的需要。該文以知識圖譜模型為基礎,結合貝葉斯網絡進行故障的診斷,以提高模型性能。實驗表明,文中提出的結合貝葉斯理論的知識圖譜模型可以對故障進行檢測。同時與對比算法相比,該文算法故障判斷準確率較高,表明文中算法模型具有較好的性能。