董建剛 , 張 峰 ,2
(1.榆林學院 信息工程學院,陜西 榆林 719000;2.西北工業大學 自動化控制學院,陜西 西安 710065)
本體庫是智能化IETM系統核心內容之一,信息檢索和圖形化呈現等后續操作都要基于本體庫進行,所以需要在領域專家的幫助下,構建出一個合理的領域本體庫。但由于本體的構建多是面向特定領域,如果沒有好的方法加以指導,就難以在不同領域本體的構建中保持一致,也不利于本體的規?;鸵幏督ㄔO。為此,迫切需要研究一種面向航空武器裝備的本體構建方法。
筆者在遵循本體建模原則的基礎上,綜合貫通各種方法的優勢,尤其是相對比較成熟的“七步法”,并借鑒軟件工程領域的質量環思想,提出了一種新的領域本體建模方法——循環進化法[1]。
目前比較有名的本體構建方法主要有7種:Methontology法 、Enterprise 法 、TOVE 法 、KACTUS 法 、SENSUS 法 、IDEF5法和七步法。
斯坦福大學開發的七步法主要用于領域本體建模,其構建步驟體現了“具體-抽象-具體”的思想,從語法上也經歷從RDF(s)原語到OWL約束聲明的過程[2]。該方法主要包括以下步驟:
1)確定領域和范圍:分析該本體面向哪個領域;為哪些類型的問題提供檢索結果;系統用例的角色是誰。
2)考慮復用:指的是能否借用現成的第三方本體庫。
3)列舉術語:寫下該本體中期望出現的所有相關術語的一個非結構化的列表。名詞是類名的基礎,動詞或動詞短語是屬性名的基礎。
4)定義術語層級:通過自頂向下或自底向上的方式將非結構化列表組織成分層結構,確保這個分層結構是類與子類的層次結構。
5)給類賦屬性:每個類(術語)都抽象自實例,類的屬性(成員)是所有實例共同特點的集合。給類加屬性后,通常立即給屬性限定定義域和值域,一方面便于通過層級關系使之被繼承應用于子類;另一方面為本體一致性校驗作準備;
6)定義側面:必須依賴于OWL原語,“側面”的概念包含3部分:①定義基數約束,給屬性設置數值限制;②定義范圍約束,給屬性設置實例限制;③關系特性,包括屬性的對稱性、傳遞性和逆屬性等。
7)實例化:類是抽象屬性的集合,實例化的過程就是將類中的屬性值賦以具體的值形成個體。
由于出自對各自學科領域和具體工程的不同考慮,現有的本體構建過程各不相同,目前也尚無統一的本體建模原則。針對航空武器裝備的實際情況,并借鑒Gruber于1995年給出 的5條本體建模原則[3],筆者提出了IETM領域本體構建的基本原則如下:
1)應具有較強的明確性和客觀性。本體應用自然語言有效地定義航空武器裝備IETM術語內涵,該定義應該是客觀的、明確的,并應是盡可能完整的。
2)應具有較好的一致性。由IETM領域本體推導產生的結論應與概念本身含義一致;本體所定義的公理以及用自然語言說明的文檔也應該是一致的。
3)應具有較好的可擴展性。在原有IETM領域本體中添加定義新的通用或專用術語時,并不需修改原有概念。
4)應具有最小編碼偏差。在知識層級進行概念的定義,而不是依賴于某一特殊化的符號層的表示方法。最小編碼偏差可以滿足知識共享代理可在不同的顯示系統和顯示風格中執行任務。
5)應具有最少本體約束。本體的約束應該最少,只要能滿足航空武器裝備IETM知識共享需求即可,即對建模對象給出盡可能少的約束條件。
6)在IETM領域本體構建過程中應有多方面領域專家共同參與和協作。
針對航空武器裝備IETM的實際情況,圖1給出了其領域本體構建的基本流程,主要分為IETM知識需求分析、IETM知識概念化和IETM知識編碼化3個階段。

圖1 航空武器裝備IETM領域本體構建的基本流程Fig.1 Aviation weapon equipment IETM domain ontology construction basic flow
在軟件工程領域中,質量環是指從最初識別需要到最終滿足要求和期望的各階段中影響質量的相互作用活動的概念模式,又稱為質量螺旋或產品壽命周期[4]。質量環中的一系列活動一環扣一環,相互制約,相互依存,相互促進,且質量環可以不斷循環,每經過一次循環,產品的質量能得到一次提高。
基于上述思想,綜合七步法和質量環的優點,提出了一種針對IETM領域本體構建的新方法——循環進化法,其具體流程如圖2所示。

圖2 循環進化法構建本體的基本流程Fig.2 Cyclic evolution method to construct ontology basic flow
在IETM領域本體構建好之后,就需要對其進行有效的存儲和管理。一般來說,本體存儲方法可以概括為以下3類:1)文件系統存儲;2)關系型數據庫;3)專用管理工具。
根據IETM系統知識庫的結構,把本體庫中的概念和實例分開,實例部分是存儲在關系數據庫中IETM的內容數據。
由于IETM的內容數據是以XML數據格式表示的,那么本體概念與其實例數據的關聯就需要在本體的概念與XML數據之間建立一個映射關系,從而可以從XML數據中獲取其相關的實例。
具體映射規則定義為

其中:R是規則的標簽,u是要映射的數據表,q是XML數據中的節點,p是本體庫中的抽象類。
例如:本體的抽象類發動機故障與數據庫表fault表中

可以根據SQL Server 2005中支持的XML查詢語句方式獲得一個集合,這個集合便是發動機故障的實例集。
飛行器發動機根據其工作原理可分為4大類[3]:
1) 吸氣式發動機(Air-breathing Engine,AE):主要由大氣中吸取空氣作為燃燒氧化劑的發動機。
2)火箭發動機:燃料消耗較大,不適于長時間工作,僅用于短時間加速。
3)脈沖發動機:多用于低速靶機和航空模型。
4)用太陽能電池驅動的航空電動機,目前尚處試驗階段。
通常意義上講的航空發動機是指吸氣式發動機。在本實例中,選擇吸氣式發動機作為本體建模的邊界,它確定了研究的核心術語范圍。
根據吸氣式發動機的全壽命周期,可將其問題域劃分為3類:第1類是設計階段的文檔,如零部件結構、整體性能參數和8大系統等設計資料;第2類是生產階段的文檔,如零部件制造、組裝等工藝流程;第3類是維護階段的文檔,包括飛行事故、故障分析和處理方法等歷史記錄。在本實例中,吸氣式發動機的問題域限定在設計和維護兩個階段的數據信息,解決“設計—使用—設計”的優化問題,提供銜接兩階段數據的語義檢索。根據上述問題域,可知用戶組主要有設計人員、維護人員和領域專家3類,以及除此之外系統必需的管理員,故其頂層用例模型如圖3所示。

圖3 吸氣式發動機的頂層用例模型Fig.3 Airbreathing engine top use case model
AE設計人員和維護人員是該本體的核心用戶,主要向他們提供語義檢索功能和知識庫支持[5];本體工程師和AE領域專家是該本體的知識庫抽象模型構建者,后者的領域知識需要轉化成OWL語言模型,轉化的過程中需要經過規范和優化才能達到高效運行的目的,這就需要具有軟件工程經驗且熟悉本體語言的本體工程師;實例采集員也是該本體的核心輸入者,其主要任務是根據抽象模型采集實例發動機數據錄入到知識庫中。
目前國外已經成型的本體知識庫資源仍非常有限,尤其是專業領域的本體庫更少。在航空發動機領域,目前只有少量的本體設計片段刊載在實驗性的研究文獻中,而尚無公開發布的航空發動機本體庫可供共享復用[6]。
上表的分類是對AE進行頂層劃分的子模塊,該結構化的過程以及后續步驟可以按照子模塊分別進行建模。以發動機類型為例進行分層結構定義,層級結構如圖4所示。

圖4 吸氣發動機類層級Fig.4 Aspirated engine type hierarchy
該結構嚴格按照類和子類間的繼承關系構建,它滿足DL中最基本的subClass分類傳遞,確保owl:subClassOf和rdfs:subClassOf等原語的內嵌語義得到遵守和執行。該層級的類屬關系是傳遞的,例如圖5所示的“CFM56-3”是渦扇發動機的一個實例,則可以推出“CFM56-3”是燃氣式發動機的一個實例。另一類層級關系由傳遞屬性完成,如構建“零部件”之間的組成與被組成關系時,subClass層級不能從含義上代替“hasPart”來表義。

圖5 CFM56-3發動機Fig.5 CFM56-3 engine
事實上,很大一部分層級結構都在類層級之外,這種情況下就需要通過“屬性傳遞”來自定義層級關系。該過程通常與后續的屬性定義和側面傳遞定義交叉進行。以**型號航空發動機零部件為對象,定義的層級結構如圖5所示,該結構在機械制造業普遍出現,向OWL或RDF(s)轉化的過程中需要通過自定義屬性“hasPart/isPartOf”來描述組件從屬關系。綜上所述,subClass原語并非層級關系的唯一映射方式,層級關系也并不局限于類(Class),圖6描述的是解決非Class層級的一個典例,以屬性定義的方式可以解決目前絕大部分Class以外的層級表義問題,盡管這類層級不是嚴格意義上的分類結構,但這樣的資源作為開發起點經常是難以回避的。常見的泛層級關系主要有5種:鄰近關系、繼承關系、從屬關系、陣列關系和參考關系。依此類推,完成其他分類的層級定義。
在Protégé中,構建本體包括建立文件、建立類及類層次、建立屬性及屬性的允許值、添加實例4個基本步驟。經過上述4個步驟所建立的本體知識庫不僅能表現出領域知識縱向的類屬分類,還通過本體術語間的關聯關系揭示領域知識間的內在聯系,有效地提高領域本體庫的共享與重用性。

圖6 渦扇發動機零部件層級圖Fig.6 Turbofan engine components hierarchy chart
1)建立文件
打開Protégé后,先定義文件名并設定保存路徑,然后在“元數據(MetaData)”畫板中輸入關于本體的各項元數據,如本體的注釋和默認名稱空間等信息。
2)建立類
在Protégé中,根據全面確定的航空發動機本體的類層次結構,可建立如圖7所示的航空燃氣渦輪發動機類圖。

圖7 航空發動機的類圖Fig.7 Aero engine class diagram
3)建立屬性
從語義上講,本體中的基本關系共有4種:part-of、kindof、instance-of和 attribute-of。但在實際構建本體過程中,概念之間的關系不僅限于這4種,還需要增加一些屬性用于更好的表示概念關系,本文中增加的基本關系有:
①因果關系:A引起B,則B造成了A。在propeties里添加“hasCaused”和“isCausedOf”,設置它們的 Domain 和 Range,并分別把InverseProperties屬性和TransitiveProperty屬性選中,這樣就可以在語義上實現逆推和傳遞。
②實體/定位關系:A放在B處,則B處有A。在propeties中添加“hasLocation”和“isLocationOf”,把 Inverseproperties 選中,并設置它們的Domain和Range。
③代理/對象關系:A操作B,則B被A操作。在propeties中添加“hasoperator”和“isOperatorOf”,把 Inverseproperties 選中,并設置它們的Domain和Range。
④執行/方法關系:A執行B,則B被A執行。在propeties中 添 加 “hasManner” 和 “isMannerOf”, 把 Inverseproperties 選中,并設置它們的Domain和Range。
在 Protégé中,可建立航空發動機的 DataType屬性、Object屬性、Annotation屬性等,其屬性如圖8所示。

圖8 航空發動機的屬性圖Fig.8 Aero engine property map
本體庫是智能化IETM系統核心內容之一。針對IETM系統中海量領域知識庫的構建和存儲問題,提出了一種領域本體構建的循環改進法。主要包括:
1)提出了IETM領域本體構建的基本原則和基本流程,對比分析了當前較為成熟的七種本體構建方法的優缺點,并指出了它們存在的不足。
2)提出了IETM領域本體構建的循環進化法,它包括本體規劃、本體設計、本體實現、本體評價、本體確定、本體維護、改進與擴展共7部分。該方法克服了傳統的七步法本體構建過程中存在的改進性和擴展性差的不足。
3)設計了IETM領域本體庫的存儲方案,并給出了本體概念與實例數據的映射方法,實現了本體知識的有效存儲和管理。
4)在詳細對比分析了4種本體構建工具的基礎上,選擇了Protégé作為本文本體構建工具,并給出了創建本體的步驟,據此可得到OWL描述的領域本體。
5)通過航空發動機本體構建實例驗證了所提循環進化法的有效性和實用性。
[1]Scott B E.Telemaintenance applications for the WearableTM PC[C]//Proceedings of the 1996 AIAA/IEEE Digital Avionics Systems Conference,USA,1996(1):407-413.
[2]Cooper D W.Document scripting with open standards:transport of application behavior for interactive technical documents[J].Multimedia Tools and Applications,1999,8(1):115-136.
[3]Taylor M A.Case study in knowledge engineering:interactive electronic technical manuals[J].Proceedings of the 1997 ISA TECH/EXPO Technology,1997,1(2):35-43.
[4]Boser C S.Automating the capture of technical information[C]//Proceedings of the 2007 IEEE Military Communications Conference MILCOM,Monterey,CA,USA,1997(2):773-776.
[5]Taylor M A.Case study in knowledge engineering:interactive electronic technical manuals[J].Proceedings of the 1997 TECH/EXPO Technology,1997(1):35-43.
[6]Su L,Bosco C D,England W.Application of New information technology to DOD legacy paper technical manuals[C]//Proceedings of the 1997 Autotestcon,Anaheim,USA,1997(1):22-25.