謝峰,孫江生,代冬升,梁偉杰
(機械技術研究所,石家莊050000)
裝備保障數據倉庫實施中的多維數據模型構建研究
謝峰,孫江生,代冬升,梁偉杰
(機械技術研究所,石家莊050000)
目的解決裝備保障數據倉庫實施中數據建模問題。方法總結近年來多維數據模型的構建方法,對基于本體的多維數據模型構建方法進行優化,提出適于裝備保障數據多維模型構建的“本體-層次”建模方法。結果該方法的運用,能夠在龐大的裝備保障體系中,較為便捷地提取數據模型的維度與指標,簡化了多維數據模型的構建過程。結論為裝備保障數據倉庫的實施提供了有力支持。
本體;多維數據模型;數據倉庫;裝備保障
近年來,數據倉庫技術在裝備保障領域得以應用,解決了因裝備保障數據量急速增長、數據分析需求不斷提高帶來的現實難題。現代信息技術的使用,有效提高了裝備保障的效率,為裝備戰斗力的快速生成提供了有力支撐[1—2]。不同于普通企業數據倉庫的構建,在裝備保障數據倉庫實施過程中,因其體系龐大,面臨許多新的技術問題,這些問題的存在對于項目實施提出了新的挑戰[3]。多維數據模型構建是裝備保障數據倉庫實施中的核心問題,通過對傳統建模方法的總結分析,文中提出基于“本體-層次”的多維數據模型構建方式。在裝備保障數據倉庫實施實踐中,該方法對多維數據模型的構建過程提供了有力支持,具有良好的實踐應用價值。
傳統的多維數據模型構建方法主要有基于關系表[4]、E-R模型[5]和UML[6]等構建方式。這些方式大都是立足于傳統數據庫中數據的建模方式,在構建多維數據模型的過程中都有一定的局限性。2007年,Oscar Romero和Alberto Abello提出基于本體的半自動維度建模方法[7],在該方法的指導下,陸群進行了海洋環境數據倉庫多維模型的構建實踐,取得良好效果[8]。該方法能較為便捷地生成維度候選集,卻并未完成最后維度的確定。徐俊良采用本體與業務混合驅動的方式實現了維度的篩選與確定,為維度的確定提供了一種新方法[9]。在混合驅動的多維數據模型構建中,業務的理解較為復雜,無形中增加了開發人員的工作負擔和數據倉庫開發周期。文中使用一種體系化的多維數據模型構建方法,從本體生成,到候選維度生成,再到維度確定,實現了裝備保障數據多維數據模型的完整構建。多維數據模型維度構建實施步驟如圖1所示。

圖1 “本體-層次”方法多維數據模型構建實施步驟Fig.1"Ontology-AHP"based process for building multidimensional data models
裝備保障領域本體構建是裝備保障信息化發展的必然。根據裝備保障領域知識的研究和應用,進行科學化地提取和分類,形成形式化的概念,即本體。本體現階段的主要構建方法主要有手工構建、復用已有本體(半自動構建)以及自動構建本體等3種方法。胡金強對裝備保障領域本體進行了研究,采用了半自動的方式進行構建,利用已有的裝備保障資源目錄,結合領域專家的參與,對裝備保障領域本體構建進行了分析[10]。借鑒上述文獻的本體構建思想,并對常用的本體構建方法進行總結,文中使用較為常用的斯坦福大學的“七步法”,參考已有的知識庫資源,對裝備保障本體進行構建,實施過程如圖2所示。

圖2 裝備保障領域本體構建流程Fig.2 Process of building equipment support business ontology
3.1 本體的三元組表示
裝備保障領域內的本體結構可以表示為一個三元組:
ESOntology∶∶=<C,R,Attr>。
1)C表示概念集合,主要指裝備保障領域中的對象、類,如設備工具類、備件器材類類、故障維修類等,形式化描述為:
C∶∶=<CID,Name,Syn,Abb,ParentC,ChildC, Domain,Description>
分別表示概念標識符、概念名稱、同義詞、縮略詞、父概念、子概念、領域以及概念的描述。
2)R表示概念間的關系,及裝備保障領域中定義的關系包括常用的關系(如is-a,part-of,kind-of)等以裝備保障領域中定義的關系(如基地、倉庫與部隊),形式化描述為:
R∶∶=<RID,Name,FirstCID,SecondCID,Description>
分別表示關系標識符、關系名稱、第一個概念標識符、第二個概念標識符、關系描述。需要說明的是,一些基本關系具有傳遞性,例如:如果存在c1∈C,c2∈C,c3∈C且c1is-a c,c2is-a c3,則c1is-a c3。
3)Attr表示概念的屬性集合,如維修器材類的屬性有:器材名稱、器材編碼、生產廠家、單價、器材批次等表示為:
Attr∶∶=<AtrrID,Name,CID,RID,Type,Constraint,Default,Description>
其分別表示屬性標識符、屬性名稱、概念標識符、關系標識符、屬性取值類型、屬性缺省值、屬性描述。另外,屬性可以附屬于某一概念,也可以附屬于某一關系。
3.2 OWL描述本體中維度的生成策略
在數據倉庫中,數據模型以星型結構或雪花型結構進行存儲,這種存儲結構利于數據的分析、挖掘,同時形成了維度與事實之間的特殊關系,即一對多的關系。其關系總結如下:對于每個事實都有且僅有1個維與之對應;對于每個維度來說也就有多個事實與之對應。基于維度與事實的這一特殊關系,結合本體概念的特殊描述形式,得到如下推論:在本體集中如果一個概念與另一個概念是一對多的關系,那么這個概念就有可能成為一個潛在的維。
OWL是常用的本體描述語言,該語言中,將本體描述為概念、屬性、實例等3部分,其中屬性又分為對象屬性和數據屬性,對象屬性能夠完整描述類之間的相互關系。通過上文的分析,維度與事實的關系符合OWL描述語言中的如下描述:
本體中描述的概念F和D,如果F的一個屬性R具有約束‘allValuesFrom(D)’和‘minCardinality (1)’,那么就可以認為D和F之間的關系式是維度與事實。
其中,屬性R的約束allValuesFrom(D)表示F中的實例全部來源于概念D的;屬性R的約束min-Cardinality(1)表示概念F的實例數量至少為1。
通過以上分析,從本體描述的OWL中遴選裝備保障數據倉庫維度集,其實現的偽代碼如下:
for(classObj:ontology){//循環本體中的概念
class=ontology.getNextClass();//獲取本體中的概念
Fact fact=new Fact(classObj);//為概念建立事實
for(property:ontology){//循環本體中的屬性
property=ontology.getNextProperty();//得到本體中的屬性
if(property.allValueFrom(class)and minCardinality(1)){//存在allValueFrom和minCardinality (1)關系
dimension=new Dimension(property);//建立維度
fact.addDim(dimension);//為事實表添加維度}}}
美國運籌學家A.L.Saaty于20世紀70年代提出的層次分析法(Analytic Hierar-chy Process, AHP),是一種定性、定量分析相結合的多目標決策分析方法[11—13]。應用該方法,對上文通過本體篩選出的維度候選集進行評價,得到符合裝備保障需求的最優選維度集。應用層次分析法,通過以下步驟實現維度確定[14—15]:建立裝備保障層次結構模型、構造判斷矩陣、層次單排序、判斷矩陣的一致性檢驗、層次總排序權重計算。
1)建立層次結構模型,確定各個評價指標。如圖3所示。

圖3 維度集評價指標體系Fig.3 Index system for dimensionality evaluation
2)根據指標體系的層次結構構建判斷矩陣,并求出權重向量。

表1 比例標度含義Table 1 Implications of the proportional scale
表2為判斷矩陣之一,是準則B層對于A層的權重判斷矩陣。層次分析法是一種多層級的分析方法,這樣,每一層對于上層的影響都有一定的權重分配。表2確定了B層的領導決策支持、業務工作指導、基層保障實施相對于A層裝備保障數據倉庫維度集確定相對重要性權重。

表2 A-B判斷矩陣Table 2 A-B judgment matrix


5)進行層次總排序獲得維度排序。通過以上幾個步驟,得到了一組元素對其上一層中某元素的權重向量。通過自上而下將單一準則下的權重進行合成,得到了各元素對于評價指標體系頂層目標的最終排序。該排序反映出各維度在裝備保障工作中的重要程度。
通過以上5個步驟,在維度候選集中的對象以定量的方式給出了排序。用戶根據排序,選取最具有價值的維度對象,生成最終的維度集,完成了裝備保障數據倉庫維度的生成。
面對裝備保障地域廣、層次復雜、對象多樣的現實情況,數據倉庫維度的選擇亟待一種定性與定量相結合的篩選方法。文中在汲取近年來多維數據模型構建方法的基礎上,提出的“本體-層次”多維數據維度選取方法,改變了簡單由客戶需求定性生成維度集的單一方式,減少了多維模型構建中維度選擇的盲目性。通過科學化、體系化的方法甄選維度集,使得模型維度的構建更符合裝備保障的實際需求,為裝備保障數據倉庫的實施提供了有力支持。
[1] 阮擁軍,董立寧,劉棟.信息化戰場環境下裝備精確保障探析[J].裝備環境工程,2012,9(2):54—56. RUAN Yong-jun,DONG Li-ning,LIU Dong.Research of Equipment Support in Informatization Battlefield Environment Analysis[J].Equipment Environmental Engineering,2012,9(2):54—56.
[2] 單志偉.裝備綜合保障工程[M].北京:國防工業出版社,2007. SHAN Zhi-wei.Integrated Equipment Support Project [M].Beijing:Defense Industry Press,2007.
[3] 鄭巖.數據倉庫與數據挖掘原理及應用[M].北京:清華大學出版社,2011. ZHENG Yan.Data Warehouse and Data Mining Principles and Application[M].Beijing:Tsinghua University Press, 2011.
[4] 陸昌輝.基于關系數據模型的多維數據建模方法的研究[D].長沙:國防科學技術大學,2002. LU Chang-hui.Multidimensional Data Modeling Method Based on The Relational Data Model Research[D].Changsha:National University of Defense Technology,2002.
[5] 嚴金貴.基于ER模型的多維數據建模方法研究[D].重慶:重慶大學,2006. YAN Jin-gui.The Research of Multidimensional Data Modeling Based on ER[D].Chongqing:Chongqing University,2006.
[6] 段薇,戴莉萍.基于UML的社會保險多維數據模型建模的研究[J].計算機與現代化,2008,10:40—42. DUAN Wei,DAI Li-ping.On Multidimensional Data Model of Social Insurance Based on UML[J].Computer and Modernization,2008,10:40—42.
[7] OSCAR Romero,ALBERTO Abello.A Survey of Multidimensional Modeling Methodologies[J].International Journal of Data Warehousing&Mining,2009,5(2):1—23.
[8] 陸群.基于領域本體的海洋環境數據倉庫設計[D].沈陽:東北大學,2009. LU Qun.Domain Ontology-based Marine Environmental Data Warehouse Design[D].Shenyang:Northeastern University,2009.
[9] 徐俊良.混合驅動多維數據模型建模方法研究與應用[D].上海:上海交通大學,2012. XU Jun-liang.Research and Application of Hybrid-driven Data Warehouse Modeling Method[D].Shanghai:Shanghai Jiaotong University.
[10]胡金強.裝備保障知識管理平臺構建與應用研究[D].石家莊:軍械工程學院,2010. HU Jin-qiang.Research on Construction and Application for Knowledge Management Platform of Equipment Support[D].Shijiazhuang:Ordnance Engineering College, 2010.
[11]李千,紀小檸,牟牧.基于AHP和ANP作戰飛機系統效能評估[J].火力與指揮控制,2009(S1):92—94. LI Qian,JI Xiao-ning,MOU Mu.AHP and ANP based combat aircraft system performance evaluation[J].Fire Control and Command Control,2009(S1):92—94.
[12]張志強,徐斌,何勇靈,等.基于AHP評價方法的發動機性能評價[J].兵工學報,2008(5):625—628. ZHANG Zhi-qiang,XU Bin,HE Yong-ling,et al.AHP Based Engine Performance Evaluation[J].Journal of China Ordance,2008(5):625—628.
[13]趙國存,劉占嶺.基于AHP-TOPSIS的裝備保障信息定量評價研究[J].裝備環境工程,2012,9(4):118—122. ZHAO Guo-cun,LIU Zhan-ling.Based on AHP and TOPSIS Equipment Support Information Quantitative Evaluation Research[J].Equipment Environmental Engineering,2012,9(4):118—122.
[14]梁波,易建政,蔡軍鋒,等.基于AHP的野戰彈藥防護效果評價[J].裝備環境工程,2007,4(2):73—76. LIANG Bo,YI Jian-zheng,CAI Jun-feng,et al.Field Ammunition Protection Effect Evaluation Based on AHP[J]. Equipment Environmental Engineering,2007,4(2):73—76.
[15]藍金輝,馬寶華,李有文,等.層次分析法用于多傳感器數據融合中屬性權的求取[J].兵工學報,2001(1): 74—77. LAN Jin-hui,MA Bao-hua,LI You-wen,et al.AHP Used in Multi-sensor Data Fusion in the Calculating of Property Rights[J].Journal of China Ordnance,2001(1):74—77.
Study on Multidimensional Data Modeling in Building Equipment Support Data Warehouse
XIE Feng,SUN Jiang-sheng,DAI Dong-sheng,LIAGN Wei-jie
(Mechanical Technical Research Institute,Shijiazhuang 050000,China)
Objective To solve the issue of the construction of multidimensional data model in the implementation of equipment support data warehouse.Methods This paper summarized multidimensional data modeling methods in recent years,optimized the ontology-based multidimensional data modeling method and put forward a new method of establishing multidimensional data model-"ontology-AHP"construction method.Results This method conveniently extracted the dimension and indexes for the data model from the large equipment support system and simplified the construction process of multidimensional data modeling.Conclusion It provided strong support for the implementation of equipment support data warehouse.
ontology;multidimensional data model;data warehouse;equipment support
10.7643/issn.1672-9242.2014.05.026
TP311.1
:A
1672-9242(2014)05-0137-05
2014-06-05;
2014-07-30
Received:2014-06-05;Revised:2014-07-30
謝峰(1986—),男,山東泰安人,碩士研究生,主要研究方向為裝備保障信息化。
Biography:XIE Feng(1986—),Male,from Tai'an,Shandong,Master graduate sutdent,Research focus:equipment support informatization.