楊艷歌 黃瑋 蔣莉



摘要
提出了獲取LCA系統數據庫表關系的方法,該方法較現有的手工查找方式快捷、高效。其次利用社會網絡研究方法對表關系進行可視化和特征發現,直觀且準確地展示和揭示了LCA系統數據庫表關系及其無標度特性和社團結構特征。
【關鍵詞】社會網絡 數據庫 直升機產品數據管理系統
1 引言
ENOVIA LCA(以下簡稱LCA)是達索公司全球領先的產品數據管理系統,是直升機所產品協同研制數字化平臺的關鍵核心系統之一。針對LCA系統,直升機所采取各種可行的技術途徑進行了大量的應用開發,取得了較好的效果。而基于數據庫的開發,具有更加直接、有效的特點,使得對LCA系統數據庫的研究成為LCA開發應用的重要方面。
LCA系統的數據庫表達上千個,而且表之間的相互關聯關系錯綜復雜,以前主要通過手工查看和對比數據庫表內容的方式獲取,操作繁瑣、費時費力。本文通過探索LCA系統導出的數據對象XML關系文檔的結構特征,提出了高效的LCA系統數據數據庫表關系獲取方法。同時利用社會網絡研究方法,對數據庫表關系進行建模及可視化,最終利用建立的網絡模型進行特征發現和分析,直觀且準確的揭示了LCA系統數據庫表關系的無標度特性和社團結構特征。
2 基于社會網絡的LCA系統數據庫表關系研究方法
2.1 LCA-XML文檔結構特征
LCA系統提供了將數據發送至外部站點的功能,為本文的研究提供了理想的入口。發送至外部站點的數據主要包括兩部分的內容:物理文檔和記錄LCA數據對象信息的XML文檔(以下簡稱LCA-XML文檔)。如圖1所示為LCA-XML文檔的結構示意圖,文檔中使用特定標簽標記LCA系統中不同類型的數據對象,如標簽-和~等。
LCA-XML文檔中對不同的數據對象,都使用特定屬性字段進行標識和關聯。由此,通過LCA-XML文檔能夠發現各種類型的數據對象以及相互之間的關聯關系,如通過標簽中RootOId和RBOClass屬性可識別數據對象的ID和類型;通過標簽中的Id和Idx可唯一標識數據對象的屬性,通過Name和Value分別標識屬性名及其對應的值,Vaule的值可用來判斷數據對象之間是否存在關聯關系;通過標簽中的OId屬性與標簽中的OId屬性可識別兩個數據對象之間的關聯關系等。
2.2 社會網絡研究方法簡介
隨著信息技術的不斷發展,對社會網絡的研究逐漸超越了傳統的社會學范疇,吸引了計算機、物理等領域的眾多研究者。自20世紀末,Watts D J、Barabasi等成功解釋了在諸多領域廣泛存在的小世界和無標度現象后,社會網絡研究逐漸成為一種研究范式。被用于理解各領域研究對象間復雜的拓撲關系和行為特征分析,從物理和數學的角度發現了許多實際網絡如交通網絡、論文引用網、客戶關系網等存在的一系列特性:小世界特性、無標度性、社團結構等。
在社會網絡研究領域中,提出了一系列對網絡特征刻畫和分析的方法和度量指標。本文主要用到的度量指標,見表l。
文中網絡可唯一表示為鄰接矩陣A:
2.3 LCA系統數據庫社會網絡研究方法構建
LCA-XML文檔的獲取使得基于社會網絡方法對LCA數據庫進行分析成為可能,表2是本文構建的LCA數據庫社會網絡分析方法。數據庫表之間關系的獲取是依據各數據對象之間的關聯關系獲得的,使用數據庫表名替換數據對象關系中的數據對象名稱,即可得到數據庫表關系網絡。然而,LCA系統數據庫中的數據庫表名與數據對象名不存在一一對應的關系。由此,對于不存在數據庫表名一致的數據對象,從LCA-XML文檔中獲取的該數據對象的屬性名,與各數據庫表中的字段名進行比對,若一致則該數據對象的屬性信息存儲在該數據庫表中,即二者相互對應。
3 基于社會網絡的LCA數據庫表關系分析
3.1 LCA系統數據庫表總體分析
在直升機所,除去數據庫的系統表,LCA系統數據庫總共包含678個表。研究發現,實際情況下LCA系統對直升機產品數據的管理主要使用的表僅93個。基于社會網絡分析方法得出LCA數據庫表及其業務分類特征,與直升機所對LCA的開發實施內容一致。如表3所示。
3.2 LCA系統數據庫表社會網絡特征分析
基于社會網絡方法、使用社會網絡指標對LCA數據庫的特征進行刻畫,圖2(a)所示為獲取到的該系統數據庫表關系網絡圖。很明顯,該網絡具有“社團結構”特征,如對于文檔對象,除了包含CHDDocumentMaster、CHDDocRevision、CHDDoclteration、CHDDocFormat、CHDDocSecuredFile等主要數據庫表之外,還包括CHDDOCREVISI0006A(記錄文檔對象的發放單位屬性),CHDDOCREVISI0002A(記錄文檔對象的更改標識),VPMDOCUMENTREOO01(記錄文檔對象與零部件對象之間的關系)等數據庫表,各數據表之間相互連接緊密,形成“社團”。
其次,如圖3為該網絡的度分布情況,擬合得到的冪律函數為f (x) =ab,其中a=0.4341,b=-1.723。可知該網絡具有無標度特性,表明直升機設計領域以少數數據對象為核心,形成型號設計結構樹。
最后還分別計算了關系網絡中各節點的度數中心性、中間中心性、接近中心性,度量結果分別如圖2(b)-(d),圖中節點的大小表明指標值的大小,節點的顏色相同表明指標值相同。可知直升機設計領域的LCA系統中主要通過GCO、零部件和更改指令將各個數據對象整合起來,三者是數據對象中的“核心”和“重要”對象。
4 結束語
本文基于社會網絡研究LCA系統數據庫表關系的方法能夠有效地獲取和發現LCA系統數據庫表之間的關系及關系特征。如基于本文的研究,可以發現LCA系統中的文檔對象涉及15個數據庫表,各數據庫表相互關聯形成“社團”,如圖4中的藍色方形節點所示。
對LCA系統數據庫表關系的研究,不僅有助于理解業務邏輯,更使得LCA系統基于數據庫的二次開發可行。下一步工作將對LCA系統基于數據庫的二次開發方法進行深入探索。
參考文獻
[1]Dassault Syst emes, ENOVIA V5 VPM/LCADocumentation.2006.
[2] Watt s,D.and S.Strogatz.Collect ivedynamics of 'small-world' networks.Nature, 1998.393 (6684): 440-442.
[3] Barabasi A L,Albert R.Emergence ofscaling in random networks.Science,1999. 286 (5439): 509-512.
[4]Wang X F,Li X,Chen G R 2006 Complexnetwork theory and its application(lst Ed.) (Beijing:TsinghuaUniversity Press) p78 (in Chinese)[汪小帆、李翔、陳關榮,復雜網絡理論及其應用(第一版)[M].北京:清華大學出版社,2006: 78.
[5] Barab a si AL, Albert R,Jeong H,Bianconi G.Power-Law dis tribut ionof the World Wide Web. Science,2000, 287 (5461): 2115a.
[6] Pa s tor-Satorras R,VespingnaniA. Epidemic spresding in scale-free networks. Phys. Rev.Lett.,2001,86(04):3200-3203.
[7]Watts D J,Dodds P S,Newman M EJ. Identity and search in socialne tworks. Science, 2002, 296: 1302-1305.