代冬升 李雅峰 趙曉文 連云峰



摘要:數據集成是數據中心建設的重要內容和關鍵環節。針對裝備保障數據中心功能定位,分析了裝備保障數據集成需求及原則,建立了面向數據中心的裝備保障數據集成框架及相關數據模型,分析了關鍵屬性,設計了基本流程,并對數據集成成果在信息資源規劃、數據倉庫建設、數據共享交換、主數據管理等方面的應用進行了闡述。
Abstract: Data integration is an important part of data center construction. Against the functional positioning for equipment support data center, it analyzes the equipment support data integration requirements and principles. Then, it constructs the data center-oriented equipment support data integration framework and relational data models, analyzes its key properties and designs its basic procedure. And also, it explains the data integration results applications for information resources planning, data warehouse construction, data sharing exchange and main data management.
關鍵詞:數據中心;數據集成;裝備保障
Key words: data center;data integration;equipment support
中圖分類號:TP311.52 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2019)23-0226-04
0 ?引言
隨著信息技術的快速發展、裝備保障業務需求的豐富拓展和信息化建設的逐步深入,數據中心建設成為深化裝備保障信息服務需求、實現裝備保障信息有效管理、強化裝備保障信息綜合運用的重要措施,是裝備保障信息化建設的重要節點。裝備保障數據中心功能的有效發揮,依賴于存儲數據的高準確性、規范性、一致性和完整性,也對多源異構裝備保障數據集成提出了更高要求。本文探討了面向數據中心建設的數據集成方法,目的是實現高質量的數據集成,滿足數據中心數據體系建設與應用需求。
1 ?裝備保障數據中心數據集成概述
1.1 裝備保障數據中心的功能定位
裝備保障數據中心是以裝備保障各類數據為核心,依托數據庫管理、業務運行基礎平臺和網絡系統,按照統一的標準,建立具有信息管理、數據綜合分析、數據分類查詢、綜合統計分析及信息服務等功能的一體化裝備保障數據管理體系[1]。單從數據角度來看,其主要功能應體現為:
①信息匯聚存儲。數據中心是裝備保障全系統、全壽命、全要素信息的大集中,基于相關數據標準規范,進行裝備保障全方位信息的采集、處理、傳輸與存儲,實現信息資源的大集中,為有效解決全局性、綜合性問題奠定數據基礎。
②保障決策支持。以裝備保障決策重難點問題為牽引,對裝備保障數據進行整合,通過數據挖掘、深度學習、大數據分析、可視化展示等技術手段,進行規律分析、模式提取、趨勢研判、能力評估等,生成統計圖表、指標數據、咨詢報告等數據產品,為各級決策者提供決策支持。
③信息保障服務。面向裝備管理、使用、維修、科研、生產等多類型用戶,提供數據交換、信息檢索、知識定制等服務以及交流互動平臺,使各級保障人員能系統、精準、及時地獲取解決問題所需的知識。
1.2 裝備保障數據集成需求分析
數據中心是提供裝備保障綜合性數據服務的地方,數據來源廣泛、體量龐大、類型多樣,服務對象多元化明顯。與傳統意義上的數據集成相比,其特殊需求主要體現為[3,4]:
①數據全面性要求高。從作用發揮角度看,數據中心要匯聚裝備保障領域的全部數據,才能提供系統、全面、綜合的數據服務。裝備保障數據中心的數據源包括全業務全壽命各業務信息系統數據、業務報表單據、網絡情報信息、教材教案、數字化加工資源等,存在著多源異構、一致性差、標準化程度不高、數據冗余等常規問題,但數據源的數量非常龐大,涉及面非常廣泛。
②數據標準化程度要求高。標準化是裝備保障數據工程建設的基礎和依據,決定了數據中心數據架構的規范性和穩定性,是數據中心長久穩定運行的重要保證。需要建立數據中心標準規范體系,指導和約束裝備保障數據標準化處理,構建形成穩定的數據環境,以對外提供統一、標準和規范的數據支撐,滿足多變業務應用的數據服務需求。
③數據集成工作量大。裝備保障數據集成,需要大量收集、解析原始數據資源資料,搭建數據集成環境,在集成工具的輔助下,由多人協作共同完成數據集成工作。為確保數據集成各步驟準確無誤,需同步采取有效措施進行數據集成過程管控,確保數據質量。
④需要建立數據間復雜的關聯關系。數據中心中的數據間存在廣泛的關聯關系,如引用、計算、約束等,需要通過集成的方式建立眾多來源數據之間的關聯關系,使其成為一個有機整體,為深度開展數據挖掘、大數據分析奠定基礎,以有效解決單一業務信息系統無法解決的全局性、綜合性、復雜性問題。
1.3 裝備保障數據集成原則
為滿足數據中心數據體系建設與應用需求,裝備保障數據集成應遵循以下原則:
①穩定性原則。數據集成中的數據結構一經確定就應保持相對穩定,否則數據結構的變化將導致數據值的聯動變化,也就無法保證數據的穩定性和高質量。
②準確性原則。數據按照既定規則和策略集成處理后,應確保準確無誤,否則將失去使用價值,并導致嚴重后果。
③齊備性原則。數據結構設計應科學合理,確保存儲數據的完整性,以提供完整統一的用戶視圖,也為數據倉庫提供充足的數據。
④一致性原則。應對信息代碼、應用數據、關聯關系等進行規范統一,實現數據的“一數一源”,保證數據的一致性。
⑤快速性原則。應采取有效措施手段確保集成的高效率,使得海量數據能夠快速、準確集成整合入庫。
2 ?裝備保障數據集成模型設計
2.1 集成框架設計
面向數據中心的裝備保障數據集成從數據模型和數據記錄兩方面開展集成工作,集成框架如圖1所示。其中,數據源主要是指業務運行過程中使用的各種業務信息系統,提供數據集成對象;原樣庫是與業務信息系統數據庫相一致的存儲空間,業務信息系統數據庫中的數據經過抽取后直接存儲到原樣庫中;融合庫用于存儲經過整合、規范后的數據結構和數據記錄,包括標準代碼庫、維度定義庫、規范事務庫和業務實體庫的數據結構和數據記錄。在融合庫中,標準代碼庫用于存儲經過規范統一的分類代碼和標識代碼;維度定義庫用于存儲數據分析的維度數據;規范事務庫用于存儲經過整合、規范、統一的裝備保障事務數據;業務實體庫用于存儲按裝備保障業務實體進行組織的實體數據。
上述數據集成框架中,原樣庫建設是在不改變業務信息系統數據及結構的基礎上將其導入原樣庫,在物理上包括多個業務信息系統數據庫及其數據,其目的是借助數據中心強大的數據存儲和處理能力,為各業務信息系統技術人員進行單項業務運行數據處理提供支撐,同時為融合庫建設奠定基礎,避免直接操作業務信息系統數據造成破壞。融合庫建設通過對各業務信息系統數據進行統一設計,實現相關數據邏輯上和物理上的統一,解決各業務信息系統數據標準不一帶來的諸多問題。數據融合的結果可以用于信息資源規劃、統一信息視圖、數據倉庫建設和數據交換等應用。
2.2 數據模型設計
2.2.1 原樣庫模型設計
原樣庫數據模型和數據記錄以業務信息系統為單元進行組織,其組織結構如圖2所示。
原樣庫需要忠實反映各業務信息系統數據庫的實際,主要體現在:
①數據庫類型和版本。原樣庫與各業務信息系統的數據庫管理系統盡可能保持一致,包括數據庫管理系統類型和版本。
②數據結構。原樣庫數據表和各業務信息系統數據表的數據結構應保持一致,包括表的組成、表名、數據項名稱、中文全稱、類型、精度、存儲格式、關聯關系等。
③數據記錄。原樣庫數據記錄和各業務信息系統數據記錄應保持一致,可以暫不考慮數據記錄的準確性問題。
2.2.2 融合庫模型設計
融合庫由標準代碼庫、維度定義庫、規范事務庫和業務實體庫組成。融合庫首先將原樣庫中的數據模型進行規范化設計,然后對數據模型的定義關系、數據記錄的引用關系與發布關系進行明確,實現全局范圍內各業務信息系統數據模型和數據記錄的規范統一。
①標準代碼庫。標準代碼庫存儲的標準代碼包括分類代碼和標識代碼兩部分,是在綜合分析各業務信息系統代碼基礎上,通過合并、補充、新編等方式建立的統一的代碼體系,用于實現各業務信息系統數據之間的集成關聯。
②維度定義庫。維度定義庫提供統一的維度分類和維度表,為同類分析提供一致的視角。維度定義來源于標準代碼庫中的分類代碼,如單位維度來源于標準代碼庫中的單位分類代碼,裝備維度來源于裝備分類代碼等。
③規范事務庫。規范事務庫用于存儲原樣庫中的事務數據。規范事務庫的數據字段的命名屬性需要進行規范和統一,包括實體詞、特性詞、表示詞、限定詞等。同時,要同步更新使用標準代碼庫中的代碼,并完成數據完整性驗證。
④業務實體庫。業務實體庫用于存儲以業務實體為單位建立的數據模型和數據記錄,對應于業務數據中相對穩定、共享交換頻率較高的基礎性數據,如單位基本信息、裝備基本信息、器材目錄標準信息等。
2.2.3 模型關系描述
原樣庫與融合庫各模型間的關系如圖3所示。標準代碼庫數據模型來自于原樣庫數據模型,以業務信息系統中分類代碼表和標識代碼表為原型進行設計;維度定義庫數據模型來自于標準代碼庫的分類代碼表;規范事務庫數據模型是在原樣庫數據模型的基礎上,經過統一數據庫類型、字段物理屬性、字段命名屬性等規范化處理后創建生成;業務實體庫數據模型在規范事務庫數據模型的基礎上,經過數據項合并重組創建生成,且一旦建立就作為事務庫數據模型的定義方,對事務庫數據模型數據項進行定義。
2.3 關鍵屬性分析
數據項的命名屬性、關系屬性和存儲屬性等對于裝備保障數據集成的質量至關重要,是數據集成設計的重點之一。命名屬性用于統一數據項名稱,關系屬性用于統一不同數據模型中數據項間的關聯關系,存儲屬性用于統一數據項的物理存儲屬性。
①命名屬性。命名屬性是從語義角度對數據項進行分析和理解,主要包括數據項的名稱、中文簡稱、中文全稱、實體詞、特性詞、表示詞、限定詞,屬于概念數據模型范疇。
②關系屬性。關系屬性是指數據項間存在的邏輯關系,主要包括定義關系、引用關系、發布關系和計算關系等,屬于邏輯數據模型范疇。
③存儲屬性。存儲屬性是指數據項所具有的物理存儲屬性,主要包括數據項的數據類型、長度、格式等,屬于物理數據模型范疇。
2.4 集成基本流程設計
業務數據集成主要包括數據源資料收集分析、原樣庫建設和融合庫建設三個主要階段。其中,資料收集分析階段主要是收集現有業務信息系統相關的文檔資料、數據庫管理系統及相關信息,為數據集成的開展提供參考和依據;原樣庫建設階段主要是建立與各業務信息系統盡可能相同的數據庫環境,通過逆向分析,完成現有業務信息系統數據結構設計,并進行業務數據的抽取與存儲;融合庫建設階段主要是在原樣庫建設基礎上,進行標準代碼庫、維度定義庫、規范事務庫和業務實體庫的數據模型設計,然后進行數據記錄的抽取、清洗、轉換等,并存儲到相應的數據庫中。業務數據集成的基本流程如圖4所示。
3 ?裝備保障數據集成典型應用
3.1 信息資源規劃
信息資源規劃是對裝備保障領域信息的全面規劃設計,能夠構建形成穩定的數據環境,滿足多變業務應用的數據需求。面向數據中心的裝備保障數據集成,對已有業務信息系統進行了系統全面的梳理分析,對數據表、數據項、數據關系進行了詳細的規范設計,建立了裝備保障業務功能相關的主題模型、數據模型和統一的數據標準,在裝備保障領域形成了穩定的數據結構和齊備的數據記錄。該過程涵蓋了信息資源規劃的大部分工作,能夠為裝備保障數據體系建設、新研系統開發以及焦點應用的數據服務奠定堅實基礎[5]。
3.2 數據倉庫建設
面向數據中心的數據集成的主要目的之一,是為構建數據倉庫提供優質數據源,支撐裝備保障決策。一方面,業務數據集成融合了異構數據源的數據結構和數據記錄,為數據倉庫提供了統一的數據元素和數據記錄;另一方面,維度定義庫和用戶事務庫分別為數據倉庫中的維度表和事實表提供了直接來源,可以直接使用相關成果,從而實現面向“管、修、供、訓、戰”等裝備保障主題的數據倉庫的快速構建,為KPI指標計算、多維數據分析、綜合態勢展現、數據深度挖掘等提供數據支撐[6]。
3.3 數據共享交換
面向數據中心的數據集成建立了統一規范的數據模型、數據標準和信息代碼,以及相關數據內容間的對照映射關系,使得數據中心能夠作為裝備保障領域各業務信息系統間數據交換的樞紐,能夠提供面向不同業務信息系統數據交換服務。一方面,避免了兩兩業務信息系統間建立繁瑣的交換關系,以及數據在多個上下級系統間的級聯傳遞,提升了交換速度、質量及效益;另一方面,通過數據中心的交換,只需要了解數據中心與業務信息系統間需要交換的那部分數據模型,整體架構易于維護和擴展,數據完整性可靠性易于保證[7]。
3.4 主數據管理
主數據是具有高業務價值的、可以在裝備保障領域跨業務部門被重復使用的數據,例如裝備基本信息、器材目錄標準信息等。面向數據中心的數據集成對裝備保障業務信息系統中的主數據進行了抽取整合,構建形成了標準代碼庫和業務實體庫,并進行有效管理,還可以服務的方式把統一、完整、準確的主數據分發給裝備保障領域內的操作型應用和分析型應用,包括業務系統、業務流程和決策支持系統等,從而保證裝備保障關鍵數據在分散業務系統間的完整性、一致性[8]。
4 ?結束語
本文針對裝備保障數據中心數據體系建設需求,提出了面向數據中心的數據集成方法,設計了數據集成框架、相關數據模型及集成基本流程。在實際開展數據中心建設過程中,依托數據中心的設施網絡環境、存儲計算資源和人員技術力量,應用該方法完成了多個業務信息系統數據的集成、整合、入庫,在數據倉庫建設、數據共享交換和主數據管理中發揮了重要作用。
參考文獻:
[1]林小村,馬玉林,翁小云.數據中心建設與運行管理[M].北京:科學出版社,2011:5.
[2]孟小峰,馬如霞,馬友忠等譯.數據集成原理[M].北京:機械工業出版社,2014:201-204.
[3]徐永成.裝備保障工程學[M].北京:國防工業出版社,2013:252-256.
[4]祝本玉,劉焱,朱洪波,高智宇.裝備保障數據集成的認識與思考[J].裝備學院學報,2015,26(5):91-94.
[5]高復先.信息資源規劃[M].北京:清華大學出版社,2005:5.
[6]代冬升,謝峰,孫江生,梁偉杰.基于數據倉庫的裝備綜合保障系統設計研究[J].裝備環境工程,2014,11(6):163-166.
[7]滕曉燕,盧宇國,滕應杰.基于數據中心的企業生產數據集成模式初探[J].數字軍工,2008(9):66-69.
[8]李萌,魏瑋.基于SOA的主數據管理架構設計及實踐[J]. 兵工自動化,2015,34(8):49-51.