鄒紅霞 王 楨 胡欣杰
1(航天工程大學航天信息學院 北京 101416)2(北京空間信息中繼傳輸技術研究中心 北京 100082)
信息化建設中各單位依據各自需要所建設的信息系統形成了大量的信息孤島,制約了數據與信息共享應用的發展。特別是隨著編制體制的調整改革,以前歸屬于同一部門的業務系統現在可能分散在多個不同的部門。隨著軍民融合的不斷發展,跨部門、跨單位、跨層級的所謂跨域信息共享成為信息化建設新的增長點。傳統的通過整合或組織系統內部的接口和數據映射的方式,導致開發接口多且復雜、開發成本高等問題。本文通過分析跨域信息共享需要解決的問題,參考美國國家信息交換模型(NIEM),提出了一種基于標準化方式解決跨領域信息共享的實現思路。依照思路進行模型設計并規范了建模方法,設計了跨域信息共享實現中的共享模型應用體系框架,為實現標準化的用戶接入提供參考借鑒。
跨域是跨領域的簡稱,對領域概念的界定,當前并沒有一個明確的標準,一種普遍的認為是:為了實現業務協同及輔助決策等目的,在不同行業、不同業務領域、不同組織機構之間的信息共享被稱為跨域信息共享。本文根據各跨域信息共享展現出的特性歸納總結,認為跨域信息共享的主要特性是不同自治系統之間的異構性。自治系統指的是參與信息共享的業務系統均為可獨立自主運行的系統。實現跨域信息共享首先要解決的就是異構性問題,主要涉及到數據的異構性和平臺的異構性兩個方面。數據的異構性問題,即指各業務領域數據的語義、格式、編碼方式、數據模式的不統一,導致系統之間難以直接進行數據共享。而平臺異構性問題,則是指各業務系統采用軟硬件系統、網絡環境等的不同,致使系統之間數據共享時要考慮信息交換格式、交換協議的跨平臺性問題。其次,跨域信息共享要考慮的是分布性問題,即業務領域系統往往分散在不同的地理位置,跨領域信息共享易受到網絡的傳輸性能、傳輸機制等因素的影響[1]。第三,自治性問題,即不能妨礙原系統的運行,信息共享要適應原系統的變化。最后,跨域信息共享不能破壞原有信息系統的安全性。
傳統的數據整合與系統集成主要采取點對點的信息共享方式,每個系統都需要與其他系統建立離散的點對點連接,每個連接需要在防火墻開放端口。而且隨著參與系統的增加,點對點連接及數據轉換接口數量顯著增加,很難滿足安全信息按需共享的要求。而跨域信息共享應更強調采取松耦合的方式進行系統互聯[2]。因此,可以考慮通過標準化建模的方法,采取面向服務的軟件架構,通過建立規范的數據模型來解決跨域信息共享數據異構性的問題。其基本思想如圖1所示。

圖1 跨域信息共享標準化模型基本思想
(1) 建立標準化數據模型 跨領域信息共享的數據來源于各個業務領域,為了實現信息共享參與各方對數據的一致理解,需要對各個業務領域的數據按照統一的標準進行表示和描述。美國國家信息交換模型(NIEM)數據模型提供了統一的數據模型標準,可作為信息共享模型開發的依據和參考。
首先,構建核心數據模型,通過分析各業務領域共享需求,提煉出共性的數據類型(如人員編碼等)。其次,構建業務領域數據模型,通過對核心數據模型進行擴展,形成反映自身業務特點的領域數據模型。最后,整合核心數據模型、業務領域數據模型以及各領域已有的數據編碼標準(即編碼表),形成應用數據模型標準文件。
(2) 通過數據模型建立信息共享規范 信息共享規范[3]是一種信息交換標準,由共享雙方共同約定遵循的。在具體的項目或應用中,開發人員在充分完成用戶需求分析的基礎上,引用標準化數據模型,形成面向應用的信息共享規范。
首先,信息交換雙方需要根據共享需求,確定共享數據的范圍、內容和格式,形成共享業務模型。然后,依據標準化數據模型,形成雙方共識的信息共享模型。盡管跨域信息共享的需求千差萬別,但信息共享建模的過程是基本一致的,為了提高信息共享建模的效率和質量,建立規范的信息共享建模過程十分必要。
(3) 由信息共享規范生成信息交換包 信息交換包[4]是收發雙方通過網絡方式傳遞的含有共享數據的交換包。接收方在接收到交換包后,依據信息共享規范,對信息交換包進行解析,以達到對共享數據理解的目的。
信息交換包文檔構建完成以后,數據源即發送方需要將待交換的數據依據信息交換包文檔進行消息封裝、發布,數據消費者可通過上網搜索和訂閱,獲取所需要的數據。
跨域數據描述模型基本的要求是具備簡潔性與完備性。簡潔性是指模型標準需要足夠簡單,不會對所在業務系統的正常運行造成明顯影響。完備性是指模型標準需要滿足對本業務系統及與其有信息共享業務聯系的其他業務系統涉及到的所有概念的描述,使業務系統所有信息均有明確的標準。運用XML Schema模式語言對各個業務領域共用的實體或領域內部實體及其關系的抽象描述,其邏輯結構如圖2所示。

圖2 信息共享模型邏輯結構
模型由結構模型、基礎模型和領域模型三部分組成。結構模型是信息共享模型的定義基礎,通過引用XML Schema的語法和基本數據類型可以定義基本屬性(如id、ref、metadata、relationshipMetadata等)和基本數據類型(如抽象數據類型ObjectType、關系數據類型AssociationType、元數據類型MetadataType等)。其他所有模型都必須以結構模型為基礎進行定義,保證接收方按照結構模型可以正確解讀。基礎模型是通用的數據類型的集合,這些數據類型是信息共享環境中通用概念的基本定義,如幾乎所有業務系統都包含對人員的描述,可將所有人員部分抽象成為人員類型。根據業務領域使用需要,在基礎模型上針對領域常用類型進行擴展的類型集合構成領域模型。
共享模型的邏輯結構劃為核心集和領域集兩類[5]。核心集包含定義類型結構的結構模型和基礎模型,通過定義最基本的模型實現信息共享的簡潔性要求。核心集是最權威的定義,也是強制所有參與信息共享的業務系統需要支持的定義。擴展集通過對基礎模型內容按照結構模型的規則擴展形成針對特定領域內信息共享具體要求的領域模型的集合,滿足信息共享完備性的要求,針對不同特點定義不同特性的屬性,以適應具體信息共享標準需要。
信息共享規范的開發步驟:(1) 總體規劃,根據項目目標、任務、業務需求和業務流程等分析共享的信息和信息共享邊界,形成開發計劃,確定項目組成員等。(2) 需求分析,描述信息共享需求,包括涉及的單位、交換的內容等。(3) 模型生成,依據信息共享需求,參照標準數據模型,生成信息交換包,并對交換包的正確性進行驗證。(4) 模型發布,將前面階段形成的所有文檔進行壓縮,形成一個信息交換規范文件,并通過注冊進行發布。
其中重難點是模型生成,涉及到信息共享業務模型建立和信息共享業務模型映射2個部分。信息共享業務模型是業務領域專家在需求分析基礎之上運用建模手段以關聯表、圖形或標準化的UML語言(統一建模語言)的方式描述需求。信息共享業務模型是軍地間、業務系統與業務系統之間溝通的工具與橋梁,同時也能為非技術人員(如企業管理人員、項目組管理人員)了解信息共享需求的功能。信息共享業務模型映射是指構建信息共享業務模型與標準數據模型的映射關系[6],即將信息共享業務模型中的類映射為標準數據模型中的類型或屬性。標準數據模型能否與信息共享業務模型準確匹配是信息能否被正確描述的關鍵。匹配結果可能會出現三種情況:全匹配、部分匹配與不匹配。
(1) 全匹配:若業務模型中的類均能在信息共享模型中找到完全相同的表達方式,即屬性的命名、取值范圍等完全相同,則認為二者語義結構是完全相同的,可以不加修改直接使用,這是最理想的情況。此外,若類名與類型名稱不同但語義與結構完全相同,也可認為是全匹配。
(2) 部分匹配:若業務模型中的類僅有部分屬性與信息共享模型中某個類型的屬性相同。業務模型的類與信息共享模型的類型主要差異體現在語義或結構上的不一致(包括屬性命名上的不一致及取值范圍、數據類型上的不一致等),則可通過對映射的信息共享模型類型進行部分擴充或刪減,屏蔽掉不需要的屬性、添加新的屬性或修改不一致的屬性,來實現對業務模型中類的匹配。其中批量引用信息共享模型中屬性可以通過繼承來實現。
(3) 不匹配:若業務模型中的類在信息共享模型中找不到相同或相似的類型,則需要參照信息共享模型的結構模型定義,定義新的數據類型。
確定匹配關系后,將業務模型中建立的類及其屬性與匹配后信息共享模型的類型之間建立關系。業務模型建立的類的屬性按照信息共享模型中的類型屬性添加數據類型、數量關系及其他相應限制關系。
信息交換包文檔[7]是由建模過程中生成的各種文件組成的一個壓縮文件,其中包括用例圖、序列圖、模式文件、信息交換包文檔的更改日志、交換模型的實例文件和元數據等內容。
(1) 信息交換包組成 信息交換包文檔由主文檔和輔助文檔組成。主文檔部分主要包含子集模式、擴展模式和交換模式這三種模式所對應的模式文件,還有反映子集模式中元素列表的文件。列表文件記錄了子集模式中各元素的狀態,便于對子集模式進行修改與重構。另外,主文檔部分還包括總體規劃階段生成的各種文件(如用例圖、序列圖等)、信息交換包文檔的更改日志、交換模型的實例文件等。輔助文檔由描述信息交換包文檔構成的目錄文件和用來對信息交換包注冊、搜索和管理的元數據文件組成。如圖3所示。

圖3 信息交換包文檔
將信息交換包文檔進行解壓,打開目錄文件,就可以清楚地了解文檔中的文件分類,并可以通過目錄文件中的鏈接瀏覽所有的文件。目錄文件說明了包中每個文件的格式與內容。
信息交換包經過注冊后會生成信息交換包文檔元數據。信息交換包文檔元數據包含了所有注冊的信息,元數據文件是按照XML規范編寫的,因此能夠對其進行解析,實現注冊、搜索和發現功能。
(2) 信息交換包元數據 元數據是關于信息資源的描述[8]。在信息交換包經過注冊發布后,其他用戶能夠通過元數據搜索到所需要的信息交換包。信息交換包元數據包括信息交換包的基本信息描述、變更日志、狀態、信息交換包業務內容描述和授權單位等信息。
信息交換包元數據內容見表1(在標識列,R表示必選項,O表示可選項)。

表1 信息交換包元數據

續表1
為實現跨域信息共享的數據交換,需要開發設計邏輯實體交換框架LEXS(Logical Entity Exchange Specifications)[9]。通過定義數據交換方式、框架接入方式與框架運行方式,形成了一個能夠滿足不同信息共享需求的抽象消息交換框架。運用LEXS進行信息共享,數據的發布者將數據提交給框架,由框架實現數據的推送等操作。如圖4所示。

圖4 信息共享服務框架
共享服務信息交換框架主要由接口、交換消息、服務和管理控制策略組成。接口負責與用戶間的數據交互。用戶通過接口的不同實現方式接入框架,由接口調用服務來完成用戶的數據交換操作。在與用戶交互的過程中,接口將用戶所提交的數據包及相關信息封裝為交換消息用于框架內的傳遞,或將消息中的數據包及信息取出傳遞給用戶。交換消息是信息共享服務框架中進行交換的實體,由數據包摘要、信息交換數據包與用戶參數組成,由用戶提交的數據包與方法參數封裝而成。信息共享服務主要包括發布、檢索、訂閱、獲取、校驗、分發等服務。在框架中,信息共享服務起到了信息代理的作用,即由信息共享服務實現對用戶信息的接收與發送。控制管理策略是對框架中用戶與信息的管理。解決跨域信息共享缺乏管理層的問題,對信息共享過程中出現的問題進行協調與仲裁,對用戶任務進行分配,對信息進行權威性界定等。
通過設計框架接口的方式,將業務系統的請求轉化成為由接口調用的服務,把不同業務系統的異構連接方式轉化為標準接口調用的統一服務,由接口實現松耦合的目標。
本文使用標準化建模的方式解決跨域信息共享的數據交換問題。重點描述了信息共享標準化數據模型、信息共享規范和信息交換數據包的構建方式及標準的建模方法。通過接口服務的方式,設計了跨域信息共享服務架構,該架構提供了一種良好的松耦合方式,易于搭建,便于擴展和使用。