王玉德
(遼寧省朝陽水文局,遼寧 朝陽 122000)
從20世紀90年代開始,遼寧省水利逐步開展業務應用系統的信息化建設工作[1]。當前,遼寧信息化設施逐步覆蓋到縣域層級進行視頻和網絡的應用,并對網絡安全體系進行了初步建立。建設了各類遙測水文監測站點4000余座及符合省級標準的現代化視頻會議系統,在水利業務方面覆蓋水旱災害防御、水資源監控、防洪決策調度、水土保持監測、大壩安全監測管理服務等系統[2]。在當前數字信息化發展的新形勢下,水利高質量發展需要的業務數據范圍和種類將逐步增多,數據組織的方式因此發生深刻的變化,而目前主要對單項業務數據應用方式有所側重,數據之間相互獨立,不能實現水利業務之間的數據的有效連通和應用,從而不能實現對于遼寧水利業務的有效支撐[2- 5]。因此需要對現有水利信息資源進行統一整合,實現“一數一源”,達到信息資源深度開發和綜合利用的目的[6]。本文結合近些年來其他省份數據資源整合和共享相關研究成果[7- 12],按照統一的數據共享和整合標準對水利業務數據進行整合共享的建設思路,可以對其他業務類信息系統提供有力支撐服務,從而支撐水利業務的高質量發展。
從水利業務服務支撐需求角度而言,建立業務應用關聯數據分類,面向業務進行數據模型構建,對不同來源的業務數據按照空間屬性進行整合、分類,對業務數據的來源、共享方式、授權管理進行信息資源整合和共享思路的設計,信息資源整合與共享思路如圖1所示。
根據集中存儲的數據形式和最終數據供給方式的不同,可分為數據源聚合、數據源同步和邏輯整合3種整合方式。
(1)數據源聚合方式
對已建信息系統數據資源進行遷移是數據資源聚合的主要方式,在信息系統升級改造后,在統一的數據基礎的平臺上對數據資源進行聚合,在業務數據區進行核心業務的數據存儲,再按照業務類型、基礎數據的種類對業務對象進行模型轉換后,按照集中統一存儲空間進行數據倉的建設,面向業務類型、方向、統一整合共享方式對數據體系進行關聯和挖掘,形成水利業務數據整合體系,同時對元數據進行抽取后形成數據類別清單,按照數據整合庫的方式對各應用系統業務庫數據資源進行遷移整合后,有原數據責任業務部門對元數據進行動態更新。數據倉主要對實測數據共享方式進行需求承載。
(2)數據源同步方式
數據源同步方式主要針對業務應用系統暫不具備升級改造條件,不能遷移部署數據資源按照同步方式進行整合并對其數據來源方式進行確定。在同一個數據映像庫進行遷移整合后的數據資源的備份和鏡像。按照水利業務對不同數據按照面向對象類型進行轉化后,在相對獨立的鏡像空間內進行數據存儲倉庫的集中空間建設。按照統一共享、整合的方式進行數據體系的有機挖掘,通過對應元數據進行抽取后形成數據資源的分類目錄。由于信息系統同步運行保持數據資源的動態更新。數據倉庫對數據的共享和使用需求進行滿足。原生產庫僅需提供接口供共享服務庫抽取數據。

圖1 信息資源整合共享與共享思路
(3)邏輯整合方式
邏輯整合方式主要針對不能進行同步聚合的數據資源建立整合資源目錄。邏輯整合方式是指將數據資源對應的數據在數據倉進行數據資源目錄的統一存儲,在原有的物理環境中對原始數據進行存儲。這類數據一般具有極強的專業性,共享需求不大,或者具有涉密和不易公開性,只將數據資源目錄進行共享。整合后數據資源目錄的共享使用由數據倉庫承載。
1.2.1數據資源共享
通過數據資源同步聚合后,數據共享通過數據倉進行承載,結合數據交換共享授權方式實現數據的共享和交換。各業務主管部門負責對數據整合和共享進行需求申請,數據來源部門負責對數據共享權限進行設定,信息化管理部門負責數據共享技術支撐。
1.2.2數據資源目錄共享
數據資源目錄是將遼寧水利所有的數據資源,統一編制數據資源目錄體系,形成全省唯一的水利數據資源目錄服務體系,為全省水利數據資源的統一管理、發布、查詢和統計服務提供支持。整合后的數據資源目錄可以為水利行業和其他行業部門等提供共享服務。
結合遼寧省水利信息化建設的現狀和發展要求,根據遼寧省水利廳水行政管理業務和數據需求,結合本項目的建設目標,本項目在數據方面主要完成以下工作:將現有省廳機關、廳直單位業務系統數據資源進行整合,形成遼寧省水利廳數據中心,并對外提供數據共享和使用。數據設計架構如圖2所示。
數據資源整合后建設省級水利數據中心,主要存放除涉密數據以外的全部數據。數據中心主要由業務數據存儲區、ODS存儲區和數據倉庫存儲區3個區域構成。業務數據存儲區:主要存放直接遷移到數據中心的業務數據庫和沒有遷移到數據中心的業務數據庫的映像庫,以及未來新建的業務數據庫。ODS存儲區:是業務系統數據庫和數據倉庫之間形成的隔離層,從數據映像庫直接抽取和存放的業務數據按照數據架構、數據之間的關聯程度與業務系統進行同步運行。相對穩定且面向主題水利業務進行數據的存儲,數據整合后按照數據倉模型進行共享和轉換,是具有分析價值的歷史數據與現狀數據,可以支持基于大量歷史數據的決策分析。數據倉庫存儲區包含水利基礎數據庫和水利專業數據庫,即主數據庫,以及面向對象數據庫。

圖2 數據設計架構示意圖
面向對象的水利業務數據屬性架構如圖3所示。為了降低業務數據冗余,提高數據穩定和邏輯性,按照標識屬性的方式對各業務數據對向進行劃分,本體數據的標準按照對象進行標識,本體數據的特征數據按照數據類型、業務類型、空間關聯程度等進行屬性的劃分。

圖3 對象與其屬性的數據模型
對象與其屬性建模以水庫為例進行說明,唯一數據編碼按照水庫對象標識進行存儲,水庫名稱可以作為基本屬性進行標識,水庫編碼可以作為所所屬類型進行屬性對象的標識,水庫蓄水容量等其他信息可以按照特征屬性進行標識。水庫設計指標、防洪特征指標、水庫運行情況等作為業務屬性數據進行存儲和標識,以面狀信息對空間數據的比例尺進行空間匹配,以點狀信息對小空間尺度數據進行匹配。水庫特征、標識、屬性數據均存在時空特征。例如水庫除險、不同蓄水位下水庫淹沒范圍等情況。以水庫工程為例的具體數據模型如圖4所示:
按照統一集中更新和維護的機制對數據模型中各類數據空間屬性、數據特征進行標識,各業務分管部門對業務數據進行更新和維護。本文擬針對對象建立標識表及其屬性表,并且在標識表和屬性表中考慮時相特征的存儲。
3.2.1數據關聯關系
水利不同對象數據之間存在一定的關聯關系,表述各業務數據之間的關聯程度,這種關聯程度較大的情況下,一旦關聯性有所影響,則不能建立數據對象之間的關聯程度。因此需要建立數據之間較好的關聯度。如:某個水庫其大壩屬于附屬關聯,則水庫則和某行政區域可進行關聯。具體數據模型如下圖中用實線表達的關系。
3.2.2邏輯關系
另外,不同數據對象之間存在關聯度,也存在一定的邏輯關系,但不能影響數據之間的關聯程度,因此要建立數據之間的邏輯關聯度。主要包含:不同數據對象之間的邏輯關聯度,如業務關聯度和水庫對象關聯度,水庫與檔案對象之間的邏輯關聯度。具體數據模型如圖5所示用虛線表達的關系。

圖4 以水庫為例的數據模型示意圖

圖5 對象關聯關系示意圖
3.2.3空間關系
數據之間存在空間關聯程度。比如水庫之間的排污口的具體位置。通過關聯關系建立無空間屬性和有空間屬性之間的空間邏輯關聯關系,如:“水庫安全加固初步設計報告的審批材料”這個信息數據可以與水庫空間特征屬性進行相對應的標識。
(1)在信息資源整合和共享建設中,整合或鏡像備份數據應在數據結構、數據關聯度上與原應用系統在邏輯上保持一致。
(2)數據倉庫建議全要素綜合設計,按照“急用新行”的原則選擇重點業務進行數據資源整合共享建設設施,再逐步向其他業務逐步擴展建設。
(3)水利基礎數據庫和水利業務數據庫的模型設計應以ODS數據模型為核心建立基礎數據模型,并在此基礎上根據業務劃分進行重新組織和擴展,添加匯總及派生對應數據。