韓璐遙,韋廣昊,張 歡,東 成
(國家海洋信息中心,天津 300171)
面向海洋領域的環境數據管理模型的設計與研究
韓璐遙,韋廣昊,張 歡,東 成
(國家海洋信息中心,天津 300171)
在信息技術飛速發展的當代,如何對高精度、多維度、多源異構的海洋環境數據進行有序管理和高效應用是一項重點和難點。通過采用特定領域建模(DSM)技術,設計面向海洋領域的環境數據管理模型,論述其數據對象抽象和元模型構建過程,并開發了應用系統實例,驗證了模型的有效性,在實現海洋環境數據與具體業務邏輯的松散耦合的基礎上,解決了基于數據庫的傳統設計模式在管理多源、異構、多模態的海洋環境數據時遇到的效率低下、靈活性差和擴展性不足等問題,提高了海洋環境數據的管理效率和服務能力。
知識類;元模型;領域建模;海洋環境數據
隨著信息技術的飛速發展,各行業的數據量都在急劇增長。在海洋領域,由天基(衛星)、空基(飛機、飛船等)、陸基(臺站等)、海基(船只、浮標、潛標等)等構成的海洋立體觀測體系催生了呈指數級增長的高精度、多頻度、多源異構的海洋環境數據。多源多類性、時空敏感性等特點加大了海洋環境數據在有效管理和高效應用服務過程中的難度。
現有的海洋數據管理模型大部分采用傳統建模方法,針對某個具體項目建立專項模型,缺乏可擴展性和復用性。當用戶需求發生改變時,模型也需要進行相應調整,不利于海洋數據管理人員對內容復雜、結構多變的海洋數據進行長期統一管理。
領域建模作為一種新的建模手段,通過建立面向特定知識領域的行業知識模型,可以大幅提升行業知識的復用性和可控性,增強業務人員對領域知識的學習和發現能力,有效解決傳統建模方法可擴展性差、復用性低等問題。本文采用特定領域建模思想,對面向海洋領域的建模方法進行研究,提取海量海洋環境數據的邏輯特征,設計并建立海洋環境數據管理模型。
特定領域建模(DSM)是一種通過對特定知識領域進行抽象分析,獲得該領域的普遍共性和個性特征,并面向具體領域對象建立元模型的建模方法[1]。
1.1 領域建模組織架構
領域知識是領域建模的本質,對象是領域建模的研究主體,類是領域建模的邏輯切面,元模型是領域建模的中間成果,領域模型是領域建模的最終產品。

圖1 領域建模組成結構圖
以下分別對DSM的各組成部分進行介紹。
(1)領域知識。領域知識是領域模型的一個知識切面,是關于特定行業領域的數據實體所處的狀態及其變化規律的表述,集合了該領域的數據、數據之間的相互關系以及有關的數據約束。
(2)對象。對象是通過對特定行業領域知識進行特征抽取,獲得該領域數據實體的共性及變化特征并對其進行分析歸納所得到的,高度概括了屬性、規則和職能的業務實體集合[2-3]。
(3)類。類是具有同一屬性、方法的對象集合,由領域知識類和與領域知識密切相關的外部信息類所組成。
(4)元模型。元模型是對特定行業領域的建模環境進行規范定義后得到的抽象類模型[4],元模型是領域模型的度量單位和最大組成單元。
(5)領域模型。領域模型是對特定行業領域的完整抽象,包含該領域的全部數據屬性和操作定義,可有效解決數據模型一致性、擴展性與可復用性問題。
1.2 領域建模方法
構建領域模型的過程就是把領域建模的各重要組成部分按順序實現的過程。領域建模的具體步驟如圖2所示。

圖2 領域建模方法圖
領域建模的步驟如下:
(1)構建能夠完全表示領域問題即領域業務邏輯的領域知識體系。
(2)對領域知識進行分析提取得到領域對象。
(3)對具有相同特征的領域對象集合進行高度抽象并生成類。
(4)根據已有類設計建立滿足規范的元模型。
(5)將元模型進行邏輯組合,構建領域模型。
建立基于領域知識的行業通用模型,將領域知識應用到具體的業務處理策略中,使業務應用對象和知識對象有更好的內聚性,從而提升領域知識的可控性、可管理性和復用性[6-8]。
基于特定領域建模方法構建海洋領域知識模型,其主要步驟包括海洋領域知識體系構建、海洋領域對象分析提取、海洋領域知識類生成、海洋領域元模型設計和海洋領域模型建立5個組成部分。
2.1 海洋領域知識體系構建
海洋領域建模的本質是海洋知識,由海洋領域中一系列具體業務對象所共有的自成體系的知識切面組成。
構建海洋領域知識體系,即依照已有的行業標準及規范,通過對與具體實現技術無關的純業務對象的分析,將海洋領域知識體系進行縱向切面[9],并對海洋領域的業務概念或數據實體進行可視化表示的過程,是建立完整海洋領域模型的概念基礎。
構建海洋領域知識體系的主體為海洋業務領域的業務專家或工程技術帶頭人;構建的依據主要參照特定海洋數據領域專家經驗、具體使用情境、用戶偏好、已有知識體系及其綜合體現等。
2.2 海洋領域對象分析提取
海洋領域對象的分析提取工作建立在海洋領域知識切面基礎之上,從復雜的海洋領域知識體系中正確提取出具有代表性的關鍵對象,是構建具有的普適性的領域模型的重要過程。從模型復用角度來說,提取出的領域對象抽象程度越高,則模型在該領域的應用范圍越廣、應用價值越大。
海洋領域對象從廣義上劃分,主要是由各類海洋信息對象構成,從狹義上劃分,又可細分為海洋數據對象、海洋業務對象和海洋人員對象3類,本文主要從狹義角度對海洋領域對象中海洋數據對象的分析提取進行探討。
2.3 海洋領域知識類生成
海洋領域知識類是對具有相同屬性特征和方法的海洋領域對象集合的概括性描述,如構建一個海洋數據類,則需要對海洋數據的關鍵特征、詳細屬性、操作方法等進行高度抽象,并通過符號語言進行描述[10]。
生成海洋領域知識類時,需要對其他相關領域的知識具有一定了解,并充分考慮與外部類之間的關系,海洋知識類與外部類的結合程度越高,則設計出的領域模型完整性越高、可擴展性越強。
2.4 海洋領域元模型設計
海洋領域元模型設計,即根據分析提取、抽象概括得到的海洋領域對象、知識類和與海洋領域密切相關的外部知識類,構建海洋領域元模型,并對元模型進行轉換及驗證的過程。
海洋領域元模型主要由屬性定義、類屬關系定義及操作定義三部分構成,其中屬性定義主要界定海洋知識的特征屬性,如數據來源、處理級別、更新頻率等用于區別海洋數據對象的標志;類屬性關系定義主要用于描述海洋知識類之間的關系,例如父類與子類之間的包含和從屬關系等;操作屬性定義主要用于對海洋數據對象的創建、編輯、刪除、版本管理等行為進行定義。海洋領域元模型是海洋領域模型的最大組成單元。
2.5 海洋領域模型建立
建立海洋領域模型的根本目的是通過模型化的方式體現海洋領域的核心價值,為構建智慧海洋提供完備的模型支撐[11-14]。一個構架合理的海洋領域模型應當能夠最大限度地涵蓋海洋領域知識體系內的特征對象及業務關系等,并盡可能全面地與外部知識體系建立知識類之間的相互聯系。
圖3展示了一個比較簡單的海洋領域模型架構,取海洋領域知識體系與地理信息知識體系中數據對象抽象的交集,建立數據對象b;取b與海洋知識域內數據對象a,c的并集,建立海洋類A。同理,建立海洋類B,C,D,海洋類A及其類屬關系組成海洋數據對象元模型;海洋類B,C及其類屬關系共同組成海洋人員對象元模型;海洋類D及其類屬關系組成海洋業務對象元模型,三組元模型共同構成了一個基本的海洋領域模型。

圖3 海洋領域模型架構圖
按海洋業務需求劃分,可以將海洋數據分為海洋環境數據、基礎地理與遙感數據及綜合管理數據3大類。其中,海洋環境數據是使用頻率最高,使用范圍最廣的數據類型,梳理海洋環境數據管理流程,構建海洋環境數據管理模型,實現基于模型驅動的海洋環境數據管理,對更新我國海洋數據管理手段、提高海洋環境數據服務效率,具有重要意義。
3.1 海洋壞境數據管理
3.1.1 海洋環境數據分類 海洋環境數據資料按照數據來源可以分為國內科技專項調查、國內其他海洋機構專項調查、大洋調查、國內業務化海洋環境觀測、國內業務化海洋環境監測、國際合作與交換和國際業務化等資料類型;按照學科可以分為海洋水文、海洋氣象、海洋生物、海洋化學、海洋光學、海洋聲學、地質、地球物理和地形地貌等資料類型;按照數據處理程度又可以分為原始資料、基礎數據和數據產品等資料類型,復雜多樣的數據分類方式充分體現出海洋環境數據的多源性、多態性和多維性等特點。海洋環境數據分類如圖4所示。

圖4 海洋環境數據分類圖
3.1.2 海洋環境數據管理體系 為保證海洋環境數據管理方式的科學性和有效性,針對每一類數據資料的特點和處理成果,制定海洋環境數據的分類分級標準。按照原始資料、基礎數據和數據產品等處理程度進行數據分層,實現海洋環境資料匯集、處理、存儲、服務的全周期管理。海洋數據管理模式的確立是構建環境數據管理知識體系的業務基礎。
針對海洋環境原始資料的數據特征,采用以資料來源為特征區間,清單與數據文件相關聯的方式進行管理;針對海洋環境基礎數據的數據特征,采用以學科要素為特征區間,航次信息與站位信息相關聯,元數據映射標準數據文件的方式進行管理;針對海洋環境數據產品的數據特征,采用以學科和產品類型為特征區間,時空分辨率與數據文件相關聯的方式進行管理[15-19]。上述管理方法主要用于滿足科學計算和聯機分析的需求,是優化整合海洋環境數據資料,提高數據管理水平的有效途徑。
3.2 海洋環境數據對象抽象
3.2.1 海洋環境數據對象單元抽取 根據原始資料、基礎數據和數據產品3種數據類型以及其對應的數據管理方式,在繼承原有海洋環境數據庫實體并對其進行逆向模型分析的基礎上,根據歸納分析數據實體的共性及其變化特征,從現有海洋環境數據資料集合中抽象出6個對象單元,分別是清單數據對象、元數據對象、時空索引數據對象、原始資料文件對象、基礎數據文件對象和數據產品文件對象。海洋環境數據對象單元抽取流程如圖5所示。

圖5 海洋環境數據對象單元抽取圖
3.2.2 海洋環境數據對象屬性抽取 海洋環境數據對象屬性抽取是將各類海洋環境數據對象按照不同粒度進行抽取,為構建擴展性高、復用性強的海洋環境數據類提供結構基礎[20-21]。清單數據對象可以抽取出接收日期、匯交單位、文件個數、數據量大小、接收人等屬性;元數據對象可以抽取出數據來源、數據量大小、數據量單位、標準數據集格式、版本等屬性;時空索引數據對象可以抽取出開始時間、結束時間、時間分辨率、空間分辨率等屬性;原始資料文件對象可以抽取出任務名稱、任務年份、項目負責人、學科等屬性;基礎數據文件對象可以抽取出航次號、站位號、調查船代碼、質量符等屬性;數據產品文件對象可以抽取出產品名稱、產品類型、經度、緯度、產品質量評價單位等屬性。
3.3 海洋環境數據管理元模型構造
3.3.1 海洋環境數據管理類定義 根據海洋環境數據對象抽象得到的結果,充分考慮類的可擴展性,可以歸納出清單類、元數據類、時空索引類和文件實體類4個海洋環境數據管理類。
3.3.2 海洋環境數據管理類屬關系定義 根據海洋環境數據的具體業務需求,清單類擁有原始資料整編前清單類和原始資料整編后清單類1個繼承類,元數據類擁有基礎數據元數據清單類1個繼承類,時空索引類擁有數據產品時空索引類1個繼承類,文件實體類擁有原始資料整編前文件類、原始資料整編后文件類、基礎數據文件類和數據產品文件類4個繼承類。
清單類、元數據類和時空索引類的繼承類分別實現了數據文件實體導航接口,并和對應的文件類直接關聯。
3.3.3 海洋環境數據管理類操作定義 清單類、元數據類和時空索引類的繼承類主要映射了對應數據文件實體的處理及統計等業務邏輯,主要的類操作包括新建、錄入、刪除、編輯、查詢和統計等;文件實體類的繼承類主要映射基于業務的海洋環境數據存儲及服務等業務邏輯,主要的類操作包括導入、導出、備份和統計等,如圖6所示。
3.4 海洋環境數據管理模型搭建
3.4.1 海洋環境數據管理模型搭建 以海洋環境數據管理元模型為核心,構造業務系統模型和數據字典模型,搭建海洋環境數據管理模型。其中,業務系統模型是整個業務系統功能的高度抽象,映射系統運行與服務過程中海洋數據無關的業務流程,為基于業務需求變更的系統更新提供軟件復用的模型基礎。數據字典模型由3類元模型集合組成,分別是通用字典模型、海洋數據字典模型和系統字典模型,其中,通用字典模型包括國家元模型、區域元模型、調查元模型等;海洋數據字典模型包括數據庫信息元模型、庫表映射信息元模型和表字段信息元模型等。
3.4.2 海洋環境數據管理模型在數字海洋服務系統中的應用 為測試海洋環境數據管理模型的性能,在數字海洋應用服務系統的環境數據服務模塊研發過程中,采用了基于海洋環境數據管理模型驅動的軟件開發方式,研發完成的海洋環境數據服務模塊查詢檢索響應時間達到1S量級,遠小于其他類型海洋數據服務模塊10S量級的查詢響應時間,且模塊復用性高,可擴展性強,便于根據業務需求的變更進行調整。圖7為數字海洋應用服務系統海洋環境數據服務模塊界面圖。

圖6 海洋環境數據管理元模型結構圖

圖7 數字海洋應用服務系統海洋環境數據服務模塊界面
構建海洋領域模型是一項龐大工程,目前僅面向海洋環境數據管理業務進行建模。將領域建模概念引入海洋領域,構建面向海洋領域的高度抽象化的普適模型,直接使用特定海洋業務體系中既有的概念和規則,映射海洋領域的業務邏輯,可以為模型在各種業務情景中的復用提供邏輯基礎。
針對海洋數據的多維、動態及時空變化等特征,深入研究海洋環境數據的組織建模及其管理方法。采用基于特征的研究方法,對海洋資料的數據來源進行梳理,提取海洋數據資料的特征屬性,將復雜多樣的海洋數據進行分類,按照海洋數據處理歷程,從原始、基礎和產品三個層次對海洋數據進行界定;并按照海洋資料的學科類型和數據開放程度等進行分類分級,依據各層次數據資料的特點及其應用需求設計建立數據管理模型。通過實際測試證明,采用此模型可以大幅提高海洋環境數據組織、管理、查詢及檢索效率。
由于海洋數據類型眾多、格式龐雜,海洋數據管理業務體系依據職能部門的不同各有側重。目前僅根據國家海洋信息中心已有的數據管理體系進行模型構建,模型適用范圍較小。可以預見的是,隨著國家海洋信息化整合工作的逐步推進,在統籌國家海洋業務體系的基礎上構建一整套抽象化的領域模型,高度概括海洋數據對象的數據屬性、數據特征及數據間關聯關系,形成適用于整個海洋業務領域的數據對象約束體系,可以為海洋領域業務體系的頂層設計提供模型指導,為面向服務的海洋數據共享交換提供扎實的模型基礎。
[1]徐軼,戰洪飛,余軍合,等.基于特定領域建模元模型的知識建模方法[J].輕工機械學報,2012,30(2):74-78.
[2]趙雪,郭忠文,沈飛飛,等.海洋數據管理系統的設計與實現[J].中國科技信息,2012,23(1):72-74.
[3]李貴,張淼,李征宇,等.基于領域模型的Web數據抽取與集成[J].微電子學與計算機,2012,29(9):152-156.
[4]張煒.面向業務領域的模型驅動架構擴展應用[D].蘇州:蘇州大學,2007.
[5]衛紅春,賈笑蕊.特定領域建模方法和代碼生成的研究[J].微電子學與計算機,2013,30(9):154-157.
[6]于婷,楊錦坤,祁冬梅,等.全球海洋數據獲取系統元數據(JCOMM/ODAS)服務計劃[J].海洋開發與管理,2014(2):28-33.
[7]莊峻,褚燕.基于領域知識的企業知識模型[J].華東電力學報,2013,41(5):1101-1104.
[8]周駿,徐林,李征.元模型驅動的企業建模[J].計算機工程與應用,2005(27):215-217.
[9]黃光芳,金義富.基于領域驅動設計構建企業級Web平臺的應用[J].實驗室研究與探索,2013,32(8):72-75.
[10]徐軼,戰洪飛,余軍合,等.面向知識資源配置服務的特定領域建模方法[J].科技與管理,2012,14(1):27-30.
[11]李海峰.基于統一數據模型的企業數據集成與交換[J].制造業自動化,2003,25(1):8-11.
[12]羅榮良,朱勇.基于模型驅動架構的Web Services應用開發[J].計算機應用與軟件,2004,21(1):110-112.
[13]朱翠麗,謝益武.面向特征的領域建模方法研究與應用[J].計算機技術與發展,2010,20(11):240-245.
[14]吳映波,王旭,林云.面向服務的領域分析與建模框架[J].計算機工程與設計,2011,32(8):2704-2707.
[15]IsabelF Cruz,Huiyong Xiao,Feihong Hsu.An ontology-based framework for semantic interoperability between XML sources[C]// Proceedings ofthe 8th International Database Engineeringand Applications Symposium(IDEAS2004),2004:217-226.
[16]AlertoPace.Technologies for large data management in scientific computing[J].International Journal ofModern Physics,C.Physics and Computers,2014,25(2):343-352.
[17]Yue-Shan Chang,Hsiang-Tai Cheng.A scientific data extraction architecture using classified metadata[J].Journal ofsupercomputing, 2012,60(3):338-359.
[18]Muhammad Waqar Aziz,Radziah Mohamad,Dayang N A Jawawi,et al.Service based meta-model for the development of distributed embedded real-time systems[J].Real-time systems,2013,49(5):563-579.
[19]Smith G.Folksonomy:social classification[R].2011.
[20]Kingston J,Macintosh A.Knowledge management through multi-perspective modeling:representing and distributing organizational memory[J].Knowledge-based systems,2000,13(02):121-131.
[21]Juan de Lara,Esther Guerra,Ruth Cobos,et al Extending deep meta-modelling for practical model-driven engineering[J].The Computer Journal,2014,57(1):36.
Study on the Meta Object Driven Data Service Platform in Marine Data Management
HAN Lu-yao,WEI Guang-hao,ZHANG Huan,DONG Cheng
National Marine Data and Information Service,Tianjin 300171,China
Along with the rapid development of information technology,orderly management and efficient application is an important and challenging technique for marine environmental data,which have high-precision, multi-dimensional and multi-source heterogeneous features.This paper puts forward an ocean-oriented environmental data management model based on DSM,expounds abstraction of data objects and meta-model's establishment process concerning this model,and then illustrates an application instance to prove its validity.The proposed model integrates marine environmental data and concrete business logic in a loosely coupled manner, and therefore solves the problems of low efficiency,less flexibility and insufficient extensibility in managing multi-source,heterogeneous and multi-mode marine environmental data based on traditional database design, and ultimately improves the management efficiency and service capacity of marine environmental data.
knowledge class,meta-model,domain-specific modeling,marine environmental data
TP311.5
A
1003-2029(2017)03-0084-07
10.3969/j.issn.1003-2029.2017.03.016
2016-11-23
韓璐遙(1987-),女,碩士,工程師,主要研究方向為數據庫建設與管理、大數據技術在海洋領域的應用研究。E-mail:hlyiocean@126.com