楊錦坤,李維祿,韋廣昊,韓璐遙,韓春花,陳剛,鄭兵
(國家海洋信息中心,天津 300171)
隨著經濟全球化、區域一體化的進一步發展,海洋越來越成為沿海各國爭取和發展利益的重要空間[1]。在建設海洋強國戰略背景下,海洋經濟、現代海洋產業體系建設、海洋生態環境可持續、全球海洋治理等海洋領域發展面臨著新的機遇和挑戰[2]。旨在全面提升經略海洋能力的“智慧海洋”工程應運而生,海洋信息透徹感知、海洋通信泛在隨行、海洋應用協同智能的發展體系成為研究的熱點領域[3]。海洋數據資源作為重要的國家性基礎資源,是推動“智慧海洋”工程實施的核心和靈魂,在國家和地方海洋領域發展中發揮著越來越重要的作用[4]。隨著大數據等信息化技術進步與海洋發展利用需求的不斷碰撞和融合,體量爆炸性增長的泛海洋數據資源的共享應用逐漸暴露出頂層布局設計不足、整合處理程度不高、共享交換機制不暢等問題[5],如何有效地規劃海洋數據資源體系,進一步構建海洋數據共享應用生態、挖掘海洋數據價值,成為重要的研究課題[6]。
區別于國家層面,沿海省市等地方海洋數據資源的共享應用往往服務于當地海洋經濟發展、海洋生態保護、海洋預報減災、海域管理等不同應用場景[7],致力于推動海洋強省(市)建設,具有很強的需求導向性。本文結合浙江省“智慧海洋”建設,通過探討需求導向的泛海洋數據資源體系規劃,為海洋數據資源共享應用和潛能釋放提供解決方案,進一步結合應用實踐,為地方省市海洋相關領域發展提供參考。
根據調研結果,浙江省海洋數據資源主要涉及國家海洋大數據資源、省涉海政務數據資源、省涉海社會數據資源和互聯網涉海數據資源四個層面。
(1)國家海洋大數據資源。主要為國家和地方建設運行的浙江海域各類觀測平臺所采集的數據(海洋站、浮標、雷達等數據,涉及海洋水文、氣象等要素類型),以及國家海洋科學數據共享平臺[8]共享的海洋多學科實測數據、分析預報產品和各類專題信息等。
(2)省涉海政務數據資源。主要為浙江省大數據局所歸集的省自然資源廳、海事局、氣象局等數源單位[9]相關涉海數據,包括實時觀測數據、監測數據、預報數據、海域海島管理數據、基礎地理數據、物流港口數據,以及涉海機構業務審批產生的政務數據等。
(3)省涉海社會數據資源。主要為省內科研院所、社會企業和其他相關領域的數據平臺歸集的涉海數據,如自然資源部第二海洋研究所海洋遙感在線分析平臺SatCO2 相關數據[10]、寧波世紀海洋信息科技有限公司獲取的漁船海洋氣象數據等。
(4)互聯網涉海數據資源。主要為賦存于互聯網平臺的大量應用側涉海數據[11],通過在線爬取/下載以滿足浙江省具體涉海應用需求,包括但不限于海洋實測/預報數據、海洋基礎地理信息、海洋生物數據、海洋歷史數據,以及海洋資訊信息等數據內容。
在浙江省深入推進海洋強省建設背景下,海洋經濟、海洋創新、海洋港口、海洋開放、海洋生態文明等領域[12]的數據需求日趨強烈,其中,浙江省大灣區建設、海洋經濟發展、智慧海防預警、江海聯運服務等工作對海洋專題數據、灣區應用數據、空間地理數據、海洋經濟數據、海防應用數據、港域航道數據等應用側數據資源需求尤為明顯。
(1)海洋專題數據。主要包括各類海洋環境調查和觀/監測數據、海洋環境產品數據,以及海洋資源數據等,涉及資源環境、海域海島、生態保護、預警監測等眾多應用專題。
(2)灣區應用數據。主要是面向浙江省大灣區建設支撐的相關涉海應用數據,包括行政境界(面)、傾斜攝影、工程建設、基礎設施布局、海域監測點位、重要資源分布等數據。
(3)空間地理數據。主要是面向空間處理分析、基礎地理專題展示,以及二、三維一體化等的多比例尺基礎地理底圖、地形數據、遙感影像以及其他二、三維模型數據。
(4)海洋經濟數據。主要是面向浙江省海洋經濟分析評估的數據資源,包括海洋經濟運行監測、海洋經濟發展指數、海洋產業生產總值、涉海企業營運數據等。
(5)海防應用數據。主要是面向海域防控需求的海上目標監測、分析、識別和預警等數據,包括雷達、AIS 數據、海洋功能區數據、海上平臺數據、碼頭數據等。
(6)港域航道數據。主要是面向港口、貿易、航運等企業和社會公眾的港域航道、錨地、泊位等數據,以及港口航運動態信息和貨物交易信息等數據。
構建科學合理的海洋數據管理體系,能夠有效推進海洋數據資源的整合管理、價值挖掘和共享服務[13],也是本文所提需求導向的地方海洋數據資源體系規劃的核心。其關鍵技術體現在分類管理體系設計和數據資源體系布局兩個方面。
在數據資源現狀和需求分析的基礎上,按照海洋數據處理程度和類型等屬性[13-14],進一步明確各類海洋數據資源的級別和范圍,設計了包括基礎數據資源層、整合數據資源層和專題應用數據層在內的海洋數據分類管理體系(圖1)。

圖1 海洋數據分類管理體系
(1)基礎數據資源層,以數據來源/獲取途徑進行一級分類,包括前文所述國家來源海洋數據、省涉海政務數據、省涉海社會數據和互聯網涉海數據,以及補盲數據,形成基礎數據資源層。
(2)整合數據資源層,整合不同來源/獲取途徑的數據,按照需求導向的海洋環境資源數據、海洋空間地理信息、海洋政務管理數據和海洋專題應用數據等為一級分類,形成整合數據資源層。
(3)專題應用數據層,基于基礎層和整合層,根據具體應用支撐數據需求,補充數據缺口,補充的數據進入基礎數據層,經整合數據層,形成浙江專題應用數據層。
以浙江省大灣區建設、海洋經濟發展、智慧海防預警、江海聯運服務等海洋數據資源應用需求為導向,按照海洋數據全生命周期,從數據來源渠道、類型屬性、應用需求等多維度多角度,統籌規劃了浙江省海洋數據資源體系布局(圖2),實現了泛海洋數據資源的互聯互通和共享應用。

圖2 浙江省海洋數據資源體系布局
從數據流通布局上看,浙江省海洋數據資源體系向上與國家海洋大數據平臺開展數據交換,縱向匯集浙江省相關委辦局涉海數據,橫向與鄰近省份開展數據共享交換,向下打通全省各市縣海洋數據共享通道,對外依托區塊鏈等技術手段吸收各行業涉海數據,進一步聚焦重點應用領域,面向政府、企業和公眾提供服務。
在數據管理體系的基礎上,按照“分布式管理、調用式服務”的總體架構,設計構建了浙江省海洋大數據資源池,從數據共享交換、多源數據處理、涉海綜合數據庫,以及海洋數據治理等多個維度,完成浙江省涉海數據資源體系規劃的系統實現。
結合已建立的數據傳輸/交換機制,構建海洋數據共享交換和采集更新的統一化、定制化通道,實現國家、省政務、省社會、互聯網等多來源多層面海洋數據資源的高效歸聚匯集和共享交換(圖3)。關鍵技術模塊包括智能轉換和交換配置、流程、調度、管理、監控等。

圖3 數據共享交換系統界面
(1)智能轉換。支撐數據多方式轉換、可視化配置數據加密和脫敏規則、多源數據解壓/壓縮算法、圖形化參數配置數據分發模式,以及臨時存儲等功能。
(2)交換配置、流程、調度、管理和監控。包括交換接口、流程、數據流、策略等的配置,交換、遷移、加工、自定義等映射流程,周期管理、任務配置、任務執行、任務管理等交換調度,用戶、權限、字符集編碼等管理,以及任務、異常、對賬等交換監控。
針對海洋數據的分散存儲、高速增長、結構各異等特性[15],基于大數據技術手段,構建了覆蓋標準處理、質控評估、多源融合處理和統計計算等多源數據處理整合系統,提供高質量底層數據資源支撐。關鍵技術包括標準化處理、質量控制與評估、多源融合分析處理、海洋環境統計分析、實況分析和再分析等。
(1)標準化處理。主要實現數據清洗和記錄整理等數據預處理,以及數據量綱換算、代碼統一、數據提煉轉換、清洗結果驗證和數據清洗回溯等標準化處理。
(2)質量控制與評估。圍繞復雜多源海洋數據的質量分析,實現數據符合性、正確性、一致性、邏輯關系、空值與重復檢查等質量控制,以及真實性與可靠性對比驗證、深度符合率評估等質量評估。
(3)多源融合分析處理。主要實現海洋大數據不確定性分析、量質融合、強弱關聯分析、時間序列分析、灰色系統分析、可視分析、時空特征影響關聯關系分析和三維結構分析等面向多源多模態海洋數據的融合分析處理。
(4)海洋環境統計分析、實況分析和再分析。主要實現海表溫度、氣溫、氣壓等海洋環境要素的統計分析,基于大數據多變量回歸及變分方法的水下三維溫鹽剖面實況動態分析,以及長時序海洋要素時間和空間多尺度連續變化特征數值再分析。
對應分類管理體系,構建面向海洋領域模型的涉海綜合數據庫系統,包括平臺支撐庫、基礎數據庫、分析產品庫和專題數據庫四大類(圖4),為現有和潛在應用提供跨領域、全量數據和知識服務支撐。關鍵技術環節包括數據加載更新、數據庫管理和接口服務等。

圖4 涉海綜合數據庫系統架構
(1)數據加載更新。針對數據文件、事務型數據和分析型數據,通過加載調度和并行數據加載等,實現不同來源海洋數據的智能抽取、系統校檢和并行更新,形成海洋數據資源的統一加載更新能力。
(2)數據庫管理。重點構建數據源頭回溯、數據資產維護以及數據庫管理監控等功能,實現溯源信息配置和模型維護、規則版本管理、數據流和狀態監控等海洋數據全生命周期管理。
(3)數據接口服務。主要包括數據服務發布、服務檢索和服務調度等模塊,實現面向不同層級和領域業務系統的穩定數據服務。
基于數據管理體制機制核心,聚焦海洋數據共享開放利用和價值釋放[16-17],構建包括主/元數據管理、資產化管理、安全治理和隱私保護、挖掘分析等系統(圖5),為海洋數據資源全生命周期管理提供解決方案。關鍵技術包括主數據管理、元數據管理,以及數據分析挖掘。

圖5 海洋數據治理系統
(1)主數據管理。主要包括全生命周期的主數據標準管理和主數據實體管理,形成浙江省海洋大數據資源池輸出核心業務基礎信息的統一管理能力。
(2)元數據管理。通過服務接口的方式提供指標、維度、數據模型、多維數據集、碼表映射和轉換規則等元數據信息,實現數據分類分級、元數據獲取、血緣分析、異常觀測和權限管理等功能,形成海洋數據資源體系各類元數據的統一管控能力。
(3)數據分析挖掘。整合多種數據挖掘算法和涉海行業特色算法,開發可視化數據挖掘建模、基礎算法調用和面向應用的海洋大數據挖掘等關鍵功能,支撐多類型涉海業務應用的海洋大數據分析挖掘。
以大灣區海洋一張圖應用為例,在浙江省海洋數據資源體系規劃框架下,接入并充分整合相關數據資源,提供灣區規劃、重點項目、生態保護、預警監測、海洋文化等多源信息的綜合展示和在線可視分析(圖6),為實時監測、動態了解大灣區開發利用狀況,統籌謀劃大灣區發展布局提供了技術支撐[18]。

圖6 大灣區海洋一張圖應用系統
(1)數據分類管理。基于本文構建的分類管理體系,該應用集成了國家、省政務、省社會和互聯網等來源的海洋經濟、海域海島、預警監測、生態保護、資源環境領域相關矢量專題數據、業務可視化數據、屬性數據和多媒體數據。
(2)三維場景構建。二維地圖場景所用的服務通過ArcGIS Server 進行發布,服務類型包括WMS 和WFS 兩類;基于浙江省海洋大數據資源池,本應用構建了全國范圍、全球30 m 地形、2015 年與2019 年重點海島礁三維可視化球體模型,進一步發布三維球體數據。
(1)灣區規劃。主要展示大灣區總體規劃布局、產業和生態規劃布局,結合示意圖與詳情介紹,清晰直觀地展現浙江省海洋重大戰略規劃及經濟發展情況。
(2)重點項目。對接重大項目庫管理平臺,整合統計投資、在建項目類型及數量,展示相關項目分布情況和建設進展。
(3)預報減災。圍繞實時觀/監測、海岸侵蝕、港口預報、海平面變化等多源數據信息展示,實現臺站、浮標等位置分布情況統計,以及潮汐實時預報、海平面變化統計和海岸線侵蝕變化統計。
(4)生態保護。針對生態紅線、紅樹林以及海洋保護地數據進行圖層信息的展示和定位,實現了海洋保護地統計分析、查詢檢索、定位屬性信息查看和列表統計。
(5)海洋文化。從宗教文化、民俗文化、旅游文化、海防文化等不同方面,提供浙江省涉海文博古跡、非物質文化遺產等空間定位和查詢展示。
(1)推進了海洋數據整合集成程度。充分利用浙江省各涉海部門資源,納入近海海圖、區域三維和矢量地圖,以及海域海島、港口航道等代表性數據和信息,推進了面向灣區建設的海洋數據整合集成。
(2)提高了海洋數據處理治理能力。通過搭建基于海洋數據管理體系的專題資源池系統,實現各類海洋數據資源的按需處理分配和針對性管理治理,有效提高了面向應用的海洋數據處理和治理能力。
(3)提升了海洋數據共享增值水平。應用牽引下,面向行業、公眾等開放海洋數據資源,顯著加強了數據和應用協同共享,進一步拓展輻射相關應用生態,提升海洋數據供應側增值服務水平。
在國家層面推進海洋數據資源共享應用的背景下,本文結合浙江省“智慧海洋”建設實踐,提出了需求導向的地方海洋數據資源體系規劃方案,以應用需求驅動海洋數據資源協同整合共享,統籌規劃了基于分類管理的浙江省海洋數據資源體系,試驗探索了海洋大數據資源池系統實現手段,并給出了面向典型應用的數據共享和挖掘實踐。
需求導向的地方海洋數據資源體系規劃及應用為海洋數據資源的共享應用、海洋數據要素的作用發揮[17]提供了一種解決方案。結合應用實踐,仍需加強地方泛海洋數據資源的協調和整合、健全完善數據共享交換機制、豐富地方發展所需的海洋應用生態謀劃,持續推進海洋數據資源與應用的協同創新和交叉共融,通過深化應用牽引的海洋數據資源體系規劃,激活海洋數據資源潛能,更好發揮海洋數據要素作用,為地方海洋相關領域發展等提供新動能,為“智慧海洋”建設構筑新優勢。