段明旭 李玉冬 閆 寧 李 楊 龍家恒
(1. 北京市測繪設計研究院, 北京 100038; 2. 城市空間信息工程北京市重點實驗室, 北京 100038)
地理空間數據是地理信息的一種抽象表達,也是真實世界與虛擬世界互相傳遞信息的一種有效媒介[1-2]。因此,其質量的好壞與優劣對能否實現準確的空間分析與精準的空間決策有著至關重要的影響。如何精準把控數據質量,并建立一套有效的、便捷的質量控制產品,已經成為當前新形勢下地理信息產業的一個熱門話題。
目前為止,我國地理信息產業已初步建立集調查、研究、保護、評價與監督等于一體的新型產業模式[3-5],地理空間數據的成果質量控制平臺也由單一管理平臺[6-8]逐步向系統性的全流程的成果質量控制平臺[9-11]邁出了堅實的一步。全流程的成果質量控制平臺覆蓋了地理空間數據檢查的全部流程,不僅能夠在最大限度上滿足各級別的檢查人員的需要,更能自如地適應各類別、各量級的成果數據,具有易操作、使用靈活方便等特點。
依據《數字測繪成果質量檢查與驗收》(GB/T 18316—2008)和《測繪成果質量檢查與驗收》(GB/T 24356—2009)兩項國家標準,并根據地理空間數據質量控制的主要特點和相關技術手段,為滿足本單位對產品質量的總要求,以標準化、自動化、數字化為重要技術手段和主要途徑,研發了“地理空間數據質量檢查平臺”。該平臺軟件是全流程的成果質量控制平臺,遵循模塊化的開發思想,支持檢查算子[12-14]、規則和方案的自由組合與靈活配置,制定了統一標準的輸入與輸出模板,建立了合理的評分和篩選機制,實現了自動化檢查成果輸出,簡化了質量檢驗的工藝流程,在最大限度上提高了地理空間數據質量檢查效率,縮短了質量檢查工期,降低了產品生產和檢驗成本。
軟件平臺在設計過程中始終貫穿領域驅動設計[15]思想,采用洋蔥架構模式構建平臺模型,由里向外逐層擴展平臺更多層次功能。如圖1所示,該平臺設計主要包括4個層次,由里向外依次為內核層、核心層、業務層和應用層。
圖1 平臺設計方案
內核層是該平臺最重要的結構層次,類似于生物學中的中樞神經系統,是驅動整個平臺運行的核心領域。該領域層次主要由許多核心模型(核心驅動)共同構建而成,是貫穿于軟件與硬件之間的重要橋梁,能夠完成內存管理、進程控制、權限認證、日志管理與共享等操作。內核層是平臺獨立運行的底層邏輯結構,具有跨平臺、易擴展以及易搭建等特性,既是平臺結構的邏輯抽象,也是抽象的具體表達。核心模型是該領域層次的重要組成部分,各模型相互交織并彼此獨立,它們猶如一個又一個獨立的信號源,向其他領域層次傳遞和交互信息,驅動著整個平臺的有機的、協調的運行。
核心層是該平臺設計的另一個重要的領域層次,是平臺運行的大腦,主要由檢查算子、檢查規則與檢查參數3個部分構成。其中,檢查算子是質檢平臺的最基本單元,是對成果質量評價體系各要素的概括與抽象,是實現各項技術指標的具體量化與算法實現;檢查參數是指導檢查規則運行的重要因子,也是算子規范化的一種具體約束,它是工作實踐與工作經驗相互結晶而產生的一個科學的、經驗性的集合,具有先驗性、指導性、規范性等特點;檢查規則可以概括為2個部分,一部分是由檢查算子和檢查參數共同構建的有參規則,另一部分則是無參規則。前者是可以被量化的規則,具有先驗指導,而后者則獨立存在于空間邏輯之中,需要去挖掘和擴展。如圖2所示,算子、規則和參數共同構成了平臺的檢驗因子,三者是有機結合的統一體,不同規則、不同算子以及不同參數既可以疊加,也可以自由組合,以滿足不同項目、不同層次以及不同規模的檢驗任務。
圖2 檢驗因子結構圖
業務層是平臺從抽象到表達的具體實現,處于平臺的主干地位,總體上由6大模塊組成,即質量檢查模塊、數據處理模塊、質量評定模塊、空間分析模塊、成果輸出模塊以及服務管理模塊。
(1)質量檢查模塊是6大模塊中的核心模塊,也是其他模塊的基礎,它是平臺檢驗因子的具體實現過程,由“任務+方案”共同組成。不同的質檢任務決定了不同的質檢方案,不同方案的有序疊加構成了不同的質量檢查模塊,不同質量檢查模塊的有機結合最大限度地保證了檢查的科學性與規范性。
(2)數據處理模塊、質量評定模塊以及成果輸出模塊是質量檢查模塊的子模塊,前者定義了數據處理方案與規則,后者完成質量評定與成果輸出。
(3)空間分析模塊是有關地理信息方法的具體實現,包括地圖投影、空間拓撲分析、空間幾何分析等內容。
(4)服務管理模塊主要用于對外提供服務接口,實現了對外擴展與外接設備注入的算法。
應用層是平臺的具體表現形式,是對各業務領域的展示與封裝,主要由用戶界面、外部服務、數據庫以及工具集合等因素組成。用戶界面是平臺的集中表現形式,通過圖形化定制將各功能對用戶展現,方便用戶實現軟件的操作與控制;外部服務是服務管理接口的具體表現,方便用戶進行軟件擴展與外接設備注入;數據庫操作是軟件運行的支撐平臺,實現了數據的統一管理、存儲與共享;工具集合是提供給用戶進行其他操作的工具集,可以進行文件瀏覽、文檔整理、任務分發等工作。
為滿足當前多種地理空間數據質量檢查的基本要求,平臺采用了輕便靈活的架構模式,配置了靈活多變的檢驗因子,提供了規范化的輸出模式,以任務和方案為運行導向,簡化了質量檢驗的工藝流程,在最大限度上提高了地理空間數據的質量檢查效率。
檢查算子、檢查參數以及檢查規則相互間有機地結合與串聯,構成了靈活多變的檢驗因子。三者是有機的整體,不同規則、不同算子以及不同參數既可以疊加,也可以自由組合,以滿足不同項目、不同層次以及不同規模的檢驗任務。
當前地理空間數據數據量大,具有復雜的空間拓撲和時空關系,層次也比較復雜,對檢驗方法的自由度和靈活度提出了巨大挑戰。面對復雜的地理空間數據形式,質檢規則也不是一成不變的,就需要根據不同項目、不同方案不斷調整與調和。靈活多變的檢驗因子提高了程序的穩定性與靈活性,擴展了平臺的適用性,加大了平臺的使用范圍。有參規則與無參規則相互配合,即解決了規則的量化程度,也滿足了規則的靈活擴展,同時可以配合人工智能手段進行有參或無參的模型訓練,可以進一步提高檢驗因子的智能化程度。
質量檢查模塊在從抽象到具體實現過程中,遵循著“任務+方案”為根本指導原則。不同的質檢任務決定了不同的質檢方案,不同方案的有序疊加構成了不同的質量檢查模塊,不同質量檢查模塊的有機結合最大限度地保證了檢查的科學性與規范性。任務是質量檢查的最基本導向,它驅動著不同質檢方案的協調與統一;質檢方案是質量檢查的最終表現形式,它推動著平臺的有序工作和各工序間的有效銜接。
如圖3所示,檢查任務和檢查方案具有較高的自由度,不同任務的自由組合構成了每一個檢查方案,所有的方案匯總為一套完整的、科學的評價方案,其主要由質量子元素、檢查項以及評價方法組合而成。檢查任務與檢查方案是相輔相成的關系,其構建模式具有很強的方向性,保證了質量檢查模塊構建的統一性。
圖3 任務和方案關系圖
檢查結果數據是質量檢查的重要成果,它是評價體系的最終表現形式,也是提供用戶用于成果評估的重要依據。檢查規則在制定過程中,主要涉及數據的空間參考、屬性特征、拓撲關系以及數據完整性等方面,具體規則與內容如表1所示。
表1 檢查規則與內容表
平臺在設計過程中,參考了領域驅動設計的眾多思想,摒棄了傳統的層架構模式,采用更為輕巧、靈活的洋蔥架構模式,降低了平臺各業務領域間的耦合程度,其層次更加清晰,也易于拆分和維護,實現平臺的快速擴充或精簡。
平臺在架構過程中的另一個優勢是將內核層從結構中剝離出來,它獨立運行于平臺內部,具有跨平臺、易擴展以及易搭建等特性,提高了平臺的運行效率。
如圖4所示,平臺的主要功能設計到4個領域,包括檢查模板制定模塊、檢查規則制定模塊、樣本質量統計模塊以及質量報告輸出模塊。
圖4 平臺主要功能簡圖
海淀區管理基礎數據維護更新項目是我院承接的重點項目,主要負責全區市政部件采集、加工與分析工作,并提供相關專題地圖。本期項目需對13個街道,涉及57 000多個圖斑進行質量檢查。
按照本次任務要求,以矢量圖形文件(Shapefile,SHP)文件數據作為組織單元和檢查對象,配置了由坐標系統、幾何位移、分類代碼值、要素遺漏等數十項檢查項目組成的檢查方案,平臺實現自動化批量檢查并輸出樣本質量統計表(表2所示。相比人工檢查而言,降低了人工的工作成本,提高了質檢質量與速度。
表2 樣本質量統計表
本文所述平臺是一款全流程的成果質量檢查平臺,可根據不同任務、不同項目自由定制檢驗規則,具有規范化的輸出模式,易于擴展和配置,簡化了質量檢驗的工藝流程,在最大限度上提高了地理空間數據質量檢查效率。
目前為止,本平臺還處于不斷完善的階段,雖然可以應用于生產過程中,但還存在諸多問題有待解決。第一,平臺缺乏智能化管理模塊,還不能實現智能化的質量檢查。第二,目前平臺只能制定針對一般性規則進行檢查,不能對特殊或不常見的規則進行制定,還需要進一步地擴充規則。第三,目前平臺功能比較單一,還需要進一步細化功能,提高檢查時效。