

[關鍵詞]智能化;地理信息;數據;重構
1. 地理信息數據的發展
地理信息數據的存儲、傳輸技術和應用隨著地理信息系統(GIS)技術發展而改變,隨著信息化技術和應用的發展而不斷發展。地理信息數據經歷了模擬化、數字化、信息化、智慧化等幾個發展階段。
地理信息數據是與地理空間有關的自然地理、人文地理等數據。初期人們對地理信息數據的認識發生在日常生活中,隨著人類活動的廣泛,特別是農業生產、軍事活動、工程實施等,對地理信息數據的了解需求越來越迫切,這也推動了早期地圖的發展[1]。早期的地圖沒有數學坐標、標準符號等,隨著現代科技的發展,人類對地球的認識越來越深入,地理信息的表達、獲取、應用也越來越多、越來越深刻了,表述內容信息也越來越豐富多樣。
近代以來,隨著測繪技術、航空攝影測量技術的發展,地理信息數據走向了模擬化的發展階段。計算機的出現使得地理信息數據邁向了數字化的發展階段,互聯網的出現推動地理信息數據到了信息化發展階段。當前地理信息數據面臨著大的技術變革,即將走向智慧化的發展階段,這后面有當前的大數據、人工智能、區塊鏈、物聯網等技術的推動[2]。社會發展、治理能力現代化需要地理信息數據的智能化獲取、處理、存儲、管理、應用、歸檔。
2. 智能化的需求
遙感數據、物聯網的發展以及社會信息化的發展催生著地理信息數據的智能化。
智能化就是要實現地理信息數據從獲取到管理決策的高效、準確、可靠、自動化以及安全。要從地理信息數據的內涵、應用來認識、實現地理信息數據的智能化。地理信息數據一是來自地表自然界,二是來自人工建造、改造的內容,即人工構筑物,自然界對人工構筑物有著基礎性的影響,人工構筑物對自然界也有著巨大的影響。目前地理信息數據的來源有傳統測繪、遙感技術、GNSS 測量、互聯網、物聯網、工程測繪、傾斜攝影測量等手段,數據種類和形式更加多元化,數據量也越來越大,當前技術發展趨勢表現出主要數據來源應屬遙感、互聯網眾籌等[3]。
數據多了,帶來的好處是可用數據資源豐富了,以前想解決的問題現在變成現實。如遙感數據用于用地執法工作等。帶來的問題是使用時不知道選擇哪一個數據源好,數據之間的差異性不知道如何面對,存儲的空間越來越大,成本增加,數據處理的成本也在增加。
社會信息化的發展,人們的生活更加高效,活動空間擴大。包括治理體系和治理能力現代化。這些對社會整體信息化提出了更多的要求,而地理信息是社會整體信息化的一個“ 數字底座”,對其他信息有著承載、整合、監控的作用。當前信息化的應用場景走向三維模式[4],帶有三維場域、時間信息的地理信息數據成為了未來發展的趨勢,一些應用需要三維信息才能夠說清楚。如深圳市目前開始了城市空間建設用地地上、地表和地下分別設立使用權,探索按照海域的水面、水體、海床、底土分別設立使用權,促進空間合理開發利用,這就對三維空間的精細化、智能化管理提出了要求。智慧城市是當前信息化的重要著力點,智慧城市的建設也需要地理信息數據的智能化。
不同的應用,數據的內容、組織方式是不同的,紙質圖、數字化制圖、信息系統建設、智能化應用對地理信息數據提出了不同的需求[5]。
3. 重構的思路和技術實現
為了適應智能化的需求,需要依托當前的技術、面向智能化應用將地理信息數據進行重構。重構的思路和技術實現的初步思考如下。
3.1重構的思路
3.1.1面向高效治理的重構
數據支撐高效治理是當前首要考慮的維度。高效治理需要從各類數據中分析提取與管理決策相關的信息,提供輔助決策信息。信息應該包含法律法規、政策文件、技術標準、數據事實、可靠度(誤差)分析等,這些信息需要以管理決策者的維度整合后呈現。對于地理信息數據來說,直接服務管理決策的信息是不完整的,需要與其他的經濟、文化、應急、社會、自然等信息接合、整合,在此基礎上進行綜合分析比對,綜合法律法規、政策文件等信息進行數據分析,提煉出可用的信息。
這個需求需要地理信息數據具備時間、地理實體編碼(掛接其他信息)、數據來源、用途、準確度等屬性,提供基本的查詢、面積計算、統計分析等工具,為后期的管理決策使用作好必要的準備。
3.1.2全生命周期的重構
從數據管理本身的角度來看,為了更好地支持智能化應用,需要對數據全生命周期進行管理。數據的全生命周期涉及數據的產生、流轉、應用、變化、歸檔、失效等多個環節和階段,數據要對象化(注意對象化交叉重疊現象的處理),并將不同階段的變化記錄下來,為數據準確、及時使用提供必要信息。
這些需求需要地理信息數據在屬性上或者元數據上不斷記錄變化情況,至少包含產生時間、來源情況、使用中的變化信息、主要應用場景、反饋信息、歸檔時間等。地理信息數據的全生命周期的管理是滿足今后智能化應用的基礎工作,區塊鏈技術可以應用到這里。
3.1.3確保數據可靠地重構
地理信息數據作為智能化應用的基礎,為管理決策分析服務,需要數據是可靠的,這是重構的重要要求。可靠代表著數據的來源可靠、數據質量可靠、數據安全方面可靠、數據時效性方面可靠,可靠是智能化應用的重要方面,不可靠的數據做出的管理決策是不可靠的[6]。
可靠性的需求需要數據攜帶著來源、質量(對于地理信息數據來說重要的要素是精度、坐標系等)、保密、完整性等信息。高效的管理決策需要可靠的數據來支撐。
3.1.4面向快速更新的重構
當前信息化應用的一個重要維度就是數據的快速更新。自然地理、人工構筑物等變化更新的速度比較快,這對于應用來說更新的周期、實時性顯得特別重要。更新還需要考慮經濟成本、更新周期、技術方法等因素。當前測繪地理信息行業的技術裝備更新比較快,物聯網設備的研制更新的迭代頻率較高,對于地理信息數據的更新來說十分有利。
更新是基礎性技術工作,工作量大。為了能滿足后期的使用,需要將后期的應用向前推,就是在獲取的第一步兼顧到后期的工作需要。更新還要實現低成本、高效的目標,從成本效率的角度分析,遙感技術、互聯網眾籌等辦法成為了地理信息數據更新的主要手段。
3.1.5兼顧已有應用的重構
地理信息數據的重構是測繪地理信息行業的技術革命,發展的過程中要兼顧已有的數據成果和技術。行業已有的與生產技術規程、成果標準規范、數據字典、數據建庫規范等要綜合、統籌在一起。已有的技術標準是重構的基礎。
3.2 技術實現的探索
3.2.1數據結構的調整
當前的地理信息數據結構有面向對象、關系型、對象關系型、場模型等。地理信息領域有地理實體模型,這樣的數據類型應用領域比較廣,是未來發展的重點。數據結構的設計是關鍵的第一步,是支持智能化的要害。自然資源部的《新型基礎測繪體系建設試點技術大綱》中提出了地理實體的概念、數據模型等[7],可以很好地支持今后的智能化應用。地理實體的相互關系如下圖1。
本文的思路是數據對象的組成部分是變化的,數據元、地理實體的組織模式是符合自然社會活動實際,滿足實際應用需要的。需要在地理實體的基礎上增加可變的數據要素項,從數據產生、協同應用、分析、歸檔中自動增加數據描述項,記錄全生命周期的信息,可以借助XML、區塊鏈、面向對象技術、地理實體技術、服務注冊技術等來實現,從而達到智能化的應用目的。
在應用遙感影像發現地表變化輔助衛片執法工作實例中,對解譯圖斑的后續數據分析過程中,一般方法是通過與各項專題數據相疊加后進行數據統計形成分析數據報表,供決策人員使用。本文討論的方法,是將圖斑按面狀地理實體對待,初始圖斑并無任何意義,單純的是一個地理實體,參考地理實體編碼規范賦予唯一標識,當此實體進入到數據資源庫中時,以數字標簽方式通過空間、時間兩個維度與各項數據進行關聯并對實體進行標記,實現了實體入庫后產生數據“磁吸”效應。數據資源庫內容越豐富,數字標簽越多,變大數據“千人千面”的缺憾為優勢,豐富地理實體的數據維度,使用戶體驗“橫看成嶺側成峰”的大數據優勢,以便在執法督察業務中可以從時間維度(過去與現在、春夏秋冬四季等)、現狀地類維度、實體占地面積大小維度、空間位置等多維度、靈活地進行數據統計分析,輔以GIS應用研發的技術方法,成功避免了改變一個要求,技術人員就要重新進行一次數據處理分析,減少工作重復性,提高了工作效率和決策者對數據的滿意度[8]。
3.2.2數據屬性的調整
當前地理信息數據的屬性比較豐富,但分散在以圖層為基礎的各專題數據中,整合建庫后也以這樣的形式整合在一起,面對智能化應用缺少屬性的自動擴展、屬性識別等。
數據屬性應該是可自定擴展的,成為數據的標簽。經過本文的討論與應用,初步形成了面向業務對地理實體“磁化”以自動吸附標簽的方法和應用。隨著應用的發展,將進一步深入探討一個實體進入數據庫后從物理“磁吸”到“化學反應”創新,應用區塊鏈技術實現數據資源庫建設從整合到融合,攻克語義描述近似性的難題,解決了數據存儲分散使得數據分析、信息提取難度大的問題。
3.3.3數據庫的設計
數據庫應該是“數據湖”模式,支持多種數據的“流入”、存放。進入數據庫的數據支持分布式存放、進行數據清洗、數據自動編碼、數據粒度可組合,支持多種應用需求,實現“一庫多能、按需組裝”。
3.3.4面向整合分析的設計
整合主要是面向與其他行業數據的整合。整合主要涉及兩個方面的內容,一是空間位置關聯,二是地理對象關聯掛接。需要兩個方面的關鍵技術來解決,一是地理編碼技術,包含正向、反向編碼;二是地理實體編碼技術。
分析要面向管理決策控制,分析規律、形勢變化。規律性的內容包含自然地理規律、人和自然相互作用之間的規律、經濟社會活動的規律。這些規律對于管理決策以及控制規律過程有著基礎性作用。
4. 應用展望
地理信息數據智能化的序幕剛拉開,將來面臨的問題還比較多,發展的路程還比較遠。需要行業內多創新,加強數據理論方面和技術方面的創新、交流、廣泛應用,在廣泛應用中推動創新技術的落地開花。