鄭新奇,肖 飛,3
(1.自然資源部國土空間大數(shù)據(jù)工程技術(shù)創(chuàng)新中心,北京 140083;2.中國地質(zhì)大學(北京)信息工程學院,北京 140083;3.自然資源部信息中心,北京 100812)
根據(jù)國際數(shù)據(jù)公司(International Data Corporation,IDC)統(tǒng)計數(shù)據(jù),全球數(shù)據(jù)每18 個月會翻一番,2025 年,全球數(shù)據(jù)總量預計達175 ZB[1],時空數(shù)據(jù)規(guī)模增長非常快速。相關(guān)證據(jù)表明,80%的信息都與地理空間位置相關(guān)[2]。隨著對地觀測、移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等技術(shù)的興起,新型時空數(shù)據(jù)層出不窮,如視頻監(jiān)控、手機信令、位置服務等數(shù)據(jù),不斷豐富和擴展國土空間大數(shù)據(jù)的內(nèi)涵。
國土空間大數(shù)據(jù)是國家管理下的領(lǐng)土、領(lǐng)海和領(lǐng)空等國土空間本體及其各類要素的數(shù)字化表達,是物質(zhì)世界(包括自然界和人類社會)在數(shù)字世界映射的客觀記錄。國土空間大數(shù)據(jù)除了具備普通大數(shù)據(jù)大量性、高速性、多樣性、價值性的“4V”特征,也具備豐富的時間、空間屬性特征,為數(shù)據(jù)的管理、分析和應用帶來了巨大的挑戰(zhàn)。
(1)數(shù)據(jù)結(jié)構(gòu)復雜多樣,國土空間大數(shù)據(jù)具有類型多樣、高度非結(jié)構(gòu)化、大單體、多維度等特征,使得一體化數(shù)據(jù)管理和高效查詢檢索變得困難。
(2)數(shù)據(jù)動態(tài)變化對高維度分析計算提出要求,以人類活動為代表的時空移動對象動態(tài)數(shù)據(jù)越來越多,需要提供時空建模、索引、分析計算的能力。
(3)大數(shù)據(jù)和大規(guī)模計算場景性能不足,大數(shù)據(jù)時代下空間數(shù)據(jù)的體量小則百吉字節(jié)、大則太字節(jié),對系統(tǒng)的存儲成本、彈性能力、讀寫效率提出更高要求。
(4)智能化應用需求對多模態(tài)數(shù)據(jù)融合分析提出挑戰(zhàn),單模態(tài)數(shù)據(jù)智能化無法有效支撐復雜業(yè)務知識發(fā)現(xiàn)并探尋事物發(fā)展規(guī)律和趨勢的需求。
國土空間大數(shù)據(jù)技術(shù)旨在全方位采集空間位置信息,高效存儲與管理空間數(shù)據(jù),對空間本體和要素的時空屬性進行分析挖掘,涉及國土空間對象表達、數(shù)據(jù)建模、空間存儲和索引、空間處理和優(yōu)化、空間數(shù)據(jù)挖掘、空間數(shù)據(jù)應用等方面。本文研究了國土空間大數(shù)據(jù)的關(guān)鍵技術(shù),分析了不同的應用場景,對未來國土空間大數(shù)據(jù)的發(fā)展進行了展望。
數(shù)據(jù)采集是一切信息處理活動的起點。當前數(shù)據(jù)采集設備呈現(xiàn)小型化、專業(yè)化、網(wǎng)絡化、泛在化和智能化等特點,為國土空間大數(shù)據(jù)的獲取提供了嶄新的技術(shù)手段。從時空方面看,人們對國土空間數(shù)據(jù)的采集從局部、片段向全域、連續(xù)發(fā)展,從二維平面向三維立體發(fā)展;從參與主體和采集模式看,政府、企業(yè)、個人都參與了數(shù)據(jù)采集活動。
1.1.1 空天地一體化采集技術(shù)
當前地面互聯(lián)網(wǎng)絡、移動通信網(wǎng)絡、空間網(wǎng)絡不斷融合,構(gòu)建了覆蓋全球的空天地一體化網(wǎng)絡。它是以地面網(wǎng)絡為基礎、空間網(wǎng)絡為延伸,覆蓋陸、海、空、天等物理空間,為各類用戶的活動提供信息保障的基礎設施[3]。空天地一體化采集技術(shù)是以空天地一體化網(wǎng)絡為基礎,對包括人類活動在內(nèi)的地球系統(tǒng)運動進行觀測的技術(shù)。需要解決的關(guān)鍵問題是空間信息獲取的一體化和智能化,空間數(shù)據(jù)處理的自動化、定量化和實時化,空間信息分發(fā)與應用的網(wǎng)格化;研究的核心是解決地球空間信息獲取、處理等方面的基礎理論問題[4]。通過空天地一體化采集與集成,能夠有效擴展傳統(tǒng)對地觀測系統(tǒng)的能力,從而實現(xiàn)全球、全天候、全天時、全方位的空間數(shù)據(jù)獲取與處理。
1.1.2 基于數(shù)據(jù)中臺的采集技術(shù)
隨著數(shù)據(jù)資源管理科學理論技術(shù)發(fā)展及人們對數(shù)據(jù)與業(yè)務細化分離趨勢規(guī)律的不斷認識,數(shù)據(jù)中臺概念被廣泛接受,主數(shù)據(jù)及主數(shù)據(jù)管理已經(jīng)成為人們建設基礎數(shù)據(jù)庫的基本方法。數(shù)據(jù)湖和湖倉一體是數(shù)據(jù)中臺建設中廣泛應用的一項關(guān)鍵技術(shù),依托各種分布式文件系統(tǒng)和計算引擎實現(xiàn)統(tǒng)一管理結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),真正實現(xiàn)了多系統(tǒng)之間的數(shù)據(jù)共享。在為上層應用提供事務處理、聯(lián)機分析等不同類型服務的過程中,實現(xiàn)實時采集和分析數(shù)據(jù),如圖1 所示。圖1 中,ETL(extract transformation load)為抽取、轉(zhuǎn)換、裝載。在各級自然資源信息化建設實踐中,國土空間基礎信息平臺成為各類現(xiàn)狀、規(guī)劃、管理、管控數(shù)據(jù)匯集和共享的核心[5],依托其數(shù)據(jù)中臺作用,能夠有效完成政府內(nèi)部數(shù)據(jù)的采集治理。在各類企業(yè)應用中,數(shù)據(jù)中臺的建設和應用實現(xiàn)了企業(yè)數(shù)據(jù)的采集治理與共享服務。

圖1 數(shù)據(jù)倉庫、數(shù)據(jù)湖和數(shù)據(jù)中臺架構(gòu)的演變
1.1.3 基于眾包的采集技術(shù)
工程測量、航空攝影、衛(wèi)星遙感等傳統(tǒng)的時空數(shù)據(jù)采集方法具有采集精度高、可靠性強等特點,但是也存在工程耗時長、成本高等不足。隨著互聯(lián)網(wǎng)的全民普及和智能終端技術(shù)的快速發(fā)展,眾包采集模式具有較好的規(guī)模效應,不受地域空間限制,在興趣點(point of interest,POI)、空氣質(zhì)量、電子地圖等空間數(shù)據(jù)采集方面的應用日益廣泛。眾包采集是指將傳統(tǒng)上內(nèi)部員工或外部承包商所做的數(shù)據(jù)采集工作外包給一些沒有清晰界限的個人或群體的模式。在技術(shù)上,眾包數(shù)據(jù)采集需要建立眾包數(shù)據(jù)采集系統(tǒng),實現(xiàn)任務的管理和推送、數(shù)據(jù)的采集和上報、數(shù)據(jù)質(zhì)量控制和檢查等功能。
1.1.4 基于人類行為的采集技術(shù)
人們參與各種經(jīng)濟社會活動,時刻處于國土空間的運動之中,不斷產(chǎn)生大量的時空信息。如果這些運動能夠被實時準確記錄,將為人類活動數(shù)據(jù)采集提供一種新的途徑。一種新的理念認為,人類自身作為傳感器,可以通過有意或無意的人類活動采集數(shù)據(jù)[6],如人們使用社交軟件或手機導航服務時發(fā)布和產(chǎn)生的數(shù)據(jù)。從人與傳感器關(guān)系的角度看,人類行為的采集技術(shù)可以分為傳統(tǒng)傳感測量、被動人群感知和參與式感知。
(1)傳統(tǒng)傳感測量通過人工安裝在環(huán)境中的傳感器收集數(shù)據(jù),例如,道路上設置的車輛檢測傳感器采集交通流量。
(2)被動人群感知指利用現(xiàn)有基礎設施在無主動意識的情況下采集數(shù)據(jù),例如,手機通信過程采集的位置信令。
(3)參與式感知則帶有主動采集數(shù)據(jù)的意愿,積極獲取周圍信息,貢獻自己的數(shù)據(jù)。
基于人類行為的采集技術(shù)雖然在一定程度上為國土空間大數(shù)據(jù)的獲取帶來便利,但是也存在隱私數(shù)據(jù)安全問題、樣本缺乏控制或分布不均衡、噪聲較多、隱性知識難以發(fā)現(xiàn)等方面的挑戰(zhàn),需要在數(shù)據(jù)處理和挖掘等方面深入研究。
1.1.5 基于權(quán)籍數(shù)據(jù)的采集技術(shù)
權(quán)籍是反映資源或財產(chǎn)的權(quán)屬、位置、數(shù)量、質(zhì)量和用途等基本狀況的檔案,包括地籍、不動產(chǎn)權(quán)、礦業(yè)權(quán)等[7]。權(quán)籍數(shù)據(jù)采集通過運用各種測量方法和手段明確其位置、大小、權(quán)屬界址點等。傳統(tǒng)的權(quán)籍調(diào)查主要通過全站儀、水準儀等測繪儀器進行數(shù)據(jù)采集,人工實地測量工作量大、作業(yè)效率低、調(diào)查成本高。隨著信息化測繪技術(shù)裝備的發(fā)展,傾斜攝影、激光雷達等技術(shù)逐步被應用到權(quán)籍測繪中,同時配合無人機、手持和車載等平臺,能夠提高外業(yè)生產(chǎn)效率,適合大面積權(quán)籍數(shù)據(jù)采集。另外,通過無人機傾斜攝影測量等手段,還可以實現(xiàn)權(quán)籍對象的三維立體數(shù)據(jù)采集,以適應數(shù)字孿生時代權(quán)籍信息化的管理需求。
空間數(shù)據(jù)庫是物理存儲介質(zhì)上應用相關(guān)的地理空間數(shù)據(jù)總和。傳統(tǒng)的空間數(shù)據(jù)庫主要基于關(guān)系型數(shù)據(jù)庫,對簡單數(shù)據(jù)類型進行空間化擴展,并對空間數(shù)據(jù)存儲、查詢、索引等進行優(yōu)化,例如,Post GIS 基于開源對象關(guān)系數(shù)據(jù)庫管理系統(tǒng)(PostgreSQL)進行擴展,Oracle Spatial 基于甲骨文(Oracle)數(shù)據(jù)庫進行擴展。國土空間大數(shù)據(jù)的多源異構(gòu)、多模態(tài)、時空立體等特點使得傳統(tǒng)的空間數(shù)據(jù)存儲和管理模式已經(jīng)無法滿足其處理需求。例如,傳統(tǒng)關(guān)系型數(shù)據(jù)庫受強關(guān)系模式的設計限制,在擴展性、并發(fā)控制等方面遇到瓶頸,以靜態(tài)數(shù)據(jù)為主的存儲方式難以適應大數(shù)據(jù)流質(zhì)性帶來的挑戰(zhàn)[8]。
各種非結(jié)構(gòu)化查詢語言(not only structured query language,NoSQL)數(shù)據(jù)庫的出現(xiàn),為解決國土空間大數(shù)據(jù)的存儲問題提供了新的機遇。NoSQL 數(shù)據(jù)庫以鍵/值、列族、文檔等非關(guān)系模式為基礎,沒有固定的表結(jié)構(gòu),突破數(shù)據(jù)庫原子性-一致 性-隔離性-持久性(atomicity-consistencyisolation-durability,ACID)的約束,具有靈活的水平擴展性,支持海量數(shù)據(jù)存儲。基于NoSQL 數(shù)據(jù)庫擴展實現(xiàn)空間數(shù)據(jù)管理功能,借助分布式計算框架提高空間數(shù)據(jù)計算性能成為研究熱點。
1.2.1 存儲引擎
針對非結(jié)構(gòu)化、大單體的空間大數(shù)據(jù)特點,空間大數(shù)據(jù)存儲引擎將數(shù)據(jù)按照一定規(guī)則進行切分,將其存儲到集群中的節(jié)點,實現(xiàn)分布式的讀寫功能,目前主流的實現(xiàn)方式包括如下3 種。
(1)分布式關(guān)系型數(shù)據(jù)庫如阿里云云原生關(guān)系型數(shù)據(jù)庫PolarDB,在單機關(guān)系型數(shù)據(jù)庫基礎上進行分布式擴展,將多臺物理機資源組織起來,整體作為一個數(shù)據(jù)庫為應用提供服務,實現(xiàn)高并發(fā)場景下計算、存儲、網(wǎng)絡壓力在物理機之間均衡。
(2)分布式文檔型數(shù)據(jù)庫如MongoDB,可以將地理空間數(shù)據(jù)存儲為GeoJSON 對象或傳統(tǒng)坐標對,再以BSON(類似JSON)作為數(shù)據(jù)模型,通過B 樹索引將數(shù)據(jù)組織到多個邏輯容器,提供高可用、高可靠、彈性伸縮和自動故障轉(zhuǎn)移的數(shù)據(jù)庫服務。
(3)分布式文件系統(tǒng)如Hadoop 分布式文件系統(tǒng)(Hadoop distributed file system,HDFS),是一種經(jīng)典的大數(shù)據(jù)存儲引擎,將大文件分成若干大小相同的塊(默認為64 MB),作為獨立的單元以多副本的形式存儲到集群中的節(jié)點,并實現(xiàn)高可用、高吞吐的數(shù)據(jù)存儲。但由于其缺少對于空間數(shù)據(jù)模型、空間索引、空間查詢等的支持,需要用戶自行實現(xiàn)相關(guān)功能。
1.2.2 空間數(shù)據(jù)索引
空間數(shù)據(jù)索引是從空間數(shù)據(jù)庫中獲得數(shù)據(jù)的有效方法,可以快速訪問一條或一組特定查詢的數(shù)據(jù),無需遍歷整個數(shù)據(jù)庫。常見的空間數(shù)據(jù)索引實現(xiàn)思路包括空間映射方法和空間分割方法等。由于空間索引的實現(xiàn)與其使用的空間存儲引擎直接相關(guān),不同的大數(shù)據(jù)存儲引擎需要相應實現(xiàn)。例如,Spatial Hadoop 建立在Hadoop 分布式文件系統(tǒng)之上,使用MapReduce 計算引擎的空間擴展,建立了較完整的索引和訪問功能,包括空間高級語言、兩級空間索引結(jié)構(gòu)、基本空間組件和范圍查詢、k 近鄰查詢(k-nearest neighbor query,KNN)工具等。
時空立方體是二維空間運動在時間維度上的當然擴展,是由二維的空間坐標系(X軸和Y軸)和一個時間維度(Z軸)組成的三維立方體,時間維度以離散或連續(xù)的形式表示。時空立方體可以按照時間或空間維度進行切片,最小的每個立方體被稱為條柱。按時間維度切片后形成一系列時間片,按空間維度切片后形成條柱時間序列,如圖2 所示。時空立方體模型為國土空間大數(shù)據(jù)的表達提供了理論基礎,為開展新興時空熱點分析、局部異常值分析和時間序列聚類等時空模式挖掘提供了新的工具。

圖2 時空立方體模型
當前,時空變化的展現(xiàn)和表達主要以文字、報表、圖片、地圖等單一形式為主,導致人們對時空變化過程的分析限于局部、表面,難以獲得全局和深層的時空信息認知。時空變化動態(tài)可視化技術(shù)在傳統(tǒng)的靜態(tài)視覺變量表示基礎上,綜合運用動態(tài)的表示符號和表示方法,對事物的發(fā)展演化過程進行展現(xiàn)和表達[9]。從時間動態(tài)角度看,對自然資源總量、結(jié)構(gòu)等方面發(fā)展變化進行動態(tài)分析,桑基圖提供了一種對時序數(shù)據(jù)流動方向、數(shù)量和結(jié)構(gòu)變化關(guān)系的可視化表達。例如,根據(jù)年度國土變更調(diào)查結(jié)果,基于桑基圖的變化路徑可視化能夠分析兩個年度地類之間的轉(zhuǎn)換變化關(guān)系。從空間動態(tài)角度看,可視化技術(shù)從二維向二三維一體化升級,需要重新搭建以三維(three dimensions,3D)數(shù)據(jù)模型為基礎的顯示引擎,并借助圖形顯卡的計算能力解決國土空間大數(shù)據(jù)場景下海量數(shù)據(jù)加載、圖形場景計算、顯示特效渲染等方面的技術(shù)瓶頸。
混合現(xiàn)實(mixed reality,MR)技術(shù),是在虛擬現(xiàn)實(Virtual Reality,VR)和虛擬增強(Augmented Reality,AR)技術(shù)融合基礎上的最新發(fā)展,將虛擬世界和真實世界合成一個無縫銜接的虛實融合世界,核心保證物理實體和數(shù)字對象滿足真實的三維投影關(guān)系,實現(xiàn)“實幻交織”,用戶難以分辨真實世界與虛擬世界的邊界[10],如圖3 所示。MR 技術(shù)本質(zhì)上是一種更加自然、高效的人機交互方式,涉及用戶界面形態(tài)、交互對象注冊跟蹤、動作手勢識別、3D 交互、觸覺反饋、眼動跟蹤等一系列關(guān)鍵技術(shù)。同時,受交互技術(shù)、界面范式、社會認可等方面的約束,能夠更加真實地虛擬表達自然資源現(xiàn)狀,開展基于遠程MR 交互的資源評估、交易和開發(fā)利用活動,全面拓展資源流通和管理的時空限制,促進自然資源全面節(jié)約和高效利用。

圖3 MR 與AR、VR 和真實世界之間的關(guān)系
時空變化過程是生態(tài)與環(huán)境、社會經(jīng)濟和地理系統(tǒng)的基本運動形式之一[11],自然資源管理中的很多問題都可以利用時空變化過程進行描述和建模,如土地利用變化、人口遷移、空間格局改變等。受自然地理、氣候條件、經(jīng)濟社會等多種因素共同作用,準確理解和刻畫時空變化過程非常困難,需要針對性的分析技術(shù)。從驅(qū)動機理角度看,時空變化過程可以分為以下兩種情況:
(1)對于確定性的變化過程,相關(guān)研究可以基于相對確定的作用機理,運用基于數(shù)據(jù)的時空過程因子識別、多元線性回歸、空間連接檢驗、莫蘭(Moran)散點圖等方法,分析變化過程的影響因素及其相互作用。
(2)對于尚無明確作用機理的變化過程,可以通過空間相互作用、空間分形、空間元胞自動機、隨機過程等方法建立時空仿真模型,并結(jié)合地理信息系統(tǒng)(geographic information system,GIS)對時空變化過程和結(jié)果進行分析。
由于時空信息具有復雜性和隱含性,深層的時空知識往往難以被簡單發(fā)現(xiàn)。智能挖掘技術(shù)從海量、多維、高噪聲和非線性等特性的時空數(shù)據(jù)中提取潛在隱含、事先不知道但又潛在有用的信息及知識,包括時空模式發(fā)現(xiàn)、時空聚類、時空異常檢測、時空預測、時空分類、時空推理等[12]。時空模式發(fā)現(xiàn)需要找出隱藏在大型時空數(shù)據(jù)集中的有意義時空聯(lián)系,包括頻繁模式、周期模式、共現(xiàn)模式、關(guān)聯(lián)模式等,例如,通過手機信令數(shù)據(jù)分析群體的通勤出行規(guī)律。時空聚類根據(jù)數(shù)據(jù)在空間、時間和屬性上的相似度將其劃分到不同的分組,使得組內(nèi)相似性盡量大、組間相似性盡量小,例如,通過分析臺風活動數(shù)據(jù)對其類型和影響進行評估,輔助預測臺風運動特征。
深度學習又稱表征學習,是一種研究信息最佳表示和獲取方法的技術(shù),是在神經(jīng)網(wǎng)絡或信念網(wǎng)絡的情況下對基于深層結(jié)構(gòu)或網(wǎng)絡表示的輸入輸出間映射進行機器學習的過程。從信息表達的概念看,深度學習可以根據(jù)特定任務的需要,將高維數(shù)據(jù)中蘊含的信息進行極限壓縮。例如,在圖片分類任務下,卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN)、圖神經(jīng)網(wǎng)絡(graph neural networks,GNN)等深度學習模型,可以將包含幾千萬個像素的圖片信息壓縮為若干個類別標簽。
在地理空間領(lǐng)域,特別是遙感方面,很多應用問題都可以在計算機視覺方面找到與之對應的深度學習方案,如土地利用分類(語義分割)、森林砍伐和洪水監(jiān)測(變化檢測)、冰川流動(像素跟蹤)、颶風跟蹤和強度估計(回歸)以及建筑和道路檢測(對象檢測、實例分割)等。與傳統(tǒng)的深度學習相比,遙感影像通道數(shù)多、存儲容量大,并經(jīng)常會進行數(shù)據(jù)的擴充和光譜指數(shù)的轉(zhuǎn)化[13],因此地理空間深度學習需要考慮多波段、大尺寸、多影響因素條件下的深度學習問題,并且將經(jīng)典的遙感統(tǒng)計方法和知識與計算視覺領(lǐng)域深度學習技術(shù)進行融合,開辟地理空間深度學習的技術(shù)體系;需要考慮構(gòu)建標準化的地理空間樣本數(shù)據(jù)集和模型評測基線,方便模型重現(xiàn)和性能比較;還需考慮如何以自監(jiān)督學習的范式,在大數(shù)據(jù)樣本集上構(gòu)建遷移性較強的預訓練模型,實現(xiàn)跨圖像模式(光學、合成孔徑雷達、多光譜)、跨衛(wèi)星平臺等的學習能力。
自然資源“一張圖”建設是《自然資源部信息化建設總體方案》中確定的主要任務之一,要求按照統(tǒng)一的標準,形成地上地下、陸海相連、集成融合、可持續(xù)更新的自然資源三維立體“一張圖”大數(shù)據(jù)體系[14]。“一張圖”的概念由來已久,它是為滿足自然資源參與宏觀調(diào)控、資源監(jiān)管、形勢分析、輔助決策支持和社會化信息服務提供數(shù)據(jù)支撐所必要的政策、機制、數(shù)據(jù)及其管理、技術(shù)、標準、應用、基礎和服務的總和[15],在建設用地等各類審批中作為空間合規(guī)性輔助審查的重要依據(jù)[16]。“一張圖”為國土空間規(guī)劃編制和監(jiān)督實施提供信息服務,在此基礎上開展資源環(huán)境承載能力和國土空間開發(fā)適宜性“雙評價”,并為自然資源決策支持提供基礎數(shù)據(jù)支撐。
在建立“五級三類”國土空間規(guī)劃體系的過程中,將大數(shù)據(jù)和空間智能技術(shù)交叉融合,構(gòu)建國土空間規(guī)劃機器人,是提高國土空間規(guī)劃編制、審批、實施監(jiān)督等環(huán)節(jié)智能化服務水平的關(guān)鍵。規(guī)劃編制環(huán)節(jié)在“統(tǒng)一底圖、統(tǒng)一標準、統(tǒng)一規(guī)劃和統(tǒng)一平臺”的國土空間規(guī)劃“一張圖”系統(tǒng)基礎上,通過GIS 與系統(tǒng)動力學(system dynamics,SD)模型、元胞自動機(cellular automate,CA)模型及基于智能體建模(agent-based modeling,ABM)的整合集成,構(gòu)建基于時空動力學的復雜系統(tǒng)仿真模型[17],實現(xiàn)規(guī)劃問題的自動識別、規(guī)劃方案的智能生成、規(guī)劃效果的高精度模擬仿真。規(guī)劃審批環(huán)節(jié)利用計算機自動實現(xiàn)設計條件提取、建筑規(guī)劃方案“圖審”等智能審批工具,提高用地規(guī)劃審查等審批效率。面向規(guī)劃社會服務,國土空間大數(shù)據(jù)通過互聯(lián)網(wǎng)為開發(fā)單位提供智能規(guī)劃選址工具,提升全社會土地資源利用效率。此外,國土空間規(guī)劃機器人的構(gòu)建還需要突破語音識別、語義檢索、智能問答、規(guī)劃知識圖譜等一系列人機交互和人工智能技術(shù)難點。
針對城市發(fā)展過程中面臨的“大城市病”問題,新的國土空間規(guī)劃體系提出“健全規(guī)劃實時監(jiān)測、定期評估、動態(tài)維護制度,建立城市體檢評估機制”的要求,并在北京、上海等12 個城市試點開展城市實時體檢評估。城市體檢是指針對城市發(fā)展過程中一系列社會管理和公共服務問題進行現(xiàn)狀分析與評價[18]。從數(shù)據(jù)可獲取性角度看,國土空間大數(shù)據(jù)為城市體檢提供了豐富的數(shù)據(jù)基礎,城市中廣泛分布的各類主動和被動式傳感器為全面感知人類活動與城市之間的關(guān)系提供數(shù)據(jù)。從信息傳導角度看,城市體檢工作涉及數(shù)據(jù)的采集與存儲、分析與挖掘、表達與可視化等技術(shù),需要國土空間大數(shù)據(jù)全過程的技術(shù)支撐。
中國提出2030 年“碳達峰”與2060 年“碳中和”(以下簡稱“雙碳”)的目標,實現(xiàn)這一目標既要關(guān)注數(shù)量的變化,也要關(guān)注空間格局的變化,建立碳中和的國土空間格局就是實現(xiàn)這一目標的關(guān)鍵。相關(guān)研究運用國土空間大數(shù)據(jù)技術(shù),建立土地利用時空動力學模型,實現(xiàn)土地利用與碳排放和碳匯之間的時空耦合分析[19]。在碳源部分,測算土地利用中土地利用類型變化所產(chǎn)生的碳排放情況,得到土地利用類型變化與“雙碳”目標的相關(guān)聯(lián)系。在碳匯方面,測算綠地、耕地、園地、水面等產(chǎn)生碳匯的土地利用類型的碳匯系數(shù)。通過細分碳源、碳匯用地類型,建立碳排放計算方法與相關(guān)系數(shù),對未來中國碳排放進行定量耦合計算。可以通過國土空間開發(fā)利用碳足跡跟蹤,分析評估國土空間規(guī)劃多政策情景下土地利用變化結(jié)果對中國“雙碳”目標的影響。
中國是世界上地質(zhì)災害威脅最嚴重的國家之一,地質(zhì)災害分布廣、危害大。建立服務于長期部署、中期防范和短期應對的地質(zhì)災害預測、預報、預警工作機制是自然資源部門的重要職責。國土空間大數(shù)據(jù)是地質(zhì)災害“技防”的重要支撐手段,利用合成孔徑雷達干涉(interferometric synthetic aperture radar,InSAR)技術(shù)和激光雷達(light detection and ranging,LiDAR)技術(shù)實現(xiàn)對地球表面毫米級位移的全天候全天時監(jiān)測,通過構(gòu)建“天空地”一體化的多源立體觀測體系對潛在的重大地質(zhì)災害隱患進行早期識別,針對性排查潛在的地質(zhì)災害隱患[20]。結(jié)合全球衛(wèi)星導航系統(tǒng)(global navigation satellite system,GNSS)、裂縫計、雨量計等地面?zhèn)鞲衅骱推麦w內(nèi)部傳感器,對發(fā)現(xiàn)的隱患點進行精準密集監(jiān)測,通過位移、應力等監(jiān)測指標及時準確預警,提前采取轉(zhuǎn)移或加固等措施,有效降低地質(zhì)災害造成的損失。
自然資源工作區(qū)別于其他行業(yè)的一個重要特點就是其管理對象的空間化,建立空間思維、掌握空間狀況、保障空間底線、協(xié)調(diào)空間關(guān)系、提高空間效率、打造空間品質(zhì)是實現(xiàn)國土空間高質(zhì)量發(fā)展的必然要求。國土空間大數(shù)據(jù)技術(shù)的發(fā)展和進步為有效應對國土空間面臨的問題和挑戰(zhàn)提供了前所未有的機遇。人們每時每刻都產(chǎn)生并為社會貢獻海量數(shù)據(jù),同時也享受著通過數(shù)據(jù)的真知灼見帶來的生活便利,政府部門也在努力利用這些數(shù)據(jù)優(yōu)化公共政策。
在數(shù)據(jù)采集獲取方面,傳感器小型化、輕量化成為不可阻擋的趨勢。目前,測繪人員可以使用手機的激光雷達開展室內(nèi)測繪;智能汽車通過安裝更多的激光雷達,應對更加復雜的自動駕駛場景。
在數(shù)據(jù)表達建模方面,國土信息模型(territorial information model,TIM)、建 筑信息模型(building information model,BIM)加速融合,元宇宙(Metaverse)的概念已經(jīng)被社會認同,數(shù)字孿生也不再是靜態(tài)的3D 模型或?qū)ξ锢硎澜鐔误w的獨立映射,而是對物理對象、資產(chǎn)或系統(tǒng)進行動態(tài)、持續(xù)更新地表達,這就需要多傳感器的實時數(shù)據(jù)源輸入,通過數(shù)字世界和物理世界之間的聯(lián)系為管理和決策提供更科學的判斷和預測。
在數(shù)據(jù)分析挖掘方面,人工智能空間分析未來還將加速演進,并且?guī)韲量臻g大數(shù)據(jù)、大模型、大算力等方面能力的持續(xù)提升。目前,空間分析和挖掘模型大都以機器執(zhí)行固定的計算邏輯為主,并沒有真正實現(xiàn)空間知識的深度表達和底層編碼表示,跨尺度、跨任務、跨數(shù)據(jù)類型且具有良好遷移和泛化性能的地理系統(tǒng)基本模型還有待研究。