駱劍承, 吳田軍, 胡曉東, 李曼嘉,趙 馨, 陸炫之, 吳小波
(1. 中國科學院 空天信息創新研究院 遙感科學國家重點實驗室, 北京 100101; 2. 中國科學院大學 資源與環境學院, 北京 100049;3. 長安大學 理學院, 陜西 西安 710064; 4. 浙江科技學院 信息與電子工程學院, 浙江 杭州 310023;5. 貴州師范大學 喀斯特研究院/地理與環境科學學院, 貴州 貴陽 550001; 6. 四川農業大學 資源學院, 四川 成都 625099)
進入“十四五”以來,我國經濟已由高速增長階段轉向高質量發展階段,調整發展方式、優化經濟結構、轉換增長動力已成為新時代主題[1].推動高質量發展,既是遵循經濟規律實現可持續增長的內在要求,又是解決社會矛盾的根本途徑.數據作為信息時代的核心要素,是理論創新和科技突破的重要工具,加快數字經濟領域的技術創新和成果轉化,促使新產品、新服務、新業態的出現,是實現高質量發展的關鍵引擎.為此,近年來,以大數據為核心的“數字中國”“數字經濟”“數字政府”等建設工程方興未艾,在推動社會經濟從高速發展轉向高質量發展過程中正煥發著強大的蓬勃生機,為重組我國產業體系新架構、加快產業數字化轉型升級起到了積極作用[2].正因為如此,如何充分發揮大數據的基礎資源作用和創新引擎效用,對于經濟發展的新舊動能轉換,驅動生產、生活和生態治理方式的全面深入變革具有重要的戰略意義.
伴隨國家大力推動數字化建設的時代機遇,高質量的大數據產品及相關服務需求應運而生,一系列服務國家和省市地方經濟社會發展的大數據產品不斷涌現且取得了價值持續提升的應用成效.然而,縱觀當前的數字化服務,尚存在一定局限,主要表現在:1) 數據缺乏一致性和統一基準,缺乏實現信息對齊的高效技術和大型所見即所得的軟件平臺,造成“數據煙囪”和“信息孤島”現象仍較為普遍;2) 低劣數據混雜,對數據資源的挖掘利用浮于表面,造成數據利用效率低,構建的應用系統脆弱而缺乏生命力[3-4].究其緣由,一個重要的原因是諸多工作缺乏時空觀視域下對事物發生現象、本質規律以及各類觀測數據的統一理解.事實上,“時空”具有刻畫地表的唯一性,是對多源多模態發生數據進行融合處理和關聯分析的結構化基準,時空型大數據及其衍生的信息資源天然是各行業管理和社會經濟發展的基礎性、戰略性生產要素,對于開展數字化經濟建設與治理、提升管理現代化水平至關重要[5].“十四五”以來,面向經濟領域數字化建設需求,加強時空信息平臺建設的重要性和迫切性不斷提升.例如,在農業農村建設方面,國家針對糧食安全、鄉村振興方面的戰略要求,陸續提出精細化、智能化監測監管的需求,以時空大數據為基礎的數字化農業建設成為實現農業現代化的必經之路,數字鄉村建設正成為中國農村經濟變革的新方向,它們的落地必將大力帶動農業農村的高質量發展.因此,時空數據支撐下的數字化信息技術必將是當前做大、做強、做優數字經濟的重要依托,以“時空”為典型特征的地理信息產業服務也必會為數字經濟賦能我國高質量發展發揮關鍵支撐作用[6].
鑒于此,我們聚焦數字經濟時代的形勢背景,錨定時空大數據賦能數字化建設的目標,開展地理時空智能計算理論和應用模式的研究,以期充分發揮大數據驅動高質量發展的“時空”價值,助力政府加快形成精細、智能、科學的現代化治理能力,同時為市場與社會提供精準化的信息服務支撐.從該立足出發,本文在既有時空大數據智能計算研究基礎上,提出面向數字經濟的“地理時空數字化底座”(geographic spatiotemporal digital base,GST-DB,簡稱為“時空數字底座”或“底座”)概念,旨在以時空大數據為驅動力解構社會經濟事物發生演進的真實世界,利用多模態觀測數據發掘流動性時空價值,在時序流動中實現重組與再生,在空間流動中調整結構與配置,在人際流動中進行多方演化與博弈,最終通過“空間—時間—屬性”維度的分層解構、綜合優化與精準決策,為高質量發展實施途徑的選擇及其評估提供理論方法支持.
基于上述研究背景與需求,本文針對時空大數據計算進行發展動態的綜述,重點圍繞大數據位置發現、時空信息融合以及關聯分析3個方面,闡釋“時空”對于大數據結構化智能分析的作用與挑戰.
1.1 多源大數據位置發現自20世紀60年代以來,伴隨著“數字地球”“智慧地球”概念的提出,以解決空間信息獲取、處理、應用與服務為核心的“空天地一體化對地觀測網絡”逐步形成[7-8].在數據精準化、處理智能化、信息數字化等現實需求的驅動下,現代對地觀測逐步發展成為全球覆蓋、全天候檢測、全要素觀測的大系統[9],多源遙感平臺與地面觀測網所產生的對地觀測大數據不斷積累.與此同時,得益于互聯網與移動通訊技術的發展,社交性大數據也積水成淵.兩大類數據共同促進了時空大數據的快速發展,描繪了地表要素和人的行為在時間、空間和屬性等方面的內容,加速了對時空格局和人地關系的理解[10].
位置是時空數據的核心特點,各類數據以位置作為空間框架對地理要素和人的行為進行表達.因此,數據位置的確定是多源時空數據聚合的基準和前提.但傳統時空數據位置的確定多關注數據本身的三維坐標卻忽略其與地理對象的關系,從而導致數據之間關聯分析的困境[11].對此,學者們將研究空間位置的基本單元逐漸從“規則像元”或“行政單元”“流域單元”過渡到各精細的“空間對象”[12],并嘗試引入分區分層思想[13]以及位空間[10]、知識圖譜[14]、地理圖斑[15-16]等概念,以促進多源數據的位置發現與匹配.然而,廣泛的數據來源、多樣的表達方式、多重的觀測尺度以及密集的采樣頻率,極大地限制了數據應用的深度與廣度[17-18],如何形成具象化、多層級、可伸縮的位置空間,是當前多源時空大數據應用朝精準、定量、可解釋方向發展的重難點.
1.2 多模態時空信息聚合單源觀測的信息量局限以及時空大數據的海量擴增,對多源多模態數據的有效聚合提出了更高要求[19].如何從龐雜的海量數據中抽取其中的有效部分,并將其聚合至統一的時空框架內,以全面表征研究對象的多維屬性和動態特征,成為剖析各類人地現象及過程的必要環節.數據聚合以時空位置、地表實體等為線索,圍繞分析目標和應用需求將多源數據映射至同一研究對象[11],因而數據與對象間的時空關系是結構化聚合的基本依據.常見的數據融合方式多以規則化的像元或網格為基本單元,經分辨率/比例尺標準化處理后相互堆疊,以實現基元在時空域或屬性域的信息擴展[20-22].但多源數據采集機制不同、時空范圍各異,難以實現無損對齊,且尺度的轉換及疊加過程必定伴隨觀測數據真實性、語義完整性的削弱;同時,由于規則化基元并不與地表實體對應,難以精準匹配針對人地觀測的點、線、面離散數據.因此,面對多源多模態的時空大數據,如何通過對復雜地表的逐層解構,在不同尺度識別內部均質、真實有效的空間單元,構建穩定的時空基準框架,至關重要.進一步,以此為容器,充分考慮各類數據在表達方式、覆蓋范圍、波動速率,以及空間單元自身環境屬性等方面的差異,針對性地發展時空尺度轉換、地統計、機器學習等方法,實現數據的結構化嵌入與協同計算[23-24].
1.3 多粒度關聯關系分析多模態數據從不同角度描繪了地理實體的時空特征,之于地理場景的聚合之后初步實現了對地表要素和人行為的結構化表達與發展過程還原.在此基礎上,通過關聯分析識別對象的時空演進過程及對象、屬性之間的依賴關系,實現由具體數據至時空格局、人地關系綜合性結論、知識的跨越.因此,由對空間單元的簡單描述轉向模式挖掘[25]、規律認知[26]乃至發展預測等關聯分析階段,是大數據時空計算的關鍵.關聯分析通常聚焦以下2個方面[10]:1) 時空關系挖掘.強調不同參量在數據集上呈現的函數關系,常見的如考慮時空特性的地理加權回歸模型[27]、考慮非線性相關關系的隨機森林機器學習模型[28].2) 時空模式分析.強調對象時空演進機制或對象與環境之間的依賴關系,如評估地理實體或過程分布模式的聚類分析[29]、格局分析[30],度量空間異質性的地理探測器[31]等.
有別于傳統以像元為基本單位或尺度固定的分析方式,大數據時代的多源數據模態互異,時空粒度、密度、廣度各有不同[10],變量統計指標及其交互關系存在顯著的尺度依賴性[32],且分析的時空范圍隨需求波動,聚焦的時空對象粒度不一,進而決定了面向大數據的關聯分析任務具備顯著的多粒度特性.隨之,關聯分析過程亟需包括以下必不可少的計算環節:研究問題及數據的逐級解構、多粒度模式挖掘,以及系統性融合策略指導下的全局模式識別[33].其中的關鍵問題在于粒度的合理選取,以實現數據驅動下關聯模式的最優表達和挖掘,避免虛假模式,揭示內蘊關系[34].時空位置作為信息關聯的關鍵紐帶,對地理空間的多層次抽象表達是粒度轉換的有效依據.因此,對地理對象而言,時空框架提供了多粒度分析的基準,由于其構建過程遵循自頂向下的解構機制,能夠在不同粒度構建與實際地表自然呈現或社會管理相對應的抽象單元;對特征參量而言,該框架能夠容納多源多模態數據,支持其協同計算和聯合分析[24],并在粒度轉換過程中,實現地學規律指導下的高質量數據關聯對齊與關系挖掘[35],進而實現分析粒度的靈活轉換,以及分析結論綜合性、關系普適性、區域特殊性的合理權衡.
鑒于當前數字化發展的現實需求以及時空大數據智能計算的發展動態,本文提出“地理時空數字化底座”GST-DB的概念模型,是指采用大數據、人工智能、GIS等技術,以地理實體為基礎打造可表達、可計算、可應用的精準化數據生產平臺,具備多模態觀測數據的高效承載與關聯分析能力,可面向創新場景應用提供二維/三維一體化、動態/靜態一體化的地理時空信息服務,支撐社會經濟建設、管理、運行、決策等環節所需的“多、快、好、省”智慧化應用.
底座的概念示意如圖1所示,核心就是要從“格”“局”兩方面構建一套具象化的地理知識圖譜模型:一方面,對于相對穩定的地表空間(狀態,類比喻之“棋盤”“鐵打的營盤”),以地理圖斑(geo-parcel,或地理對象geo-object)為基本表達單元,通過時空位置、地物形態、土地利用類型等信息獲取,形成穩定且與要素存在狀態時空異質契合的不規則形態表達單元,從而構建可定位、可量測、可表達的多粒度地理空間場景;另一方面,針對地表之上發生的內容(事勢,類比喻之“棋譜”“流水的兵”),以前述地理單元為底盤,開展土地覆蓋類型變化分析、指標/參數反演、質量/適宜性評價、價值精算、過程模擬、趨勢預測等應用,深度解析環境依存、相互作用、粒度包含、動力傳遞等關聯關系,從而構建具象化的地理知識圖譜(geo-knowledge graph, GKG),支撐社會經濟高質量發展所亟需的科學、高效、定量決策.

圖1 地理時空數字化底座的概念模型設計
對于如何打造時空數字底座,本文借鑒復雜問題求解的結構化處理范式,結合地理大數據的時空特性,在理論層面進一步設計了“空間(?;纸?+時間(重組—約束)+屬性(關聯—傳遞)”耦合的計算模型(如圖2所示),以期通過時空制圖(geographic spatiotemporal mapping)方式有序解構復雜地表、解析人地關系.具體過程是:1) ?;?在分區分層的地理學思想指導下,利用基礎地理數據和高分辨率遙感影像精細剖分地表空間,筑起多粒度多層級的空間對象網絡,形成穩固可靠的底座支架(空間信息圖,spatial information map).2) 重組.將水、光、熱、土等表征自然資源稟賦和生態環境本底,以及刻畫人類活動和地表變化過程的多源多模態觀測聚合于由統一空間對象撐起的底座支架之上,在多重知識約束下,以分譜、分時等方式重組數據,將多尺度連續場轉換為離散格,分級呈現空間對象的多維度自然與社會屬性,形成多元可信的譜序特征(特征信息譜,feature information spectrum).3) 關聯.利用底座支架空間對象承載的屬性信息,從空間、時間、屬性等維度挖掘關聯關系(如對象和環境依賴關系、對象和對象關系、對象聚合關系),基于底座位置、形態、結構構建時空視域下的地理知識圖譜,在其引導下面向領域需求進行時空制圖與行業應用,結合質量評價和動態驗證,形成交互可控的傳遞優化機制與服務提升措施.

圖2 “空間(粒化—分解)+時間(重組—約束)+屬性(關聯—傳遞)”耦合的地理時空智能計算模型
遵循上述計算邏輯,本文提出的時空數字底座能否被有力夯實并從中挖掘出流動性價值,根本上起決于時空制圖的精準性,而這有賴于以下2類計算方法的實施:1) 圖譜耦合是制備數字化底座并彰顯其“時空”優勢的重要抓手,圖的空間位置、形態和結構為地表發生數據的融合處理和關聯分析提供了結構化基準,在圖的邊界約束下重建各類譜序特征,能解決多源多模態數據難以匹配融合和高效關聯分析的問題,亦有助于彌補單源、單時數據表征的不足.2) 星地協同是打造時空數字底座兼具“三可”(可靠、可信、可控)特性的關鍵,“衛星(面)觀測的廣域空間覆蓋”與“地面(點)觀測的稀疏絕對量測”兩者互有長短,協同2類觀測開展由點及面的推測對改善模型可遷移性、提升時空制圖精準性有積極促進作用.
為此,我們為數字底座的構建進一步梳理了“地理推測系統—遙感探測星座—地面觀測網絡”(簡稱“三測”)閉環計算體系.以面向種植業的數字農業應用為例,說明如下(如圖3所示):1) 分解.從地理時空結構和農業生產模式出發,通過地理分區控制、地類分層感知等環節,按照“行政區—種植區—耕地區—種植地塊—像元”的多層結構,將農業生產地表空間有序地解構為形態可量測的最小種植地塊單元,進而在各個層級之上關聯政策引導、地形地貌、環境要素、調查統計、土地利用等信息以推測地塊中的作物類型、性狀、指標等參量(地理推測系統的可靠表達).2) 約束.協同長時序的多源遙感探測信號,構建地塊種植作物的波譜序列,并根據局部先驗物候開展分時段的譜序分析,確認推測結果的現狀匹配度,并根據不確定性分析制圖結果的置信度(遙感探測星座的可信計算).3) 傳遞.依據地塊制圖結果置信度的空間分布特征,動態有序下發地面調查驗證點開展驗證,通過關鍵的高信息量真值反饋來增強學習模型,迭代優化以逐步優化時空制圖結果(地面觀測網絡的可控優化).除農業應用外,其他諸如生態、城市等領域的應用,亦可遵循該流程構建可靠、可信、可控的時空數字化底座表達與智能計算過程.

圖3 以數字農業應用為案例的“三測”閉環計算體系
以農業應用為例,本文進一步探析地理時空數字底座的應用模式.相較于其他產業,農業產業單位面積價值密度低但全域總量高,因此,構建基于省級大區域時空底座的精準化數字應用場景具有推廣意義.對此,我們基于農業產業數字化底座提出“全域數字底座—數字孿生平臺—分級用戶服務”為應用架構,打造以政府、企業、消費者為服務步驟的數字農業平臺運營模式(圖4):1) 在應用架構方面,首先按照上節闡述的流程主動生產多層級、精細到每個農業生產單元(種植地塊)的數字化底座并持續更新;并同步搭建虛實交互的數字孿生基礎服務平臺,構建起“數據+軟件”一體化的應用支撐平臺;在此基礎上針對不同類型用戶的需求開展定制化服務.2) 在服務步驟方面,首先提供精準的政府農情服務,將時空底座與部門數據進行關聯和融合,建立領導信任的同時獲取政府信用背書;而后,維護起一套可信的精準農情數據,推動為大型企業和金融機構提供低成本、高效率的優質服務,進一步在底座上融合社會經濟運行信息;最終,設計與建立鏈接生產與消費兩端的運營服務平臺,實現“從地塊到餐桌”的消費模式革新.

圖4 農業產業數字化底座的平臺運營模式
如此運營模式下的農業產業數字化底座具有“精、準、快、穩、動、智”的優點,在服務內容上可以概括為“人、地、錢、事”四大類應用服務(如圖5所示):1) “人”側重于在明確地塊權屬后,開展地塊利用方式、使用狀況等的非農化、非糧化監測監管及量化評估,從而有依據地實施對人的獎勵(補貼)、懲罰(罰款)和對地的治理、利用.2) “地”強調在劃定的有限空間范圍和一定的價值目標約束下,對地塊的土地資源和外部投入或干預進行時空優化配置與精細規劃,使其產生更優的社會經濟效益.3) “錢”落實于金融領域,是在一定社會經濟相關指標協同下,對地塊的農產品產出價值進行資產核算,服務于信貸、保險等金融產品的精確計算.4) “事”發生在對農業生產變化態勢的動態預測上,通過耦合自然與社會實時發生的數據,準確預判事件的發生及未來事態的發展,如病蟲害、氣象災害、產量、期貨等關注內容的預警預判.除數字農業的應用領域外,生態價值評估與整合開發利用、城鎮增存量資源評價與優化利用等其他涉及三生空間的應用場景業務也完全可以構建于時空底座之上,有望促使原有的行業應用模式迭代升級.

圖5 面向農業產業的“人、地、錢、事”四大類數字化應用服務
以數據和信息技術為關鍵要素的數字經濟己經成為創新發展的時代潮流,是國家經濟轉型和高質量發展的必經之路.時空信息作為不可或缺的資源要素,是數字經濟時代推動傳統行業高質量發展的重要支撐.本文在時空觀視域下分析了時空大數據支撐高質量發展的潛在價值,闡釋了借力大數據智能計算技術生成精準化時空信息的重要性與迫切性,并從大數據位置發現、多模態信息融合、多粒度關聯分析等方面對當前的時空數據智能計算理論方法進行了進展綜述和動態分析,時空大數據位置感知、表達、聚合、挖掘等方面取得的諸多研究成果彰顯了“時空”對于大數據治理和場景化應用的積極促進作用.
在此基礎上,我們面向數字經濟的時代背景及其對精準時空信息的迫切需求,首次提出了地理時空數字化底座的概念,以期激活數據要素,構建一套具象化的知識圖譜,為數字經濟建設“夯實精細化底座,提升流動性價值”.針對時空底座的打造,本文還設計了“空間(粒化—分解)+時間(重組—約束)+屬性(關聯—傳遞)”耦合的計算模型,展示了其中“地理推測—遙感探測—地面觀測”協同的閉環計算體系,同時結合數字農業需求,厘清了平臺運營模式和“人、地、錢、事”四大類應用服務.農業應用的數字化實踐案例充分展示了時空底座“賦能實體經濟轉型升級”的潛力,未來可以進一步拓展能源、生態等領域的應用,結合行業需求豐富、細化本文提出的框架,形成助力高質量發展的新一代時空信息產品和普適化應用模式.在我國正大力推進數字產業化、產業數字化的緊迫歷程中,上述方面的工作亟待盡快實踐并落地推廣.