中圖分類號:TP393.028 文獻標志碼:A DOI:10.3969/j. issn.1673-3819.2025.05.008
Abstract:With therapid development of informationperception methods,thevolumeof multi-source heterogeneous data has increasedexplosively.Traditional methodsexhibitobviouslimitations inhanding inconsistent spatio-temporal scalesandinformationredundancy.Inthis paper,the principles of spatiotemporal grid codinganditsapplicationareintroducedandan innovativeunfied spatiotemporal gridbaseddataassociationanalysis method is proposed toconduceresearchonspatio-temporalinformationextraction,nifiedencodingandidentificationofspatio-temporal giddata,crossscalespati-temporaldata sharingand dynamic corelation analysis.Our method constructs aspatio-temporal grid framework forunified alignmentof heterogeneous multi-soucedataspatialcordinates,temporalbaselinesynchronization,andatributecorelation withbehaviors.Inadition,aspatio-temporal gridframeworkisconstructedtoalignspatialcoordinatesofmulti-source heterogeneous data,synchronize temporalbaseline,andcorrelateatributebehaviors.Theresultof simulationof typicallow-altitudeairspaceplanning for Unmanned Aerial Vehicles verifies thatour proposed method is enable to efectivelyenhance the managementandutilizationefciencyinclasification,integration,andcorrlationanalysisofmulti-source heterogeneous data.
Key words: spatio-temporal grid; cross-scale data sharing;dynamic correlation association
隨著信息感知手段與方式的快速發展,現有數據處理分析方法存在計算效率低、有效信息提取難等問題,難以滿足數據有效管理運用等需求。時空網格作為一種創新性的數據處理和分析方法,為時空數據關聯分析提供了全新的視角。本文通過將全球范圍統一網格剖分、要素統一編碼,實現時空網格數據統一標識,從空間角度實現跨尺度時空網格數據快速共享傳遞,從時間角度實現數據的動態關聯,支撐數據的快速高效管理運用,通過無人機(集群)低空空域規劃應用仿真驗證,證明了時空網格技術在數據處理與關聯分析的效率提升方面的有效性。
1 國內外研究現狀
美、英、澳等國積極探索時空網格技術的研究應用。美國DeepMind團隊發布的AlphaEarthFoundations模型,運用多模態數據融合與深度學習技術,把地球表面精細劃分為數萬億個精確到米級的網格,實現全球陸地與沿海水域網格化動態監測。此外,美國NASA開發的時空自適應分辨率編碼(STARE)技術,革新了地球科學數據處理,其獨特的時空索引機制能有效對齊不同來源的數據。英國的研究主要集中在氣候領域,如英國氣象局創建了HadUK-grid氣候數據集,涵蓋了英國各地 1km×1km 網格的氣候變量。此外,英國倫敦大學等高校組成的聯盟獲得了英國政府的資助,開展名為RealityGrid的項目,旨在利用網格技術進行復雜凝聚態物質結構的建模和模擬。澳大利亞的地球科學數據立方體(AGDC)能靈活處理大量分層網格數據,顯著減少傳統圖像分析的處理時間。
國內對于時空網格剖分編碼的研究也已有一定成果。大學程承旗教授等提出了GeoSOT網格剖分與統一編碼方法[1-3],該方法已廣泛應用于減災、公安、建筑、國土資源、軍事等多個領域。北斗網格碼以Geo-SOT地球空間剖分理論為基礎,已發展為一種離散化、多尺度區域的位置標識體系。阿里云的Ganos[4也是基于GeoSOT全球網格剖分理論。除此之外,國內地理網格標繪相關研究不斷深入,如國家“863”計劃提出了中國國家網格項目(CNGrid)。空間信息網格體系及網格GIS研究也取得了一些成果,并在武漢等城市的信息網格中得到應用。近年來,陳彬[5]等將時空網格運用于極端災害下配電網受災情況分析上,成果可有效協助配電網災后指揮及修復。基于時空網格的STGI模型[實現了海洋大數據的高效查詢,提升了數據檢索效率。郭星華[7等分析了時空網格在指揮控制系統中的應用前景,為新一代指揮信息系統的發展提供了思路。
2時空網格數據關聯分析方法
面向多源異構時空數據的關聯分析需求,基于時空網格方法實現對數據的統一標識、快速管控及高效運用,主要研究內容包括數據時空信息提取、時空網格數據統一標識、跨尺度時空網格數據共享傳遞、動態時空數據關聯分析等。
2.1 數據時空信息提取
時空網格技術在多源異構時空數據關聯分析方面的應用,首先需將數據的時空信息準確提取,按照數據的時間信息和空間信息將數據與時空網格進行綁定,使得數據等實體對應空間位置的數據能夠映射在相應的網格中,對應時間的數據能夠映射在相應的時間段內。多源異構時空數據的時空信息提取流程如圖1所示。
數據時空信息提取的主要內容包括:面向多源異構時空數據,設計實體識別規則,采用基于正則表達式與詞典的實體識別方法提取時空描述的關鍵詞及實體類型,收集訓練語料,構建正則規則庫,實現對數據的識別與實體標注;采用RNN/CNN的方法開展時間/空間序列的關系建模,識別時空網格數據間的關系,豐富其時空語義特征,支撐后續關系抽取與時空網格數據的實體識別的結合;利用時空網格數據的維度與屬性信息,基于時序和空間維度的事件關系,對時空網格數據的關聯關系與事件時序、因果關系進行提取,實現數據的時間信息提取及空間信息提取。當數據時空信息表征不明確時,可通過序列標注模型學習文本中的時間實體特征以實現復雜歧義表達的時間信息提取,學習空間位置的上下文特征來識別提取出非標準空間位置,從而實現復雜時空信息的提取。
圖1數據時空信息提取流程圖Fig.1Flowchartof dataspatio-temporalinformationextraction

2.2 時空網格數據統一標識
針對數據來源廣泛、數據量大等導致的計算空間爆炸的問題,利用時空網格編碼的方式,劃分多層級空間網格及離散時間序列,將對應地理位置/時間的數據與時空網格綁定,完成對數據的離散化時空統一標識。
時空網格技術通過對數據時空信息提取和及時空網格編碼規范設置,實現了數據與時空網格的綁定,數據按照對應的時間信息、空間信息被劃分在對應的網格中,具備唯一的二進制標識碼,有效提高數據的存儲、篩選及計算效率。時空網格數據統一標識概念描述如圖2所示。
(1)時間編碼
本文開展時間編碼,實現多源異構數據的時間信息統一表征,針對不同粒度的時間單位,采用多尺度時間剖分編碼的形式進行時間描述。時間編碼通過64位二進制編碼來存儲時間,編碼從高位到低位,依次存儲該時間的UTC年數、月數、日數、時數、分數、秒數、毫秒數、微秒數,實現數據時間的高效準確描述,為數據在時間角度的高效關聯分析提供支撐,具體如圖3所示。本方法保證了時間編碼具有單調遞增的性質,即時間的值越大(時間越晚),時間剖分編碼的值越大,確保同一個編碼值的只有唯一的時間對應。
(2)空間編碼
本文基于GeoSOT地球空間剖分理論開展空間編碼[8-9],考慮緯度范圍與經度范圍的大小不一致性,需將緯度方向進行擴展,使其與經度方向的跨度保持一致。通過四叉樹遞歸剖分法,將整個地球表面經緯方向全空間進行四等分,完成一級剖分,每個1級網格的經緯度范圍為 180°×90°";再將這四個子空間繼續剖分,劃分為四個更高級別的子空間,依次遞歸剖分,直至獲得最高層級(32級)的子空間,如圖4所示。對于第 N 0 (Ngt;2) 級剖分,其對應網格的經緯范圍為 (90°/2N-2)× 0 90°/2N-2")。空間網格在應用過程中與任務相關,由于不同人員的任務不同,關注的空間網格層級也有所不同。在空間剖分完成后,通過二進制編碼進行空間編碼,空間編碼能夠快速完成多源異構數據地理位置的統一表征,實現數據信息在地球中位置的準確描述,為數據在空間角度的高效關聯分析提供支撐。

圖4空間剖分編碼規則
Fig.4Encoding rules for spatial partitioning

2.3跨尺度時空網格數據共享傳遞
針對信息傳遞鏈路冗長導致信息傳遞時效性難以保證的問題,利用空間編碼將地球逐級進行精細化網格剖分,對應形成跨尺度網格間的從屬關系,如圖5所示,進而按照網格間從屬關系進行數據快速共享,打破現有數據傳遞逐級上報的鏈路壁壘,實現基于時空網格的數據開放共享傳遞。
跨尺度時空網格數據共享傳遞主要基于空間剖分編碼,實現在空間區域內自上而下的逐級精細剖分,自下而上的數據共享傳遞。對于0級剖分區域內的海量數據,通過查看高層級剖分的區域,最終可準確定位數據來源的精細區域,形成精細區域的數據可快速共享給較大區域的數據傳遞方式。如圖6所示的示例中,該區域內顯示有15條數據信息,經1次剖分形成的四個區域中分別包含3、4、2、6條數據信息,逐級剖分最終可確定各條數據信息所屬網格及位置區域,從而使得低級剖分網格快速精準掌握區域內數據情況,高級剖分網格數據信息對應向低級剖分網格進行高效共享傳遞。
圖5跨尺度多層級空間網格示意圖

2.4動態時空數據關聯分析
針對海量數據分散異構、關聯性差等問題,通過對數據進行時空多維分析,在空間角度形成區域數據集合,在時間角度形成數據動態變化時間序列,實現數據的動態關聯,支撐態勢演進分析、資源要素變化趨勢分析等應用。圖7為某區域在不同時刻的資源分布示意
圖,通過時空網格數據統一標識開展數據關聯分析,可以準確表征在不同時刻資源分布的變化趨勢,從時間角度呈現數據的動態關聯情況。
圖6跨尺度時空網格數據傳遞示例

圖7動態時空數據關聯示例
Fig.7Dynamic correlation of spatio-temporal data

動態時空數據關聯分析的主要流程:首先利用時空網格將連續、異構的多源數據離散化、標準化,統一映射為網格單元序列,接下來依托分布式框架實現高效的鄰域統計、疊加分析,最后開展動態時空數據關聯分析。動態時空數據關聯分析主要包括個體行為模式挖掘以及實體行為與環境的關聯分析。對于個體行為模式挖掘,主要是在序列數據庫中進行頻繁項篩選,通過逐步生成頻繁序列的前綴,完成對個體行為模式的挖掘;對于實體行為與環境的關聯分析,是通過逐層搜索的迭代方法在數據庫中找出項集的關系,形成一定的規則,完成實體的行為動機或受環境影響程度的分析。動態時空數據關聯分析能夠實現相應資源要素在不同時間內的能力表征,支撐開展雙方態勢分析研判及任務規劃。
3基于時空網格的空域規劃計算仿真驗證
結合典型空域規劃計算應用,對時空網格編碼與計算進行仿真驗證。通過戰場數據時空網格統一標識使得空域規劃同時考慮空間位置和時間約束,可有效提升空域規劃計算效率。具體仿真方法為:
(1)場景設定
面向低空無人機(集群)低空空域規劃的需求,需進行空域規劃計算,確保無人機均能合理使用空域,完成飛行任務,避免因空域沖突造成的損失。時空網格能夠準確描述空域情況且計算復雜度低。針對飛行速度不高、飛行區域較小的低空無人機,進行基于時空網格的空域規劃計算,主要是利用時空網格計算給定范圍內多個空域的沖突情況。
(2)網格劃分
按照GeoSOT地球空間剖分理論及空間編碼規則, 16級網格對應的格網大小為 32′′ ,對應赤道附近的大概 尺度為 989.5m;17 級網格對應的格網大小為 16′′ ,對 應赤道附近的大概尺度為 494.7m;18 級網格對應的 格網大小為 8′′ ,對應赤道附近的大概尺度為 247.4m 19級網格對應的格網大小為 4′′ ,對應赤道附近的大概 尺度為 123.7m 。考慮飛行速度較低的無人機短距離 飛行試驗,利用18級/19級網格剖分下的地球開展空 域規劃計算仿真。
(3)仿真計算
在數字地圖上選取兩個任意形狀區域,使其有疊加區域,開展空域疊加計算分析。仿真計算機硬件配置:CPU內核為24,CPU邏輯處理器為32,GPU內存為47.8G,算力約為20TFLOPS。
(4)結果分析
開展3次空域規劃仿真計算,設置第1次仿真計算的網格等級為19級網格,第2次、第3次仿真計算的網格等級為18級網格,分別進行仿真數據統計。3次仿真的空域范圍如圖8所示,空域設置情況、時空網格計算結果見表1。
圖8空域規劃計算仿真范圍
Fig.8Calculation and simulation scope of airspace planning

表1基于時空網格的空域沖突計算應用仿真結果
Tab.1Simulationresultsofairspaceconflictcalculation applicationbasedonspatio-temporal grids

由上述仿真計算結果可知,在給定仿真計算機硬件配置情況下,從空間角度開展面向典型應用的空域沖突計算分析,在1s內能夠計算出總數約100萬個網格的疊加網格數量,證明了時空網格技術應用于數據處理分析的高效性,能夠有效提升資源利用率,一定程度上增強了空域規劃的動態調整能力。從時間角度,通過時間剖分編碼準確表征空域占用情況的時間序列,進一步提升空域規劃的效率及合理性。
4結束語
本文針對來源廣泛、格式多樣、內容復雜的數據在高效處理、關聯挖掘等方面存在的問題,開展基于時空網格的數據關聯分析方法研究,分析了時空網格在國內外的研究現狀,通過時空網格數據統一標識設計、時空網格數據關聯分析方法研究,實現了多源異構數據的網格化表征及處理應用,支撐多源異構數據的跨尺度共享傳遞、動態關聯分析及高效管理運用。以空域規劃(空域沖突計算)應用為例,開展數據時空網格編碼與計算仿真驗證,結果表明時空網格能夠有效提升數據關聯分析效率。
參考文獻:
[1] 程承旗,任伏虎,濮國梁,等.空間信息剖分組織導論[M].:科學出版社,2012.CHENGCQ,RENFH,PUGL,et al.Introduction tospatial information division and organization[M].Bei-jing:Science Press,2012.
[2] 吳立新,余接情.地球系統空間格網及其應用模式[J].地理與地理信息科學,2012,28(1):7-13.WULX,YUJQ.Earth system spatial grid and itsappli-cation modes[J].Geography and Geo-Information Sci-ence,2012,28(1):7-13.
[3] CHENGCQ,TONG XC,CHENB,et al.A subdivisionmethod to unify the existing latitude and longitudegrids[J].International Journal of Geo-Information,2016,5(9) :1-23.
[4] XIEJ,CHENZ,LIUJW.Gano:A Multi-dimensional,Dynamic and Scene-Oriented Cloud-Native Spatial Data-baseEngine[C]//48th International Conference on VeryLargeDatabases,Sydney,Australia(and hybrid),Sep-tember 05-09,2022.
[5]陳彬,倪明,周霞,等.極端災害下基于時空網格的配電網多源數據融合方法[J].中國電力,2019,52(11):77-84.CHENB,NIM,ZHOUX,etal.Multi-sourcedatafu-sion method for distribution network based on spatiotempo-ral grid under extreme disasters[J].Electric Power,2019,52(11): 77-84.
[6] QU TT,WANGL Z,YU J,et al. STGI:a spatio-temporalgridindex model for marinebigdata[J].InternationalJournalofDigitalEarth,2020,4(4):435-450.
[7] 郭星華,朱偉,郭錦杰.時空剖分網格在指揮控制系統中的應用展望[J].指揮信息系統與技術,2022,13(4):80-84.GUO XH,ZHU W,GUOJJ.Application prospect ofspatio temporal subdividing grid in command and controlsystem[J].Command Information System and Technolo-gy,2022,13(4):80-84.
[8] 宋樹華,程承旗,濮國梁,等.全球遙感數據剖分組織的GeoSOT網格應用[J].測繪學報,2014,43(8):869-876.SONGSH,CHENGCQ,PUGL,etal.Global remotesensing data subdivision organization based on GeoSOT[J].Acta Geodaetica et Cartographica Sinica,2O14,43(8):869-876.
[9] 金安,程承旗.基于全球剖分網格的空間數據編碼方法[J].測繪科學技術學報,2013,30(3):284-287.JINA,CHENGCQ.Spatial data coding method basedon global subdivision grid[J].Journal of Geomatics Sci-enceandTechnology,2013,30(3):284-287.
(責任編輯:許韋韋)