王洋洋,孫 偉*,古麗米拉·克孜爾別克
(1.新疆農業大學 計算機與信息工程學院,新疆 烏魯木齊 830052)
時空數據模型研究進展
王洋洋1,孫 偉1*,古麗米拉·克孜爾別克1
(1.新疆農業大學 計算機與信息工程學院,新疆 烏魯木齊 830052)

對已有的時空數據模型進行了分析,介紹了有關學者對構建模型的見解和貢獻;闡述了具有代表性的時空數據模型的原理和特點,指出不同階段時空數據模型的研究成果和不足之處以及當前時空數據挖掘面臨的難題。
時空數據模型;研究成果;發展趨勢
也逐漸形成了海量的時空大數據[1]。時空數據具有增長速度快、數據量大、來源多樣、結構各異等特點,高效管理問題突出。時空數據模型是其中的一個關鍵技術;涉及許多學科,需要運用計算機、遙感、全球定位系統和地理信息系統等技術來分析時空數據;可應用在國防、工業、社交網絡、醫療、交通、救災、氣象等領域。與此同時,在物聯網環境下,大量傳感器的應用,遙感集市云平臺的建立使得時空數據模型成為GIS研究中的一個重要方向[2]。數據挖掘技術的突破和海量時空數據的生產,為空間理論的驗證提供了一個新的視角[3]。
陳新保[4]等從時態GIS的核心內容出發,闡述了時空數據模型間的關系和本質區別,為模型的擴展和新模型的研究提供了理論依據和參考,并就幾類具有代表性的模型進行了介紹;分析了側重狀態描述的時空數據模型、側重過程描述和因果分析的時空數據模型和側重時空對象及其關系描述的時空數據模型。劉大有[5]等對時空數據挖掘的研究現狀和面臨的主要問題進行了分析,對時空模式發現、時空聚類、時空異常檢測、時空預測和分類等方面進行了詳細說明,結合近年來數據挖掘領域的研究進展討論了各種研究方法的優缺點。趙彬彬[6]等闡述了從數據挖掘到空間數據挖掘,再到時空數據挖掘的發展歷程,找出空間數據和傳統知識發現的異同,并討論了未來時空數據挖掘的研究熱點。在眾多數據模型中較為特殊的模型要數海洋時空過程數據模型[7],海洋現象時刻發生變化,與陸地的瞬時變化相比存在明顯的差異。
時空數據挖掘工作都還處于起步階段,且許多研究工作都是針對特定領域,缺乏廣泛性[8]。在理論研究方面不僅受到空間數據挖掘和時態數據挖掘研究的影響,還受到時空數據表示和存取方式的限制[9]。一些文獻中提到的更新方式都是同步更新,若在更新過程中出現錯誤,將無法進行回溯和修改[10]。
隨著大數據的到來,數據量急速膨脹,導致了人們對數據處理的困難,數據挖掘應運而生。除了數據挖掘的共性,空間數據挖掘還有自身特性,不僅包含位置和屬性數據,還包含實體間的空間關系[11]。不同時期提出的數據模型在解決的科學問題方面都存在差異,表1給出了不同時空數據模型的研究成果和不足之處。由表1可知,不同階段發展起來的數據模型均能解決特定問題,但缺乏更完善的體系。
2.1 時間快照圖像序列模型
時間快照圖像序列模型是較為經典的時空數據模型之一[12],通過使用經過空間配準后的柵格圖像來表示真實世界在某個時刻的狀態。在數據庫中只記錄當前的數據狀態,數據更新時,新數據會替換舊數據,可將時間片段存儲起來,根據用戶需要對指定時間的片段進行回放。因數據未發生變化時也會進行存儲,故當數據量較大時,系統的處理效率會急劇下降。該模型還只是一種理論上的模型,開發價值不是很大。
2.2 時空復合模型
在與矢量基態修正模型相似的時空復合模型中[13],時空復合式把空間分割成具有相同時空過程的最大公共時空單元,較容易實現時空拓撲分析[14]。該模型保留了沿時間的空間拓撲關系,所有更新的特征都被加入到當前的數據集中,新的拓撲關系也會伴隨生成。但隨著時間的延續,時空數據庫中的數據會逐漸增多,影響時空復合模型的查詢效率。

表1 時空數據模型對比分析
2.3 面向對象的時空數據模型
在靜態對象模型的基礎上擴展時態信息表達[15],其核心思想是把所考察的系統看成一個對象,提取它們之間的共性和相互作用方式并進行規范化,使得邏輯過程的建模變得簡單且容易實現[16]。該模型能夠較好地表達數據的時間、空間和語義屬性信息,反映要素對象之間的多層次關聯關系[17],有助于探索事物動態變化的內在規律[18]。面向對象的數據庫也將是未來數據庫的發展方向[19]。
2.4 時空立方體模型
1970年Hagerstrand提出了時空立方體模型,由兩 個空間維和一個時間維組成三維立方體[20],給定一 個時間位置值,即可從三維立方體中獲得相應的截面[14]。時空立方體單元是以規則的空間網格為底,相應的時間段為高組成的方形柱體,是數據存儲的基本單元[21]。當時空立方體單元中存儲的物理表或邏輯表超出數據存儲的上限時,數據的管理效率將會大幅下降,同時在時空立方體表達方面也較難實現。
2.5 基態修正模型
當狀態變化相對緩慢,為了降低數據冗余量,存儲時只記錄變化部分,可選擇基態修正模型,又稱為底層疊加模型[22]。每變化一次的快照可通過疊加每次變化內容獲得,每個對象只需存儲一次,記錄很小的數據量。雖然解決了數據冗余問題,但也增加了時空操作的復雜性[23]。該模型設使用最為頻繁的狀態為基態,每當有狀態變換時,將前一狀態相對于最新狀態的變化部分存入歷史庫。存儲入庫的內容會被變更數據不斷修正[24]。該模型處理矢量數據的效率較低,但處理柵格數據較為合適。
2.6 快照增量時空模型
要素在其生命周期中,可發生多次空間幾何變化和屬性變化,空間幾何擁有正負號特性。每一時刻的快照信息為前一快照信息加上增量信息,表現為空間幾何標識符的集合。時空索引的節點包括空間幾何集和時間區間,其中空間幾何集共有3類,通過出現的集合和消亡的集合來表示增量。該索引機制將時間和空間作為同等重要的維,能對時間段和時間點進行快速查詢,兼顧了時間和空間的查詢效率[25]。
2.7 時空ER模型
ER模型常用于設計高性能的事務型處理系統,主要是圍繞數據和數據之間的關系構建而成。在傳統的ER模型上引入新的符號結構來支持時空信息,將現實世界中的空間、時間、屬性信息相互關聯,可為時空數據的建模提供便利條件,并對數據庫的設計提供有效的方法[26]。在用戶使用該終端時,為了理解查詢的結果,必須要先了解數據庫如此龐大的ER模型,這一點對用戶而言不易實現[27]。
2.8 基于事件的時空數據模型及其擴展
按時間順序把事件組成一個鏈,新發生的事件會依次加到整個事件的尾部。以時間順序來組織發生在特定地理位置上的變化。擴展后的模型主要適用于高級時態查詢,具有3個重要功能:解決對象標識問題,使更新機制更加靈活;被擴展的時間對象能夠清晰地反映時空模型中事件與狀態變化之間的因果關系;為了提高在事件、空間、屬性的查詢速率,在空間和屬性信息中可加入它們的事件對象標識,時間與空間信息是分離的[28]。
2.9 基于圖論的時空數據模型
尹章才[29]等基于圖論的時空數據模型研究顯式地表達與存儲時空實體與時空拓撲關系,避免了用快照序列進行數據的存儲與表達。圖論是一種研究具體事物間關系的抽象代數,實現歷史數據與當前數據的分離,能夠描述在空間與時間上不連續變化的時空實體。數據結構簡易也有益于用戶對時間和空間數據的查詢與管理。
2.10 GSM數據模型
張恒才[30]等提出了GSM數據模型,實現了截取、擴展、投影和多維投影4種基礎操作,彌補了移動對象數據庫系統中地理空間及社交網絡數據管理的不足。該模型與PostgreSQL相比,穩定性較高,在執行效率方面,GSM模型操作符也要高于PostgreSQL實現方式,能夠有效防止關系數據庫中表鏈接造成的移動對象管理與查詢效率不高的問題。
通過對當前典型時空數據模型的歸納分析發現,理論研究模型與實際應用還存在很大差距。典型表現就是理論研究的模型較多,而開發實現的應用原型較少;大部分數據模型只能表達某一時刻地理實體狀態的變化,卻不能描述與表達連續發生變化的地理實體,在森林火災和臺風預警方面欠缺時效性。因此,理論研究要與應用開發緊密結合才能取得更大的發展空間;通過結合已有數據模型,使其互補產生新的擴展模型;在解決實際問題的同時也要兼顧數據冗余等問題。
[1] 王勁峰,葛詠,李連發,等.地理學時空數據分析方法[J].地理學報,2014(9)∶1 326-1 345
[2] 龔健雅,李小龍,吳華意.實時GIS時空數據模型[J].測繪學報,2014(3)∶226-232
[3] 王小兵,孫久運.地理信息系統綜述[J].地理空間信息, 2012,10(1)∶25-28
[4] 陳新保,朱建軍,陳建群.時空數據模型綜述[J].地理科學進展,2009(1)∶9-17
[5] 劉大有,陳慧靈,齊紅,等.時空數據挖掘研究進展[J].計算機研究與發展,2013(2)∶225-239
[6] 趙彬彬,李光強,鄧敏.時空數據挖掘綜述[J].測繪科學, 2010(2)∶62-65
[7] 薛存金,董慶.海洋時空過程數據模型及其原型系統構建研究[J].海洋通報,2012(6)∶667-674
[8] 王衛民,葉秋菊,賀文麗,等.基于GIS的氣象時空數據挖掘和融合技術[J].電子科技,2014(2)∶130-133
[9] 陳捷,唐世渭,楊冬青,等.面向移動環境的時空數據挖掘研究現狀與展望[J].計算機工程與應用,2002(16)∶1-3
[10] 楊思吉.森林資源時空數據異步更新和回溯算法的研究[D].北京∶北京林業大學,2014
[11] 李德仁,王樹良,李德毅.空間數據挖掘理論與應用[M].第二版.北京∶科學出版社,2013
[12] 姜曉軼,周云軒.從空間到時間∶時空數據模型研究[J].吉林大學學報(地球科學版),2006(3)∶480-485
[13] 樊雅婷,楊建宇,朱德海.地籍管理中時空數據模型研究[J].測繪科學,2009(5)∶139-141
[14] 張保鋼,王潤生.時空復合數據庫模型及實現∶以規劃道路中線為例[J].測繪通報,2006(2)∶18-22
[15] 薛存金,謝炯.時空數據模型的研究現狀與展望[J].地理與地理信息科學,2010(1)∶1-6
[16] 佘江峰,馮學智,都金康.時空數據模型的研究進展評述[J].南京大學學報(自然科學版),2005(3)∶259-267
[17] 劉玉婷,李景文,傅瑋佳,等.基于Geodatabase的版本-對象時空數據組織方法[J].地理空間信息,2012,10(4)∶63-65
[18] 陳新保, LI Songnian,李黎,等.基于對象-事件-過程的時空數據模型及其應用[J].地理與地理信息科學,2013(3)∶10-16
[19] 沈敬偉,周廷剛,溫永寧,等.基于面向對象數據庫的空間數據管理[J].西南大學學報(自然科學版),2013(4)∶132-137
[20] 吳正升,胡艷,何志新.時空數據模型研究進展及其發展方向[J].測繪與空間地理信息,2009(6)∶15-17
[21] 胡繼華,程智鋒,詹承志,等.車輛監控數據倉庫中時空立方體數據模型的設計與實現[J].武漢大學學報(信息科學版),2013(1)∶78-81
[22] 李婷,徐柱,盧彩霞,等.交通路況基態修正模型及其效率分析[J].地球信息科學學報,2012(6)∶712-718
[23] 齊慶超,曾永年,吳桂平,等.一種多基態修正時空數據模型改進的方法[J].測繪科學,2008(4)∶178-180
[24] 胡彥波,吳華瑞,朱華吉.農村土地調查時空數據模型構建及應用[J].江蘇農業科學,2014(9)∶387-391
[25] 尹章才,李霖.基于快照-增量的時空索引機制研究[J].測繪學報,2005(3)∶257-261
[26] 任家東,高偉,任東英.時空ER模型的設計[J].計算機工程,2003(12)∶77-79
[27] 唐九陽,陸昌輝,鄧蘇,等.ER模型與多維模型互相轉換的研究[J].計算機工程,2003(1)∶109-111
[28] 鄭扣根,余青怡,潘云鶴.基于事件對象的時空數據模型的擴展與實現[J].計算機工程與應用,2001(3)∶45-47
[29] 尹章才,李霖,艾自興.基于圖論的時空數據模型研究[J].測繪學報,2003(2)∶168-172
[30] 張恒才,陸鋒,陳潔.移動對象時空軌跡及社交關系一體化數據模型[J].武漢大學學報(信息科學版),2014(6)∶711-718
P208
B
1672-4623(2016)09-0029-03
10.3969/j.issn.1672-4623.2016.09.009目前對時空數據分析理論方法的研究日益增多,
王洋洋,碩士研究生,研究方向為時空數據挖掘,嵌入式。
2015-11-16。
項目來源:2014年庫爾勒科技合作資助項目(KRLKJHZXM);新疆維吾爾自治區研究生科研創新資助項目(XJGRI2015087)。(*為通訊作者,博士)