陶留鋒,邢廷炎+,呂建軍,林偉華
(1.中國地質(zhì)大學(xué) (北京)信息工程學(xué)院,北京100083;2.中國地質(zhì)大學(xué) (武漢)信息工程學(xué)院,湖北 武漢430074)
GIS在各行業(yè)信息化中發(fā)揮了重要的作用,但是GIS還存在一些問題,阻礙了其作用的進一步發(fā)揮,傳統(tǒng)GIS存在的問題主要體現(xiàn)在以下幾方面:①傳統(tǒng)的GIS是以歷史空間數(shù)據(jù)為核心,被動地接收數(shù)據(jù),利用緩沖區(qū)分析、疊加分析、最短路徑分析等空間分析算法,作用于歷史空間數(shù)據(jù),計算分析出反映過去某一時段事物狀態(tài)的信息。傳統(tǒng)GIS對實時性數(shù)據(jù)的接收、分析、分發(fā)能力不足,不能滿足電力、交通、應(yīng)急指揮、災(zāi)害監(jiān)測等實時性強的應(yīng)用需求。②傳統(tǒng)GIS的服務(wù)方式為被動式服務(wù),根據(jù)用戶的操作,被動地進行數(shù)據(jù)處理,以得到相應(yīng)的信息服務(wù)。傳統(tǒng)GIS不能根據(jù)用戶的實時位置、使用偏好、歷史操作習(xí)慣等信息,主動地將用戶可能感興趣的信息發(fā)送到目標客戶。③傳統(tǒng)GIS服務(wù)內(nèi)容單一,對海量數(shù)據(jù),尤其是對海量空間數(shù)據(jù)的分析和挖掘能力不足,只是對現(xiàn)有數(shù)據(jù)進行簡單的分析和計算,缺乏深層次的挖掘和提煉。
當(dāng)前IT界各大互聯(lián)網(wǎng)公司,如Google、Facebook和Twitter等對實時技術(shù)廣泛關(guān)注,實時Web訪問將成為一種技術(shù)趨勢,實時技術(shù)使Web應(yīng)用變得響應(yīng)速度更快,用戶體驗更好,在某些情況下,甚至可以替代桌面應(yīng)用。實時Web并不只是一種時尚,而是一種技術(shù)趨勢[1]。
隨著實時Web技術(shù)的興起和成熟,實時GIS將成為GIS領(lǐng)域研究的熱點。實時GIS是具有實時性或準實時性特征的GIS系統(tǒng),由數(shù)據(jù)采集層、數(shù)據(jù)服務(wù)層、Web服務(wù)層和用戶層四部分組成。數(shù)據(jù)采集層實時采集的數(shù)據(jù),經(jīng)過高性能的分析處理,即時分發(fā)到多類型用戶終端,實現(xiàn)地理空間信息的實時共享和多用戶協(xié)同。
為滿足實時GIS的應(yīng)用需求,國內(nèi)外學(xué)者做了大量的研究工作。ESRI公司推出了用以實現(xiàn)實時數(shù)據(jù)和GIS集成的Tracking Server解決方案產(chǎn)品[2],用于將動態(tài)采集的,來自各種數(shù)據(jù)源和不同格式的實時數(shù)據(jù)和GIS集成,并將之發(fā)送到網(wǎng)絡(luò)和桌面客戶端,以幫助用戶做出更好的決策,快速、便捷和高效地共享信息;北京大學(xué)方裕教授(2008)[3]認為:“實時GIS就是必須在規(guī)定的時間里完成規(guī)定的動作,實時操作系統(tǒng)、實時數(shù)據(jù)庫合在一起才是實時GIS系 統(tǒng)。”; 美 國 加 州 大 學(xué) 教 授 Michael F.Goodchild(2011)[4]認為: “GPS、傳感器、地圖制圖等技術(shù)的發(fā)展,使得GIS從相對從容不迫的處理分析靜態(tài)數(shù)據(jù)狀態(tài),到可以動態(tài)的處理實時監(jiān)控數(shù)據(jù)和決策。在未來,GIS將涉及更多的實時情況的監(jiān)測和評估,因此需要更多新的工具,描繪不斷變化中的信息。決策將會用合理的方式制定,既考慮到現(xiàn)有信息的有效性又考慮到未來發(fā)展的不確定性?!?;武漢大學(xué)朱慶教授 (2011)[5]認為: “人們生活在日益復(fù)雜的大立體高動態(tài)環(huán)境中,傳統(tǒng)GIS方法空間跟真實地理空間及人們認識空間之間的矛盾日益突出,傳統(tǒng)GIS方法在很多領(lǐng)域都不再具有優(yōu)勢,因此實時GIS在智慧城市的未來中顯得非常重要,做好實時GIS,需要解決多維信息統(tǒng)一表達、GIS與過程模擬的緊密耦合、分布式多維時空數(shù)據(jù)高效存儲管理、高性能時空數(shù)據(jù)動態(tài)可視化分析以及面向任務(wù)的時空數(shù)據(jù)自適應(yīng)處理流水線等?!崩畹氯试菏浚?012)[6]認為 “實時GIS是測繪地理信息學(xué)新的研究方向,GIS將從以數(shù)據(jù)為中心,轉(zhuǎn)向以用戶為中心,從使用歷史數(shù)據(jù)轉(zhuǎn)向獲取實時數(shù)據(jù)?!?。
實時GIS的研究將有助于解決傳統(tǒng)GIS現(xiàn)勢性不強、被動服務(wù)等問題,用戶可以在已有的數(shù)據(jù)庫和應(yīng)用系統(tǒng)中加入實時或準實時的信息,快速地分析、顯示、運用現(xiàn)時的精準的數(shù)據(jù)進行輔助決策,以提高決策的科學(xué)性和可行性。特別是在電力、交通、應(yīng)急指揮、災(zāi)害監(jiān)測、市政設(shè)施巡檢等對信息響應(yīng)、發(fā)布時間要求高的領(lǐng)域具有重要的意義。
實時GIS與傳統(tǒng)GIS的最大區(qū)別在于其對時間的精確要求,即實時性。實時GIS的實時性主要體現(xiàn)在4個方面:一是數(shù)據(jù)采集存儲的實時性,將各種手持設(shè)備、傳感器或互聯(lián)網(wǎng)上的信息,通過寬帶或移動互聯(lián)網(wǎng)進行實時的傳輸、接收、存儲,或者采用互聯(lián)網(wǎng)信息搜索挖掘技術(shù),對海量的互聯(lián)網(wǎng)信息進行過濾和抽取,并將其進行歸檔和存儲;二是海量異構(gòu)數(shù)據(jù)分析處理的實時性,要求系統(tǒng)具有高效的分析處理算法和強大的硬件支持,采用云存儲、云計算等技術(shù),實時從海量異構(gòu)數(shù)據(jù)中抽取出用戶感興趣的信息;三是信息發(fā)布的實時性,采用最新的互聯(lián)網(wǎng)信息發(fā)布技術(shù),如簡易信息聚合 (really simple syndication,RSS)、Atom(一種訂閱網(wǎng)志的格式)、服務(wù)器推送等技術(shù),將后臺分析處理結(jié)果實時發(fā)布到多類型的用戶終端,并進行友好展示;四是用戶需求滿足的實時性,研究分析用戶的使用偏好,采用垂直搜索、推薦搜索等技術(shù),為用戶定制個性化的空間信息服務(wù),有選擇的進行信息發(fā)布。
實時GIS的實現(xiàn)過程 (如圖1所示),首先是實時數(shù)據(jù)采集,并將實時數(shù)據(jù)發(fā)送到動態(tài)數(shù)據(jù)庫,利用數(shù)據(jù)庫觸發(fā)器和消息服務(wù)器,將數(shù)據(jù)更新服務(wù)發(fā)布到Web服務(wù)器,Web服務(wù)器利用服務(wù)器推技術(shù),實現(xiàn)多類型客戶端信息的實時發(fā)布。

圖1 實時GIS實現(xiàn)過程
根據(jù)實時GIS的實現(xiàn)過程,實時GIS的體系結(jié)構(gòu) (如圖2所示),可以劃分為四層:數(shù)據(jù)采集層、數(shù)據(jù)服務(wù)層、Web服務(wù)層和用戶層。
數(shù)據(jù)采集層是實時GIS的數(shù)據(jù)源,也是實時GIS特征的主要體現(xiàn),包括兩部分,一是通過智能手機、物聯(lián)網(wǎng)傳感設(shè)備實時采集的數(shù)據(jù),另一部分是在互聯(lián)網(wǎng)上搜索的海量異構(gòu)網(wǎng)絡(luò)信息數(shù)據(jù)。實時采集的數(shù)據(jù)通過寬帶網(wǎng)絡(luò)或移動互聯(lián)網(wǎng)實時傳輸?shù)綄崟r動態(tài)數(shù)據(jù)庫中。海量網(wǎng)絡(luò)信息經(jīng)過數(shù)據(jù)清洗、數(shù)據(jù)挖掘、知識提取等過程處理后保存到實時動態(tài)數(shù)據(jù)庫中。

圖2 實時GIS體系結(jié)構(gòu)
數(shù)據(jù)服務(wù)層主要對外提供數(shù)據(jù)發(fā)布服務(wù),包括兩大類數(shù)據(jù),一種是實時采集的數(shù)據(jù),另一種是經(jīng)過加工處理,相對穩(wěn)定的歷史數(shù)據(jù)。實時采集的數(shù)據(jù)保存在實時動態(tài)數(shù)據(jù)庫中,相對穩(wěn)定的歷史數(shù)據(jù)保存在數(shù)據(jù)倉庫中。經(jīng)過一定的時間之后,需要對實時動態(tài)數(shù)據(jù)進行清洗、抽取和歸檔處理,讓后保存到數(shù)據(jù)倉庫中。
Web服務(wù)層主要是為用戶提供實時的、個性化的空間信息服務(wù),包括實時數(shù)據(jù)發(fā)布、異構(gòu)數(shù)據(jù)集成分析、多類型信息一體化展示,推薦搜索引擎主動服務(wù)等主要功能。
用戶層面向的是各類用戶終端,包括臺式機、筆記本、智能手機等各類型的實時信息接收終端。
動態(tài)數(shù)據(jù)是隨時間變化的數(shù)據(jù),如移動GPS定位點數(shù)據(jù)、車輛軌跡數(shù)據(jù)、洪水淹沒數(shù)據(jù)等。智能手機、GPS、RFID等設(shè)備實時采集的動態(tài)數(shù)據(jù),通過GPRS或3G網(wǎng)絡(luò),以XML為基礎(chǔ)進行數(shù)據(jù)傳輸。通過XML文件表達、傳輸數(shù)據(jù),不僅具有良好的跨平臺性,并且XML文件數(shù)據(jù)與表現(xiàn)的分離使得XML文件可以成為不同終端間信息交換的載體。數(shù)據(jù)接收端根據(jù)系統(tǒng)配置表信息,將實時數(shù)據(jù)按照點、線、面等分類存入指定的數(shù)據(jù)庫表中。當(dāng)有新的數(shù)據(jù)發(fā)送過來之后,系統(tǒng)將調(diào)用執(zhí)行數(shù)據(jù)插入 (Insert)操作的存儲過程,將接收到的實時數(shù)據(jù)保存在數(shù)據(jù)庫實時監(jiān)測表中[7],如果是異常數(shù)據(jù),則將其保存于異常數(shù)據(jù)表中,供將來的查詢、統(tǒng)計、分析使用。另外,使用專門的實時數(shù)據(jù)庫服務(wù)器,以減少數(shù)據(jù)傳輸?shù)闹虚g環(huán)節(jié),從而提高了數(shù)據(jù)傳輸?shù)膶崟r性和穩(wěn)定性。
車載導(dǎo)航GPS實時數(shù)據(jù)的標準XML格式,如圖3所示。

圖3 車載導(dǎo)航GIS實時XML數(shù)據(jù)
更新數(shù)據(jù)的即時分發(fā)是實時GIS實現(xiàn)過程的重要一環(huán),本文研究利用數(shù)據(jù)庫觸發(fā)器和消息中間件相結(jié)合的模式,實現(xiàn)更新數(shù)據(jù)的即時分發(fā)。
數(shù)據(jù)庫觸發(fā)器是一種特殊的存儲過程,它類似于數(shù)據(jù)表中參照完整性約束,主要功能是監(jiān)視用戶對數(shù)據(jù)的修改、更新和刪除。觸發(fā)器的一個主要優(yōu)點在于,當(dāng)基表被修改時它能自動的執(zhí)行內(nèi)嵌的過程[8]。在實時GIS中,通過對發(fā)生更新的數(shù)據(jù)庫表創(chuàng)建Insert、Update和Delete三類觸發(fā)器,當(dāng)數(shù)據(jù)庫表發(fā)生增加、修改或刪除操作時,將自動觸發(fā)對應(yīng)的觸發(fā)器,可以實時捕獲到數(shù)據(jù)的變更,并執(zhí)行外部更新發(fā)布過程,從而實現(xiàn)更新數(shù)據(jù)的實時發(fā)布。
消息中間件是一種由消息傳送機制或消息隊列模式組成的中間件技術(shù)[9]。消息中間件為在分布式軟件系統(tǒng)中創(chuàng)建、發(fā)送、接收消息提供了一套安全、可靠、通用、高效的方法。利用消息中間件提供的高效可靠的消息傳遞機制,進行平臺無關(guān)的數(shù)據(jù)交流訪問。
在實時GIS中,消息中間件是數(shù)據(jù)服務(wù)層的重要組成部分。消息中間件在接收到數(shù)據(jù)庫服務(wù)器發(fā)送的更新數(shù)據(jù)后,根據(jù)客戶端訂閱的信息,將接收的數(shù)據(jù)轉(zhuǎn)發(fā)至目標客戶端。
消息中間件利用端口監(jiān)聽數(shù)據(jù)庫服務(wù)器是否發(fā)送更新數(shù)據(jù),當(dāng)端口探測到有新的數(shù)據(jù)到達時,根據(jù)配置信息,進行數(shù)據(jù)的路由發(fā)送,將數(shù)據(jù)發(fā)送到目標客戶端[10]。
數(shù)據(jù)更新發(fā)布過程如圖4所示。
如何將后臺數(shù)據(jù)的變化直接推送到客戶端是實時GIS的關(guān)鍵。傳統(tǒng)的Web應(yīng)用模式以客戶端發(fā)送請求,服務(wù)器響應(yīng)的方式進行工作,服務(wù)器端發(fā)生的任何變化,客戶端都是無法得知的,客戶端獲得數(shù)據(jù)永遠都是 “過時”的,這已不能滿足實時GIS的應(yīng)用需求,這時就需要服務(wù)器能夠主動把最新數(shù)據(jù)信息推送到客戶端,以滿足用戶的需求。

圖4 數(shù)據(jù)更新發(fā)布過程
服務(wù)器推送技術(shù)是Web技術(shù)中最熱門的流行術(shù)語之一,它是一種新的Web應(yīng)用模式[11]。服務(wù)器推送技術(shù)的優(yōu)點在于,它能夠在保證多用戶高效響應(yīng)的前提下,主動向客戶端發(fā)送信息。在實時GIS中,服務(wù)器推送技術(shù)的實現(xiàn)方法主要包括[12]:①瀏覽器每隔一段時間向服務(wù)器發(fā)出輪詢 (poll)以進行更新,類似于HTML Refresh;②服務(wù)器始終打開與瀏覽器的連接并在數(shù)據(jù)可用時發(fā)送給瀏覽器,即應(yīng)用基于長輪詢 (long-polling)方式Comet模型;③基于HTTP長連接的服務(wù)器推送;④基于消息中間件的服務(wù)器推送;⑤基于HTML5WebSocket的服務(wù)器推送。
這些實現(xiàn)服務(wù)器推送的技術(shù)各有優(yōu)缺點,在實際應(yīng)用過程中,可以根據(jù)需要具體選擇,將實時數(shù)據(jù)即時分發(fā)到多類型客戶終端。使用服務(wù)器推送技術(shù)實現(xiàn)的實時GIS Web應(yīng)用模型,如圖5所示。
隨著Facebook、Twitter、微博等社交網(wǎng)絡(luò)的興起,互聯(lián)網(wǎng)信息呈現(xiàn)爆炸式增長,互聯(lián)網(wǎng)成為實時GIS的重要數(shù)據(jù)源。研究如何從海量互聯(lián)網(wǎng)信息中搜索挖掘用戶感興趣的信息,并將其與現(xiàn)有的空間數(shù)據(jù)集成融合,是實時GIS迫切需要解決的問題。

圖5 使用服務(wù)器推送技術(shù)實現(xiàn)的實時GIS Web應(yīng)用模型
Web數(shù)據(jù)挖掘可以快速地從大量的Web文檔集合中發(fā)現(xiàn)隱含的、潛在的模式,成為實時GIS數(shù)據(jù)獲取的重要途徑。根據(jù)對Web數(shù)據(jù)的感興趣程度不同,Web數(shù)據(jù)挖掘一般可以分為三類[13]:Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用挖掘。Web內(nèi)容挖掘通過對Web頁面的內(nèi)容,如文本、音頻、視頻、圖像等各種類型的數(shù)據(jù)進行處理分析,從中提取有效信息;Web結(jié)構(gòu)挖掘通過對Web頁面之間的超鏈接結(jié)構(gòu)進行挖掘分析,獲取有用信息;Web使用挖掘通過對用戶的訪問記錄進行挖掘分析,提取用戶訪問模式。實時GIS網(wǎng)絡(luò)數(shù)據(jù)主要是動態(tài)的從Web頁面中獲取有效信息,因此,Web內(nèi)容挖掘是實時GIS網(wǎng)絡(luò)數(shù)據(jù)獲取研究的關(guān)鍵。
Web文本內(nèi)容挖掘的過程一般包括:文本預(yù)處理,文本特征提取,文本分類、聚類等,如圖6所示。

圖6 Web文本挖掘的一般過程
市政設(shè)施是城市的生命線,是城市的重要基礎(chǔ)設(shè)施,市政設(shè)施日常養(yǎng)護是市政設(shè)施管理部門迫切需要解決的問題。傳統(tǒng)的人工巡視存在著資料獲取不便、人員難以管理、巡檢效率低下等問題。利用實時GIS技術(shù),在市政設(shè)施上加裝具有實時信息發(fā)送功能的RFID、SCADA等設(shè)備,以WebGIS的形式提供監(jiān)督指揮系統(tǒng),能夠顯示電子地圖、實時顯示巡視人員所在位置、實時顯示事故解決情況、實時顯示瞬時壓力流量等遙測信息,市政設(shè)施管理部門可以實時掌握各類設(shè)施的運行狀態(tài),實現(xiàn)市政設(shè)施巡檢、監(jiān)控、維修、養(yǎng)護一體化,降低巡檢工作管理成本,加快巡檢維修養(yǎng)護工作的處理速度,提高企業(yè)信息化水平。市政設(shè)施巡檢人員實時監(jiān)控,如圖7所示。
實時GIS在電力、交通、應(yīng)急指揮、災(zāi)害監(jiān)測、市政設(shè)施巡檢等方面具有廣闊的應(yīng)用前景。本文在提出實時GIS概念的基礎(chǔ)上,論述實時GIS的體系結(jié)構(gòu)及其關(guān)鍵技術(shù),并對其實現(xiàn)過程進行描述。實時GIS后期研究方向包括:①實時數(shù)據(jù)與歷史數(shù)據(jù)集成分析,實現(xiàn)多時相、多類型數(shù)據(jù)融合和集成分析;②推薦搜索主動服務(wù),研究用戶的使用偏好,實時主動向用戶提供個性化的空間信息服務(wù);③時空過程模擬,研究時空過程對象的描述和組織、時空查詢機制,通過對時空數(shù)據(jù)結(jié)構(gòu)、時空數(shù)據(jù)操作等問題的研究,建立時空過程模擬模型;④多類型信息一體化展示,實現(xiàn)屬性信息、空間信息、視頻、音頻等信息一體化展示。

圖7 市政設(shè)施巡檢人員實時監(jiān)控
[1]Matthew Braga.Say hello to the real real-time web [EB/OL].[2012-05-16/2012-09-20].http://arstechnica.com/business/2012/05/say-h(huán)ello-to-the-real-real-time-web/.
[2]ESRI.Tracking Server—GIS的實時時間解決方案 [EB/OL].[2012-09-20].http://www.esrichina-bj.cn/old/produce/ESRI/tracking-server/index.htm.
[3]Michael F Goodchild.Looking forward:Five thoughts on the future of GIS [EB/OL]. [2011-02-24/2012-09-20].http://www.esri.com/news/arcwatch/0211/future-of-gis.html.
[4]FANG Yu.Clear the role of GIS in various application areas,play their own role [EB/OL]. [2008-04-25/2012-09-20].http://www.gisera.com/MainForm/GIS/text.aspx? ID =2800(in Chinese). [方裕.明確GIS在各應(yīng)用領(lǐng)域的作用,扮演 好 自 己 的 角 色 [EB/OL].[2008-04-25/2012-09-20].http://www.gisera.com/MainForm/GIS/text.aspx?ID=2800.]
[5]ZHU Qing.Real-time GIS and spatial and temporal data modeling [EB/OL].[2011-10-31/2012-09-20].http://www.3snews.net/zhuanti/geostar/ (in Chinese). [朱慶.實時 GIS與 時 空 數(shù) 據(jù) 建 模 [EB/OL]. [2011-10-31/2012-09-20].http://www.3snews.net/zhuanti/geostar/.]
[6]LI Deren.Smarter planet era of surveying and mapping,geographic information science mission [J].Scientific Chinese,2012,20(21):43-44 (in Chinese).[李德仁.智慧地球時代測繪地理信息學(xué)的新使命 [J].科學(xué)中國人,2012,20 (21):43-44.]
[7]SUN Ke,JIN Chao,LIU Yongsheng.Development of GIS-based visualization monitoring system for real time data of distribution networks [J].Guangdong Electric Power,2011,24(1):44-47 (in Chinese). [孫珂,金超,劉永生.基于 GIS技術(shù)的配電網(wǎng)實時數(shù)據(jù)可視化監(jiān)控系統(tǒng)的開發(fā) [J].廣東電力,2011,24 (1):44-47.]
[8]LIN Yuan,CHEN Zhibo.Implementation of synchronization system for distributed [J].Computer Engineering and Design,2010,31 (24):5278-5281 (in Chinese).[林源,陳志泊.分布式異構(gòu)數(shù)據(jù)庫同步系統(tǒng)的研究與應(yīng)用 [J].計算機工程與設(shè)計,2010,31 (24):5278-5281.]
[9]LI Wenxiao,YANG Xiaohu.Messaging middleware based on a distributed cache storage model [J].Computer Engineering,2010,36 (13):93-95 (in Chinese).[李文逍,楊小虎.基于分布式緩存的消息中間件存儲模型 [J].計算機工程,2010,36 (13):93-95.]
[10]YANG Fengyu,CHEN Ying, WU Zhenhua.Design of underlying communication model for application in Internet of things [J].Application Research of Computers,2012,29(3):1054-1059 (in Chinese). [楊豐玉,陳英,吳振華.一種面向物聯(lián)網(wǎng)應(yīng)用的底層網(wǎng)絡(luò)通信模塊設(shè)計 [J].計算機應(yīng)用研究,2012,29 (3):1054-1059.]
[11]Mikko Pohja.Server push with instant messaging [C]//Proeeedings of the ACM Symposium on Applied Computing,2009:15-22.
[12]SUN Qingguo,ZHU Wei,LIU Huajun,et al.Survey on server-push technology of web applications [J].Computer Systems&Application,2008,17 (11):116-120 (in Chinese). [孫清國,朱瑋,劉華軍,等.Web應(yīng)用中的服務(wù)器推送技術(shù)研究綜述[J],計算機系統(tǒng)應(yīng)用,2008,17 (11):116-120.]
[13]SHAO Fengjing.Principle and algorithm of data mining [M].Beijing:China Water Power Press,2005:11-14 (in Chinese).[邵峰晶.數(shù)據(jù)挖掘原理與算法 [M].北京:中國水利水電出版社,2005:11-14.]