黃樹鵬
(成都理工大學地球科學學院,四川 成都 610059)
地理信息科學(GIS),主要研究關于地球表層地理空間的各種重要自然地理信息,和人類社會活動中與表層空間地理位置密切相關的地理信息及其內在運動規律,應用計算機技術對地理信息進行處理、存儲、提取,以及管理和分析過程中一系列的科學理論和技術方法問題。本文通過介紹智能地理信息系統技術和數據挖掘技術應用的必要性和可能性,來探討遙感影像數據信息和基于遙感數據挖掘的智能地理信息系統技術。
智能地理信息技術,是一種在云服務、大數據和人工智能的基礎上,利用人工智能和無人自動控制來實現與現實世界融合的一種技術。
目前,GIS通過融合和直接集成其他信息技術,形成具有綜合性的信息技術服務系統,而地理空間信息服務系統技術的發展,主要取決于地球空間信息技術的不斷進步,以及應用領域的不斷擴大。隨著現代信息技術的發展,地理空間信息科學的基礎服務管理功能不斷加強,地理空間信息科學系統已經作為地理空間技術信息分析手段廣泛存在。
地理綜合信息分析系統在自然景觀地理生態環境規劃、計算機信息科學、人類學以及自然森林資源管理等科學領域,已經從單一功能和較分散的信息系統,發展成為了一個具有信息共享的、多功能的地理綜合性基礎信息處理系統,將充分運用我國專家地理知識分析系統,進行地理綜合信息分析并及時作出形勢預報和分析決策,向系統智能化角度發展[1]。
智能地理信息技術是在地理綜合信息分析系統上發展起來的,它結合了云服務、大數據和人工智能等技術,通過融匯自然地理學、人類地理學和地理信息系統等三個分支專業的理論方法,綜合利用了物聯網、互聯網、智慧管理、大數據挖掘、人工智能等現代技術,進行了客觀地理學世界與信息地理學世界的雙向映射,是集合了地理傳感網絡、地理智能網絡與地理控制網絡于一身的信息融合體系,完成客觀物理世界與信息技術世界的交互映射和融合,其映射原理如圖1所示。

圖1 現實物理世界與信息技術世界的映射
智能地理信息技術和非智能地理信息技術的區別在于:在地理信息系統的管理中,特別是在空間管理中,需要完成許多枯燥、重復的操作,極大地消耗了管理者的時間和精力。因此,如果將智能技術與地理信息系統數據庫管理相結合,開發出相應的智能空間管理庫,將大大減輕管理者的負擔。例如,管理者只需將需要管理的數據轉移給智能空間數據庫,并將自己的需要逐一告知智能空間數據庫,智能空間數據庫就會自動、智能地讀取和分類信息。
地理信息系統是描述地球、地球表面及其周圍空間中存在的物體的科學信息收集系統。該數據庫包含豐富的歷史數據和科學信息,許多科學知識可能會隱藏在地理信息系統的數據庫中。地理信息系統依靠數據分析和挖掘新技術的幫助,可以獲得快速的發展,并被廣泛應用[2]。
(1)雖然在地理信息系統中存儲了大量的客觀數據,但它的存儲容量是有限的,總是不完整地描述一個客觀世界。而物理數據挖掘主要使用深度數據學習等新技術,從這些有限的物理數據庫中發現新的物理知識,更新已有的物理數據和數學知識。基于深度挖掘技術的發展,智能地理信息系統技術不僅是一個數據信息處理系統,更是一個物理數據源和數學知識源。
(2)數據挖掘可以用來提煉大量的地理信息系統數據。現有地理信息系統,已經存儲了大量的重要數據,要對其中不同的數據進行區分識別,才能有效應用。利用數據挖掘技術,可以發現并計算分析信息層次和數據層次關系,使數據庫只用來存儲必要的重要數據和相互關系,從而可以細化GIS的數據庫結構,最大限度地節省內存空間,大大提高整個數據庫的管理效率和系統運行速度。
(3)用戶可以通過數據挖掘和智能地理信息系統技術的結合,來實現所需測量數據的更新,并對更新后的數據進行有效利用。數據挖掘應用于智能地理信息系統,使智能地理信息系統技術可以自動獲取知識和信息,通過專家系統與智能地理信息系統技術的結合,使其成為一個空間咨詢和決策支持系統,而數據挖掘與智能地理信息系統技術的結合,使其成為一個真正的智能空間信息系統[3],其自動化、智能化程度更高。
隨著雷達、紅外、光電、衛星、電視攝影、掃描圖像科技,以及各類宏觀和微觀傳感器技術的廣泛應用,遙感影像數據的總量、規模和復雜度都在飛速地擴大,已大大超過了人的分析和解譯能力。用戶已經不能夠更詳盡地解析已有數據信息,造成'空間數據信息爆炸但科學知識匱乏'。所以,迫使人們通過發展遙感影像數據信息內容的發掘(remote sensing image information mining,ReSIM)技術,找到并挖掘出蘊藏于遙感影像數據中的新信息。這是一種涵蓋了眾多學科,如影像數據處理、空間數據庫、空間數據分析表現和圖像可視化研究、空氣信息挖掘、地方信息技術、資訊獲取、機械教學與設計等的新型科學技術領域,它是急需發展的信息理論和科學技術研究的新興產業,是空間數據挖掘科學技術研究范疇的一個重要分支。
遙感是在20世紀60年代發展起來的對地探測綜合性科學技術,它以多光譜、多時相、高分辨率、多傳感器以及全天候的服務特性為地球科學提供大量對地探測數據,并推動了遙感技術地球科學應用向更廣闊、更廣泛的方面發展。但盡管如此,地面遙感的實際應用技術水平卻遠遠落后于空間遙感科學技術的進展,突出表現為:從衛星上發回的大量遙感數據并沒有得到有效充分運用,對遙感數據處理資料了解的欠缺以及對遙感技術專題信息提取水平的落后,使得遙感技術數據中隱含的豐富科學知識遠遠不能得到充分的挖掘與運用,從而導致了遙感數據處理資料的大量耗費,以及實際使用價值的減少。所以,遙感數據的獲取能力和認識與分析能力,將成為未來遙感技術應用中應重點研究的問題。
遙感數據是地表信息內容的反映,但因為地理體系的復雜化和開放式,地球表面信息內容往往是多維的、無限的,而通過信號傳遞所獲取的遙感數據也就是最簡單的二維信號,所以遙感數據的地學空間解析和傳播過程反演,帶有模糊和多解的特征。遙感信息的復雜化和不確定性的特征,給影片的解譯工作造成了很大障礙,也是遙感信息得到進一步實用化和深化研究的主要障礙。
遙感系統是以地理信息技術為理論基石,通過綜合應用數學統計分析、新一代人工智能、神經網絡、進化運算、數據分析發現等現代智能理論與技術手段,在現代地理信息系統與專家系統的幫助下,把不同表達的地學信息加以融合,從而發現了遙感影像的信息特性,并模擬了地學專家對遙感影像的認識與理解,從而完成遙感影像的自動解譯和進一步綜合決策分析。
解讀遙感大數據的根本目的是掌握數據背后的知識和規律。遙感挖掘技術是空間數據挖掘技術的一個重要分支,其已成為空間數據挖掘的主流。在研究遙感與影像信息挖掘的基本框架基礎上,簡要介紹其所涉及的基礎理論和關鍵技術,重點涉及目標確定、影像索引與檢索、影像分析與聚類、關聯規則挖掘等。
目標辨識管理系統,一向是在映像處理應用領域中一種相當活躍的研究范疇。因為對象模式一般是先驗的意識,而目標識別管理系統則利用它來找到影像上真正的人地物。這是視覺影像數據挖掘中最重要的一點。但一般來說,目標識別問題也被視為根據已有模式的監督標識提問。也就是說,給定網絡中某個含有單個或許多感興趣目標對象的映像,或者某個已標識的與目標對象有關的模式,目標識別問題將有適當的標識給響應的目標區域,或一組響應的區域。已知的對象模型,常常都是由人輸入一個先驗值。
影片挖掘者需要根據某些特殊的條件,來搜尋影片訊息。上述規則和要求,根據其復雜性可以分成如下三個階段:一是對影片中原始信息的檢查,這種原始影像信息內容中包含了色彩、紋樣、形態和影像元素的空間定位;二是對映像邏輯屬性的搜索,即已指定類型目標的搜索;第三則是對映像抽象屬性的空間搜索。
在人們將關注的焦點聚集到社會各個層面的資訊需求上之際,為檢索影像數據而進行快速有效的搜索策略,也是十分必要的。一般來說,被檢索的影像數據庫的信息量都是相當大的,屬性矢量通常是高維的,查詢復雜度也相當高。
根據研究內容的影像數據智能劃分,是從大量影片數據分析中發現有價值信息內容的最重要方法之一,劃分模塊在影片發現體系中也叫分類器。
關聯規則挖掘的目的就是挖掘經常同時出現的事件項或對象。在影片中,關聯規則挖掘主要是用來發掘一些特定的對象同時存在時出現某種事物或情景的可能性。
遙感圖像數據中的“深度知識”,如空間位置分布規律、空間關聯規則、形態特征分化規則等,必須通過操作和學習來挖掘。圖像數據庫中的空間關聯規則挖掘,與事務數據庫中的空間關聯規則挖掘存在一定的差異。一幅圖像可以包含多個對象,每個對象可以有許多特征,如顏色、形狀、紋理、關鍵字和空間位置,可能有很多關聯。采用智能地理信息技術挖掘方法,可以在不損失數據挖掘結果質量和完整性的前提下,大大降低整體數據挖掘的成本。這是在大型圖像數據庫中挖掘關聯的一種有效方法。
利用全球遙感氣象數據分析挖掘技術,通過對全球遙感氣象數據的采集,進行高度智能化和高度自動化的采集分析,從當前全球氣象遙感范圍大氣的氣象數據中,自動分析挖掘采集得到的與地球上的各種氣象相關聯的氣象物理信息,實現從全球氣象遙感知識到大數據分析知識,到氣象科學知識的全新技術轉變,突破“大數據,小知識”的全球氣象遙感和天氣大數據挖掘氣象應用處理技術發展瓶頸。
遙感信息大數據的數據分析挖掘工作過程為:首先進行數據的分類獲取和綜合存儲,存儲從各種不同的視覺傳感器中獲取的各種海量、多源流的遙感信息數據,并利用去噪、采樣、過濾等技術方法,對其進行綜合篩選后再整合形成一個數據集;然后對這些數據集進行分類處理和綜合分析,如分別利用矢量線性和非線性等統計學技術方法進行綜合分析,并根據一定邏輯規則對這些數據集進行分類,并綜合分析這些數據及不同類別數據間的互聯關系等;接著對分類后數據類別進行深度數據挖掘,利用人工網絡、決策樹、云計算模型、深度機器學習等技術方法,探索和分析發現數據間的各種內在聯系、隱含關聯信息、模式及隱含知識;最后通過可視化信息模式及隱含知識等,用直觀的數據展示模式方便企業用戶深入理解,并將數據類別信息進行數據融合,方便用戶分析和綜合利用[4]。
隨著我國衛星航空遙感照片圖像和地球航空遙感物理圖片圖像分辨率的不斷提高,人們不僅可以從衛星遙感照片圖像中同時獲得更多有用的遙感數據和影像信息,同時利于遙感圖片影像信息分類技術對遙感信息提取。
隨著全球遙感技術和自動地理環境信息監測系統分析技術的快速發展,基于全球遙感技術數據的自動地理環境信息系統分析技術得到了快速的發展,并廣泛地應用到自然資源與環境管理、自動環境制圖、設施環境管理、城市與工業區環境規劃、人口管理與商業環境利用、交通運輸、石油與天然氣利用、教育與軍事等九大產業的100多個工業領域。
綜上所述,遙感技術所獲得的信息,為專業地理數據庫提供了大量豐富的內容,智能地理信息系統技術為我國遙感技術的發展和廣泛應用,提供了良好的技術環境。創新發展的遙感專業技術模型的形成,數據挖掘的深度與廣度,使得遙感信息技術應用產生了一個新的飛躍,促進了地理數據的快速發展。