楊學習
1. 北京大學遙感與地理信息系統研究所, 北京 100871; 2. 中南大學地球科學與信息物理學院, 湖南 長沙 410083
地理空間異常模式探測旨在發現地理空間中“與眾不同”的實體或現象,為深入剖析地理現象或地理過程的特殊分布狀況、變化或發展規律提供重要的理論依據和實踐指導。隨著異常探測應用需求的越來越廣泛、深入,對異常探測的算法精度、智能化以及探測結果的可靠性要求越來越高。因而,一方面需要充分考慮地理空間數據自相關、異質性、多尺度等特性;另一方面需要解決探測參數設置大多依賴主觀經驗,以及探測結果有效性評價等問題。鑒于此,論文在既有研究的基礎上,結合空間認知、空間統計學、圖論等理論工具,深入系統地研究地理空間異常模式統計探測模型與方法。主要研究內容如下:
(1) 充分考慮空間認知、領域知識對地理空間異常模式探測的重要指導作用,提出了地理空間異常模式研究的分類體系,在此基礎上,構建了一個地理空間異常模式探測的新框架。從地理空間認知的角度深入剖析了地理空間異常模式的內涵與特征,加深地理空間異常模式的認知理解,并探討了地理空間異常探測過程中需要解決的兩個關鍵問題,即地理空間鄰近關系表達和地理空間異常度量。
(2) 針對空間異常區域探測過程中區域形狀復雜以及異常判別參數設置等關鍵問題,提出了顧及專題屬性的面狀空間異常模式統計探測方法。具體包括:①基于多層次專題屬性約束的方法。該方法分別把空間距離和專題屬性距離賦值為Delaunay三角網邊的權重進行層次約束,根據集簇數目進行異常模式的統計判別。②基于空間掃描統計的方法。該方法自適應構建空間鄰域,并發展了一種耦合空間-屬性的異常度量指標,采用空間掃描統計的策略獲取候選異常區域,并對空間異常區域的顯著性進行統計檢驗。所提方法被應用于檢測極端氣候事件、探測土壤重金屬污染潛在污染源和探究城市偏高房價影響因素。試驗結果表明,所提方法能夠自適應探測任意形狀的異常區域。
(3) 針對顧及多變量的地理空間異常探測過程中實體地理環境的復雜性、變量關系的非線性以及探測結果的顯著性判別等關鍵問題,提出了融合多變量特征的地理空間異常模式自適應探測方法。首先,采用地理環境相似性和地理加權回歸模型對多變量特征進行定性和定量描述,顧及空間數據分布特征發展了一種自適應的權重構建機制。然后,在此基礎上,發展了一種基于地理環境相似性的顯著空間異常探測方法。最后,該方法應用于分析氣溫年平均數據與高程、土壤重金屬采樣數據與各影響因素距離、高程等變量的異常關系。試驗結果表明,該方法能夠探測更深層次的地理空間異常模式。
(4) 針對顧及多類別的地理空間異常探測過程中實體類別的差異、交叉強度的描述以及多尺度探測結果顯著性的評價等關鍵問題,提出了多類別交叉的地理空間異常統計探測方法。該方法從全局和局部視角對參考數據集的分布特征進行建模,分別采用模式重建和蒙特卡洛隨機模擬構建空間交叉異常顯著性判別的非參數檢驗。進而,發展了一種空間交叉異常多尺度探測結果的有效性評價指標。所提方法被應用于分析城市金融設施與搶劫犯罪間的交叉異常。試驗結果表明,該方法可以在多個分析尺度上探測交叉異常模式,有效解決探測結果的誤判和漏判問題。