王遠帆 張世良


摘要:大數據時代的到來以及網絡科學的發展,使得空間交互研究成為目前信息科學領域的研究熱點。以往的研究和分析方法已經不是那么適用于基于大數據的所得到的空間交互數據。本文針對空間交互可視化、距離衰減方法、粒子群優化算法及BGLL算法等進行研究和實現。空間交互可視化的研究對于認識許多社會經濟現象,理解空間在其中發揮的作用是十分重要的。
關鍵詞:空間交互;距離衰減;BGLL算法;可視化
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2020)19-0008-02
開放科學(資源服務)標識碼(OSID):
空間交互的研究對于人們認識許多社會經濟現象,理解空間在其中發揮的作用是十分重要的。由于大數據時代所帶來的便利,我們現在可以輕松地獲取不同尺度上的空間交互數據。但是同樣由于大數據的大量、高速、多樣化等特點,我們獲取到的空間交互數據也往往是海量的、多樣化的。以往的研究和分析方法已經不是那么適用于基于大數據的所得到的空間交互數據。那么為了能更好地利用大數據時代提供給我們的便利,更好地進行關于空間交互作用的研究,如何研究和分析這種包含了“大數據”特點的空間交互數據,是目前十分重要且亟待解決的問題[1]。本文從可視化、距離影響、社區發現等方面出發,總結目前基于大數據的空間交互研究,應用實際數據進行了相關的空間交互研究并對結果進行評價。
數據可視化技術指的是運用計算機圖形學和圖像處理技術,將數據轉換為圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術。它涉及計算機圖形學、圖像處理、計算機輔助設計、計算機視覺及人機交互等多個領域[2]。空間交互數據的可視化主要關注數據的顯示方面,而流地圖則是表現空間交互數據的一種最常用的表現形式。流地圖中的點是根據實際地理位置固定的,代表實際的地點;流地圖中使用直線或者曲線來連接起點和終點,代表起點和終點之間的流。流地圖能夠使人清晰、快速地理解所要表達的流的含義、大小、方向等,能夠直觀地展示出流的空間模式。但是隨著數據規模的增大,大量的線之間的交叉以及覆蓋使得流地圖很快的失去它的有效性。
1 算法分析
1.1 距離衰減方法
空間交互的三大基礎:互補性、可轉移性和干擾機會[3]。其中可轉移性和干擾機會都是與距離相關的,可見距離對于空間交互的影響應該是十分巨大的,而這種影響就是距離衰減。在空間交互中,隨著距離的增長,交互強度相應減弱,這種現象稱為距離衰減。距離衰減有宏觀和微觀兩個層面的表現形式:宏觀層面上,由于距離衰減,兩個地理實體之間的交互總量在其他變量相對穩定的情況下,與距離表現為負關系;微觀層面上,在不考慮其他影響因素下,由于距離衰減,單個目標移動到不同目的地的概率與距離呈負相關。距離衰減的形成可以從與之相關的空間交互的兩個基礎上找原因。首先,根據可轉移性,空間移動的成本與距離成正相關,為了最小化成本,需要降低長距離交互的強度;其次,在交互目的地的選擇過程中,由于干擾機會的存在,降低了長距離交互的概率。目前根據實際交互強度來求解距離衰減系數的方法主要可以分為兩種,根據實際交互強度來求解距離衰減系數的方法主要可以分為兩種;一是通過公式推導或問題轉換的方法來計算出距離衰減系數解析值,稱為解析法;另一種是通過給定的假設條件,由計算機給定的假設條件,由計算機模擬大量的重復實驗,得到符合條件的距離衰減函數值,稱模擬法。
1.2粒子群優化算法
PSO算法求解重力模型也是基于逆重力模型的,思路是把估算節點規模的問題轉化為優化問題[4]。對于包含n個節點的空間交互網絡,粒子Xi被定義為Xi={PI,P2,-Pn},□□是每個節點的規模。初始化一群粒子后,給定距離衰減系數B,并求出相應的規模估算結果。在給定不同的B得到的結果中,選取估算結果最優的p值。粒子群優化算法( Particle Swarm Optimi-zation,PSO)是KennedY等(Kennedy et al.,1995)受鳥群捕食行為的啟發,提出的一種隨機搜索算法。它將優化問題的每一個解看作一個粒子,初始時每個粒子都獲得一個隨機的位置和初始速度。下一時刻的位置由當前位置和速度決定,而速度則是與所有粒子中最優的那個粒子有關。粒子通過不停迭代直到找到滿足給定的擬合優度的最佳位置,即最優解。
算法描述如下:
a)相關定義:首先,我們進行如下定義:粒子Xi={P1,P2,-Pn},其中Pi是每個節點的規模;粒子速度Vi={VI,V2,…Vn};實際觀測到的交互流量{T},其中每一個Tij是實際觀測到的節點i、j之間的交互流量;計算得到的交互流量{T'),其中每一個Tij是根據當前粒子中的節點規模,由重力模型算出來i、j之間的交互流量;
b)擬合優度(fitness value)評價函數fv0,輸入實際交互流量{T}和由粒子Xi計算得到的交互流量{T'},返回兩者之間的相似度,作為評價粒子Xi的指標。實質是一個求皮爾遜相關系數的函數;第i個粒子所找到的最優解pBesti_ {P1,P2,…,Pn),其中pi是每個節點的規模;第i個粒子所找到的最優解的擬合優度pBestFVi,記錄pBesti的擬合優度值;整個粒子群所找到的最優解gBest=(P1,P2 -,Pn},其中Pi是每個節點的規模;第i個粒子所找到的最優解的擬合優度gBestFV,記錄gBest的擬合優度值。
1.3 BGLL算法
BGLL算法是Blondel、Guillaume、Lambiotte和Lefebvre提出的一種基于模塊度優化的社區發現的算法。它的運行效率極高,即使是大型的復雜網絡,也能很快得出結果;與此同時,結果的模塊度也往往較高[5]。在計算結果與實際情況的對比中發現,該算法發現的社區的準確度也是極高的。更值得一提的是,該算法的結果是一個分層級的社區集合序列,可以得到不同空間尺度上的社區發現結果。
該算法分為兩個部分:
第一部分的步驟如下:
1)給定一個N個頂點的帶權圖,首先把每一個頂點都標記為不同的社區,即一共有N個社區;
2)對于每一個頂點i,我們考慮與i相鄰的每一個頂點j。計算把i從i的社區中刪除并加入j的社區所帶來的模塊度的變化。如果存在一個最大的模塊度的增加,那么就把i加入那個j的社區;如果結果都是模塊度減少,那么i就仍在原社區中:
3)重復步驟2)直到模塊度不再增加,第一部分結束。
至此,我們達到了一個局部上的最優,單個頂點的變動已經不能再使模塊度增加。
進行第二部分:
1)將第一部分得到結果中的社區轉變為頂點。新的頂點之間邊的權重是對應的兩個社區之間邊的權重的和,社區內部的邊變為新頂點上的自環。
2)對1)得到的結果進行第一部分的操作。我們發現BGLL算法實質上是一個從下而上的聚合算法,每進行一次聚合,都能得到一個尺度上的社區發現的結果。最后我們得到結果是一系列從下到上的社區集合,空間尺度由小變大,社區數量由多變少。算法示意圖如圖1所示。
2 交互實現過程
數據預處理將采集來的信息進行預處理和加工,使其便于理解,易于被輸入顯示可視化模塊。預處理內容包括數據格式及其標準化、數據變換技術、數據壓縮和解壓縮等[6-7]。有些數據也需要做異常值檢出、聚類、降維等處理,繪制的功能是完成數據到幾何圖像的轉換。一個完整的圖形描述需要在考慮用戶需求的基礎上綜合應用各類可視化繪制技術。顯示和交互顯示的功能是將繪制模塊生成的圖像數據,按用戶指定的要求進行輸出。除了完成圖像信息輸出功能外,還需要把用戶的反饋信息傳送到軟件層中,以實現人機交互。針對可視化的主要任務,即總覽、縮放、過濾、詳細查看、關聯等,交互技術主要包括動態過濾、全局+詳細、平移+縮放、焦點+上下文及變形、多視圖關聯協調等技術。其可視化實現過程如圖2所示。
3 結論
可視化是人通過視覺觀察在頭腦中形成客觀事物印象的過程,以人類慣于接受的圖形、圖像為媒介,并輔以信息處理技術,將客觀事物及其內在聯系表現出來。其不僅是客觀現實的形象再現,也是客觀規律、知識和信息的有機融合,同時還提高了人對復雜事物的觀察能力及整體概念的理解.可視化在空間數據分析和認知中起重要作用,其直觀形象地展示了空間數據的結構特征和復雜關系,是對知識更高層次的抽象概括,被廣泛應用于空間數據的分析和理解、信息的提取和表達、知識的發現和決策中。空間交互是從一個地理實體到另一個地理實體的流過程,這個過程中的流可以是人口的流動,可以是貨物的運輸,也可以是信息的傳播,抑或是金錢的投資。研究空間交互,對于人們認識許多社會經濟現象,理解空間在其中發揮的作用是十分重要的。隨著大數據時代的到來,我們現在能夠容易地從多種渠道獲取各種各樣的空間交互數據,比如基于手機和GPS可以得到海量個體的移動軌跡數據,通過社交媒體提供的API可以得到帶有位置標記的社交媒體簽到數據等等。這些數據為我們研究不同類型的空間交互作用提供了極大的便利。但是這些數據帶有大數據時代海量、多樣化的特點,我們需要不同于以往的、有針對性的方法來對這些數據進行處理和研究,才能更好地幫助我們理解空間交互。
參考文獻:
[1]劉智慧,張泉靈.大數據技術研究綜述饑.浙江大學學報(工學版),2014,48(6):957-972.
[2]宋樹華,程承旗,關麗,等.全球空間數據剖分模型分析[J].地理與地理信息科學,2008,24(4):11- 15.
[3]劉錫鈴,張世良.空間高維數據可視化方法研究[J].許昌學院學報,2013,32(5):59-63.
[4]劉錫鈴,張世良.自然災害智能化應急救援信息系統關鍵技術研究[Jl‘韶關學院學報,2018,39(9):32-37.
[5]張世良,王遠帆,劉錫鈴,基于Slice-Oriented算法的寧德市森林健康分類研究[J].中國管理信息化,2019,22(21):170-171.
[6]張世良,基于Android的寧德茶葉電商平臺研究[Jl,信息與電腦,2018(15):67-68,71.
[7]周亞男.遙感云環境下影像數據產品生成與可視化服務研究[D].北京:中國科學院大學,2014.
【通聯編輯:梁書】
基金項目:福建省自然科學基金計劃項目(2018J01579);福建省中青年教師教育科研項目(JAT170652);寧德師范學院創新團隊項目(2017T05)
作者簡介:張世艮(1973-),男,碩士,副教授,通訊作者,主要研究方向為空間信息科學與信息工程。