宋國民,吳軍珂,黃麗華,徐少坤
(1.信息工程大學,河南 鄭州 450001;2.61512部隊,北京 100088;3.61175部隊,江蘇 南京 210049)
近年來,得益于互聯網、地理信息系統等技術的推動,人們對于地理空間信息的需求不斷增大。對于地理空間信息的描述,通常使用地理空間元數據,其大多為專業知識的文本或數字的抽象化表示,非專業人員難以理解文本或數字背后隱藏的豐富信息,更無從知曉海量地理空間信息之間在特征、語義、內容等方面的關聯關系。1989年,Robertson,Car d和 Mackinlay在科學可視化的基礎上提出信息可視化的概念[1-2],目的在于利用計算機支撐的、交互的、對抽象數據的可視表示,來增強人們對這些抽象信息的認知[3]。目前,基于信息可視化的數據檢索研究已經廣泛展開,在信息檢索、數據挖掘、數字圖書館等方面都取得較快的發展。本文通過引入信息可視化技術中的平行坐標方法,探究基于平行坐標實現地理空間元數據可視化檢索的方法,以期提高數據檢索和服務效率。
地理空間元數據是用于描述地理空間數據集相關信息的數據,它可以對地理空間數據集的空間、時間、屬性等信息以及數據集的獲取、處理、使用等信息進行詳細描述?;诘乩砜臻g元數據,用戶可了解數據集的名稱、質量和組織方式等詳細信息,為實現地理空間數據的共享提供基礎數據支撐。
地理空間元數據有兩個特點:一是抽象性,即數據的表現形式為數字或文本,表現形式不直觀;二是多維性,即元數據描述內容多樣,其可以描述數據集的空間位置信息、數據生產信息、數據質量信息等等,要完整描述一個數據集往往需要幾十甚至幾百條元數據。如何基于抽象的、多維的地理空間元數據進行高效的數據檢索服務,一直是實現數據共享待解決的問題。
信息可視化是將抽象信息用可視的形式表示出來,用于揭示抽象信息之間的關系和信息中隱藏的特征[4]。信息可視化結合諸多學科的理論和方法,可獲取絕大部分具有非幾何屬性的抽象信息間的復雜關系。數據探索是信息可視化的核心,目的在于形象化地表達信息,發現新知識,識別信息在結構、模式、非規則、趨勢等方面的規律[5]。當前,信息可視化的研究主要集中在層次信息可視化、多維信息可視化、文本信息可視化和Web可視化等方面[6]。
在信息可視化中,絕大部分的抽象信息是3維以上的多維信息。如何將多維度、多屬性的信息以直觀的形式加以表達是多維信息可視化的根本任務。多維信息可視化通常可采用平行坐標、散點矩陣、星狀圖和Chernoff臉譜圖等方法[7]。其中,平行坐標已經成為多維信息可視化領域主要使用的方法之一,其可以很好地解決維數增加的問題,滿足多維信息可視化的基本要求,目前已經被廣泛應用于該領域。
平行坐標是一種在二維空間中采用多條等距離、垂直的平行坐標軸表示多維空間,通過平行坐標軸上的取值表示對應數據維屬性的可視化方法(見圖1)。平行坐標中數據關系的表達非常直觀,易于理解,且信息量豐富,有助于發現大規模數據中多維屬性之間復雜的關系[6-7]。平行坐標可用于高維、多元數據的可視化,如地理空間元數據。

圖1 平行坐標
在地理空間元數據檢索中,平行坐標將用戶關注的元數據屬性項映射為平行坐標軸,根據元數據屬性項的關注程度設置相應的坐標軸順序。檢索結果以各個坐標軸上屬性值的連線顯示。用戶可交互式地添加或刪除元數據屬性項對應的坐標軸,以對檢索結果進行過濾篩選。當檢索結果數據量比較大時,坐標軸之間的連線可能比較密集,要素間的關系會模糊不清,可對連線進行半透明化處理,連線顏色的深淺可反映元數據的趨勢特征;當數據量較少時,平行坐標有利于用戶快速查找所需的數據[8]。
平行坐標屬于幾何轉換技術的一種,是對傳統坐標系統的擴展。其原理就是對多維數據集的屬性進行幾何映射,使其轉換成二維平面或三維空間可以表達的形式,采用的是一種數據降維的思想[9]。
平行坐標的實現思路如下:在具有X軸和Y軸的二維平面中,等間隔放置n條垂直坐標軸Y軸,分別記為x1,x2,x3…xn,每個Y 軸上放置一維屬性項,各Y軸的取值范圍是對應屬性項的最小值到最大值,各屬性值均勻分布在對應的Y軸上。這樣,每一條數據記錄都可以用一條折線表示到n條平行坐標軸上。假設一條地理空間元數據記錄有n個屬性項(n個維度),其屬性值為(C1,C2,C3…Cn),則其在平行坐標上的表示如圖2所示,折線可表示為P(C1,C2,C3…Cn),其n個頂點分別位于xi軸上的(i-1,Ci)。圖3是基于平行坐標繪制的10條6維(6個屬性項)地理空間元數據記錄的效果。

圖2 平行坐標繪制原理
平行坐標的基本思想是將多維信息映射到二維平面上,解決多維信息的顯示問題,加以設計合理的交互方式,可以方便用戶根據需要在檢索結果的基礎上挖掘更多的信息。應用于平行坐標的交互技術主要有刷取技術、維數控制、維度縮放、坐標軸交換等。
2.2.1 刷取技術

圖3 多維地理空間元數據可視化效果
刷取技術是一種突出顯示某個數據子集的可視化技術。其根據用戶的操作,動態地更新交互結果,其中圖形重繪是主要的方式,且圖形重繪要及時并且使重繪后的結果更加直觀[10]。例如,圖形的高亮顯示是平行坐標中常用的交互方式,當鼠標移至某條記錄數據的折線時,折線會變粗或者改變顏色以突出顯示該條記錄。刷取技術可以使用戶更清晰地了解局部數據的變化規律,著重分析用戶所關注的內容。
2.2.2 維數控制
如果用戶不關注某些屬性項,可忽略表示這些信息。在平行坐標中,可以通過控制數據屬性項的數量,即控制平行坐標軸的維數,只將用戶關注的屬性表現出來,這樣既可以減小平行坐標的復雜度,又可以減少不重要數據對顯示結果的干擾,使用戶更容易對數據進行分析[11]。
2.2.3 維度縮放
當用戶關注的屬性項過多或較少時,平行坐標的坐標軸(即相應的維度)會相應地增加或減少,出現坐標軸過于密集或分散的情況,這會影響可視化的效果。維度縮放是用戶通過鼠標拖拽,對坐標軸之間的距離進行適當調整的人機交互方式,這種交互可以使視覺效果更加明顯[12]。
2.2.4 坐標軸交換
坐標軸交換是指用戶通過人機交互操作,調整各屬性項對應坐標軸之間的順序關系。通過坐標軸交換,可以將用戶重點關注屬性項的坐標軸前移,或把用戶認為屬性關系較密切的坐標軸相鄰,更好的呈現屬性間的關系,方便用戶挖掘更多的信息。
平行坐標相較于傳統的地理空間元數據的可視化方法有著明顯的優勢。其優點主要有:
1)平行坐標與傳統直角坐標相比最大的優點是對維度無限制。在傳統的可視化方法中,當數據維度較多時,就會出現視覺混亂,可視化的效果會大大降低。平行坐標則十分直觀,不會因為數據維度的增加而無法顯示。
2)平行坐標具有良好的數學基礎。坐標軸的對稱性可以確保各數據維度的均勻分布,由多維到二維的獨特映射讓用戶關注的每項數據都能充分顯示,適合進行可視化的數據分析。
3)可視化的圖形簡單明了,易于理解。每條數據記錄以折線的形式顯示,折線與坐標軸的交點即為數據項在該軸上的屬性值。
與此同時,平行坐標也存在一些需要解決的問題:
1)當用戶關注的數據維度(屬性項)較多時,容易導致垂直坐標軸之間距離較近,辨認數據項的結構和關系時會比較困難。另外,當查詢檢索得到的記錄較多時,會出現圖形重疊、層次不清的情況,使用戶難于識別,如圖4所示。

圖4 檢索記錄較多時的平行坐標效果
通??刹捎镁S數控制調整用戶關注屬性項的數量,或采用維度縮放技術調整用戶關注屬性項的坐標軸距離,并通過分層方式組織數據集,解決多維度、多記錄信息可視化的效果問題。
2)折線的意義較單一。各平行坐標軸之間的連線只是簡單的折線,除了能表示一條數據記錄之外,無法承載更多的含義,這樣往往會導致用戶因為折線的波動而影響對數據的分析和理解。
3)從整體的角度分析數據方面有所欠缺,也不能反映出局部的變化趨勢。
基于平行坐標的地理空間元數據可視化檢索原型系統的檢索流程如圖5所示,其主要步驟包括:限定檢索范圍及關鍵詞(元數據屬性值)、可視化要素選擇(選擇關注的元數據項)、可視化映射、交互操作、得到檢索結果(地理空間元數據或數據集)。

圖5 原型系統檢索流程
利用Microsoft Visual Studio 2010編譯平臺,結合 WPF(Windows Presentation Foundation)開發包,構建基于平行坐標的地理空間元數據可視化檢索原型系統。原型系統的框架如圖6所示,系統主要由3部分組成:①數據檢索窗口;②可視化要素選擇窗口;③檢索結果繪制及交互窗口。實驗數據為我國1∶100萬、1∶25萬矢量地圖的元數據信息。

圖6 原型系統界面及實驗結果
平行坐標是一種用于表達多維空間中點的幾何投影方法。多維地理空間元數據的數據集是由多維空間中多變量函數的多個取值點構成的數據集合。平行坐標可以把多維地理空間元數據的數據點映射到二維空間中,而且不受維數的限制,可有效解決多維地理空間元數據可視化的問題。
[1] ROBERTSON G,CARD S K,MACKINLAY J D.The Cognitive Co-processor for Interactive User Interfaces[A].ACM SIGGRAPH sy mposiu m on User interface soft ware and technology[C],New Yor k.1989:10-18.
[2] 董士海,王堅,戴國忠,等.人機交互和多通道用戶界面[M].北京:科學出版社,1999.
[3] 周寧,張玉峰.信息可視化與知識檢索[M].北京:科學出版社,2005.
[4] 劉慶元,易柳城,劉莉.基于diamond square算法的數字地形模型構建與三維可視化研究[J].測繪工程,2014,23(2):1-4.
[5] 袁國明,周寧.信息可視化和知識可視化的比較研究[J].科技情報開發與經濟,2006,16(12):93-94.
[6] 徐少坤.地理空間元數據可視化研究與實踐[D].鄭州:信息工程大學,2013.
[7] 徐少坤,宋國民,王海葳,等.基于信息可視化技術的地理空間元數據可視化研 究[J].測繪工 程,2013,22(3):83-87.
[8] 徐少坤,宋國民,陳令羽,等.多維可視化技術在地理空間元數據檢索中的應用研究[J].地理信息世界,2013,20(1):46-50.
[9] 鐘志文.基于平行坐標的關聯規則挖掘技術可視化研究與實現[J].常州工學院學報,2012,25(2):29-33.
[10]周曉崢,劉勘,孟波.多維數據集的平行坐標表示及聚簇分析[J].計算機工程,2002,28(1):94-95.
[11]董軍凱.基于平行坐標法的可視化數據挖掘技術研究[D].北京:北京工業大學,2008.
[12]路燕梅.基于平行坐標的可視化多維數據挖掘的研究[J].現代計算機:專業版,2011(20):16-19.