高屹++陳小瑩++孫海霞
摘 要:當今社會是一個經濟和科技高速發展的社會,各種先進的技術被應用到生產以及生活活動之中。其中可視化技術就是一個非常顯著的體現。通過信息可視化,我們可以更加直觀的分析數據,此時使用人能夠非常直觀的查看數據,進而得知其中隱藏的關系等。如今該項技術被大范圍的運用,具體來講主要被用到如下幾個層面中:數據挖掘可視化、網絡數據可視化、社交可視化、交通可視化、文本可視化、生物醫藥可視化等。
關鍵詞:信息可視化;可視化技術;人機交互;數據挖掘
中圖分類號:TP391 文獻標志碼:A 文章編號:2095-2945(2017)20-0167-03
可視化技術最早被人們運用是上個世紀的末期,通過將其合理的運用信息工作中,我們能夠將信息精準的變化為視覺模式,能夠便于我們更加直觀的查看數據,此時使用人能夠很直觀的分析數據,便于我們得知其中隱藏的各種聯系,在過去的時候很顯然這是無法做到的。進入到新的發展時期之后,由于電腦技術高速發展,此時數據處理工作也迎來了全新的發展局面,其處理能力明顯提升,而且方式也明顯增加,此時使用人能夠隨意地查看自己所需的各種信息內容,目前該技術的應用范圍非常廣。
1 信息可視化的過程
1.1 Card信息可視化模型
在Card等提出的信息可視化模型中,我們可將其過程分成三個具體的步驟,即:原始數據到數據表的轉換、數據表到可視化結構的轉換、可視化結構到視圖的轉換。
1.2 信息可視化過程
按照上述的模型,我們可以將該可視化活動分成如下的幾個步驟。
第一,預處理數據。具體來講,把獲取的信息提前處理,方便人們理解,便于將其錄入到模塊之中。而預處理內容包括數據格式及其標準化、數據變換技術、數據壓縮和解壓縮等。對于一些特殊的數據還要對其進行特殊處理,比如要降維。
第二,繪制。通過繪制我們可以將數據變成具體的圖形。具體來講在繪制的時候一定要認真分析使用人的需求,然后再結合該技術加以體現。
第三,顯示以及交互。所謂的顯示,具體來講是把繪制得到的圖形,依據使用人的規定對其合理輸出。同時還應該將使用人反饋的內容合理的傳輸給軟件,只有這樣才能夠真正的實現人機互動。
2 信息可視化技術
根據SHNEIDERMAN的分類,信息可視化的數據分為以下幾類:一維數據;二維數據;三維數據;多維數據;時態數據;層次數據和網絡數據。在上述的類型中,后面的幾種是我們當前工作的重點,接下來具體針對它們展開細致的論述和分析。
2.1 多維數據可視化技術
對于多維數據來講,如果使用以前的二維圖的話,其弊端較多,不能夠滿足當前的工作需要,比如無法確保信息量,無法滿足其復雜性等。而多維數據的運用就能夠很好的解決上述的弊端。目前多維數據可視化的類型非常多,接下來具體闡述幾種目前應用率較高,具有典型性的方法。
2.1.1 基于幾何的可視化方式
(1)平行坐標系。它主要是運用平行的軸線來體現維度,具體來講是在軸線上刻畫數據,并用折線相連某一數據項在所有軸上的坐標點,這樣就可以在二維模式之中看到多維數據了。點的位置使用彈簧模型計算得到。不過它也有缺點,即如果數據規模非常大的話,就會導致我們在視覺上有一種混亂的感覺,干擾使用人理解可視化內容。
(2)散點圖矩陣。具體來講,它指的是借助二維坐標中的具體的點來體現變量的聯系。一般情況下,我們常把這個方法和別的方法組合到一起使用,這樣做的好處是能夠明顯的增強數據的顯示效果,能夠體現大量的數據。這種技術的優點是能夠以非常快的速率得知成對變量的聯系,不過它也有不利點存在,即如果維度非常大的話,由于屏幕有限,因此無法體現矩陣數據的總量,此時必須借助交互技術才能夠實現我們觀察數據的目的。
(3)Andrews曲線法。其指的是借助二維坐標體現數據,把多維空間的各種信息借助函數體現到曲線之中,經由觀察曲線,我們能夠得知數據的各種聚類情況。
2.1.2 基于圖標的可視化方式
基于圖標的可視化方法用具備可視特征的幾何形狀作為圖標來刻劃多維數據,這些圖標的每一個可視化屬性如大小、長度、形狀、顏色可以作為維度,通過多維數據到這些圖標屬性的映射來實現可視化效果,代表性的方法包括星繪法和Chernoff面法等。星繪法采用由一點向外輻射的多條線段代表數據維度,各種線段的長度體現了對應的維度數。Chernoff面法指的是借助人臉的特點來體現維度,通過繪制臉圖得到多維數據,依據特定策略對其排序,以此能夠確保數據以可視化模式體現出來。它的優點是較之于別的圖形更加的吸引人的注意,因此廣大用戶們喜歡花費很多時間來研究它們,所以其展現的效果更好,除此之外,它還能夠幫助我們更好的識別要素的內在關聯。
2.1.3 動畫的多維可視化技術研究現狀
眾所周知,由于動畫能夠更加直觀的體現內容,給我們帶來更加完美的視覺體驗,因此它被大量的運用到使用人的界面里面。通過研究我們發現,使用動畫能夠幫助我們獲取更高的交互性,而且更加便于理解。具體來講有以下四點體現。第一,較之于靜止不動的物體來講,移動的物體可以更加的吸引我們的目光。第二,通過動畫,我們能夠得知對象的變化情況,比如它的方位以及形態和色澤等,此時我們可以很明顯的感受到客體的改變情況。第四,比對于靜止的物體來講,廣大用戶對移動的物體更加的感興趣,在查閱數據的時候心情更加的舒暢。怎樣做好動畫設計工作,確保其更好的被使用人所理解就成為了當前工作的重中之重。具體來講,目前常用的方法有兩種,其一,在編碼的時候運用動作,將其變成附加的變量。其二,借助動畫確保各種轉換都能夠很好的被理解。錐樹在樹的多個層次上利用動畫的旋轉使選定的項目進入觀察者的視野。SpaceTrees和DOITrees利用動畫動態地展示樹的枝葉展開和折疊的情形。同時,假如動畫的變化速率非常慢的話,無疑是一種對時間的浪費,相反的如果太快的話就會使得人們無法很好的理解。因此我們一定要確定好其速度,一般來講主要是依據場景的狀態和使用人的背景來明確,在具體的運用的時候一定要認真分析。
2.2 時間序列數據的可視化
所謂的時間序列數據,具體來講指的是有著時間特性的數據集,具體來講,其可視化形式有以下的幾種。
第一,線形圖。它是最為常見的一種形式。借助點來體現數據以及時間發展。如果數據有很多的時間維度,那么我們就可以為所有的維度創建對應的圖標,讓它們對齊,這樣做的目的是為了對比事件的發展方向。
第二,堆積圖。它體現的是事件序列的累積模式,我們可以借助這種方法獲知序列總和。它的優點是可以很好的體現出序列的總和,不過它也有缺點,即無法對比所有的序列,而且如果處理的時候出現了負數的話,其效果也不是很好。
第三,動畫。比對于靜態的圖畫來看,它的優點是可以體現時間序列是否改變。不過它的缺點是無法很精準的體現數據。
第四,時間線。具體來講,它指的是借助時間軸,把數據以圖形的形式體現到坐標中。
2.3 層次數據的可視化
在各種數據中,層次數據的出現幾率非常高,它能夠被用以繪制各種生物以及組織形式和社會關系網等。其形式有兩種,接下來分別論述。
(1)節點鏈接圖。節點鏈接圖是將層次數據組織成一個類似于樹的節點的連接結構,繪制節點等來體現數據與它們的內在聯系,一般來講節點非常小,無法涵蓋很多內容。它的鏈接圖可以很清楚的體現數據之間的聯系,不過它們之間存在很大的空白,這就導致嚴重的浪費,如果數據非常多的話,這些分支就會聚集到一起,很明顯此時的局面就會非常混亂,導致我們從視覺上無法加以判斷。
(2)樹圖。上世紀末期,有專家提出樹圖技術。它可以在特定的空間里體現很多的數據,不過它的缺陷是不能夠具體的體現一些細節。為了很好的體現它的細節,科研人員研發出了基于“焦點+上下文”技術的交互方法。
2.4 網絡數據可視化
網絡數據具有網狀結構。自動布局算法是網絡數據可視化的核心,有3種具體的類型:一是仿真物理學中力的概念來繪制網狀圖,即力節點鏈接圖二是分層布局(hierarchical layout);三是網格布局(grid layout)。目前許多的科研工作都是以上述算法為基礎的。在網絡數據的可視化中,如果節點有非常多的連接的話,就會形成邊交叉,進而使得我們在視覺上有一種非常混亂的感覺。為此,我們研究了集束邊技術,它能夠很好的處理上述的弊端。其類型非常多,比如力導向的集束邊技術、層次集束邊技術、基于幾何的邊聚類技術等。
3 其他研究熱點
3.1 可視化圖形的視覺因素研究
目前很多的科研工作者都意識到視覺要素會對可視化有很明顯的影響,比如其位置以及色彩等。通過評價此類要素對使用人的感知方面的影響效果,使得設計工作者可以不斷的優化發展,是當前工作的重點內容。BER-TIN首次進行了系統的實驗,研究了視覺要素在名義、序列和度量數據可視化中的效果,CLEVELAND等采用基于人類的主觀認知的科學實驗測試了可視化要素的影響。SIMKIN等測試了人類對條形圖和餅形圖的認知差異。通過自適應可視化技術,可以為使用人調整可視方式等。目前按照研究人員的工作情況,我們可以將其分成如下的幾種類型,分別是自適應可視化展示、自適應資源模型、自適應用戶模型。
(1)自適應可視化展示。具體來講,它指的是結合使用人的特點,自行為他們提供所需的各種類型,它能夠自行確定內容和布局等,同時還可以自動變化色彩和圖標之類的內容。
(2)自適應資源模型。其目的是為了切實提升技術的性
能。
(3)自適應用戶模型。它指的是經由體現使用人的模型內容來確保使用人可以自行編輯數據,確保他們能夠操控數據。
通過上述我們可知,該技術是靜態存在的,在交互性方面表現的較差,無法幫助用戶深入學習各種信息。
3.2 可視化效果的評估
在MORSE等人看來,當前關于該技術的評價不是很多,展開的研究課題非常少。MEYER指出沒有普遍接受的關于最優數據展示的標準,部分原因在于缺乏實證證據和可視化方法種類太多。PURCHASE認為評估只是根據美學因素或計算效率評價可視化是不可取的,而是應該考慮可視化對用戶績效的提升能力。通過分析我們發現界面是否美觀和其績效之間有著非常緊密的關系。雖然美學因素經常和感知易用性相聯系,但是感知易用性和實際的可用性可能是不相關的。目前還有一些研究人員認為可以借助表現力來開展評價工作,當然也有人認為需要借助有效性來評價。
目前一些研究人員將工作重點放到評估特定行業的可視化情況。不過,DOWELL等看來,由于其只是針對特定行業開展的,因此它的推廣效益不是很好。而最常見的評價措施是借助心理學知識,運用各種可視化措施展開具體的測試活動,然后分析被測試人的回答,以及他們回答的精確性和回答過程中的自信程度以及所耗費的時間等要素,比對各種方法的優缺點。
總的來說,它的評價措施以及系統等目前受到很多研究工作者的關注,不過相應的研究成果并不是很多,發展較為落后,所以對于這種狀況,我們當務之急的工作是要將精力集中放到評價理論以及運用情況等的分析工作之中。
4 結束語
通過上述內容我們可知,當前時期信息可視化技術已經被大范圍的應用到我們的工作之中,其研究活動也開展得如火如荼。經過相關工作者的不斷努力,目前已經在這方面積累了很多的經驗,而且也在不斷的朝著新的方向發展。按照其原則,在具體的運用的時候要切實遵守如下的要素:直觀化、關聯化、藝術化、交互化。同時,還要切實將它和數據挖掘技術聯系到一起,確保其得到更好的運用,目前該技術的應用區間非常廣,使用人的反饋也很好,我們堅信隨著時代的發展,該技術一定會發展得越來越好,我們國家的經濟建設工作也一定會更加的輝煌。
參考文獻:
[1]DEFANTI T A,BROWN M D,MCCORMICK B H.Visualization:Expanding scientific and engineering research opportunities[J].Corn-puter,1989,22(8):12-16.
[2]ROBERTSON G,CARD S K,MACKINLAY J D.The cognitive coprocessor architecture for interactive user interfaces[A].Proceedingsof the 2nd Annual ACM SIGGRAPHSymposium on User interface Software and Technology[C].New York:ACM,1989:10-18.
[3]SINDIY 0,LITOMISKY K,DAVIDOFF S,et a1.Introduction to information visualization(InfoVis)techniques for Model-Based systems engineering[J].Procedia Computer Science,2013(16):49-58.
[4]陳建軍,于志強,朱昀.數據可視化技術及其應用[J].紅外與激光工程,2001,30(5):339-342.
[5]任磊,王威信,周明駿,等.一種模型驅動的交互式信息可視化開發方法口[J].軟件學報,2008,19(8):1947-1967.
[6]劉大海.海量數據可視化方法的研究[D].天津:天津大學,2009.
[7]楊峰,李月華.高維信息可視化方法研究綜述[J].情報理論與實踐,2012,35(9):125-128.
[8]盛秀杰,金之鈞,王義剛.一種新的面向多元統計分析的信息可視化技術[J].石油地球物理勘探,2013,48(3):488-496.
[9]SIIRTOLA H.Direct manipulation of parallel coordinates[A].CHI'00 Extended Abstracts on Human Faetors in Computing Systems[C].New York:ACM,2000:373-378.