李公立 劉佃興 黃仲元
(北京清華同衡規劃設計研究院有限公司,北京 100085)
在數據急增的時代,如何能夠從海量多樣的數據集中直觀的挖掘影響商機的因素,可視化無疑是最佳的選擇。通過調研發現,數據可視化伴隨著人類多方面的應用需求歷經了漫長的發展歷程。目前,數據可視化的發展呈現了多維數據復合展示的特征;涌現了大量的可視化工具;基于平臺的可視化三維技術有了進一步的應用發展;對于一些特殊行業的監控中心或者調度中心等重要指揮樞紐,大屏幕顯示系統表現出超強的可視能力,已經成為現代行業不可或缺的核心裝備。
當今時代,數據可視化的信息隨處可見,甚至占據了各大媒體論壇的大量版面??梢暬⒉皇乾F代社會科學發展的產物,反而可視化的相關理念和技術已經有數百年之久的歷史,它的發展見證了地球物探、科學計算、工程制造、統計分析等學科的不斷進步。在早些時候,一些地理現象的考察者們為了揭示自然界中各種現象之間的聯系,定義了一種圖形化的表達形式,提出了像等溫線、等壓線、等高線、等勢線等一系列等值線圖,還有可以表達其他自然信息的圖示符號?,F代圖表可以追溯到18世紀的第一季度,歷史學家圖表的發展歸功于政治經濟學家W.Playfair和數學家J.H.Lambert在這一領域的研究發現[1]。
在20世紀初,人們已經將表格和統計圖等原始的可視化技術應用到了科學數據分析中[2]。隨著后續幾何學、統計學的快速發展,以圖表表達數據的方式逐步流行起來,改變了社會發展和科學進步的走勢,對人類的認知能力帶來了巨大的提升。進入21世紀以后,歷史上從來沒有像今天這樣大的產生數據[3]。尤其是2010年以來,數據應用的領域與深度得以高速發展,原始的可視化技術已經難以應對所謂的大數據時代,面對時代需求人們開始深入了解相應領域的背景知識,融合計算機科學、統計分析等多個方面的技術,設計滿足大數據需求的用戶交互手段,進而對龐大而構造不全的數據進行快速挖掘有用的內在信息。
目前,數據可視化并沒有一個確切穩定的概念或者明確的說明。在可視化技術發展之初,人們只是以點線或簡單圖形的方式表現數據,這樣可以減少人類大腦對數據的直接閱讀,間接提升人們對數據內涵的掌控能力。隨著數據應用領域的拓寬和表現強度需求的加深,人們開始以視覺表現對人類自身影響進行成體系的研究,可視化開始以更為抽象或更為直觀的形式表示數據內在的信息,使可視化的概念得以不斷的演變,并擴展其在社會各領域中的應用價值。
數據可視化目前主要是借助于日益成熟和完備的圖形學理論以及計算機視覺等手段,通過更為有效的數據清洗,提取更為可靠的特征屬性結合相關領域背景的建模方法,最終使數據具備了可視化解釋,能夠清晰有效地傳達不為人知的內涵信息。人們對數據的分析應用能力會直接或間接關聯社會各行業的商業價值,產生巨大的經濟效益,對人民生活和社會進步具有重大意義。一個國家擁有數據的規模和運用數據的能力將成為綜合國力的重要組成部分,對數據的占有和控制將成為國家間和企業間新的爭奪焦點[4]。當然,并不是所有數據都適合可視化,現在對那些多維而又凌亂的數據集合進行前期梳理和有效屬性整合,也是數據可視化技術發展的一個應用方向。
今天,在人類活動的許多領域中,大量的數據被收集和存儲[5]。人類社會正在高速向前發展,計算機可視化領域及其傳統智能領域的發展使數據已成為制約社會發展的重要因素。未來,數據在人類社會活動中扮演越發重要的作用,數據可視化技術也會隨著人們對數據應用的要求更加趨于成熟。
隨著科學科技的持續發展,影響各領域發展的數據已從單一轉向多維,海量的數據蘊含了極為復雜的多維信息。由于人類受限于自身能力,無法直觀獲取多維數據的認識,因此如何可視化多維數據,從中挖掘出有用的知識,是可視化面臨的一個挑戰[6]。同時,在探索復雜數據的規律時,人們發現在同一個窗口中可視化多個屬性會更加有利于人們觀察數據不同屬性之間的相互關系[7]。可視化技術通過專業的幾何圖形方法,尋找復雜數據背后至關重要的影響因素;將多維數據信息復合成圖形或圖像的形式,展示多維數據的分布特征,幫助用戶從全局的角度觀察數據變化規律、分析數據影響范圍,便于用戶準確把握數據內涵。
在當今社會發展的潮流中,任何有形或是無形的產品都不再強求工作人員從最底層干起,可視化技術也順應了這一潮流。正如牛頓所說的“站在巨人的肩膀上”,可視化編程的方式正慢慢改變著可視化新工具發展的趨勢?,F階段可視化的可視化工具不斷涌現,不斷發展,使可視化工作已經不再需要所謂的全才,除了對相關領域具備一定認知之外,僅需熟知一項前衛的可視化工具。
經調研發現,目前社會上使用較多的數據可視化工具有D3.js,JpGraph,Highcharts,iCharts等,這些工具具備功能靈活、易于上手的特點,而且有的工具還支持用戶直接將數據拖拽到對應的系統中,使其具備高效地使用效率。這些熱門的可視化工具除了可以制作基本的柱狀圖或折線圖等圖表類型之外,還可以創建內容復雜多樣的交互圖表,以及酷炫的過渡效果。
在2000年,伊利諾伊大學芝加哥分校電子可視化實驗室在教育與商業科學研究中心一個項目中,持續研究大規模復雜數據在拼接陣列式顯示墻中高效顯示的問題[8]。目前,主流的大屏幕顯示系統可支持多屏聯動、多終端復合控制、實時數據更新等大屏海量數據展示功能,在實現高分辨率超清輸出的基礎上,具備優異的展示能力、實時的數據同步能力、高效的查詢能力以及具備一定的數據分析、數據跟蹤的計算能力,以滿足當代大數據背景下用戶的不同可視化需求。圖1為大屏幕示意圖。

目前,隨著計算機軟硬件對大規模數據圖形化處理能力的逐步增強,使可視化三維技術得以快速發展。Geographic Information System也稱為GIS系統,該系統借助計算機技術綜合管理空間地理信息數據[9]。經過調研發現,GIS系統憑借與地理空間信息結合的數據可視化手段,是目前國內主要研究大規模數據可視化的主流系統平臺。如今,對于一個城市或更大的地域范圍內的地理信息系統,數據總量可以超過幾個TB[10]?,F在GIS應用的主要基于GIS平臺的二次開發,圖2是一種基于GIS的三維可視化基本架構,其開發方法主要是在微軟的Visual Studio系列編程工具中利用GIS系統提供的各種控件導入數據、處理數據以及顯示數據,最終在生成的應用程序中將數據三維可視化,并提供管理數據、查詢數據、更新數據、分析數據等功能。

除了類似GIS這種伴隨可視化發展多年的研發平臺之外,像Unity3D,Unreal Engine等三維引擎已陸續發展為數據可視化的研發平臺,尤其是近兩年投入這些引擎進行可視化研究的人員逐步增多,同時部分引擎逐步降低開發成本,并針對一些像建筑、模擬、教育等應用方面甚至提供開源免費的鼓勵方針。
近些年來,社會中各個行業和領域都已被數據化了,數據儼然已成為影響當今社會生產的重要因素。隨著數據可視化技術的持續更新,其邊界也在不斷地向多領域、多學科擴展,可視化技術不斷的專業化,人們的生產方式隨之發生顛覆式的改變。數據可視化技術一直是國內外數據挖掘、數據應用領域中研究重點,新的研究應用不斷涌出,當然目前也存在大量有待解決的問題,仍然需要進一步研究,相信未來新技術可以給人們帶來更好的數據可視化體驗,對社會生產帶來更有效的決策依據。2017年,大數據應用的全面創新之年,數據可視化技術將在更多產業化、數據化相對成熟的領域進一步得到應用。