馮逸文,秦 雨*,張向鈺
(1. 廣東省地圖院,廣東 廣州 510075;2. 武漢大學信息管理學院,湖北 武漢 430079)
隨著第三次工業革命的興起和發展,目前正在進入計算無所不在、軟件定義一切、數據驅動發展的智能時代[1]。隨著智慧城市、無人駕駛、數字孿生等領域的進一步發展,高精度空間地理信息數據庫作為其支撐也得到了長足進步,與之配套的數據可視化技術再次成為研究熱點[2-3]。專題地圖作為內容專題化、形式差異化、用途專門化的地圖,在表達空間分布相關信息時具有高度概括、直觀易讀、高效傳輸的特性[4],因而在時空大數據可視化中得到了廣泛應用。在智能時代背景下,專題制圖領域也面臨著新的挑戰,對制圖者提出了更高的要求。本文主要探究智能時代下專題數據可視化與傳統專題數據可視化的區別,并據此提供一些數據可視化的新思路。
1)數據驅動。智能時代的重要特征之一就是海量數據,制圖者能夠收集到多種類、全方位、序列化的數據,而這些數據又對制圖者提出了新的要求。傳統制圖中,專題地圖制作依賴于制圖者對專題的主觀認知和其對于專題的處理抽象[5],即由制圖者驅動;但在智能時代,制圖者更應關注數據本身,數據與專題的內在聯系、數據獲取、數據清洗處理等過程,根據數據本身的特征制定針對性的可視化措施,即由數據驅動,而將對專題數據的認知和重構[6]則更多地留給讀圖者完成。當然,純粹的數據驅動也會導致因果關系的不可解釋、機理的不透明等問題[7]。數據驅動并不是要減少制圖者在制圖過程中的主觀能動性,而是將制圖者的工作重心提前,將精力更多地分配在使用數據解釋專題這一部分。
2)計算決定。智能時代的另一個重要特征是算力的極大增長。隨著個人設備算力的不斷提升,專用信息服務器、并行機群、超級計算機、分布式計算、云計算等技術的發展[8],制圖者能對空間大數據進行分析處理,但這些數據體量大、更新快、模態多樣、真偽難辨、個體價值低[9],對制圖者的分析處理能力提出了更高的要求。制圖者要敏銳察覺數據與專題間的聯系,并通過有效的計算方法,提取整合海量數據中有價值的信息,才能形成有意義的專題指標體系。其中,能否計算處理數據、數據的計算處理方法都將極大影響甚至決定制圖數據指標價值的高低。
3)粒度影響。在智能時代,制圖者擁有更多的手段獲取和處理精細粒度的數據;但粒度并非越精細越好,隨著觀測尺度、分類層級、知識體系和描述維度的變化,所觀測到的對象的空間形態、組成結構、級別屬性、關聯關系等特征可能不同[10],過于精細的粒度可能反而會導致特征丟失、性能下降、辨識度差的問題[11]。因此,智能時代下的制圖者要深刻認識到粒度對于專題數據可視化的影響,選擇或將數據處理為合適粒度的數據,保證專題的信息傳輸效率。
圖表形式是影響數據可視化最重要的因素。絕大部分圖表都可歸類為柱狀圖、餅圖、散點圖(折線圖)3 種形式;但在智能時代的專題制圖中,基本圖表已無法很好適應愈發復雜的數據表達需要,因此衍生出了種類繁多的變種圖表,通過對基本圖表的形式、結構、維度等進行部分重構以達到凸顯要點、引起注意、提升數據易讀性、提高讀者認知率[12]的目的,極大地提高了圖表的豐富性和信息傳遞效率。通常習慣采用柱狀圖表示總量信息指標,餅圖表示比例信息指標,折線圖突出變化類信息指標。圖表的變種思路大體與之一致,但側重有所不同,具體見圖1。

圖1 基本圖表及其常見變種
不同圖表的特征也可以組合使用,如堆疊極坐標扇圖、柱狀雷達圖等。制圖者可根據數據表達和圖面配置的需要靈活組合,在突出數據特征的同時做到排布合理。此外,圖表的變種中還有瀑布圖、箱型圖、小提琴圖、桑基圖等,由于篇幅和個人能力所限,本文僅介紹在專題地圖中較常見的圖表變種類型。
在制圖中,制圖者需要將指標的數據值轉化為長度、角度、半徑、面積等可視化指標,從而傳遞信息,該過程可視為從源數據到可視化指標的一種函數映射。在智能時代,隨著數據極值差異的日益增加,傳統的分級量化和線性量化思路已無法滿足部分數據表達的需要,非線性量化的使用日漸增多。本文以源數據y到柱狀圖長度L的映射函數L( )y為例,探討專題數據值在量化過程中的策略,具體見圖2。量化的目的是為了更高效地傳遞信息,實際使用時應保證數據間的區分度,必要時突出數據的變化情況(增量)即可。

圖2 專題制圖中常見量化策略
上述智能時代下專題數據可視化的新特征與新思路在《廣東省地圖集》[13]中均有體現,作為智能時代下新編的地圖集,其在編制思路上與傳統地圖集產品有一定的差異。
1)數據驅動制圖。《廣東省地圖集》在編制過程中,更多地由數據驅動制圖而非由制圖者驅動制圖。在專題地圖編制過程中,制圖者更多關心專題數據的收集、數據與專題的聯系以及數據的清洗處理,因此筆者與專題相應主管單位、相關企事業單位進行了卓有成效的溝通,收集了龐大的專題數據庫,并以此為基礎進行了專題圖編制設計的有關工作。
2)計算決定能否成圖。《廣東省地圖集》在編制過程中,得益于廣東省良好的基礎測繪建設,收集了許多精細粒度的空間數據庫,如廣東省地理國情監測數據庫、廣東省林地地類普查庫、廣東省地名地址普查庫等,這些數據庫由數百萬多邊形或點構成。算力的極大提升使得能在可接受的時間范圍內完成上述數據的統計、關聯和符號化工作,并最終完成土地利用現狀、林地地類、常住人口分布3幅對應專題中的核心地圖。
3)粒度影響地圖可視化效果。在《廣東省地圖集》的人口專題中,收集了以行政村為單位的常住人口分布數據,并通過將其鏈接至地名普查數據庫獲得了一組廣東省常住人口分布的精細粒度數據;但在可視化時發現,若在單個點符號可辨認的基礎上對全部行政村人口點進行表示,其點密度過高導致完全無法區分人口密度中等和人口密度高的區域,且會遮擋分級底色,因此最終決定僅表示5 000 人及以上的行政村,剔除一部分精細粒度數據,最終得到了較好的可視化結果。
1)圖表形式。《廣東省地圖集》大膽結合多種類型的圖表,根據數據表達和版面排列的需要,靈活選擇圖表樣式,輔以象形符號或繪制圖案等方式,提升信息表達的維度,極大地提高了信息傳遞效率(圖3)。

圖3 《廣東省地圖集》部分圖表
2)量化策略。《廣東省地圖集》根據數據特點,靈活運用分級量化、線性量化、指數量化等方式,在確保數據準確量化的基礎上,突出數據特征、表現數據差異與變化情況。例如,在區域經濟專題下的第二產業增加值專題圖中,采用了非線性量化的思路,在保證視覺平衡的前提下,同時突出數據的增長情況。
本文通過對比傳統專題制圖與智能時代下專題制圖的聯系與區別,提出了數據驅動、計算決定、粒度影響3 個智能時代下專題數據可視化的新特征,并在此基礎上總結了智能時代下專題數據可視化的新思路,即拓展圖表形式、靈活使用量化策略。本文以《廣東省地圖集》為例,印證了所述觀點。研究成果可為今后的專題制圖工作提供參考,為專題數據的可視化提供多種思路;但對于智能時代下專題數據可視化特征與方法的總結仍不夠系統,在全面性上仍有提升的空間。