陳思錦 劉鈺 劉岱寧 余卓芮



摘要:現有城市地理學教學中的多媒體展示大多局限于教材內容和實例圖片,難以充分發揮可視化教學的優勢。基于R語言擴展包ggplot2的可視化功能,依托廣東省土地城市化案例,探索了基于參考線、圖層疊置和前置數據轉換為代表的可視化教學途徑。這些可視化途徑,可將抽象的概念、模型和統計方法轉換為直觀的視覺元素,使其更容易被學生理解和掌握。教學實踐表明,可視化教學模式可有效地對理論講解和分析建模等教學模式進行輔助和支持,從而實現教學效果的提升。
關鍵詞:R語言;ggplot2;城市地理學;可視化;教學改革
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2024)10-0146-04
0 引言
城市地理學是城鄉規劃專業的一門主干課程,通過從地理的視角講授城市發展的特征、過程和規律,使學生能夠針對城市發展中的問題,提出初步的規劃引導策略。長期以來,城市地理學課程的授課主要包括理論講解、分析建模和可視化3種模式。其中,理論講解模式主要通過概念界定、邏輯演繹和案例介紹等手段對城市發展的理論進行講述和解析。分析建模模式主要采用統計分析和數學模型等定量化工具對城市發展進行模擬和預測,并在此基礎上對其發展特征和規律進行講解。可視化模式主要通過線條、形狀和顏色等易于識別、理解的視覺元素來表征難以理解的抽象信息,從而將抽象的教學內容以較為直觀的形式向學生講授[1]。因此,可視化模式可將理論講解和分析建模兩種授課模式中講授難度較大的內容轉化為易于理解的形式,是一種具有突出優勢的授課模式[2]。
隨著教學研究和實踐的進步,城市地理學課程教學中的理論講解和分析建模模式都取得了長足的發展。例如,萬慶等采用翻轉課堂的形式優化了“城市規模分布”的理論講解模式[3]。對于分析建模模式,隨著地理信息系統等分析工具的引入,大量具有較高可操作性的案例被引入教學[4]。但是,城市地理學課程教學中可視化模式的發展仍然較為滯后。在教學實踐中,雖然以PowerPoint為代表的多媒體工具被廣泛用于教學,但往往只是將教材內容和實例圖片投放到多媒體屏幕上,使得可視化教學模式的優勢難以體現在教學實踐中。為推動城市地理學課程可視化教學模式的發展,亟須引入新的教學輔助工具。
隨著大數據時代的到來,數據可視化工具也趨于成熟,其中代表性的工具包括Tableau、Splunk和Car?toDB等商業軟件以及ColorBrewer、D3.js和R等開源軟件[5]。其中,R語言是面向統計分析以及數據可視化的開源編程語言。由于具有開源免費、功能豐富和使用靈活等優點,R語言被眾多教師應用于教學實踐[6]。例如,榮民希等基于R語言的可視化功能進行了概率統計的教學研究與實踐[7]。但在城市地理學課程教學中,依托R語言進行的可視化教學研究還很鮮見。本文擬基于R語言ggplot2擴展包的強大可視化功能,依托廣東省土地城市化案例,探索城市地理學課程的多種可視化教學途徑。
1 基于R 語言的可視化教學途徑
數據可視化是R語言的核心功能;特別是Wick?ham等基于圖形語法(Grammar of Graphics) 開發的gg?plot2擴展包,使得R語言的可視化功能得到了極大的強化[8]。在ggplot2包的圖形語法架構中,繪圖可以分解為多個要素。其中的核心要素是圖層,圖層包含了從數據到形狀、顏色等視覺元素的映射信息。映射的精確控制可通過標尺(scale) 函數來實現。字體和版式等修飾性內容,可通過主題函數來進行調整。基于圖形語法架構的ggplot2包具有組件豐富、支持圖層疊置和前置數據變換等優勢,可為多種途徑的可視化教學提供支撐:
1) 基于參考線的可視化教學。ggplot2包具有豐富的組件,除了散點圖、折線圖和雷達圖等常規的數據可視化組件,還可以繪制各種形式的參考線。例如,城市發展往往是不平衡的,各城市在發展上的差異程度可用Hoover指數等指標來測度[9],但測度結果只是較為抽象的單一數值,使得學生難以直觀地理解其不平衡程度。通過R語言,可以先行假設各城市處于相同的發展水平,并繪制其累積分布曲線作為參考線。通過該參考線與現實城市的累積分布曲線進行對比,可對城市間的不平衡發展程度進行直觀展示。可見,依托參考線,可將城市不平衡發展概念以更為直觀的形式呈現出來,從而實現抽象理論概念的可視化教學。
2) 基于圖層疊置的可視化教學。ggplot2可將數據映射到多個圖層,并疊置顯示。例如,回歸擬合是對城市發展規律進行探索的最為常見的分析模型之一。ggplot2不僅可以繪制回歸擬合曲線,還可以基于圖層疊置功能,在回歸曲線圖上進一步疊置散點圖,從而為回歸模型中異常點位的識別提供便利。此外,還可以將更多信息映射到散點圖的顏色和形狀等視覺要素上,從而為異常點位的形成原因提供線索。可見,依托圖層疊置,可在分析模型的可視化圖形上疊加更多的信息,從而以可視化的形式輔助抽象分析模型的教學。
3) 基于數據變換的可視化教學。ggplot2支持前置數據變換,可將數據進行變換處理后再以圖形的形式展示。例如,在城市地理學教學中經常需要對不同分組的城市進行比較,常用的統計方法包括基于最小(大)值、均值等基本統計量的描述性統計,以及基于概率論的推斷性統計[6]。基于前置數據變換功能,可以先在程序底層進行描述性統計的計算,再以箱線圖的形式直觀展示多個統計量。此外,還可以進一步計算不同分組數據的中位數置信區間,通過不同分組數據的置信區間的位置關系可以形象地表達推斷性統計結果。可見,依托前置數據變換功能,可以更為便捷和直觀地展示統計分析的結果,從而輔助抽象分析方法的可視化教學。
2 基于R 語言的可視化教學案例
如前節所述,R語言擴展包ggplot2具有強大的可視化功能,可以支持參考線的繪制、圖層疊置和前置數據變換,從而對抽象的理論概念、分析模型和統計方法進行直觀的可視化展示。通過將ggplot2引入教學,可將講授難度較大的概念、模型和統計方法轉化為直觀的可視化形式,使其更容易被學生理解和掌握,進而提高教學效果。本節基于廣東省土地城市化案例,對城市地理學課程可視化教學途徑進行具體介紹。本案例基于不透水地表遙感數據提取了城市用地范圍[10-11],并通過高金龍等提出的土地城市化計算方法[12],計算了廣東省124個縣級行政單元(包括縣、縣級市及市轄區)的土地城市化率。依托R語言,可對土地城市化教學中較為抽象的概念、模型和方法進行可視化教學。
2.1 基于參考線的可視化案例
區域各城市的土地城市化程度是不平衡的。以廣東省為例,廣州市天河區已有超過87% 的土地被開發為建成區,而韶關市翁源縣僅有10% 的土地被開發為城市。土地城市化的不平衡態勢,對區域協調和可持續發展有著深遠的影響[12],也是城市地理學課程的重要授課內容。現有教學中往往采用Hoover指數等定量指標來表征各城市土地城市化的差異程度[9],例如廣東省土地城市化的Hoover指數為0.35。這種以單一數值為媒介的教學形式,很難形象而全面地展示區域土地城市化的差異特征,從而制約了學生對區域發展不平衡概念的深入理解。
為支持抽象概念的教學,教師可將帶有參考線的可視化圖形引入教學。首先,繪制124個行政區土地城市化的累積分布曲線(圖1(a)中的實線),并通過與參考線(圖1(a)中的虛線)的對照向學生直觀地展示土地城市化的不均衡水平。如參考線所示,當各行政區土地城市化水平相等時,位序達到40和80時的累計百分比應分別達到32% 和64%;但由于各地城市化水平具有明顯差異,現實中土地城市化較低的前40個和80個城市的累計百分比僅為8% 和30%;由此參考線和現實累積分布曲線之間形成了圖1(a)中的灰色凹陷。各位序的實際累計百分比與參考值的差異越大,灰色凹陷的面積就越大,區域內各城市土地開發的不平衡程度也越嚴重。其次,廣東省土地城市化的均值也可作為其不平衡水平的重要參考。以土地城市化均值為基準(圖1(b)中的虛線),可將廣東省的行政區分為土地城市化較低和較高的兩組。其中,土地城市化率較低分組的均值為14%,較高分組的均值為62%。兩個分組在平均水平上4倍有余的差距,可以使學生直觀地感受到廣東省內部各地區之間在土地城市化上的顯著不平衡。
本案例通過在可視化圖形中加入參考線,可將理論假設的平衡數據與現實數據進行比較,通過兩組數據累積分布曲線之間的差異來形象地展示土地城市化不平衡的總體水平,還可以將各行政區進行分組,以揭示土地城市化在區域內部的不平衡特征。基于參考線的可視化教學,可以直觀地表達較為抽象的區域發展不平衡概念,既有利于教師從整體和區域內部兩個視角依次講解,也降低了學生對抽象概念的理解門檻,從而推動教學質量的提升。
2.2 基于圖層疊置的可視化案例
中心城市的輻射作用對土地城市化有重要影響。以廣東省為例,中心城市廣州的土地城市化率達到了69%;臨近廣州的江門市,土地城市化率為36%;而遠離廣州的梅州市,其土地城市化率僅為11%。中心城市的輻射作用已成為區域土地城市化最為重要的影響因素之一,也是城市地理學課程教學中需要重點講授的城市發展機制。現有教學中往往采用回歸模型分析來講解中心城市輻射對土地城市化的影響機制。但回歸模型是建立在復雜的矩陣運算基礎上的,如果學生沒有良好的數學基礎,很難通過回歸模型的結果來深入理解中心城市的輻射機制。
為深入講解中心城市的輻射機制,教師可將多圖層疊置的可視化圖形引入教學。以土地城市化率為因變量、到中心城市廣州的距離為自變量繪制回歸擬合曲線,如圖2所示,學生可以觀察到回歸曲線呈明顯的下降趨勢,說明隨著到中心城市距離的增加,中心城市輻射作用隨之衰減,周邊地區土地城市化水平也逐步降低。由此可見,中心城市的輻射對周邊地區的土地城市化具有顯著影響。此外,回歸曲線在200公里附近下降到最低點后,開始逆向上升,說明還存在其他因素在影響土地城市化。為進一步深入講解影響機制,可在回歸擬合曲線圖層上疊置散點圖并將行政層級信息映射到散點的顏色上。圖2顯示,在回歸曲線逆勢上揚的區間,高于回歸曲線的點位絕大多數是市轄區,而縣級城市基本低于回歸曲線。由此推斷,在中心城市輻射效應較弱的外圍地區,會依托市轄區形成當地的發展中心,這些發展中心往往土地開發程度較高,從而造成了回歸曲線的異常上揚。
本案例通過將回歸模型進行可視化展示,學生可以通過回歸擬合曲線的走勢來探討中心城市的輻射對周邊地區土地城市化的影響機制,而且還能直觀地觀察到在遠離中心城市的地區,擬合曲線的走勢會出現異常。通過結合行政層級信息的散點圖,本案例還進一步引導學生對擬合曲線的異常走勢做出了解釋。可見,基于圖層疊置的可視化教學,可以在不依賴復雜數學計算的前提下,較為深入地向學生講授抽象的城市地理學理論機制,相對于抽象的分析模型,可視化教學具有明顯優勢。
2.3 基于數據變換的可視化案例
政府政策對土地城市化有重要影響[12]。例如,珠三角作為我國對外開放最早的地區,長期得到國家政策的重點支持。廣東省土地開發程度最高的廣州、深圳等城市都位于珠三角核心區內,而廣東省外圍地區的土地城市化水平普遍較低。在我國現行的土地制度下,城市土地的調控由政府主導,政府政策對城市土地的影響也成為城市地理學課程的重要教學內容。現有教學中往往采用各類統計方法來對不同的政策地域進行對比分析,基于統計結果來講解政府政策對土地城市化的影響,但較為抽象的描述性統計量和推斷性統計判斷,很難讓學生對不同政策地域的差異形成全面而深入的認知。
為推動學生全面理解政策差異的影響,教師可將結合數據變換的可視化圖形引入教學。首先,對珠三角6個核心地級市與其余外圍地區土地城市化率的分布進行可視化。如圖3所示,外圍地區的分布呈金字塔形,除個別城市的土地城市化率較高外,大部分都位于25% 以下;而核心地區的分布呈橄欖型,土地城市化率以65% 為中心向兩側延伸。其次,從基于描述性統計變換繪制的箱線圖來看(圖3(a)) ,外圍和核心地區在最大值上的差異并不突出。由于外圍和核心地區在分布類型上有所不同,兩者的差異主要體現在低值部分。具體來看,外圍地區土地城市化率的75%分位數(31%) 比核心地區的25% 分位數(53%) 還要低得多,甚至外圍地區的均值(22%) 僅略高于核心地區的最小值(16%) 。最后,從基于推斷性統計變化繪制的箱線圖來看(圖3(b)) ,外圍地區中位值的95%置信區間為11%-18%,核心地區的相應置信區間為58%-77%,兩者中位數的置信區間存在明顯錯位,說明兩者中位數相等的概率極小,由此推斷兩個地域的土地城市化率具有統計意義上的顯著差異。
本案例通過土地城市化率分布的可視化,使學生對廣東省外圍、核心地區的土地城市化水平差異形成了整體認知,并進一步通過前置數據變換,以箱線圖的形式對其描述性統計和推斷性統計結果進行了可視化。在可視化圖形上,可以同時展示多個描述性統計量。不僅可以表現單一統計量之間的差異,例如兩個地域最大值的對比,還可以呈現不同統計量之間的比較,例如外圍地區的均值與核心地區最小值的對照。此外,還能通過兩個地域中位數置信區間之間明顯的錯位,直觀地解讀推斷性統計的結論。可見,依托前置數據轉換的可視化,可將抽象的統計分析結果進行直觀的表達,為學生深入理解統計結果提供了極大的便利,從而支持教學效果的提升。
3 結論
現有的城市地理學課程教學實踐雖然已廣泛采用了以PowerPoint為代表的多媒體工具,但大多只是將授課內容和實例圖片投放到多媒體屏幕上,難以充分發揮可視化教學的優勢。基于圖形語法開發的R 語言可視化擴展包ggplot2,支持參考線的繪制、圖層疊置以及前置數據變換等功能,可將抽象概念、模型和分析方法轉換為直觀的視覺要素,有效地降低學生對相關教學內容的理解門檻,從而提高教學效果。依托廣東省土地城市化案例,對基于R語言的可視化教學途徑進行了探索,包括:1) 通過添加參考線,在區域整體和內部對比兩個視角進行了區域發展不平衡概念的可視化教學;2) 通過圖層疊置,在對回歸擬合曲線趨勢呈現的基礎上,進一步對回歸模型異常區間的成因開展可視化教學;3) 通過前置數據轉換,可在土地城市化率數據分布的基礎上,直觀展示多個描述性統計量和推斷性統計的結論,極大地便利了統計分析方法的教學。教學實踐表明,R語言強大的可視化功能可有效地支持抽象概念、分析模型和統計方法的教學。通過與以邏輯演繹為基礎的理論講解、以定量計算為基礎的分析建模等教學模式相結合,基于R語言的可視化教學可以極大地推動城市地理學課程教學質量的提升。
除了城市地理學課程,本研究提出的可視化教學途徑還可應用于城市經濟學、城市社會學等相關學科。此外,研究表明,人類雖然可從多個渠道獲取信息,但通過視覺系統獲取的信息占到80% 以上。相對于邏輯概念和數學模型,將教學內容以可視化的形式進行展示,可更為有效地將相關信息傳達給學生并降低其認知理解的門檻[5]。因此廣大一線教師應積極嘗試將可視化模式引入教學,并結合理論講解和分析建模等教學模式,進一步推動教學質量的提升。
參考文獻:
[1] 吳磊,雷田,方浩.大數據背景下信息可視化課程教學模式與策略研究[J].藝術教育,2017(16):128-129.
[2] 周曰志,祝順和.以地理特征為中心的區域地理可視化思維建模教學[J].地理教育,2016(5):23-24.
[3] 萬慶.面向理解的《城市地理學》翻轉課堂教學設計研究——以“城市規模分布” 章節為例[J].湖北經濟學院學報(人文社會科學版),2018,15(12):143-145.
[4] 尹海偉,孔繁花.城市與區域規劃空間分析實驗教程[M].3版.南京:東南大學出版社,2018.
[5] 陳小燕,干麗萍,郭文平.大數據可視化工具比較及應用[J].計算機教育,2018(6):97-102.
[6] 潘逵,譚瑩.基于R語言的“統計學” 交互式教學探索[J].科教導刊,2022(27):117-121.
[7] 榮民希,黃士國,曲雙紅.基于R語言Shiny包的概率統計交互可視化教學研究與實踐[J].數學學習與研究,2021(6):146-147.
[8] MOULIK D T.Applied data visualization with R and ggplot2:Create useful, elaborate, and visually appealing plots[M]. Bir?mingham,UK:Packt Publishing Ltd.,2018
[9] 劉鈺,李登輝,余卓芮,等.城市人口與服務業空間協同的多維機制——以福建省為例[J]. 地理科學,2021,41(8):1354-1363.
[10] ZHANG X,LIU L Y,ZHAO T T,et al.GISD30:global 30 mimpervious-surface dynamic dataset from 1985 to 2020 using time-series Landsat imagery on the Google Earth Engine plat?form[J].Earth System Science Data,2022,14(4):1831-1856.
[11] LI X C, GONG P, ZHOU Y Y, et al. Mapping global urban boundaries from the global artificial impervious area (GAIA) data[J].Environmental Research Letters,2020,15(9):094044.
[12] 高金龍,包菁薇,劉彥隨,等.中國縣域土地城鎮化的區域差異及其影響因素[J].地理學報,2018,73(12):2329-2344.
【通聯編輯:王 力】