羅富智
(四川大學計算機學院,成都 610065)
教育興則國家興,教育強則國家強。高等教育是一個國家發展水平和發展潛力的重要標志。高等院校是立德樹人、培養人才的場所,而學科是大學教書育人、科學研究與社會服務的基礎。教育部為提高我國大學的辦學水平和國際競爭力,不僅設置了雙一流背景下的一流大學和一流學科建設計劃,近乎同時對全國高校學科開展了評估工作[1]。學科評估量化了該學科目前的發展實力和競爭力,學科建設計劃則指引了高校未來發展的方向。高等教育作為我國人才的搖籃,該兩項相關工作引發社會各界的關注。
部分即將畢業的本科生做出了國內繼續讀研深造的選擇。該類人群已經隸屬于某個專業門類,大部分同學會直接報考對口或相近的研究生專業。相比于本科的通識教育,院校學科實力對研究生的學習科研更為重要。然而,面向實力各有所長的眾多高校,高年級本科生們雖然初步了解自身專業的內容,卻對學科建設和評估難以有系統性的認識,也容易忽略一個學科群內學科間的相互帶動作用,更無法將自身對學校城市的偏好與之對比,因而在報考時過于盲目。
因此,本文綜合一流高校建設名單、一流學科建設名單、第四次學科評估結果,對城市、學科實力、發展前景等進行量化評估[2],設計并實現了一個完整的可視分析系統。該系統能夠基于學科建設評估指標,主要為面臨擇校的高中、本科畢業生提供含有用戶偏好的院校對比排名,使之擇校決策有專業依據可遵循。基于Web端的系統可提供交互手段供用戶調整指標權重,從而生成具有用戶偏好的排名。系統以計算機新興工程科學群為例進行分析,使對比結果更客觀,用戶決策更合理。
本文使用的數據來自于所寫爬蟲從中國教育在線網站、中國學位與研究生教育信息網上獲取。包含高校概況、高校學科群實力評分及高校學科大類概況三個部分。
用于描述一所高校的基本信息,包含學校編號、學校名稱、學校各評級學科數量、省市、經緯度等。學校編號(招生代碼)用于唯一標識一所大學,如四川大學的高校代碼為10610。學校學科評級包括A+~C-,反映學校的學科建設情況。
用于評價一所高校的實力,包含城市評分、知名度評分、雙一流評分、第四次學科評分。城市評分來自于上文獲取的城市排名數據。知名度評分參考“2019中國最好大學排名”。雙一流評分表征高校在一流學科建設中是否存在“電子科學與技術、信息與通信工程、控制科學與工程、計算機科學與技術、軟件工程”,如果存在則代表二十分值。第四次學科評分:將電子科學與技術、信息與通信工程、控制科學與工程、計算機科學與技術、軟件工程五個學科的學科評估等級映射為分數進行加和,表示該校學科群的發展實力。
用于描述高校的學科完整度,包含學校簡介、各學科門類名單等信息。學校簡介為該校的主要標簽,學科包含文史、理工、經管、醫學、農學、藝術等大類與哲學、理學的、工學等一級學科。
基于章節1中的數據描述,本文綜合一流高校建設名單、一流學科建設名單、第四次學科評估結果,對城市、學科實力、發展前景等進行量化評估,提出了三點可視分析任務[3],使用戶能夠基于Web系統對感興趣的院校進行對比分析,從中加入自己的情感偏好。具體的可視化任務定義如下:
任務一:不同地理粒度的高校分布:
(1)按省份劃分的高校數量;
(2)高校地理空間分布;
(3)篩選院校范圍;
(4)基于學科評估的學校發展現狀。
任務二:基于學科群的競爭力排名:
(1)學校的整體競爭力排名;
(2)學校的固有屬性、學科群實力與前景;
(3)定義排名屬性權重。
任務三:學校學科門類競爭力:
(1)學科門類實力和前景;
(2)相似發展模式院校的探索。
基于以上可視化任務,本文完成了可視化視圖設計與系統實現。
根據本文獲取的數據和本文所定義的可視化任務來設計可視化系統方案,本文基React[4]、Echarts[5]、Pandas[6]等技術進行方案實現。本文設計的可視化能夠清晰地解決定義的三個可視化任務,幫助用戶完成高校的對比與選擇。
高校本身的地理位置屬性是重要的分析因素,基于地理分布的分析能夠幫助我們發現全國的高校分布,從而發現學科建設較為完善的省份。如圖1所示,顯示了學校在全國15個省級行政區的數量分布情況。

圖1 高校分布統計
進一步地,采用地圖與玫瑰圖疊加的方式可以對大學的地理信息進行展示,如圖2所示。通過地圖上疊加的南丁格爾玫瑰圖的半徑編碼某高校從“A+”到“C-”九個學科評級上的學科數量,并用顏色區分不同的級別。在控制面板中對學校進行篩選后,可觀察到某省符合條件學校的地點信息。通過對學校間學科評估的分布情況進行分析,可以實現學校間的比較。在圖2中可以發現,四川大學和電子科技大學在第四輪學科評估中差異明顯。同時用戶可以通過對拖拽、縮放、單擊雙擊等操作于其他視圖聯動進行進一步分析。

圖2 地圖視圖:高校學科評估
本文要分析的高校信息是多維度信息,包括“城市”,“知名度”,“雙一流評分”以及個學科實力等緯度。為了支持同時對多維度信息的可視化分析,采用雷達圖[7]與熱力圖矩陣[8]相結合的方式。如圖3和圖4所示,熱力圖矩陣詳細展示了學校之間的排名情況。其中,行代表對應高校,列代表高校的某個屬性,通過顏色深淺編碼對應行高校在對應列屬性上的表現的優劣。雷達圖中,用五個坐標軸展示高校在五個緯度的歸一化表示的優劣信息,離中心點距離越遠代表在對應屬性上表現越好。雷達圖可以同時展示多個高校,不同高校用不同色相區分。

圖3 雷達圖

圖4 熱力圖矩陣
在圖4中,可以發現南開大學和四川大學排名很接近,同時各項分布得分也基本一致。通過在控制面板對第四次學科評估權重進行調整,會發現四川大學的排名有所上升。
如圖5所示,在學科門類建設和評估視圖中,通過雙向橫向柱狀圖展示高校在“理工”、“文史”等六類學科分別在學科評估和一流學科建設方面的實力,柱狀圖的高低編碼對應屬性強弱,從而對所選學校的學科評估分數和學科建設數量進行展示。在圖5中可以發現,四川大學在理工和醫學領域學科評估分數較高,同時所入選的學科建設數量也十分眾多。

圖5 學科門類建設和評估視圖
在學科評估基礎上,采用散點圖的方式展示學校之間的相似性,如圖6所示。將學校屬性降維映射到二維坐標中,每個散點代表一個學校,散點相近代表這兩所學校的發展模式相類似,如發展程度相當的綜合性大學。通過對圖6的探索,我們發現投影的結果符合人們對于學校的基本認知。強工科學校如合肥工業大學、北京交通大學、華南理工大學、西安電子科技大學等聚成了一簇。

圖6 高校投影視圖
結合以上三小節中的可視化視圖設計,最終形成的系統界面圖如圖7所示。用戶通過在地圖上點選自己感興趣的學校,可以在學校屬性視圖和學科門類建設和評估中對學校的詳細信息進行查看。同時,用戶通過鼠標懸浮操作,可以查看該校的一流學科建設名單。在高校對比視圖,用戶通過鼠標點擊刪除自己不感興趣的學校,也可以通過鼠標懸浮查看各個學校在不同維度的評分情況。

圖7 系統界面圖
本文從高校一流學科建設與學科評估的角度出發,提出了高校學科分析中應關注的三大可視分析任務,并且從這三個任務層次(地理分布、學科群排名、學科競爭力)出發進行不同維度的解析。通過交互聯動的方式,使視圖之間進行交互探索,從對高校學科信息提供了全方位、多角度的理解。基于本文實現的系統,用戶能夠從自身需求出發完成院校對比、專業選擇等任務。此外,系統也可面向高校工作人員,鮮明呈現校內外學科建設的差異,為學科群發展政策提供建議。