郭斯羽,孟志強,汪 沨,溫 和,王 華
(湖南大學 電氣與信息工程學院,湖南 長沙 410082)
可用于工程教育認證的統計結果可視化新方法*
郭斯羽,孟志強,汪 沨,溫 和,王 華
(湖南大學 電氣與信息工程學院,湖南 長沙 410082)
工程教育認證正日益成為眾多工科專業的一項常態化的工作。在工程教育認證中,畢業要求達成度評價往往是數據處理和分析任務最為繁重的一個環節。為了有效集約地展示與畢業要求達成度評價有關的統計數據,以便于分析評價結果并用于專業的持續改進,提出了稱為塔帶圖的統計數據可視化方法。塔帶圖可作為一種有效的可視化工具,用于工程教育認證中統計數據的展示。
數據可視化;統計數據;塔帶圖;工程教育認證
隨著2016年6月2日我國正式加入《華盛頓協議》組織,我國的工程教育認證工作進入了一個新的階段。[1]工程教育認證為工程教育國際互認和工程師資格國際互認的實現提供了重要基礎,而且除了滿足工程師人才跨國流動的需求之外,工程教育認證還是工程教育改革與工程教育質量保障體系完善的重要推動力。
在認證工作中,畢業要求達成度的評價往往是涉及數據、計算、統計和分析最多的一個部分,例如在畢業要求達成度評價報告中,通常都會提供包括全體畢業生的各門課程的各考核環節的成績與總評成績,以及在各項畢業要求上的達成度。在2016年的工程教育認證標準中包含了12條通用畢業要求,各專業在制定本專業的畢業要求時,必須完全覆蓋12條通用要求,因此通常專業的畢業要求數量少至7條,多的可能略多于標準的12條。[2]另外,根據工程教育認證的要求,專業需要將每條畢業要求進一步細化為若干具有可操作性的指標點,從而使需要進行評價的點擴充至數十個。可見,這些學業成績的分析和呈現以及畢業要求指標點的達成度的計算、分析和呈現形成了認證工作所面臨的一個重要挑戰。
根據工程教育認證的理念,對于專業而言,要求其每一屆畢業生均全部達成所有畢業要求,因此僅僅從考核畢業生的“合格”與否的角度出發,在進行評價時,只需要根據每屆畢業生中畢業要求達成度最低的那一個人來進行評判即可。但是畢業要求達成度評價的結果同時也應當應用于專業的持續改進,因此僅靠上述的單個最低達成度顯然無法合理體現與衡量專業的整體教學質量與培養質量。為了達到分析整體教學質量的目的,通??梢允褂靡韵路绞剑?/p>
(1)學生的學業成績和畢業要求達成度的區間分布。成績或達成度的區間分布就是統計出全體學生中,得分或達成度落在各個區間中的人數,或將人數折算為比例值。區間分布實際上可以視為全體學生的相應指標的直方圖分布,從中可以直觀地了解學生所取得的指標值的集中分布范圍,并據此判斷學生在指標上的總體水平。
(2)學生的學業成績和畢業要求達成度的排序統計量。最典型也最常用的排序統計量是全體學生在某個指標上取得的中值,但如果再進一步配合上最大值、最小值、75%分位值和25%分位值等統計量,則可以更好地反映學生在該指標上的總體水平以及該指標對學生水平的區分能力。
(3)學生的學業成績和畢業要求達成度的算術均值和樣本標準差。它們也同樣可以用來反映學生在某個指標上的總體水平及指標的區分能力,而且當建設學生的指標值服從正態分布時,這兩個統計量就完全確定了具體的分布。
上述各類統計量都已具有常用的可視化方法。區間分布一般可利用柱狀圖來呈現,但是如果希望在一幅圖中同時呈現學生在若干個指標上的區間分布,例如同時呈現學生在若干門課程上取得的總評成績或是在某個畢業要求的各個指標點上的達成度,則柱狀圖便不太適用,特別當指標數量較多時,就難以用一幅柱狀圖來給出圖形。而在多個指標上的排序統計量和均值與標準差的數據可以通過曲線圖來呈現,不過如果同時在一幅圖中給出這些,則曲線數量較多,略顯雜亂。此外,排序統計量也可利用桶狀圖來顯示。此外,也可以使用諸如雷達圖[3]、玫瑰圖[4]等可視化方法來呈現。但這些已有的方法均難以在一幅圖形中將上述所有數據都清晰加以展示。
由于上述統計數據各有其優越性與局限性,能夠體現出學生整體水平的不同方面,因此,我們希望能夠有一種直觀的、更為清晰的可視化方式,能夠集約地在一幅圖形中同時呈現所有這些統計數據。為此設計了我們稱之為“塔帶圖”的一種統計數據可視化圖形,介紹如下。
1.塔帶圖坐標軸的基本構成
塔帶圖的橫軸對應于需要進行統計分析的各個指標項,如若干門課程或若干項畢業要求,縱軸則對應于指標值。由于對于所有指標項,我們都使用同一個縱軸來定位其指標值,因此這隱含地要求所有指標項的取值范圍應當是一致的,或者通過某種歸一化方法被調整為一致。例如對于課程而言,指標值通常就是原始或折算而得的百分制成績,而對于達成度,指標值取值范圍通常設置為[0,1]。同時,根據區間分布統計的需要,縱軸被相應地分為若干區間,通過縱軸刻度來表示。對于百分制成績,通??煞譃?[0,60)、[60,70)、[70,80)、[80,90)和[90,100]等5個區間,分別對應于“不及格”、“及格”、“中等”、“良好”和“優秀”這5個等級。對于[0,1]區間取值的達成度,也可類似加以劃分。
2.排序統計量的可視化
指標值的排序統計量在塔帶圖中以“帶”來表示:將全體學生在各個指標項上取得的最大值和最小值分別依次連成折線,上下兩條折線間以顏色填充,即可獲得用于表示全體學生在所有指標項上的總體取值范圍的條帶;類似地,將全體學生在各個指標項上的75%分位值和25%分位值也分別依次連成折線,其間以另一種顏色填充,即可獲得用于表示表現居中的半數學生在所有指標項上的取值范圍的條帶;全體學生在各個指標項上的中值以一條折線表示。需要注意,由于25%-75%分位值范圍被包含于最小值、最大值范圍之內,因此在繪圖時,前者對應的條帶應該“覆蓋”于后者之上。
3.區間統計量的可視化
指標值的區間統計在塔帶圖中以圓盤表示。例如有比例為r的學生在指標項A上取得了屬于“良好”區間的成績,則在橫坐標對應于指標項A、縱坐標對應于“良好”的取值范圍的位置,以一個面積與r成正比的圓盤來加以表示。學生在一個特定的指標項上獲得的區間分布便可以通過上下依次排列的一系列圓盤來表示,狀如圓塔,結合表示排序統計量的“帶”,這便是“塔帶圖”命名的由來。對于每個指標值區間,可使用的特定顏色來填充與之對應的各個圓盤,以便區分。在繪圖時,區間統計圓盤應“覆蓋”在排序統計量的條帶之上,但不應覆蓋中值折線。
4.均值/標準差的可視化
全體學生在各指標項上取得的算術均值μ以特殊的記號如圓點、小圓圈或星形等表示,并以折線相連。各指標項的指標值樣本標準差σ利用由均值點朝上、下方發出的釘形表示,上、下釘形所確定的取值范圍即為[μσ,μ+σ]區間。
下面通過舉例來說明塔帶圖的繪制和解釋。

表1 示例中的學生課程成績

表2 示例學生成績的區間分布
表1中所列是某一個畢業班全體50名學生在某類共8門課程上所獲得的總評成績。根據成績進行區間統計、排序統計和均值/標準差求取后所得的結果分別見表2和表3。

表3 示例學生成績的排序統計、均值及樣本標準差
根據計算結果繪制的塔帶圖如圖1所示。

圖1 根據示例數據所繪的塔帶圖
由圖1可見,在這8門課程中,總體成績較好的課程是課程3和課程5,其平均成績和成績中值都達到了85分左右;課程3、課程5、課程7和課程8的得分都主要集中在良好這一檔,而且在課程5和課程8中還有相當比例的學生取得了優秀的成績;如果利用排序統計量來考察區分度,則課程3的區分度最低,課程5的區分度也不高,而課程2和課程8的區分度較高;類似地,課程2和課程8的成績散布范圍最大,課程1、課程4和課程6的散布范圍次之;從均值和標準差來分析,課程2的標準差最大,但是通過觀察成績分布并比對排序統計量可以發現,這一標準差的主要來源是少量極端性情況,即在大部分人成績中等的同時,有小部分學生取得了優秀和不及格的成績,從而使整體的標準差增大。
[1]萬玉鳳,柴葳.中國高等教育將真正走向世界——我國工程教育正式加入《華盛頓協議》的背后[N].中國教育報,2016-6-3.
[2]中國工程教育專業認證協會秘書處.工程教育認證工作指南(2016版)[Z].2015.
[3]陳宗榮.基于雷達圖的學生學業水平評價技術[J].中國教育信息化,2015(22):76-78.
[4]劉汝倩,佘冰,朱欣焰,咼維.社會經濟重心軌跡的語義方向玫瑰圖生成方法及應用[J].計算機應用研究,2015 (12):3582-3585.
(編輯:王天鵬)(編輯:王曉明)
G40-058.1
A
1673-8454(2017)05-0065-03
湖南省普通高等學校教學改革研究項目 “面向MOOC的 《數字圖像處理》可視化編程遠程實驗系統研究”(521293198);湖南大學教學改革研究項目“面向MOOC的《科學與工程計算方法及應用》遠程實驗系統研究”(521202085);教育部卓越工程師計劃項目:湖南大學測控技術與儀器(教高[2011]1號);全國專業改革綜合試點項目:湖南大學測控技術與儀器專業綜合改革(教高司函[2011]226號)。