孫永科 熊飛
摘要:該文介紹了一種學(xué)生成績等級的劃分方法,按照正態(tài)分布的3-sigma理論將學(xué)生的成績劃分為不同的等級。與傳統(tǒng)的純數(shù)字成績比較,該方法屏蔽了試卷和課程的難易程度的影響,配合線箱圖可以反映學(xué)生的成績分布和個體成績等級。
關(guān)鍵詞:正態(tài)分布;學(xué)習(xí)能力;線箱圖
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2019)06-0207-02
A Visual Analysis of Students Score Based on Normal Distribution
SUN Yong-ke, XIONG Fei
(Southwest Forestry University, Kunming 650224, China)
Abstract: This article presented a visual analysis of students score which divide students into different levels according the 3-sigma theory about normal distribution. Compared with traditional method which only display number, this method has ability to estimate the level of student more accurately than before, it can easily display the distribution of class scores and personal position in class level.
Key words: normal distribution; ability of study; box plot
1 背景
每個學(xué)期結(jié)束時,學(xué)校都要進(jìn)行學(xué)生成績分析,并給學(xué)生家長發(fā)放學(xué)生成績通知單。傳統(tǒng)的學(xué)生成績通知單中只包含各科成績的列表,信息量比較少,缺乏成績的分布信息,所以家長很難了解學(xué)生的學(xué)生情況。例如某門課程的成績90分,這并不能說明該學(xué)生學(xué)習(xí)水平高,可能本次試卷簡單,90分也許是全班的最低成績;因為試卷難度不同,分?jǐn)?shù)會表現(xiàn)出不同的差異,僅僅通過考試的成績很難對學(xué)生的學(xué)習(xí)水平進(jìn)行正確評價。文獻(xiàn)[1-3]中作者使用統(tǒng)計學(xué)方法分析學(xué)生成績,從不同的角度展示成績的分布特點,但是結(jié)果復(fù)雜需要相關(guān)的專業(yè)知識才能理解。目前成績分析研究熱點是課程的重要性分析和關(guān)聯(lián)度分析[4-8]。
利用學(xué)生成績總體呈正太分布的特點,結(jié)合正態(tài)分布理論,學(xué)生的成績可以劃分為5個不同的等級。這種劃分方法不僅可以描述成績的整體分布情況,而且還可以的描述個體與整體之間的關(guān)系。有利于了解學(xué)生的個人學(xué)習(xí)情況和整體的成績分布。
2 原理介紹
近幾年關(guān)于學(xué)生成績分布的研究都認(rèn)為:學(xué)生的成績一般都呈正太分布[9-11],文獻(xiàn)[11]中作者利用R語言對一高等學(xué)校的學(xué)生進(jìn)行了分析,再次證明了學(xué)生的成績呈正態(tài)分布,同時作者還進(jìn)一步解釋了學(xué)生成績與正態(tài)分布之間的關(guān)聯(lián)關(guān)系。在正態(tài)分布理論認(rèn)為學(xué)生的成績應(yīng)該集中分布在平均分附近,多數(shù)人的智力水平都處于平均水平,成績越遠(yuǎn)離平均分,人數(shù)越少,其分布圖類似一個對稱的山峰。利用概率可以把學(xué)生的成績劃分為優(yōu)、良、中、低和差5個等級。以圖1為例,人數(shù)最多的區(qū)域被劃分為中間水平,覆蓋了50%的學(xué)生對應(yīng)圖中Q1和Q3之間的區(qū)域;兩端的24.65%分別被劃分良和低,成績良好的占24.65%,對應(yīng)圖中的UCL和Q3之間的區(qū)域,成績低的也占24.65%,對應(yīng)圖中LCL和Q1之間的區(qū)域。優(yōu)秀的數(shù)量和差的數(shù)量最少,分布在最兩端共占0.7%。
Box線箱圖基于上述的劃分原則,按照比例對數(shù)據(jù)進(jìn)行可視化展示。箱子(矩形區(qū)域,如圖2所示)的上下邊界分別對應(yīng)Q1和Q3,上尾線對應(yīng)UCL,下尾線對應(yīng)LCL。利用box線箱圖可以清楚地看到班級的成績分布和個人的成績所處的位置,不同課程進(jìn)行比較,還可以了解課程之間的難度差異。
線箱圖中沒有出現(xiàn)班級中其他學(xué)生的成績,保護(hù)了其他學(xué)生隱私。但是通過觀察箱子、尾線和原點(黃色的原點表示學(xué)生的成績位置,如圖2所示)的位置,可以讓學(xué)生和家長非常容易地了解到班級整體的成績分布和學(xué)生個人成績的位置。
3 分析實例
以表1的學(xué)生成績?yōu)槔1碇械摹禖語言程序設(shè)計實習(xí)》成績是90分,《英語》是69分。如果按照成績的高低評判,《C語言程序設(shè)計實習(xí)》成績遠(yuǎn)高于英語的成績,多數(shù)人很容易認(rèn)為該學(xué)生的《C語言程序設(shè)計實習(xí)》成績好,英語的成績差,但實際情況卻恰恰相反。
同樣的學(xué)生成績,使用線箱圖進(jìn)行可視化分析結(jié)果就和之前的分析出現(xiàn)了明顯的。圖2是該學(xué)生的線箱圖,在圖中的每一列分別代表一門課程,課程代碼與表1中的代碼相同。圖2中的C2列是《C語言程序設(shè)計實習(xí)》的成績分布,藍(lán)色的矩形框是50%學(xué)生成績的分布區(qū)域,黃色的點為當(dāng)前學(xué)生的成績。可以清晰地看出雖然該門課程的成績是90分,但是該學(xué)生的成績?nèi)蕴幱谄骄健7列為英語成績,雖然學(xué)生的成績是69分,但是圖中的黃點已經(jīng)明顯的超出了矩形框的上邊界,說明該學(xué)生的成績高于班級的平均水平。
課程C2的矩形區(qū)域比C7的長,說明C2的成績比C7的成績分散,成績分散說明成績的集合的方差比較大,意味著學(xué)生之間的差異比較大。C2中箱子位置比C7的位置高,說明C2的成績整體比C7的成績高,位置高說明班級中多數(shù)人的成績都比較高,學(xué)習(xí)效果比較好。線箱圖按照成績?nèi)藬?shù)的分布劃分成績等級,等級的界定與成績本身沒有關(guān)系至于人數(shù)的多少有關(guān)系,這樣能很好體現(xiàn)個體在群體中的排名位置。
對比表1和圖2的結(jié)果發(fā)現(xiàn):表1中的課程只有成績沒有標(biāo)識等級區(qū)域,學(xué)生的等級只能按照成績分?jǐn)?shù)來判斷,二在圖2中不僅可以看到成績而且還可以清楚地看到成績所處的等級區(qū)域,按照表對學(xué)習(xí)進(jìn)行登記劃分出出現(xiàn)一些偏差,例如,表1中課程C7的成績只有69分,C2的成績有90分,僅從這個數(shù)字來衡量,很容易錯誤地認(rèn)為該學(xué)生課程C2的成績等級比C7的等級高。但是,在圖2中C2的成績處于平均水平,而C7的成績卻高于平均水平,等級排名比較靠前。
單純地依靠成績來衡量學(xué)生的學(xué)習(xí)能力,不能客觀全面地反應(yīng)學(xué)生的學(xué)習(xí)能力和水平。課程難度差異和試卷難度差異都會對這個評價結(jié)果產(chǎn)生比較大的影響。而通過線箱圖來評價學(xué)生的學(xué)習(xí)能力,重點考察成績的分布特點和個人的排名位置,反映的是學(xué)生在班集體中的學(xué)習(xí)水平。因此后者的排名更為科學(xué)合理。
4 總結(jié)
基于線箱圖的學(xué)生成績分析方法可以對學(xué)生成績進(jìn)行等級劃分,可以展示課程成績的分布特點。教學(xué)機(jī)構(gòu)使用該方法,可以快速地掌握學(xué)校的教學(xué)情況。使用該方法進(jìn)行不同課程之間的比較,可以及時發(fā)現(xiàn)課程難易程度的差異;進(jìn)行相同課程之間的比較,可以發(fā)現(xiàn)不同班級之間的差異。使用線箱圖制作成績通知單,圖中不出現(xiàn)其他學(xué)生的成績信息,保護(hù)了其他學(xué)生的個人隱私,同時又能夠清晰地把學(xué)生的成績、成績等級和大概位次告知家長,方便家長有目的地對學(xué)生進(jìn)行家庭輔導(dǎo)。
參考文獻(xiàn):
[1] 許德泓. 大學(xué)生學(xué)習(xí)能力達(dá)成評價指標(biāo)體系的研究[J]. 國家教育行政學(xué)院學(xué)報, 2016(12):66-71.
[2] 張玲. 考試成績評價指標(biāo)的統(tǒng)計分析及研究[J]. 數(shù)學(xué)學(xué)習(xí)與研究, 2018(5).
[3] 馬奕, 涂淑珍, 呂衛(wèi)平. SPSS統(tǒng)計分析在成績評價中的應(yīng)用[J]. 龍巖學(xué)院學(xué)報, 2015(2):110-114.
[4] 王成勇. 基于關(guān)聯(lián)規(guī)則Apriori算法的學(xué)生成績分析[J]. 價值工程, 2018(5):17-171.
[5] 陳喜華, 黃海寧, 黃沛杰. 基于聚類分析的學(xué)生成績分析[J]. 清遠(yuǎn)職業(yè)技術(shù)學(xué)院學(xué)報, 2018(2).
[6] 李曦. 多元統(tǒng)計在學(xué)生成績分析的運用[J]. 南昌航空大學(xué)學(xué)報: 自然科學(xué)版, 2006,20(3): 58-62.
[7] 石平. 基于決策樹分類的成績分析系統(tǒng)研究[J]. 長春師范大學(xué)學(xué)報, 2018(2).
[8] 李娟, 楊麗麗. 學(xué)生成績分析系統(tǒng)的設(shè)計與實現(xiàn)[J]. 河北職業(yè)教育, 2009,5(10): 143-144.
[9] 孫文興, 陳智剛, 羅婕, 等. 成績數(shù)據(jù)無量綱化在學(xué)生綜合測評中的應(yīng)用[J]. 昆明冶金高等專科學(xué)校學(xué)報, 2017, 33(5): 87-91.
[10] 龔玉玲, 徐曉棟. 基于SAS的學(xué)生成績混合正態(tài)分布的研究[J]. 江蘇科技信息,2018(1).
[11] 王培. 學(xué)生成績與正態(tài)分布之關(guān)聯(lián)[J]. 現(xiàn)代經(jīng)濟(jì)信息, 2017(3):382-382.
【通聯(lián)編輯:謝媛媛】