楊小軍 錢魯鋒 王力猛 劉文



摘? 要: 考核評價工作中有兩個問題影響考核結果的公正:一是忽略各科目重要程度不一樣,將學員各科成績簡單相加作為評價依據;二是在分組答辯考核中,忽略各組評委主觀評分標準不一致而導致的組間差,直接比較各組的成績。文章引入數據處理方法中的Z-score標準化方法并加以改進,達到將考核成績去量綱化的目的。該方法消除了由于科目重要程度不一致,各組評委主觀評分標準不一致而導致的成績差異,對提高考核的公平公正具有現實意義。
關鍵詞: 去量綱化方法; Z-score; 數據標準化; 分組答辯
中圖分類號:C812? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2021)02-38-04
Abstract: There are two problems in the assessment and evaluation work that affect the fairness of the assessment results, one is to ignore the differences in the importance of each subject and simply add the scores of each subject as the evaluation basis; the other is, in the group interview reply assessment, the difference between groups caused by the inconsistent subjective scoring standards of each group of judges is ignored, and the results of each group are directly compared. This paper introduces the Z-score standardized method in the data processing method and improves it to achieve the purpose of reducing the dimension of the assessment result. This method eliminates the differences in performance due to the inconsistency in the importance of subjects and the subjective scoring standards of each group of judges, which has practical significance for improving the fairness and justice of assessment.
Key words: dimensionless method; Z-score; data standardization; group interview reply
0 引言
考核是教學工作的一個重要環節。學員在校學習期間,學習的各門課程重要程度不一樣,不同課程之間的絕對分數沒有可比性。簡單地將各門課程的絕對分數相加對學員進行評價,這是極不科學的。需要將各門課程進行去量綱化處理,將原始分數進行標準化處理,使各門課程的評價量綱一致再計算總分,才能反映學員真實水平。考核如果采用分組答辯的方式進行,還需要考慮組間差問題。由于各組答辯評委的主觀評價標準不完全一致,導致同一名學員去A組或是B組答辯得到的答辯成績是不一樣的。這種由于各組答辯評委的主觀評價標準不一致出現的成績差異稱為組間差,組間差實際上是對同一課題,不同組評委之間的評價量綱不一致而產生的。以上這兩個問題都可以利用標準化方法對數據進行去量綱化處理加以解決。
1 Z-score標準化方法
學員的成績呈現出正態分布。各門成績之間或各組成績之間的量綱不一致,實際上是各門成績和各組成績的集中趨勢和離散程度不一致。學員成績是一組單指標數值型數據,對其進行測度的指標有兩個:一是數據分布的集中趨勢,反映各數據向中心值靠攏的程度。二是數據分布的離散程度,反映各數據遠離中心值的趨勢。數據的集中趨勢用平均數來進行測度,離散程度用方差或標準差來測度[1]。圖1表示正態分布的兩組數據的離散程度不一致,圖2表示多組數據的集中趨勢不一致,因此,對數據進行去量綱化處理就是將不同組的數據進行平移和縮放,使其平均值和方差一致。具體方法是將各組數據同時減去各組平均分,并除以各組標準差。成績數據符合正態分布,適合采用去量綱化方法中的Z-score標準化方法,其計算公式如下[2]:
其中,v是原始分數,[μi]是i組成績的均值,[σi]是i組成績的標準差,[v']為經過標準化處理后的成績。公式⑴中采用標準差而不采用方差度量離散程度,是為了保持與平均值的量綱一致。經過Z-score標準化變換后的各組成績都具有平均數為0,標準差為1的分布特征,實現了各門或各組成績的離散程度和集中趨勢一致,達到去量綱化的目的。
2 Z-score標準化方法在考核中的具體應用
2.1 多門課程綜合評價
因為考核時各科目重要程度不一樣,對學員進行綜合評價時不能將各科成績簡單相加,需要先對各門成績進行去量綱化處理,利用公式⑴進行Z-score標準化處理,其中[μi]為各科成績的平均值,[σi]為各科成績的標準差。變換后的成績雖然消除了各門成績間的差異,可以將各科成績相加,來評估學員的總體學習效果。但是各門課成績的平均值為0,說明學員成績圍繞0上下波動,低的分數為負分,高的分數也才幾分,這不合乎人們的評分習慣。因此,我們需要將公式⑴再變換一下,將成績乘以一個擴大系數,再加上基分,變換公式如下:
其中,[v'']為標準化后的最終成績,[v']為學員經過第一次標準化變換后得到的成績,公式中的w為擴大系數,b為基分。
下面以學院某年度某班次學員多個科目的考核為例,來對算法進行驗證。全班共42名學員,共計進行了5個科目的筆試考核,選取其中的4名學員成績進行比較,如表1所示。按原始分數總分從高到低排序,依次為學員1、學員2、學員3、學員4,這種處理方式沒有消除考核科目重要程度的影響,排名不合理。對原始分數按照公式⑴進行標準化處理后,各科分數之間的量綱一致了,就可以直接相加,按標準分數總分從高到低排序,依次為學員2、學員1、學員4、學員3。采用公式⑵對標準分數進行二次變換,最終結果如表1所示。w,b兩個參數的具體值由考評專家根據需要靈活設定,第二次變換時所有學員的基分b和擴大系數w是一致的,所以不影響學員的排名。
2.2 分組答辯成績組間差消除
分組答辯時由于各組答辯評委的主觀評價標準不一致,導致同一名學員選擇去A組或是B組答辯,最終得到的答辯成績是不一樣的。這種由于答辯評委的主觀評價標準不一致而出現的成績差異稱為組間差,組間差實際上也是對同一課題進行分組評價時,不同組評委之間的評價量綱不一致導致的。消除答辯成績組間差的方法還是利用公式⑴,對各組數據進行標準化變換,其中[μi]為各組成績的平均值,[σi]為各組成績的標準差。經過Z-score標準化變換后的各組分數都具有平均數為0,標準差為1的特征。實現各組成績的離散程度和集中趨勢一致,從而達到消除組間差的目的。
同綜合評價一樣,進行Z-score標準化變換后的成績雖然消除了各組間的組間差,但是各組成績的平均值為0,學員成績圍繞著0上下波動,低的分數甚至出現負分,需要將成績再一次變換,將首次變換后的成績乘以所有學員成績的標準差,再加上所有學員成績的平均值,變換公式如下:
其中,[v'']為學員的最終成績,[v']為學員經過第一次標準化變換后得到的成績,公式中的σ為所有學員成績的標準差,μ為所有學員成績的平均值。經過如此變換后,學員成績就回到了常用的評價范圍之內,而且,所有學員成績的均值和標準差也都一致了。
下面仍以學院某年某班次學員想定作業答辯為例,來對算法進行實驗驗證。全班42名學員,答辯分成三個組進行,每組14名學員,其中第三組有一名同志缺考。學員的分組和答辯順序答辯前由計算機程序自動隨機生成,理論上各組學員之間的優秀率相差不大。每組有7名評委老師,學員原始的答辯成績是將各位評委評分成績相加后,再減去一個最高分,減去一個最低分,最后除以評分人數減去2的方法。學員原始的答辯成績由公式⑷計算得出,其中[yi]為某個評委為當前答辯學員打分的成績,[Y]為所有評委為當前答辯學員打分的集合,學員答辯完成以后由答辯系統計算得出原始的答辯成績。表2是學員的分組情況,以及通過公式⑷計算得出的原始答辯成績。
經過計算,第一組的學員平均分[μ1]為89.6,標準差[σ1]為5.08。第二2組的學員平均分[μ2]為87.5,標準差[σ2]為4.57。第三組的學員平均分[μ3]為89.38,標準差[σ3]為6.2。全部41名學員總的平均分為88.81,標準差為5.26。從原始的答辯成績可以看出,第二組學員的平均成績最低,原因有兩個可能,一是該組學員的水平確實低,二是該組的答辯老師評判得太嚴。下面通過對數據進行標準化處理來確定原因。通過公式⑴和公式⑶對學員的原始答辯成績進行標準化變換,最終得到的標準成績如表3所示。
將表2的原始答辯成績按照成績從高到低排序,取前10名,得到表4。將表3中經過標準化處理的成績按從高到低排序,取前10名,得到表5。
通過比較表4和表5,可以發現兩個現象:一是兩個表中的10名學員有7名是一致的,說明優秀的學員不管成績怎么排都是優秀的,這符合客觀規律;二是學員的成績排名發生了變化,成績標準化后有些組的學員排名上升,有些組的學員排名退出了10名之外。尤其是第二組,按原始成績排序,只有2人進入前10名,對成績進行標準化處理之后,有4人進入前10名。第二組的學員16成績原來排名第六,成績標準化后,從第六名躍升至第一名。說明第二組的評委評判過于嚴苛。經過標準化處理之后,各組成績消除了組間差,排序更加合理了。
3 結論
在考核評價工作中有兩個問題會影響到考核結果的公正,一是由于考核時各科目重要程度不一樣;二是在分組答辯考核中,雖然各組統一了評分標準,但執行評分標準是評委對學員是否優秀的一個主觀評判,取決于評委的知識背景和閱歷,因此無法通過統一標準的方式消除各組評分之間的組間差,需要采用算法處理才能消除。以上這兩個問題都可以用數據去量綱化方法解決。
本文引入數據處理方法中的Z-score標準化方法,將各門或各組成績經過平移、壓縮后,使得各門或各組成績的平均值為0,標準差為1,從而達到去量綱化的目的。但各組成績為0,標準差為1意味著學員的成績太少,甚至會出現負分,不合乎常用的評分習慣。因此,我們對常用的Z-score標準化方法進行了改進,對標準化后的成績進行第二次變換,將成績變換回了正常評價區域。該方法消除了由于科目重要程度不一致,各組評委主觀評分標準不一致而出現的科目成績差異和答辯成績組間差,科學合理,對提高學員考核的公平公正具有現實意義。本文所用的方法是一種統計學方法,更適合在大數據量的情況下使用,在數據量偏小的情況下,效果欠佳。
參考文獻(References):
[1] 賈俊平,何曉群,金勇進.統計學(第六版)[M].中國人民大學出版社,2000.
[2] 韓家煒,Micheline Kamber,裴健.數據挖掘概念與技術[M].機械工業出版社,2012.
[3] 李曉康.幾種數據處理方法及其在綜合評價中的應用[J].統計與決策,2015.13:90-92
[4] 沈勇.標準分數在醫學生臨床實踐評價中的應用[J].繼續教育研究,2017.12:127-128
[5] 李玲玉,郭亞軍,易平濤.無量綱化方法的選取原則[J].系統管理學報,2016.25(6):1040-1045
[6] 詹敏,廖志高,徐玖平.線性無量綱化方法比較研究[J].統計與信息論壇,2016.31(12):17-22