在教育教學中,我們總是需要通過一定的測試來檢測學生的學習狀況,通過測驗所直接得到的分數,叫原始分數。如下圖,采用原始分數的排名。
原始分數本身意義甚小,因為僅從個別學生的原始分數,我們無法了解他學習成績的好壞,知識能力的高低,也無法與其他學生相互比較。由于各個測驗的難度不同,各原始分數的價值也不相同,不同測驗的原始分數不能進行直接比較,也就是說,考生無法根據原始分成績,判斷自己在考生團體中所處的位置。為了使原始分數本身具有意義,使不同測驗的原始分數可以相互比較,就必須把它們轉換成導出分數。所謂導出分數就是經過統計處理過的,具有一定參照點和單位的、可以比較的分數。在教育測驗中常用的導出分數有百分等級分數和標準分數。
大學教學的特點,教學過程評價的目標,需要我們淡化被評價者在團體中所處的位置的橫向比較,而注重采用“個體內差異評價”的方法,即通過被評價者進行自身縱向的比較和個體諸側面的比較,來研究被評價者自身綜合能力發展和變化的過程,探索其內在的規律。例如教育統計學所提到的如何縮減數據和描述這些數據,如制成表格,畫出圖形,計算一些常用的參數,用以揭示某些方面的特征;推斷統計則是通過樣本所提供的信息,對總體或樣本的某些特征進行推斷、估計和預測,以揭示事物的內在規律。只有這樣,才能使教師獲取更有用的反饋信息,改進教學管理,保證教學質量;使學生可以調整學習策略、改進學習方法、提高學習效率。
標準分數是由均數和標準差規定的相對地位量。它是統計學中最重要、用途最廣的統計量,相比原始分,標準分制度要比原始分制度更科學、更合理。它能夠克服原始分的上述兩種局限性,很適合通過分數來達到準確清晰地反映考生之間的水平差異并因此作為選拔的依據。標準分制度是根據教育測量學理論建立的一套有關分數報告、分數解釋和分數使用的制度。它向考生報告各科標準分及百分等級,報告總分(改稱綜合分)的標準分百分等級。
“個體內差異評價要用導出分數(百分等級分、正態化標準分)進行比較。若用原始分數對今昔或各側面進行比較,就會與評價的定義相背離,失去評價的意義。因為它既沒與絕對標準相比較,也沒與他人相比較,而且沒作出價值判斷”。標準分Z的計算公式為:
式中,X 為第i個學生的原始分,X為平均分數,S為標準差。
標準分數是一個以平均值為參照點、以標準差為單位、測量原始分數與其平均分數的距離的量數,可以表示一個原始分數在團體中所處的相對位置。不管原始分數的平均分、標準差如何,相同的標準分表示在分布中處于同樣的相對位置。為使標準分更符合我們沿用百分制的記分習慣,可將標準分Z轉化為另一種標準分T,其計算公式是:
T=10Z+50
事物進行比較的前提是要選擇共同的參照點(物)和標準,否則,比較就是無意義的,線性標準分作為一個很好的工具對每個個體(或小團體,如學?;虬嗉墸┻M行今昔比較(不同測驗之間)或個體諸側面(不同科目之間)進行比較。線性標準分的優點:“如果幾個不同測驗的分布形態是很相近的,那么,同一個被試在幾個不同測驗上的線性標準分數,可以相互比較”,“可以將一個被試幾個不同測驗上的線性標準分數相加求和”。即通常所說它具有的“可比性”和“可加性”,可以直接進行合成運算。線性標準分的缺點:當兩個測驗的分布形態不同時,它們的線性標準分既不可以相互比較,又不可以相加求和。如下圖采用標準分數的排名。
不同測驗的線性標準分只有在分布形態相同或相近的情況下才能進行比較,如果兩個分布的形態不同,譬如一個是正態,一個是負偏態,那么相同的Z分數可能代表不同的百分等級。對于這樣的兩種分數,我們難以做到準確地比較。當兩個測驗的分布的形態不同時,它們的線性標準分既不可以相互比較,又不可以相加求和。為了使不同的測驗分數可以相互比較,則需將之正態化,即使用進行過非線性轉換的正態化標準分。轉換的結果是把偏態分布強制扭轉成為標準正態分布形態。轉換生成的正態化標準分消除了分布形態的影響,才具有真正意義的“可比性”和“可加性”,為科學、準確地對不同測驗的分數進行比較和分析奠定了基礎。
標準分原理在教學研究中已經有了廣泛的應用,教師應該具備初步的推斷統計知識和應用能力,才可能看懂和吸收他人的研究成果;即使我們不需要進行以發表為目的的研究,也需要經常對學生成績進行分析,對教學方法、學生的學習效果進行科學地評價和檢驗。除了全校的宏觀分析(建立學校常模)之外,教師還應該利用本原理通過局部的數據進行“個體內差異評價”的微觀分析。系統建立了學生成績的“歷史檔案”,全面記錄歷次考試中學生個人成績、團體指標的詳細數據,可以方便地研究被評價者學習能力發展變化的過程。充分發揮教師在形成性評價過程中的“主體作用”,將使教學評價成為院部、教師和學生共同參與的交互活動。
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文?!?/p>