文/滿鑫
利用校本成績評價學校基礎教育質量
文/滿鑫
如果把中考、高考成績看做是中學生學習成就的一次終極性評價,那么中學生在校期間所參加的由學校自主進行的各類階段性測試成績就可以被認為是中學生學習成就的過程性評價。我們可以將由學校根據本地區、本校實際情況,結合教育教學計劃所進行的階段性考核評價結果定義為校本成績。校本成績因其具有廣泛性、時效性、針對性等特點,可以作為評價學生學習情況以及學校教學質量的重要依據。
教學評價;校本考試;項目反應理論
基礎教育是人才培養過程中最核心的環節,基礎教育的質量是衡量一個地區的教育水平發展的重要指標。進入新世紀,一些重要的國際組織和政府對教育質量越來越重視,并由此發展起多種基礎教育監測手段。例如,國際學生評價項目(PISA)、國際數學和科學研究(TIMSS)、美國的國家教育進步評估(NEAP)等。
中國在《國家中長期教育改革和發展規劃綱要(2010-2020)》中明確指出:把提高教育質量作為教育改革發展的核心任務,并多次強調與教育質量的監測和評價相關的內容。具體來講,要“建立國家義務教育質量基本標準和監測制度,開展由政府、學校、社會各方面共同參與的教育質量評價活動”。進一步來說,我國要逐步形成國家、省、地市、縣四級基礎教育監控網絡,建立起覆蓋全國的教育質量監測系統。
(1)評價對象上存在的問題
現有的基礎教育質量監測主要采取抽樣的方法,選取有代表性的樣本進行集中測試來評價一個地區基礎教育質量情況,例如PISA采取矩陣抽樣的方法在每個國家(經濟體)抽取4500至10000人作為評價對象。但在實際情況中,由于各個國家、各個地區的差異,勢必造成抽樣的誤差,無法準確反映本國、本地區基礎教育質量的真實情況。
(2)評價工具上存在的問題
現有的基礎教育質量監測所選用的工具,主要是由相關組織部門通過一定的技術手段開發的評價試題和練習經過檢測后編制的試題冊。由此所帶來的是:評價工具試題的有限性與工具開發的高成本。首先,每一次的評價結果都是以一次評價獲取的數據為依據,每次評價時的試題容量必定有限,同時,不同地區接受同一測試也有失偏頗,能否全面準確測出學生的真實情況有待考慮;其次,評價工具由專家組通過前期編制,以及后期反復檢測最終編制成試題冊,成本較高,對于經濟發展水平低的地區難以承受。
(3)評價的時間跨度
現有的基礎教育質量監測主要是每3到4年進行一次,如NAEP是每四年進行一次,PISA每三年一輪,因此很難針對學生的基礎教育質量進行連續的監測,存在時間上的跨度。
校本考試是學校根據本地區、本校實際情況,結合教育教學計劃所進行的階段性考核,例如單元檢測,期中、期末考試等。校本考試考核范圍廣泛,涵蓋學生接受的所有課程內容;其次,以單元檢測為例,學生進行完某一階段的學習內容,會及時的對該階段的學習效果進行評價,不存在時間上的斷續。因此具有廣泛性、針對性、時效性等優點。
除此之外,每個學校在學生學習期間都會有大量的階段性考試數據,如果棄之不用將造成數據信息的極大浪費。利用校本考試數據對教學質量進行評價,不需要進行專門的抽樣及試題開發,成本上幾乎可以忽略不計。
總體來說,利用校本成績進行教學評價,具有成本低、效率高、準確性強,并與我國當前形勢下的基礎教育現狀相適應的特點,可以預見,將具有較強的實踐意義。
由于試題的難度存在差異,比如某位考生在一次考試中獲得了高分,但是下次考試難度提高后,即使其能力有所提升,但可能考試成績也會下降,因此不能簡單的通過原始分數的對比評價其學習質量,另外,由于作答時存在考生猜測等因素,使原始分數具有一定的誤差。而通過一種新的測量理論——項目反應理論(IRT)的指導,可以有效解決這個問題。IRT理論即項目反應理論(ItemResponseTheory,IRT),是一系列心理統計學模型的總稱,用來分析考試成績或者問卷調查數據。這些模型的目標是來確定的潛在心理特征是否可以通過測試題被反應出來,具有被試特質水平不依賴于被試樣本的代表性、被試能力計算不依賴于測驗項目組的特點。使用項目反應理論計算出的學生能力值,不會因為測量內容的改變而發生變化,也就是說,無論測驗難易程度如何,同一水平考生計算出的能力值是穩定的。
若我們計算每次測驗中考生的能力值,分析其變化趨勢,即可以得出該校、該地區基礎教育的發展情況,對考生的真實能力變化進行跟蹤研究。例如,在連續幾次測驗中,學生的能力值曲線呈上升趨勢,則可以認為學校近期的教學質量是有所提高的。另外,通過分析研究某一學生的能力值曲線還可以發現該生哪一部分內容沒有掌握完善。值得一提的是,這種對學生能力值的計算是不需要花費太大成本的,同一估算方法經過簡單修改后幾乎適用于任何類型考試。
[1]戴海崎,劉啟輝. 錨題題型與等值估計方法對等值的影響,心理學報,2002,34(4):367-370.
[2]羅照盛.項目反應理論基礎[M].北京:北京師范大學出版社,2012,80
[3]漆書青.現代教育與心理測量學原理[M].北京:高等教育出版社,2002,201-215
[4]李峰,朱彬鈺,辛濤. 十五年來心理測量學研究領域可視化研究——基于CITESPACE的分析[J].心理科學進展,2012,07:1128-1138.
[5]熊江玲. 經典測量理論、概化理論及項目反映理論比較研究[J]. 求索, 2004(04)
[6]尹秋蓮,王濤. 香港高考校本評核的運用及啟示[J]. 河北師范大學學報(教育科學版),2011,09:62-65.
[7]鄭曉敏,張永軍. 接軌國際 多元出路 強化校本——香港高中教育評核制度改革述評[J]. 教育科學論壇,2011,05:22-24
G
A
2095-9214(2015)02-0243-01
江西師范大學心理學院)