診斷試題命題質量評價和管理建議

2023-05-30 00:19:54彭和強鄭浩

地理教育 2023年13期

彭和強鄭浩

高考是對學生高中階段學習成果的終結評價。《高考評價體系》中，明確了“立德樹人、服務選材、導向教學”的核心價值和功能。其中“導向教學”意為：高考要為高中一線教學指明方向。

診斷考試是地方教育管理部門對學生高中特定時段學習效果的過程性評價。過程性評價對一線教學也有著極其重要的導向作用，但卻沒有特定標準可參照。如果診斷試題不能進行有效的考核評價和約束，試題的質量難以得到有效保障，一線教學也就容易迷失方向，這將與高考評價體系中的“導向教學”理念背道而馳。

基于以上思考和分析，試圖找到能夠有效評價和考核診斷考試命題質量的途徑。

一、研究對象和方式

研究對象為綿陽市某年級的93名學生，以歷次考試測試數據為基礎。

因每次考試均按照全市排名劃定A0、A優、B優分數線，且每次劃線人數基本相當，故參照上線情況進行統計分析，具有較強統計參照價值。通過上線人數、超線差值、置信度三方面進行統計分析，能夠較好檢驗診斷考試與高考之間的關聯度，從而檢驗診斷試題質量。

二、診斷考試與高考的關聯度分析

1. 上線人數的關聯度

從歷次考試各層次上線人數看（表1），A0和A優上線人數波動幅度較大；B優上線情況除三診外，均穩定保持在75～76人。

從歷次考試上線結構來看，無論哪個層次的上線人數，高考都與該年級的一診最為接近，說明二者關聯度最強；而三診測試結果與高考差異最明顯，B優上線人數也產生較大差異，說明二者關聯度較差。

2. 超線差值的關聯度

學生考試成績與當次優生線之間存在一定差值，可稱為超線差值ΔM。理論上，如果所有學生高考超線差值ΔM1與診斷考試超線差值ΔM2之間的差值ΔE（即ΔE=丨ΔM1-ΔM2丨）無限接近于0，則表明當次診斷考試關聯度越高。但客觀上講，因學生個體存在成績不定因素，做到無偏差自然不可能。但大量統計對分析診斷考試有效度也有積極意義。

表2以A優線為參照，統計研究對象4次統考與高考之間ΔE值的大小分布情況。ΔE低值區分布人數越多，表明試題與高考關聯度越高。

通過表2數據分析可知，一診、二診考試ΔE≥15的人數相對較少，表明其關聯度較高。三診考試ΔE≥15的人數顯著偏多，其關聯度相對較差。

3. 置信度分析

置信度也可直觀分析出兩種數據之間的關聯度。將歷次診斷考試與高考上線情況進行疊加，并進行上線與未上線統計，得到各層次和各次考試之間的列聯表。運用卡方公式，得到隨機變量K?的觀測值k，再根據觀測值k對照表，得到診斷考試與高考之間的置信度。置信度越高，表明高考與當次診斷考試的關聯度越高。分A線和B線兩個層次進行置信度分析。

從A線分析來看（表3），二診、三診置信度較低，尤其是二診，置信度僅60%～75%，說明當次診斷考試是否上A線與高考是否上A線之間缺乏必要聯系，考試關聯度和有效性不足。一診置信度較高，達到95%～97.5%，即當年一診是否上A線很大程度上決定高考是否上A線，兩者之間關聯度較高。

從B線分析來看（表4），診斷考試和高考B線之間置信度整體較A線偏高，尤其一診考試達到99.9%，關聯度很高。但二診測試仍不足85%，關聯度偏低。

三、結論與建議

1.一診試題質量較高

無論是A0、A線、B優線，與高考之間的關聯度均最大。即學生在一診考試中是否上線，上什么層次的線，很大程度上決定學生在高考中的上線情況。表明當年一診試題質量高，教學指引性較強，對各個層次學生復習指導價值較大。

2.二診、三診試題質量較低

二診、三診僅在B線與高考有較大關聯度，而A0、A線與高考之間關聯度較小。說明這兩次診斷性考試對中后段學生的測試有效度較高，具有較強指導價值和意義，但是對中前段學生的測試有效度較低，指導意義不大。

3.加強命題管理的建議

（1）加大診斷試題命制投入

高考試題命制的人力、財力、時間投入，都比診斷考試多，因而試題更加嚴謹合理。診斷考試的命題者多為一線教師，且命題待遇偏低、時間不足，難以更高標準保障診斷試題質量。

故加大診斷考試投入力度，能更高標準保障過程性檢測質量，從而提高日常教學、高考復習的針對性、指導性，更有利學科人才培養。

（2）強化命題質量監督和管理

試題質量不能僅從平均分、區分度、是否存在學科爭議、學科認知錯誤等方面評判。市級教育科學研究部門應建立完善命題有效性追蹤制度，并合理運用測試所得大數據，根據上線人數、越線分差、置信度等分析診斷試題的效度、方向指導性價值等，建立量化考核評價機制并進行倒追獎懲。

影響學生診斷成績和高考成績的因素還有教師教學風格、學生考試身心狀態等。本研究對象數量偏低，無法完全規避上述因素帶來的質量評價差異。通過更大范圍數據統計和分析，建立量化考核評價機制，能更有效對試題質量進行評價，是一種行之有效的命題質量管理途徑和手段。