張淇 陳忠暖 方城



《國務院關于深化考試招生制度改革的實施意見》提出 “完善高中學業水平考試”,至少在未來一段時間里,學業水平考試將繼續作為一項重要的教育考試制度而受到關注。因此,學業水平考試基于標準的實行情況如何是值得深究的問題。
從區域對比的角度,探究廣東省與京津湘魯四省(市)2009—2015年學業水平測試地理試題與課程標準的一致性水平,分析影響一致性水平高低的因素,對學業評價制度自身的完善、基于標準教學的推進和學生學業成就的達成發揮著積極的作用。
一、研究方法
1.研究樣本
(1)課程標準。本研究選用《普通高中地理課程標準(實驗稿)》(以下簡稱課程標準)為研究對象,它是研究一致性關系的基礎。現行課程標準分為前言、課程目標、內容標準和實施建議四部分。其中,內容標準是對學生學習高中地理課程必須達到的基本要求,以行為目標方式表述。
(2)五省(市)學業水平地理試題。反映和評價一個地區的教育發展水平,可以用教育發展指數作為指標。由于全國不同省(市)高中學業水平測試方案不盡相同,因此在保證樣本時間尺度相同、課程標準依據相同的情況下,再根據教育發展水平指數,選擇教育發展水平指數處于前列的北京、天津,以及教育發展指數與廣東水平相近的湖南和山東五省(市)的試卷作為橫向比較樣本,以此探究廣東與教育發展水平相近的省份的一致性水平情況,以及與教育發展水平較高的省份間的一致性水平是否有差距。本研究累計研究五省(市)七年來水平測試地理試卷35份,完成試題編碼1 936個。
2.研究工具
目前學業評價與課程標準的一致性研究模型有韋伯模式(Norman L. Webb)、課程實施的調查(Surveys of enacted curriculum,SEC)模式和成就公司模式(Achieve. Inc)等。綜合各省(市)水平測試試題和國家課程標準的現實情況,決定選用適合筆紙測試的韋伯模式進行研究。韋伯模式是眾多工具中理解學業評價和課程標準之間最重要、最具有創新性的模式。韋伯分析模式的核心框架包括知識種類、知識深度、知識廣度和知識分布的平衡性四大維度。
3.研究步驟
(1)對認識水平的劃分。認知水平具有層次性,我國課程標準對認知水平的劃分主要依據布盧姆的教育目標分類學。據此,本研究基于布盧姆分類學相關理論,并結合廣東省學業水平測試地理試題的具體情況,將認知水平劃分為:記憶、理解、運用和分析四個層次,在編碼時分別用阿拉伯數字“1、2、3、4”進行標記。
(2)對課程標準的編碼。首先,按照《普通高中地理課程標準(實驗)》的設置,將課程標準的內容目標分成三級系統,分別是學習領域、主題和具體目標。其次,對課程標準進行重新整理,確定每條具體標準只包含一條學習要求。然后用序號x、y、z對每條具體目標進行編碼,其中x、y、z均用阿拉伯數字“1、2、3……”分別表示學習領域、主題和具體目標的序列,并對課程標準所要求達到的認知水平進行編碼,如表1所示。
由于韋伯關于學業評價與課程標準一致性的研究,主要涉及知識技能和認知要求兩大維度,不涉及過程與方法和價值觀方面的內容,因此,對個別考查體驗性目標的標準內容和試題均不編碼。
(3)對地理試題的編碼。試題編碼主要包括三個內容:①分析每道試題對應課程標準中哪一條具體目標;②對試題所考查的認知水平進行判定;③把試題所考查的認知水平與對應具體目標的認知水平進行比較,其契合情況劃分為“1(低于)”、“2(符合)”和“3(高于)”三種。由于我國課程標準的內容標準中,沒有具體對應的技能目標,因此,本研究只對知識目標進行編碼,對個別技能目標的試題則不編碼。
二、分析過程
按照韋伯模式知識種類、知識深度、知識廣度和知識分布平衡性四大維度,對編碼數據的統計和整理結果如下。
1.知識種類的一致性分析
知識種類維度探究試題考查的學習領域與課程標準要求的學習領域是否一致,依據韋伯設定的可接受水平,只要該學習領域對應的試題數大于6道則可判定知識種類的一致性水平達到可接受范圍。如表2所示,廣東省各年份、各領域下試題擊中具體目標的題目數均大于6道,一致性達到可接受水平。2009年的天津卷和2014年的山東卷考查地理3領域的題目數不足6道,一致性水平不可接受。地理1考查比重過大、題量過少是造成天津卷和山東卷該維度一致性水平不理想的原因。因此,權衡學習領域比重和充足的題量是保證知識種類一致性達標的重要條件。
2.知識深度的一致性分析
知識深度探究試題考查的認知要求和知識技能是否符合課程標準的要求,只要符合課程標準認知要求的試題數占總數超過50%,則認定為知識深度達到可接受水平,在40%到50%之間為勉強接受水平。如圖1所示,五省(市)的知識深度一致性水平均達標,但其中廣東卷三個學習領域的知識深度水平在五省(市)中均位最末,山東卷在三領域均位于前列。進一步分析發現,造成知識深度一致性程度處于低水平的原因,是試題所考查的認知水平“低于”課程標準要求的試題比重過大。而“低于”課標要求比重較大的具體目標有“分析地球運動的地理意義”、“運用簡易天氣圖,簡要分析鋒面、低壓、高壓等天氣系統的特點”、“分析工業區位因素”和“分析農業區位因素”,這些具體目標都要求學生達到“分析”水平。廣東教育仍存在區域發展不平衡的問題,政策允許在一定程度上降低學業水平測試試題考查的認知水平層次,以照顧教育落后地區學生。
通過分析,發現還有兩個因素影響知識深度一致性水平:一是學業水平測試命題依據——考試大綱。廣東省現行學業水平測試的命題依據是《廣東省普通高中學業水平考試地理科考試大綱》(以下簡稱“大綱”),《大綱》對考核目標要求的表述僅呈現知識點,省略了行為動詞,使命題者無法判斷考核目標的認知水平,影響知識深度一致性水平。二是基于標準的課堂教學未普及。受《大綱》影響,部分教師只教授大綱上的知識點,“節約”課時以備考高考必考科目。
3.知識廣度的一致性分析
知識廣度探究學生正確回答問題所需要的知識與課程標準所涉及的具體目標是否一致,擊中目標的題目數占總題目數比重超過50%則達到可接受水平,超過40%為勉強接受水平。如圖2所示,廣東卷和北京卷的知識廣度一致性水平在五省(市)中處于前列,天津卷除地理1領域較好,其它領域同湖南卷、山東卷均不理想。通過分析試題編碼數據,總結出五省(市)試題極少,甚至從未考查過的具體目標有:“說出地球的圈層結構”、“概括各圈層的主要特點”、“了解人地關系思想的歷史演變”和“了解數字地球的含義”。據計算,35套試卷的題量與知識廣度值的相關系數為0.837,表明二者之間存在高度相關性。廣東卷和北京卷平均題量為一套卷70道題,天津卷、湖南卷和山東卷則分別為46道、43道和42道。經典測量理論認為,試卷題目數量越多其信度越高。廣東卷題量最大,且題型僅為單項選擇和雙向選擇的客觀題,有利于保證每年穩定的題量并維持較高的知識廣度一致性水平。題量最少的山東卷和湖南卷七年來累計僅被擊中一次的具體目標僅15個,從未被擊中的具體目標多達18個,是北京和廣東卷的兩倍之多,天津卷則居中。
4.平衡性指數的一致性分析
知識分布平衡性探究的是試題考查的學習目標在課程標準中各個具體目標間分布的均勻程度。該維度的判定標準依據韋伯提供的知識分布平衡性指數(B)計算公式,如B=1-式中O代表某領域中試題擊中的具體目標數,Ik代表擊中某具體目標的試題數,H為擊中某領域的所有題目數。
平衡性指數超過0.7達到可接受水平,0.6~0.7則為勉強接受水平。如圖3所示,五省(市)試題總體的知識平衡性指數都表現理想,均達到可接受水平。但相比之下,廣東卷和北京卷的知識分布平衡性一致性水平在五省(市)中處于中下游位置,天津卷、湖南卷和山東卷則情況較好,說明廣東卷和北京卷雖然考查涉及的具體目標范圍廣,但卻出現部分試題扎堆現象。容易出現扎堆的具體目標有“分析地球運動的地理意義”、“說出氣壓帶、風帶的分布、移動規律及其對氣候的影響”、“分析農業區位因素”和“分析工業區位因素”。出現這些目標扎堆考查的原因,與具體目標的內容較為豐富有關,也與我國基礎教育強調基礎知識和基本技能,命題時將“雙基”列為考查重點有關。
三、結論與建議
如表3所示,廣東省2009—2015年高中學業水平測試地理試題與課程標準的一致性總體水平在五省(市)中居前列。廣東省一致性水平在五省(市)中表現良好,首先得益于廣東作為首批實行新課程改革和高考自主命題的省份,有利于保證廣東省基礎教育行業對課標的理解和命題技術的掌握。其次,雖然五省(市)在相關的學業水平測試說明中均強調對基礎知識的考查,但廣東卷題量為五省(市)中最多(70道選擇題),有利于更全面地考查學生對各部分知識的學習水平,提高了擊中課程標準中具體目標的概率。另外,通過對數據庫檢索發現,有關廣東省學業水平測試的理論研究是五省(市)中最多的,而天津市的研究情況仍屬空白。針對各省(市)出現的一致性問題,并基于廣東省的先進經驗提出以下幾點建議。
1.借鑒課程改革經驗,深化課程標準意識
建議就學業水平測試實施情況進行現狀調查,就其存在問題向新課程改革實驗區或自主命題先行省份借鑒經驗,改進不足。同時,深化命題者和教師基于課程標準的意識,引導考試和教學回歸標準的要求。
2.明確學業水平測試性質,制定試題命制程序
明確學業水平測試的標準參照考試性質,以全面考查學生基本地理知識為目的。可以參照一致性的分析維度,從知識種類、深度、廣度和平衡性方面制定相應的試題命制程度,保證試題的科學性和全面性。
3.關注學業水平測試理論研究,注重評價結果反饋
專家、教研員和教師應加強對學業水平測試的理論研究與分析,了解考試的實施情況,從考試制度、組織程序和具體實施手段加以完善。同時,注重評價結果反饋于實際教學中,調整、改進教學和復習策略,從而促進學生獲得高質量的學業成就。
4.加強學業水平測試的省際對比,建立一致性數據庫
普通高中學業水平考試制度目前還處于試行階段,各省(市)對于水平考試的性質、科目和功能定位等不盡統一,各科目試題在考試要求和題型設置上也存在差異。在這種情況下應加強省際間對比,及時總結較好經驗,取長補短,逐步完善學業水平考試制度。