●周文闊
分省命題橫向比較價值降低的原因分析和對策研究
●周文闊
至2013年,共有16個省市試行“分省命題”,“統一考試、分省命題”的格局已經基本形成。“分省命題”符合我國實際和測量學的要求,有利于新課程改革的順利實施,但同時也存在各地命題水平發展不均衡,命題模式、考查內容不一致,橫向比較價值降低,高等學校的統一化教學模式與“分省命題”選拔考生不協調等問題。本文具體闡述了橫向比較價值降低的原因,并提出通過加強命題標準化建設解決“分省命題”所面臨的問題。
分省命題;比較價值;命題標準化
高考實行“分省命題”是教育部多年倡導的一項高考改革措施,繼上海(1987年)、北京(2002年)率先實行高考自主命題之后,至2013年高考,除港澳臺外,全國共有16個省市試行分省命題。至此,“統一考試、分省命題”的格局已經基本形成。
(一)“分省命題”的主要優勢
1.適合國情實際
我國幅員遼闊、人口眾多、不同區域發展不平衡,全國使用同一套試題難以滿足不同地區學生群體的需求。“分省命題”可以照顧到本省教育發展的實際水平,對考生來說更公平,更“有利于科學選拔人才、促進學生健康發展、維護社會公平。”
2.提高測量的科學性
考試能否有效地測量考生能力水平,一個重要的測量學條件就是考生群體的同質性。考生群體越大,差異也就越大,同質性也就越小,試題越難以與整個考生群體相適應。因此,從改善高考的測量效果,提高考試分數的可靠性、測量的有效性來看,實行分省命題可以在一定程度上縮小考生群體間差異,提高試卷的難度水平與考生的能力水平的契合度,保證高考測量的科學性。
3.促進新課改的順利實施
我國的新一輪課程改革從2004年開始,不同省市都根據本省實際情況制定了各具特色的課程執行要求和與之相適應的高考方案。因此,從本省市的實際出發實行“分省命題”更有利于課程的管理和評價,有利于新課程改革的順利實施。
(二)“分省命題”的特點
1.統一《考試大綱》
《考試大綱》由教育部考試中心負責編制,作為各“分省命題”省份自主命題的指導性文件。《考試大綱》中明確了各學科考查的能力要求和知識內容的層次要求,這些是根據考生進入高等學校學習所必須具備的基本要求界定的,同時還考慮到能夠在高考紙筆形式中實現。
2.分省高考方案,分省《考試說明》
分省制定高考方案是為了進一步適應以普通高中新課程逐步推廣為標志的素質教育的深入開展,進一步深化統一考試內容改革,各省市根據本地實施新課程改革的實際及各考試科目的特點確定本省市的高考方案,并報教育部核準后方可實施。
高考方案只是確定了本地高考的基本框架,具體的命題指導思想、考試內容要求、考試形式和試卷結構、題型示例等問題,還需要《考試說明》進行詳盡闡述。因此各實驗省市還要結合本地高考方案和教學實際制定自己的《考試說明》,《考試說明》是對《考試大綱》的進一步細化,是對高考方案的具體說明。
高考的選拔功能主要體現在依據分數對考生個體進行評價,除此之外,利用考試所得到的信息為考生、學校、教育行政部門提供多樣化的評價報告,由于“分省命題”下不同省份的考試數據直接可比性下降,使得依據考試數據對不同區域教育發展水平進行橫向比較的價值降低,決策依靠度減弱。
(一)命題力量發展不均衡
高考命題是一項專業性要求很強的工作,需要專業化的命題隊伍,專業化的設備、場所等。目前,就全國來看各地的發展很不均衡,部分“分省命題”省份的機構設置、人員配備尚沒有達到專業化的要求,資源、技術力量稍顯緊張,導致各地的命題水平發展不均衡。
(二)教育測量與評價專業理論的引領力不足
教育測量與評價理論對命題實踐具有重要的指導作用,是提升命題質量的重要依靠。從各“分省命題”省份在該領域的研究來看,公布、發表的研究成果較少,高級別的專業課題立項也不多見,少數在該領域科研投入較大的命題單位,亦缺乏有權威性的文獻著作可以學習借鑒,“分省命題”在測量與評價研究上峰少山也不多的現狀,是橫向比較價值降低的表現。
(三)不同模式下的同類考生能力水平可比性減弱
不同的考試方案其考試的總分可能不同,即便是總分相同,所選的考試科目或考試模塊可能也不盡相同。同時,也無法依據各“分省命題”省份的相同批次或同一院校的錄取分數線高低,來斷定試題的難易或考生群體的能力水平高低。
因此,利用來源于不同測量媒介的測量結果難以對能力水平進行鑒別,是“分省命題”橫向比較價值降低的直接表現。
(一)高考方案導致不同省份學科設置、考試內容出現較大差異
各“分省命題”省份自行制定高考方案,導致不同省份高考科目設置、分值設置等出現較大差異。
如:北京卷,實行“3+x”方案,考查語文、數學、英語、文綜/理綜等科目,共750分;上海卷,實行“3+1”方案,考查語文、數學、英語,然后從物理、化學、生物、政治、歷史、地理中再選擇1門,共600分;江蘇卷,實行“3+1+1”方案,考查語文、數學、英語,然后從物理、歷史中選擇1門,從化學、生物、政治、地理中再選擇1門,總分(只記語文、數學、英語,其余科目記等級)480分。
另一方面,即使是同一學科,不同高考方案下的考試內容也不盡相同。
以物理學科為例:廣東卷的考試范圍包括,物理1、物理2、物理3-1、物理3-2、物理3-3、物理3-5等6個模塊;天津卷考試范圍包括,物理1、物理2、物理3-1、物理3-2、物理3-4、物理3-5等6個模塊;四川卷考試范圍包括,物理1、物理2、物理3-1、物理3-2、物理3-4等5個模塊。
由此可見,在不同省份參加高考的考生,他們考試的科目、內容、分值出現如此大的差異,利用這種考試結果繪制出來的考生能力圖譜,進行橫向比較的價值自然不大。
(二)選考模塊的設置導致同一省份同一學科考查內容的差異
選考模塊的存在導致即便是同一省份的考生,在同一學科上的考查內容也會出現較大差異。
如:山東卷的物理存在選做題,要求考生在物理的3個選考模塊(物理3-3、物理3-4、物理3-5)中選擇1個作答,這就導致不同的考生可能選擇不同的模塊,其考查內容自然不會相同。利用這種帶有差異的考試內容評價結果進行橫向比較,其意義也會打折扣。
(三)選考模塊的自身屬性差異沖擊考試的公平性
設置選考模塊的初衷是為了促進學生全面健康發展,為每位學生的個性化發展提供自由選擇的空間。選考模塊從培養學生發展的角度來說,是恰當而正確的。但是從考試的角度來分析,不同選考模塊其內容多少、學習難易、時間分配等自身屬性方面是不同的,這就導致選考模塊間難度平衡性、等值性難以掌控,即便是宏觀統計出來的難度相同了,也沒有足夠的依據證明其等值。因此,選考模塊自身的差異,命題實踐操作層面的難以掌控等對考試公平性的沖擊,也降低了利用考試結果進行橫向比較的功能。
(四)命題質量標準尚需統一完善
自實施“分省命題”以來,國家一直十分重視,提出了十分嚴格的要求,每年堅持進行評價。但在技術指導、培訓和力量支持方面還有待加強。“分省命題”的各省份均普遍反映沒有統一完善的試題質量標準可依可循。目前對“分省命題”質量的評價,依然是以個人主觀喜好為主,缺乏有效的測量學評價規范指導。人為評價不僅對公平性帶來沖擊,也因無標尺參照使其評測結果的準確性更令人質疑。在測量學方面的價值取向不一致,是橫向比較價值降低的重要原因。
(一)規定命題內容標準
“分省命題”橫向比較價值降低的一個重要原因就是各自主命題省份的考試內容差異過大,使橫向比較失去了意義。因此,通過規定命題內容標準,首先保證了比較主體的統一性,使橫向比較成為可能。
在十八屆三中全會作出的《中共中央關于全面深化改革若干重大問題的決定》(以下簡稱《決定》)中,提出“探索全國統考減少科目、不分文理科、外語等科目社會化考試一年多考。”這既明確了今后一段時期考試內容和形式改革的大方向,也為命題標準化建設提出了新的要求。
各省份在“分省命題”的實踐過程中對考試內容和形式的改革進行積極的探索和深入的研究,在完善學科能力結構和考查目標,探索加強綜合素質和學科能力考查的方式方法等方面,為考試改革提供了必要的實踐支撐;但同時也存在一些誤區,如:片面理解能力中心,降低雙基訓練和要求;片面理解模塊化教學,損害學科知識、能力的系統性等。因此規定命題內容標準還有其客觀必要性。
命題內容標準包括學科知識結構與能力目標。學科知識結構標準包括知識范圍、內容、考查層級等要求。能力考核目標包括能力目標和能力的學科化要求等。
(二)制定命題質量標準
在恢復高考30多年的命題實踐中,國家命題積累了大量的經驗和成功的做法,已經形成了較為完備的命題理論。將這些經驗、做法和理論通過命題標準的方式傳達到每個“分省命題”省份,確保命題的科學性、規范性,以標準的形式實現對“分省命題”的指導和培訓,進一步提升命題質量。試題質量提高了,才能提高高考數據的橫向參考價值,提高“分省命題”的橫向比較價值。進而發揮考試對教育教學的反撥作用,提高決策價值,提高高考數據的利用價值。
高考試題質量標準及高考各學科的試題標準包括試卷試題設計及命制技術規范。其中試卷設計包括了時間、分值、題型種類和比例等;試題設計包括試題背景材料的選擇,設問、評分標準的制定等;試題命制標準包括題型種類,題型比例,題型功能及其學科化等。
(三)細化命題管理標準
有了命題內容標準和質量標準,如何組織實施命題實踐,落實好內容標準和質量標準的相關要求,就需要命題管理標準對命題流程作出詳細、具體、明確的要求。命題管理標準是組織各方面力量,協調相關部門關系,調動各類人員能力和智慧的一項最為復雜的標準體系,其中最重要的一點是明確各自的職責。
命題管理標準包括命題組織流程及實施要求。包括了命題工作細則,命題審題的組織與實施,試題質量的保證機制,試題交印安全管理,突發事件的應急預案等。分開來說,包括以下三個方面。
1.制定安全保密管理標準,包括命題流程全過程無縫連接,執行與監督相互制約。
2.建立專門的命題管理機構,配備專職的學科秘書。
3.制定命題人員職責標準,包括命題、審題、校對、錄入、保密、技術支持人員等。
(四)優化命題評價標準
進行橫向比較必須有一套科學完整的評價體系,它需要對命題內容標準的遵照情況、質量標準的執行情況、管理標準的落實情況,作出一個最終的評價。命題評價標準不僅僅是對試題作出一個誰優誰劣的評價,更重要的是找出其中好的做法和差的原因,并歸因到命題內容標準、質量標準和管理標準上。幫助各自主命題單位發現問題找出辦法,不斷提高各自的命題水平。
命題評價標準包括評價目標,評價內容,內容標準,評價專家的組成與考試數據檢驗等,同時具有科學化、學科化、規范化、可操作性等特點。在評價標準中應明確指出試題在哪個標準的執行和落實方面出現問題和存在差距,并提出參考性的建議,為自主命題單位指明方向,實現評價的發展性功能。
綜上所述,在“分省命題”由實施到生長壯大的過程中,發現了一些問題,更積累了很多經驗,現在正處于非常重要的發展階段。通過加強命題標準化建設來促進“分省命題”的科學發展,提高考試數據的橫向比較價值是合理的,更是緊迫的。相信在標準化的規范和指引下,“分省命題”橫向比較價值會得到逐步提高。
[1]中共中央關于全面深化改革若干重大問題的決定[M],北京:人民出版社,2013.
[2]中共中央國務院.國家中長期教育改革和發展規劃綱要(2010-2020)[M].北京:人民出版社,2010.
[3]中華人民共和國教育部.教育部關于普通高中新課程省份深化高校招生考試改革的指導意見[S].教學[2008]4號.
[4]教育部考試中心.2013年普通高等學校招生全國統一考試大綱(理科·課程標準實驗版)[M].北京:高等教育出版社,2013.
[5]教育部考試中心.2013年普通高等學校招生全國統一考試大綱(文科·課程標準實驗版)[M].北京:高等教育出版社,2013.
[6]黃光揚.教育測量與評價[M].上海:華東師范大學出版社,2008.
[7]雷新勇.大規模教育考試:命題與評價[M].上海:華東師范大學出版社,2006.
[8]李光明.落實《綱要》精神促進高考與基礎教育協調發展.中國考試,2012(2).
(責任編輯:金傳寶)
周文闊/山東省教育招生考試院