姚春艷+張勇
2014年9月4日,《國務院關于深化考試招生制度改革的實施意見》(以下簡稱《意見》)正式發布后,引來各方熱議。對這次具有里程碑意義的考試招生制度改革,支持者眾多,也不乏質疑者。
評價與考試領域內的研究者們,更關注的是《意見》中關于考試招生制度改革方案所必須要解決的技術難題,以及怎么解決這些技術難題。前者關系到高考改革能否取得預期的效果,后者則關系到這些技術難題能否得到真正解決。
就評價與考試實施及其能否達到預期目標而言,需要解決的技術難題則主要包括以下三個方面:
高中學業水平考試作為高考成績的依據之一,定位于標準參照性考試還是常模參照性考試,做學科成就評價還是學科能力評價?
《意見》指出,“學業水平考試主要檢驗學生學習程度,是學生畢業和升學的重要依據”。這意味著高考成績中,高中期間的學業水平考試成績將成為重要的組成部分,將學業水平考試成績納入高考成績范疇,主要目的是為了“引導學生認真學習每門課程,避免嚴重偏科”,這種促進學生全面發展的政策導向,顯然毋庸置疑。
畢業與升學的目的、性質不同,技術實現的要求也不相同。在理論上,畢業考試屬于成就性檢測,采取標準參考性考試;升學考試則更側重能力性或傾向性檢測,采取常模參照性考試。我國現在的中考,承擔著學生畢業和升學兩種考試要求,兩種目的和性質不同的任務,給中考的技術實現造成難以解決的困擾。如此,就給考試招生制度改革提出了第一個技術難題:高中期間的學業水平考試的定位,是標準參照性考試還是常模參照性考試、是學科成就評價還是學科能力評價?
這兩類考試的目的、性質和適用的情形是不同的。標準參照性考試的結果解釋,在以下兩種情形中更有意義:其一,一門學科的難度水平呈遞增趨勢,學生需要達到一定熟練水平才能進行下一階段的學習,如數學科目中,學生如果不掌握長方形面積的計算方法,就無法計算長方體的體積;標準參照考試結果可以用來反饋學生已經達到的水平。其二,用于診斷學生在某門學科中知識、技能掌握的情況,為教師制定教學、輔導改進方案提供參考信息。而常模參照的結果解釋在下列情形中更有意義:學科內容不是按照從易到難排列的,達到特定知識、技能水平并不是影響學生下一階段學習的關鍵因素;選拔和預測成功可能性時,常模參照的結果更為適用。
標準參照考試結果用于了解學生在一門學科中究竟掌握了什么,達到了什么程度,而常模參照考試結果則用于區分學生之間的能力差異。除了結果應用上的差異,兩種考試在試題編制上也存在較大差異。標準參照考試,測量的是學生對于一門學科所學內容掌握的情況,是對過去所取得的學業成就的測量,因此試題的編制要指向學過的內容,不強調試卷的區分度;而常模參照考試關注的是學生之間能力的差異,試題的編制要指向學生形成的學科能力和未來發展的潛力,對試卷的區分要求以及對未來預測的要求是必不可少的。
高中學業水平考試結果將成為高考招生的重要依據,教育部解讀《意見》時也說明,學生可以依據自己特長以及高校要求,選取任意三科計入錄取成績。根據《意見》及解讀,學業水平考試的成績已經被賦予了人才選拔和預測成功可能性的功能,而且需要反映高校對特定人才的要求。這就意味著,學業水平考試應該是一種常模參照考試,而不應該是標準參照考試。而常模參照考試的試題編制以及成績呈現方式都有特定的要求,與群體比的結果是常模參照考試中必不可少的報告方式。如果將高中學業水平考試定位于標準參照考試,不僅測量的內容不足以反映學生的能力和未來發展潛力,等級評定的結果呈現方式也會淹沒大量的有效信息,使招生單位無法做出有效判斷,導致的結果只能有兩個:一種情況是,錄取最終還是會以統一考試的成績為主要參考依據,學業水平考試的結果最終會淪落為一
個“中看不中用”的花瓶;另一種情況是錄取參考了學業水平考試成績,但錄取的學生在進一步學習中的勝任度較差,高考作為人才選拔的一種重要方式,其功能不能得到有效的保證。
因此,高中學業水平考試,究竟定位在標準參照性考試還是常模參照性考試、是學科成就評價還是學科能力評價,是考試改革必須要解決的首要難題。
允許兩次考試的科目,如何解決不同次考試之間的等值問題,從而確保學生所選擇的高分是能力的體現而非考試差異所導致
根據教育部對《意見》的解讀,學業考試每門課程學完即考,同時鼓勵為學生提供每一個科目兩次參加考試的機會。對于統一考試中的英語,也將采取兩次考試,擇優計入成績的方式。允許學生多次考試,成績擇優計入是為了解決“一考定終身”的弊端,這是高考改革的一大進步。然而,由此而帶來的技術難題是不同次考試試卷之間的等值問題。
等值問題如果不能妥善解決,學生的分數高低就不是學生學習成績或能力的真實體現,而是試卷編制差異的一種結果。如果兩次考試之間存在差異,意味著相同的分數或等級并不代表相同的成就或能力水平,兩次考試成績之間是無法直接比較的。舉例來說,同樣是80分,在全體考生的平均水平是75分和81分兩種時,意義完全不同。不僅如此,80分的構成不同,代表學生掌握的知識、技能和能力結構也會存在較大差異,在以記憶為主的考試中獲得的80分和在以問題解決為主的考試中獲得的80分,所代表的學生能力完全不同。
相同科目的不同次考試之間的成績,如果不能實現科學可靠的等值轉換,所導致的結果也有兩個:原本是為了減輕學生負擔的制度設計,會變成逼迫考生必須考兩次的政策;招生單位按照來自不同考試中的相同分數錄取學生,學生會表現出較大的能力差異,高考對人才甄別和選拔的功能受到嚴重影響。無論哪一種結果,都將導致高考改革的良好意愿落空。因此,不同次考試之間的等值問題是考試改革要解決的第二個難題。
“兩個依據,一個參考”的高考成績報告,如何呈現才能為招生學校提供更豐富,更有效的信息,從而實現高校特色、專業特點與考生特質之間最大程度的匹配?
迄今為止,我國高考成績的報告方式,依舊采取的是各科原始分及其簡單加總的報告方式。這種成績報告方式的弊端早已有學者論述過。這次《意見》中也明確提出要完善成績報告方式。這就提出了本次考試改革的第三大技術難題,即以“統一考試和學業水平考試為兩個依據,綜合素質為一個參考”的高考成績報告,應該包含哪些指標和數據才能為招生單位提供更豐富、更有效的信息,從而實現高校特色、專業特點與考生特質之間最大程度的匹配,使高考選拔人才的功能得以充分實現,也為學生選擇最適合的成才之路提供重要參考。
教育評價與考試共存在四種比較方式:與標準比,與群體比,與他人比,與自己比。每一種比較方式都有其特定的意義。與標準比能判斷學生達到標準的程度,與群體比能判斷學生所處的層次與水平,與他人比可以判斷學生的競爭力,與自己比則可以發現學生的發展態勢。對于招生學校而言,成績報告中提供的比較方式越多,對學生整體的判斷也就越清晰越準確。多元智能理論對于人才的新定義則是八類不同的智能代表了八類N種不同的人才,每一門學科都至少包括3種以上的智能組合。單一的學科成績并不能可靠有效的確定學生的智能發展類型,多科綜合才能確保學生的智能結構更接近學生的真實情況。這意味著,新的高考成績報告單要把統一考試、學業水平考試所考察的能力要素整合起來,形成學生特有的能力結構報告,才能為招生學校提供更有效的參考信息。這樣的能力報告與高校特色以及專業特點匹配度越高,學生的成才機率也就會越高。然而,這樣的報告要怎樣采集數據,怎樣合成,通過什么技術手段處理才能保證每年如此多的考生及時拿到自己的成績報告,卻并非是一個容易解決的問題,所面臨的挑戰之大也是前所未有的。
歷史上所有重大變革,都離不開技術突破。這次高考改革方案想要落地并取得成功,評價與考試技術也必須要有重大突破。
作者
姚春艷
公眾教育研究院、公眾考試研究院副院長;
張 ?勇
中國教育學會中小學教育質量綜合評價改革實驗辦公室副主任、公眾教育研究院、公眾考試研究院院長。