耿建



摘要:傳統測試命題是基于經典測驗理論的,因而是基于知識與能力立意的。新課改背景下,借鑒TIMSS及PISA 測試項目的特點,構建以核心素養立意的“雙向細目表”,嘗試基于素養立意命制高中物理學業水平測試題,來體現、評價學生的素養水平。
關鍵詞:命題;核心素養;雙向細目表;高中物理;學業水平測試
課程改革不可回避的一個環節就是評價,評價離不開測試(考試),測試離不開命題。只有命題與測試真正體現課改意圖,才能使課改進入“深水區”。筆者嘗試在分析傳統測試命題假設及流程的基礎上,借鑒TIMSS及PISA 測試項目的特點,構建以核心素養立意的“雙向細目表”,研制能夠體現學生素養水平的測試題目。
一、傳統測試命題的假設及流程
傳統測試命題是基于經典測驗理論的。經典測驗理論提供了評價每個題目的難度、區分度的指標,也提供了評價測驗質量高低的信度和效度指標。但是,這些指標均建立在樣本理論的基礎上,對樣本的依賴性大,難以評價項目層面上的猜測程度,更無法估計被試的能力水平及其精度。尤其是,該理論關于被試的能力不論高低,測量誤差都相同的假定是不盡合理的。這樣的命題的假設是學生應該掌握相應的知識和能力,并且所測試的各種知識和能力應該達到相應的水平要求。這樣,命題的流程首先是根據測試的性質,擬定考查的范圍、試卷的結構、試卷的整體難度、各考查內容的能力要求、各試題的難度等,這些集中體現在“雙向細目表”中。傳統基于知識和能力立意命題的“雙向細目表”的大致結構如表1所示。
傳統測試命題在構建“雙向細目表”的基礎上,分別命制各道試題。以高中物理測試為例,題型一般分為客觀題和主觀題,客觀題包括單項選擇題和多項選擇題,主觀題包括填空題和計算論述題等。每道試題的命制以相應預設的考查內容為線索,構建與之匹配的物理模型或物理情境,進而圍繞考查的知識點和能力要求完善試題。在逐題命制完成后,再整體把握試卷的難度,判斷是否符合該種性質類型的測試。
根據傳統測試命題思路和方式命制的試題和試卷,普遍存在兩個方面的問題。首先,試題以知識點為命題的切入點,以能力立意為命題的價值取向。試卷是以一組相對獨立的、無關聯的試題來呈現的,各試題也僅僅檢測學生對某一知識點單一維度的理解、單一層次的能力水平,不能體現知識形成的脈絡和能力發展的進階情況,測試過程帶有偶然性。這種碎片化的考核方式不能真實反映考生在某一知識點或能力方面的發展水平層次。其次,測試成績能反映學生對學科掌握的整體情況,但不能反映學生對學科知識與能力掌握的精細化程度,不能體現測試成績由哪些方面的素養組成,也就不能表明學生知識、能力或素養的發展現狀。
二、高中物理學業水平測試命題的設想
國際教育評價研究和測評項目中影響范圍較廣的是TIMSS和PISA。TIMSS科學評價特別注重測評學生在一定的情境(無論熟悉的、陌生的、復雜的)中應用知識和解決實際問題的能力。PISA測評框架由情境、能力、知識、態度四個指標構成,且測評的主要內容是在一定的情境中學生展現受到知識和態度影響的科學素養的具體能力。這兩個測評項目具有3個共同點:一是更注重融入真實的情境;二是更關注科學實踐的測評;三是更系統的知識分類和分級。與這兩種測評項目相比,我國傳統的測評則呈現出試題的孤立性、測試內容的片面性和測試結果的偶然性等不足。這就需要依據一定的理論或標準作出改變和調整。參照TIMSS及PISA項目的試題特點,結合當下普通高中課程標準提出的學科核心素養發展目標,嘗試基于素養立意命題。
(一)基于素養立意命題的假設及流程
基于素養立意命題的假設是學生應該具備相應的素養,對應的素養是可以通過測試來評價的,不同性質的測試能反映素養的不同內容和不同水平。在這樣的命題假設基礎上,基于素養立意命題的流程預設如下:首先,根據測試的性質確定考查的素養內容及水平;其次,命制能反映素養內容的試題;再次,檢查各試題所檢測素養的覆蓋面、水平情況及交叉情況等;最終,組卷成稿。如此命題流程,集中體現在如表2所示的基于素養立意命題的“雙向細目表”中。
基于素養立意命題,應該具備以下幾個特點。其一,要考慮試卷各試題的素養指向覆蓋面。傳統測試命題主要考慮學科知識點的覆蓋面,現在應該同時考慮對各核心素養考查的覆蓋面。當然,核心素養的考查離不開具體的知識點,即在命題過程中要考慮相應知識點與核心素養的對應情況。目前,精準、全面地在紙筆測試中體現核心素養,還處于探索與實踐階段。但命題從能力立意轉向素養立意,才能完整地體現本次課程改革的初衷。其二,要考慮試題考查的素養水平與考試性質的匹配。合格性考試和等級考試對素養水平的要求不同。試題如何科學、準確地對應核心素養水平,還有待于進一步探索與研究,需要有一個從主觀感性判斷到客觀理性標準確立的過程。其三,核心素養需要不同試題的多維度呈現,同一試題也可以體現不同的核心素養。這需要考慮試題的呈現方式、問題的設置方式及問題的解答方式。傳統的相對獨立的試題檢測功能比較單一,可以嘗試基于背景材料的“問題群”或“答案群”,來多維度地考查不同的核心素養或同一核心素養的不同水平。
(二)基于素養立意命題舉隅
基于素養立意命制的試題,從來源看有兩種類型:一種是任務主題型的試題,即圍繞某一任務設置問題;另一種是情境主題型的試題,即圍繞某一情境設置問題。不論哪種類型的試題都具有情境性、學科性、結構性等特點。情境性是指試題的材料來源于現實,或是經過合理抽象、加工、提煉的現實材料。學科性是指試題的背景材料具有學科特性,與學科知識、方法等有關聯。結構性是指試題提供的材料或設問具有多維度、多層次的特點,各維度或層次具有關聯、遞進等關系。因此,基于素養立意命制的試題,其呈現方式不再是孤立的單個問題,而是“問題群”或“答案群”。“問題群”或“答案群”的功能有兩種:一是能測評某一核心素養的多個水平,即基于試題背景材料,利用一組問題來檢測某一核心素養的多個水平;二是能對兩個或兩個以上的核心素養進行測評。
題1現有相同的紙片若干、面值不同的硬幣若干、大小不同的小球若干。利用所提供的器材探究“物體下落快慢的規律”。
這是圍繞“物體下落快慢的規律”這一主題而命制的試題。對于該試題的評價可以進行如下預設,即對于該問題存在不同水平的“答案群”。
水平一:沒有利用所提供的實驗器材就直接給出物體下落規律的結論。
水平二:只選擇紙片、硬幣、小球中的某一種器材進行實驗,就給出物體下落規律的結論。
水平三:選擇所提供的器材中的某兩種進行一次對比實驗,給出物體下落規律的結論。
水平四:選擇所提供的器材進行兩次對比實驗,給出物體下落規律的結論。
水平五:選擇所提供的器材進行兩次以上的對比實驗,建立理想模型,給出物體下落規律的結論。
這五個水平的評價與四個維度的物理學科核心素養的對應關系如表3所示。
題2如圖1所示,質量均為m的物塊A和B疊放在水平地面上,左邊緣對齊。A與B、B與地面間的動摩擦因數均為μ。先敲擊A,A立即獲得水平向右的初速度,在B上滑動距離L后停下。接著敲擊B,B立即獲得水平向右的初速度,A、B都向右運動,左邊緣再次對齊時恰好相對靜止,此后兩者一起運動至停下。最大靜摩擦力等于滑動摩擦力,重力加速度為g。
(1)描述以上過程中A、B兩個物體運動的情況;
(2)根據以上過程能夠求出哪些物理量?嘗試求出相應的物理量。
這是圍繞給定的物理情境而設置的試題。兩個問題的參考答案可進行分層評價。第(1)小題不同水平的參考答案如下:
水平一:第一階段,A向右勻減速運動。
水平二:第一階段,A向右勻減速運動,B靜止不動。
水平三:第一階段,A向右勻減速運動,B靜止不動;第二階段,A向右勻加速運動,B向右勻減速運動。
水平四:能用vt圖像準確地描述兩個物體的運動過程。
第(1)小題四個水平的參考答案與核心素養的對應關系如表4所示。
第(2)小題不同水平的參考答案如下:
水平一:利用單一的公式求出單一的物理量,如A被敲擊后獲得的加速度、A被敲擊后在B上向右運動過程中摩擦產生的熱量等。
水平二:利用兩個關聯的公式求出某一物理量,如A被敲擊后獲得的初速度、B被敲擊后獲得的加速度等。
水平三:利用兩個以上的關聯公式求出某一物理量,如B被敲擊后獲得的初速度、B被敲擊后至系統停下摩擦產生的熱量等。
水平四:利用轉變參照物、整體分析或圖像分析的方法求解相關物理量。
第(2)小題四個水平的參考答案與核心素養的對應關系如下頁表5所示。
傳統測試命題的情境是確定的,問題是明確的,答案是唯一的;問題解答過程的思路基本是一定的,所選用的解決方法也基本固定;從問題到答案是一個封閉的、相對確定的過程。這樣孤立、確定的試題,只能檢測某一水平的核心素養。如果某一試題定位于考查水平三層次的核心素養,而在該問題背景下,學生只具備水平二層次的核心素養,則該試題就不能準確反映學生的實際情況。而諸如例1、例2這樣的試題,可以通過學生對主題性、情境性或開放性問題的解答情況,客觀評價他們已經具備的核心素養水平,從而實現科學、連續地對學生核心素養水平達成情況的評價。
參考文獻:
[1] 張麗娜,張一平.多項選擇題與填空題對測量效果的影響——在項目反應理論框架內答題方式的比較研究[J].考試研究,2017(3).
[2] 教育部考試中心.注重理論聯系實際加強物理學科素養考查——2019年高考物理試題評析[J].中國考試,2019(7).
[3] 曾兵芳.TIMSS2015科學測評框架的特點與反思[J].教育測量與評價(理論版),2015(8).
[4] 黃健毅.國際基礎教育科學學業測評的新趨向——基于PISA與TIMSS的比較研究[J].中小學教師培訓,2017(9).
本文系江蘇省中小學教學研究第十三期課題“普通高中物理關鍵能力水平特征、培養途徑及測評研究”(編號:2019JK13L192)的階段性研究成果。