

【摘? ?要】缺乏命題技術是一線教師探索小學學科表現性評價遇到的最大困難。對現場表現性評價的項目策劃、命題流程、原創技術和改編技術進行解析,可以幫助教師掌握表現性評價命題技術,提升科學評價學生的高層次能力,破解長期以來基礎教育評價領域的瓶頸。
【關鍵詞】小學學科評價;表現性評價;命題技術
表現性評價通常要求學生在某種特定的真實或模擬的情景中,運用先前所獲得的知識完成某項任務或解決某個問題,以考查學生知識與技能的掌握程度,以及問題解決、交流合作和批判性思考等多種復雜能力的發展狀況。測試的場景大多為真實或仿真的個人生活情境、學校生活情境或科學情境;測試內容則體現多維度學習目標,具有一定的復雜性和開放性,側重聽、看(讀)、說、寫、畫、做等操作實踐性技能和應用知識解決真實問題的能力。
當前,小學學科評價采取紙筆測試和表現性評價并舉的方式,形成了兩種測評的優勢互補。這種評價機制是落實核心素養教育的必然途徑,是教育測評發展的必然結果。浙江省、河南省等地很多小學已經在探索和實踐學科表現性評價,一線教師遇到最大的困難是缺乏表現性評價命題技術,因為表現性評價試題研制技術與紙筆測試技術截然不同。本文主要介紹現場表現性評價項目策劃、命題流程、原創技術和改編技術,以期為一線教師的表現性評價實踐提供幫助。
一、測評項目策劃
學科紙筆測試命題一般需要做一個命題方案,保證命題結構效度。表現性評價則需要做一個項目策劃表(見表1),方便學校層面的頂層設計和組織協調,同時保障表現性評價試題的研制工作順利進行。
項目策劃表通常有10項內容,尤其要關注第5項。人均測評時間是指一個學生完成測試所需要的時間,以此計算全體考試對象完成項目的總時間,確定學生測評分組情況、評委數量需求以及同質異形試題數量。如果人均測評時間比較長,就需要把學生分為三組,或準備三套同質異形試題,并按照一組2個評委的標準安排6個評委。
二、試題研制流程
表現性評價試題研制流程有四個階段。第一階段為個人或小組研制,命題人員按項目策劃表的測評內容和人均時間獨立命題。第二階段為集體研磨,與紙筆測試相比,表現性評價涉及的相關因素非常多,個別教師的獨立思考容易出現局限性,必須通過學科組集體討論,共同研究、改進命題。其實,前兩個階段可以合并為集體研制+集體研磨,類似紙筆測試的“磨卷”。第三階段為抽樣試測,面對表現性評價,學生的思考和作答行為常常出乎教師預設,必須要請幾個不同層次的學生進行試測,觀察他們的操作,詢問他們的想法,以便及時發現問題。第四階段為修正定型,即根據試測發現問題,進行修正完善,定型備用。
試測環節是表現性評價命題的特有環節。由于表現性評價的試題具有很強的真實性、綜合性、開放性,以及解決問題方法的多樣性,有些學生常出現創新作答的思維和方法,出乎命題教師的意料。如小學數學表現性評價試題“測量粽葉面積”,器材有粽葉、大白紙、刻度尺,鉛筆、橡皮擦和小剪刀。命題者有兩個作答預設:一是學生在白紙上描畫粽葉后,表格化測量面積;二是學生先把粽葉描在白紙上,再把粽葉的圖形剪出來,然后把圖形剪成若干長方形或正方形,求面積之和。試測時,命題者發現有一個學生直接用剪刀把粽葉剪成若干長方形和正方形,再用刻度尺測量出各長方形和正方形的面積,把剩下小碎片拼成長方形再測面積。該學生的行為表現有兩個意外:一是把測量對象“粽葉”損壞了,違背了科學測量的基本原則,原因是試題表述不嚴謹;二是把粽葉碎末拼成長方形測量的方法很創新,明顯減少了測量工作量和測量誤差。于是,試題文本中增加了“不能損壞粽葉”的要求和指導語“有沒有什么簡單的方法快速計算這么多小碎片的面積”,把碎片拼接計算方法納入評價標準。
三、試題研制技術
紙筆測試的試題通常由情景、設問、答案、評分標準四部分構成。現場表現性評價試題通常由試題文本、評價規則、現場情景、人員配備、其他事項五部分構成,復雜程度顯著超過紙筆測試題。
(一)試題文本
試題文本通常由題干文本、試題設問和命題說明組成。
題干文本通常用文字、數據、圖表等方式描述,且常包含提示語。如“接下來,我要為你播放一段3分鐘左右的視頻,題目叫《美好的某某小學》,請你認真觀看,回答三個問題。在觀看過程中,你可以用筆記錄”。
表現性評價試題的設問不同于紙筆測試,不是一次性呈現,而是以問答方式有序呈現,因而要考慮層次性,體現由易到難、由簡單到綜合、由定向到開放的特點。問題表達要簡短明朗,通俗易懂,層層推進,不提倡用長句或復雜的書面語(見表2)。
命題說明是命題者對試題的來源、考查要素、操作建議或注意事項的描述。交代試題來源出處,能方便使用者和改編者溯源。如果試題素材是音頻或視頻,還要交代下載拷貝的路徑。明確考查要素,是指講清考查什么知識、什么能力、什么素養,以便使用者或評委深度理解本題的特點與價值,更好地把握現場測評工作,提高測評的信度和效度。寫清操作建議或注意事項,能方便使用者現場操作或修改、生成多個同質試題,滿足不同小組的測評需求。如識字測評的命題建議是“從1號生字表中抽取10個字,先單獨認讀,再組成詞語和句子認讀,注意生字難度結構”。
(二)評價規則
評價規則通常由測評方式、作答時間、參考答案、評價標準和觀察要點組成。其中評價標準和觀察要點比較特殊。
測評方式是對評委(包括教師、家長和學生)和受測學生的行為提出要求,如:教師準備8份識字材料,學生抽取其中1份,準備1分鐘后,進行一對一口試,由教師做好詳細記錄。
作答時間是對學生作答行為提出時間限制。命題者既要考慮一個學生的測評時間,計算出所有考生測評的總時間,以便決定分組測評組數,又要與學校頂層設計者溝通測評時間情況,做到各學科各項目作答時間分配合理。
表現性評價試題的參考答案比紙筆測試的復雜。計算型和測量型的試題有數值型參考答案。開放性問答題通常只提供答題方向和關鍵詞作為參考答案。實踐性、操作性的試題通常把操作步驟、操作要領、操作方法和作品效果作為參考答案。
評價標準是對學生作答的言行表現和結果給予等第評價,通常設置三個等第。以“識字”評價等第標準為例,優秀為“能正確、熟練認讀,沒有錯誤”,良好為“能正確、熟練認讀,讀錯的字數控制在3個字以內”,合格為“能正確認讀,讀錯的字數控制在5個字以內”。在紙筆測試中,評委將學生答案對照參考答案后,就能給予結果性評分。而表現性評價中,評委一般會盡量啟發、引導學生達成最高等第,只有在確實無法達到最高等第時,才會給予結果性評價。
觀察要點是命題者提醒評委及時敏銳觀察學生發生行為的評分點。表現性評價重視學生的行為表現,因行為表現具有即時性和動態性,故需要提醒評委優先關注動態評分點,其次關注靜態評分點。如:刻度尺測量試題要先關注學生使用刻度尺的動作是否科學,讀數是否準確;寫字評價要先關注筆畫順序和握筆姿勢,后關注書寫是否正確和工整美觀;考查字詞認讀要先關注認讀是否正確,特別是要關注平、翹舌音和前、后鼻音。
(三)現場情景
現場情景由考場情景、器材準備和角色扮演三部分構成。
考場情景分為場外和場內。期末表現性評價的考場外部布置一般由學校統一設計,即統一主題、統一色調、統一框架,如用藍色氣球做成拱門,粘貼標題“小腳丫商店”。日常表現性評價的場外布置相對簡約,由命題者自主設計,如在閱覽室張貼“三年級閱讀之春”背景圖即可。考場內部情景設計要根據測評內容和方式的需要,模擬測試所需的相關生活環境、社會環境或科學環境。如考查學生人民幣知識和計算能力,通常會布置幾個貨架和收銀臺模型。
器材準備通常包括測量工具、被測量物品、實驗器材與藥品、被研究的物品和相關貨物道具等。如模擬水果店可準備一定數量的各類水果、臺秤、計算器、各種面值的人民幣等。
角色扮演比較常見,按情景需要讓評委或學生扮演即可。
(四)人員配備
表現性評價需要多人配合,需要綜合教師、現場評委和引導員的數量需求。一個測評點一般需要配置2個指導教師、8個評委、2個引導員。指導教師側重現場管理,幫助評委處理疑難問題;評委主要負責具體測試;引導員負責管理學生,提醒他們安靜等候,帶領他們有序參加測評。評委和引導員通常由經過培訓的高年級學生或家長擔任。對評委要側重測評項目的專項培訓,以便掌握評價標準和觀察要點,會使用規范的評價導語,如“請你看清楚,再次認讀”“祝賀你順利通過‘識字樂園,下一站‘詩詞樂園加油”等。
(五)其他事項
其他事項主要涉及安全因素和經費預算。由于考場是由教室、操場等臨時變成功能室、公園、社區等開放性的陌生空間,其間要安排情景布置和道具物品,因而命題者需要思考可能產生的安全隱患及預防措施,并提早做好經費預算,請學校后勤部門審批和購買。
四、試題改編技術
(一)基于紙筆試題改編技術
1.情景真實化。命題者將紙筆試題中的文字情景、圖表情景、照片情景改編成真實情景或模擬情景。
2.物品真實化。紙筆測試題中的測量工具等物品通常以示意圖或照片形式呈現,在表現性評價中則要提供真實的被測物品(可用模型替代)、測量工具。例如,紙筆測試題畫有刻度尺和正方形,求正方形的面積。命題者將其改變為:提供一把刻度尺和一個正方形的塑料片,請學生用刻度尺測量正方形塑料片的面積。如此改編,測試重點就由“解題能力”向“靈活運用知識解決真實問題的能力”轉變。
3.角色扮演化。命題者將紙筆試題轉化為生活情境,通過角色扮演解決問題。如,將“3+5=( )”一題,改編成:學生扮演“水果店”售貨員,教師扮演顧客。“顧客”先買3個蘋果,等“售貨員”拿出后再買5個,問“售貨員”一共賣了幾個蘋果?
(二)基于表現性試題改編技術
1.改變情景。命題者可以改編原先表現性評價試題的情景,讓知識在新情景中應用。如把音頻素材變為視頻素材。
2.改變物品。即指把表現性評價試題中的測量工具、測量對象、道具等物品的種類、結構和大小進行改變。如測評刻度尺的應用能力,被測物品可以是正方形、長方形、三角形、梯形等圖形或實物,也可以是一段鐵絲、細繩,以及桌椅、走廊、跑道、樓層等。
3.改變數量。命題者還可調整觀察對象、研究對象的數量,改變信息容量。例如,將一包10顆糖果變為21顆,2分鐘聽力素材變為3分鐘,“聽一個人聲音”變為“聽兩個人聲音”。數量變化通常會影響測評難度。
4.改變難度。即通過調控情景器材復雜程度,調控物品數量復雜程度,調控內容能力綜合程度,調控操作行為復雜程度等來改變命題難度。例如,把“規則幾何圖形面積測量”改為樹葉等非規則幾何圖形面積測量;把“3種物品分類”改變成“5種物品分類”;在一個項目中綜合考查語文的聽說讀寫能力,甚至跨學科綜合考查;將滿刻度30厘米的直尺換成小量程的三角尺,用多次拼接的方法測量筆記本長度;將測量桌子高度改為測量二樓窗戶離地面的高度,學生需要從樓上放下繩子,確定繩子的有效長度。
改變單一的標準化紙筆測試,大力推廣表現性評價,能破解長期以來基礎教育評價領域的瓶頸。希望每一個教師都能掌握表現性評價命題技術,提升科學評價學生的高層次能力,促進學生高層次能力的發展。
參考文獻:
[1]王旭東.小學表現性評價的行為分類及其評價要點[J].教學與管理,2020(7).
[2]王旭東.小學表現性評價中優秀試題的五個標準[J].教學與管理,2017(8).
[3]王旭東.表現性評價:實施核心素養教育的必然途徑[J].教育家,2018(4).
[4]王旭東.紙筆測試堅冰初融[J].當代教育家,2017(3).
[5]王旭東.項目化 等第化 校本化——促進小學生健康成長的學業評價體系的構建[J].未來教育家,2017(12).
(浙江省溫州市教育評估院? ?325000)