[摘 要] NAEP是美國國家教育進展評估的簡稱,本文主要從科學知識維度評價、科學能力維度評價、科學教育評價項目等方面探討了NAEP科學教育評價的趨向,對我國科學教育評價及改革的啟示。
[關鍵詞] 美國;NAEP;科學教育;評價
[中圖分類號] G40-058.1[文獻標識碼] A[文章編號] 1672-1128(2010)04-0037-04
一、NAEP簡介
NAEP是美國國家教育進展評估(National Assessment of Educational Progress)的簡稱。它是由美國國會授權教育部國家數據中心持續開展的全國學生學業成就評價體系,是美國國內最權威的學生學業成就評價體系,科學教育評價是其中的一部分。NAEP首次評價于1969年進行,評價對象是來自全美的4、8、12三個年級的學生。評價框架由4個部分組成:學科領域(地球、物質和生命科學),知與行(概念理解、科學研究、實際推理),科學本質(科學和技術發展史、體現科學和技術特征的思維習慣、探究方法和問題解決),統一的概念(模型、系統、變化方式)。有關部門運用這一框架分別于1996年、2000年和2005年進行了測試。
在此基礎上,它又汲取了科學教育、認識科學以及教育評價等諸多領域的研究成果,于2006年推出了“NAEP2009科學評估框架”和“NAEP2009科學評估與測試題規則”兩個重要文件,旨在為2009年以及更為長期的科學教育評價提供指導框架和實踐手冊。該評價體系試題編制技術從學生“表現期望”入手,根據其認知及實踐能力生成的規律,開發出一套詳細的試題編制細則,目的是通過測量學生的學業成績反映美國教育成就的進展情況,目前,NAEP已成為美國國家及其各州政府衡量其教育發展狀況的一個重要指標。2009框架中的評價內容及項目與原來的框架發生了什么變化,說明了什么問題,是本文探討的重點。
二、NAEP科學教育評價的趨向
資料顯示,NAEP2009科學評估框架相對于1996~2005框架來說,在保持歷史連貫性的同時,也做了一些調整,以適應科學教育理論和實踐的變化,主要變化趨勢如下。
1.科學知識維度評價的趨向
在科學知識維度上,兩個框架的具體內容都是物質科學、生命科學和地球空間科學這三個領域,只是維度方面不同,主要歸納為下列幾點。
(1)對綜合性主題的評價。新框架對綜合性主題的評價側重于三大領域中交叉的話題,如能量守恒問題。這種交叉不是抽象概念的交叉,而是具體科學內容的交叉,即試題情境盡量接近真實世界,測試能反映真實世界所需的科學知識和技能,從而更好地評價學生科學素養中科學知識的遷移能力。這種理念與國際科學課程改革趨向相吻合。現代科學課程作為一門綜合性課程,其獨特價值在于引導學生整體地觀察、研究自然現象,從而更好地構架學生科學學習與實際生活之間的連結,使學生能遷移運用所學知識于現實生活中。
(2)對科學本質的評價方式不同。科學教育一直提倡讓學生理解科學的本質,然而,一直沒能很好地落實于實踐之中。1996~2005框架提出,至少要有15%的評價內容圍繞科技發展史以及對科技發展有重大影響的科學本質的重視。2009框架將科學本質歸類到科學能力的維度去評價。這說明NAEP期待不僅僅在知識層面上理解科學本質,還要能運用于實際之中。從能力的角度出發,結合具體實際情境,也更能真實地評價學生對科學本質的理解。
(3)對評價內容的呈現和描述不同。1996~2005框架說明了內容主題涉及的概念術語,并分年級說明各主題的具體評價內容。2009框架一方面按年段劃分科學教育內容,另一方面也汲取了一些研究成果,對評價內容進行更深入的說明,從而更清晰地勾勒出美國科學教育對不同年級學生應該知道什么的要求,更確切地提出了符合學生認知發展的科學素養知識目標。因此,2009框架與原框架相比,物質科學領域仍是“物質”、“能量”和“運動”三大主題,生命科學領域的主題則由原來的4個改為“生物體的結構和功能”、“生物體的變化”2個主題,地球空間科學領域的主題則由原來的4個改為“時空的地球”、“地球結構”和“地球系統”3個主題。這不僅有利于提高NAEP科學素養的評價效度,對學科課程開發和實施都具有重大意義。
2.科學能力維度評價的趨向
相對于科學知識維度,2009框架在科學能力維度上的變化要更大些。
(1)2009框架評價四類科學能力。1996~2005框架主要評價3種科學能力:“概念理解”,評價學生運用科學概念解釋或預測所觀察到的真實現象的能力;“科學研究”,評價學生運用適宜的工具和方法進行研究、獲取新知識的能力;“實踐推理”,評價學生運用科學知識和技能有效解決日常問題的能力。
2009框架對科學能力的評價更加清晰明確,評價的四類能力分別是“識別科學原理”、“運用科學原理”、“運用科學探究”和“運用技術設計”。此框架描繪了期待學生在這四類科學能力上的表現。如“運用科學原理”的4種成就表現,分別要求運用科學知識作出解釋、預測、例舉說明和評價分析。“運用科學探究”則要求能進行設計,進而能去實施,并能將數學運用于探究結果的分析與說明,能用數據類型進行理論建模,最后能對結論進行證明和批判。“運用技術設計”則規定了三類能力表現,一是能依據科技提出解決實際問題的辦法,二是能在運用科技的時候考慮利害關系,三是能預測決策帶來的風險。后兩類能力的期待,涉及科學情感態度與價值觀,更全面地評價了學生的科學素養。
NAEP認為,一位具有科學素養的人首先是熟悉自然界的,能理解科學的主要事實、概念、原理、定律和理論,即具有“識別科學原理”的能力。其次是能運用對科學的認識和理解正確解釋或預測所觀測到的現象,即“運用科學原理”。再次是知道如何運用科學知識和科學思維去提高對自然界的認識,即“運用科學探究”,以及知道如何依據科學技術解決真實世界的問題,即“運用技術設計”。
(2)2009框架結合學生的認知需求評價其能力。1996~2005框架對科學能力的考查大部分是基于學生經驗的。也就是說,通過測題真實情境的創設,學生解答試題需要調動類似的科學體驗,而不是依靠對科學的死記硬背。這些科學體驗可以來自科學課堂,也可以來自實際生活。2009框架對科學能力的考查則進一步強調要從學生的認知出發,編制試題時要從問題解決的認知需求出發,而不只是關注科學體驗的有無。這使得NAEP科學評價結果不僅僅是一個分數,還是對學生的一次認知診斷。
2009框架評價4種認知類型:第一類是陳述性知識;第二類是程序性知識;第三類是圖式知識;第四類是策略性知識。
上述4種認知類型與4種能力不是一一對應的,每種能力可能涉及不只一類認知,如都需要調動陳述性知識。從側重點來看,“識別科學原理”主要涉及陳述性知識;“運用科學原理”側重于圖式知識;“運用科學探究”和“運用技術設計”主要涉及程序性知識,也與策略性知識密切相關。
(3)2009框架評測學生的學習進步。美國在學生科學學習進步方面取得的研究成果以及測評技術的發展,使NAEP在2009框架中能著眼于學生學習進步測評。NAEP認為,學生在科學學習上的進步,就是他們的“樸素理論”越來越多的發展成為科學理論。或者說,學習的新手進步為勝任者,進而成為專家,是他們在某一領域的相關體驗、科學知識和技能逐漸增多并結構化的結果。因此,通過評價四、八、十二年級在某一主題內容方面的知識和能力水平,將獲得的學業成就與年段進行聯系,在整體上(不針對個別學生)得知學生進步的情況。
3.NAEP科學教育評價項目的趨向
2009框架除了保留原來的評價項目以外,還新增了2類評價項目:組合題和計算機交互式任務。
(1)組合題。為了檢測學生對某個主題理解的深度,或者對科學理解的廣度,NAEP運用多道有聯系的試題,作為組合題進行評價。這些組合試題可以都是選擇題,或是簡答題,或是選擇題和簡答題的混合。在紙筆評價中,組合題有試題串(item cluster)和預測-觀察-解釋系列題兩類。前者是一系列有聯系的試題,可以涉及多個內容領域,可探測學生的“心智模型”、“樸素理論”;后者要求學生對某一現象進行預測、觀察和解釋。
(2)計算機交互式任務。2009框架指出,計算機交互式任務是對操作類任務的補充,而不是取代。它強調,要有效檢測學生的能力,操作類任務需要給學生富有挑戰性的、具體真實的問題,讓學生通過運用所學的科學知識和技能,自己探尋解決問題的途徑和方法,最后得出結論。作為操作類任務的補充,計算機交互式任務則要發揮計算機的獨特功能,針對現實中在短時間內難以觀察到的現象,如波運動的慢鏡頭、江河腐蝕;或是肉眼觀察不到的現象,如氣體分子的運動進行科學知識和能力的檢測。這樣,運用計算機進行評價的好處還在于無需準備實驗場地和實驗材料,也不需要經過培訓的監考人員,無需整理實驗現場,無需要求學生按序進行,并可建立數據庫由計算機來評分。
交互式計算機任務有4種類型:信息收集和分析,使學生主動尋找有關信息進行問題解決;信息研究,以經驗為基礎進行調查,使學生為實現問題解決而研究;計算機模擬,使學生巧妙地運用科學處理多變的問題;概念圖,探測學生組織知識進行邏輯推理的能力。實踐證明,概念圖能有效檢測學生對各學科概念之間關系的理解和聯系能力。2009框架要求八年級和十二年級必考概念圖,可用于“識別科學原理”的評價,也是對陳述性知識的評價。
總體來說,2009科學評估框架評價內容更貼近學生的現實生活,評價要求更深入、更全面、更明確。既能更全面
地評價學生的科學素養,又能適應現代社會的發展趨勢。
三、NAEP科學教育評價的趨向對我們的啟示
由上可見,NAEP科學教育評價給我國科學教育改革提供了很多借鑒之處,但鑒于我國教育文化背景的不同,我國要進行科學教育評價改革,不能照抄照搬,應注意下面幾個方面。
1.重視學生科學學習的認知發展,構建清晰的評價內容體系
NAEP科學評價框架的發展趨向告訴我們,構建評價內容最為重要的是要與學生認知發展相匹配。也就是說,要構建清晰有效的評價內容,我們就要摸清學生科學概念的認知發展,明確某一核心概念在某年級可以評價什么。唯有遵循學生認知發展的評價內容體系,評價反饋的結果才能有效促進科學課程與教學的改進,實現科學素養的培養目標。
在知識維度上,可根據我國現行的中小學各理科課程標準,梳理出核心科學概念體系,確定評價學生“應該知道什么和能做什么”的主要內容。在能力維度上,可以評價科學理解能力、科學運用能力與科學探究能力。受NAEP的啟發,還可以評價學生運用科學技術解決現實問題的能力,并由此涉及科學情感態度與價值觀的考察。
2.重視科學教育的認知評價方式,構建有效的評價項目體系
畢比指出,科學教育對科學素養的界定,主要圍繞“作為一個具有科學和技術素養的公民,應該知道什么、能判斷什么、會做些什么”這一問題展開討論。也就是說,科學素養具有“功能性”,具備科學素養的評價,則就要從認知評價的角度出發,才有信度和效度。NAEP科學教育評價的趨向以評價學生陳述性知識、程序性知識、圖式知識和策略性知識來進行科學素養的認知評價,值得我們學習和借鑒。在評價的能力維度上,哪種能力最適宜于通過哪種認知類型的評價,則需要我們進一步去摸索,以更清楚科學素養的認知評價方式。
在評價項目上,我們也常采用選擇題、簡答題,也會使用選擇題與簡答題的組合,或者幾個簡答題的組合。如何選擇最匹配的評價項目,提高評價的信度和效度,則需要向NAEP學習。例如,NAEP的組合題、概念圖的評價確實值得我們借鑒,但鑒于我國的國情,要量力而行。如采取操作類任務評價學生動手的能力,如何在全國層面的評價中使得操作類任務具有信度和效度,則需要進一步積極試驗和摸索。再如計算機交互式任務能在更多情境中評價學生動手的能力,確實非常可取,但鑒于我國中小學計算機教學現狀,只能選點試驗,全面推廣要慎重。
3.重視學生學業能力,構建學業成就評價的理論與模式
目前,我國基礎教育評價的弊端,突出反映在強調甄別與選拔功能,忽視改進與激勵的功能;注重學習成績,忽視學生全面發展和個體差異;關注結果而忽視過程,評價方法單一等方面。考試本應是對學業的評定,但因擔負著選拔任務,學業成就評價的本體功能被扭曲,進入了小考為大考服務、大考為升學和選拔服務、教育教學為考試服務的惡性循環。為了轉變因考試造成的惡性循環,充分研究和開發注重學生學業能力、促進學生發展的學業成就評價模式迫在眉睫。
可見,以什么工具怎樣評價學業成就是決定學業成就性質和高低的不可忽視的因素。也就是說,學業成就評價工具的信度與效度以及評價形式決定著是否能夠真正測試出學生的學業成就。當前,在我國以學科課程考試來獲取學生學業成就現象非常普遍,因為學校課程考試命題的隨意性和人為性較大,很多課程考試只能考出學生掌握知識的水平,達不到測試學業能力的要求,以課程考試成績來代表學業成就難免有不妥之處。為了學生學業成就評價的客觀準確性,認真研究和開發學業成就評價理論與模式就顯得尤為重要。
4.重視學生的不同價值,構建衡量學生不同價值的標準體系
由于我國人口眾多、教育條件差異很大,所以學生的學習環境、水平及能力差異明顯,若只用一種價值、一把“尺子”去判斷所有學生,必定“制造”出很多“差生”,這實際上是傳統教學評價的致命問題。因此,對于不同地域或某方面學習有困難的學生來說,應該用不同評價方法去評價,減少高考“一把尺子”的負面影響。因為多一種價值判斷,“多一把衡量的尺子”,就會多出一批有用人才。即使考不上大學,也為今后的人生打下良好基礎。因此,對于不同地域的學生如何制定評價標準?對于同一地域不同類型的學生又如何制定評價標準,以達到促進每一個學生發展的目的等問題都值得探究。
總之,NAEP科學教育評價的發展趨勢,不僅對我國基礎科學教育的評價有所啟示,更啟示我們要縮減科學教育“理想課程”與“實際課程”之間的差距。要落實科學素養的培養目標,迫切需要科學素養評價的“保駕護航”。而我們當前首要的任務是要構建與學生認知發展相適應的,適合我國評價不同地域、不同類型學生的內容和標準,達到有效提高每一個學生科學素養的目的。
參考文獻
[1]趙保鋼.美國全國教育進步評價(NAEP)中的科學探究.物理教學探討[J],2005(7).
[2]張布和.我國學業成就評價改革現狀及對策.中國教育學刊[J],2009(4).
[3]林靜.美國NAEP科學素養評價新趨向——基于美國2009NAEP科學評價框架的分析研究.課程·教材·教法[J],2009(8).
[4]http://www.fzyz.net/news_open.aspx?ID=8879.
作者單位 山東省泰山學院教師教育學院
(責任編輯 王永麗)