


教育對一個國家和民族是很重要的,國民的受教育水平直接決定了國家競爭力的強弱。在世界范圍內,不管是發達國家或者是發展中國家,對教育的支持力度都在逐年提高,因此各種先進的教育理論也隨著社會的進步得到不斷的發展。然而教育是多方面因素作用的長期結果,很難對教育理論、教育行為和結果進行評估。所以,一直以來沒有一個完善的、被普遍認同的評估體系來對教育理論和國家教育政策,以及公民受到的教育水平進行評估。各國教育部門和國際組織一直致力于建立一個合理的教育評估體系,使其可以全方位地對一個國家或者地區的教育水平進行評估。
目前,在美國并存有一些針對全美公民的教育評估體系,其中國家教育進展評估(National Assessment of Educational Progress,NAEP)和國際數學和科學教育趨勢評估(Trends in International Mathematics and Science Study,TIMSS)是兩個重要評估體系。NAEP是由美國國會授權的一項全國性學生學業成就評估體系。它由美國教育部任命,但又獨立于教育部的國家評估理事會(National Assessment Governing Board)負責制定NAEP的政策并設計其評估體系[1],是美國國內最大的、周期性評估體系。它目前涉及的內容有數學、閱讀、科學、寫作、藝術、公民教育、經濟、地理和美國歷史。評估的對象是4、8和12年級的學生。TIMSS是由國際教育成就調查委員會(International Association for the Evaluation of Educational Achievement,IEA)負責運行的國際性教育評估項目[2]。TIMSS每四年舉行一次調查,比較不同國家和地區的學生在數學和科學學科的學業成就,參與最近一次評估(2007年)的國家和地區將近60個,評估的對象是4和8年級學生。
這兩種教育評估體系運作多年,且全程都有科學家、教育專家和統計專家參與,都是較為成熟的教育評估體系。因此,通過研究和比較前述的兩種教育評估體系,可以使我們更好地深入了解國際上對學生學業成就評估的模式,建立一個適合我國的中小學教育評估體系。為了有針對性和可比性,本文僅僅比較這兩種體系中的科學課程方面的體系內容。
人類科學實踐活動依賴于人們具有的科學認知能力來完成,因此為了全面考察學生在科學課程方面的學業成就時,NAEP和TIMSS除了設定科學內容的考察,還對科學認知能力進行了評估。這兩種評估體系都通過評估試題對學生進行評價,每個試題都有兩個分類編碼,一個分類編碼用于區分科學內容,一個用于區分科學認知能力,因此兩種評估體系對科學內容和科學認知能力的評估是同時進行的。下面將從三個方面對這兩個體系進行比較。
一、NAEP和TIMSS在科學課程內容上的異同
NAEP的科學內容分布如表1所示,可以看出它包括三個部分:生命科學、自然科學和地球和空間科學。從表1中可知:各部分在4年級分布均勻,8年級則偏重地球和空間科學。從內容分布情況可以看出,NAEP認為4年級各部分內容應保持均衡,以適應4年級學生的認知水平;為了培養8年級學生的理性思維能力和空間想象力,8年級的科學內容則更加強調地球和空間科學。
表1所示也列出了TIMSS覆蓋的科學內容。考慮到不同國家和地區的課程內容的差異,TIMSS對4年級和8年級設置了不同的內容類別,4年級沒有涉及化學的內容,8年級的自然科學課程分成化學和物理,同時生物的占比下降,地球科學內容占比保持不變。需要特別指出的是,兩個體系中的4年級自然科學包含的內容不一樣,在NAEP中包含物理和化學,在TIMSS中只有物理內容。從表1中可看出,相對NAEP來說,TIMSS中的生物、物理和化學占比更多。TMISS中4年級生命科學內容占比達到45%,8年級的物理和化學合起來占比達到45%。TIMSS認為低年級學生對于生命現象有很強的好奇心,因此因勢利導地加強生命科學的內容,而到高年級則通過物理和化學課程來培養學生的邏輯分析能力。
為了更好地說明兩個體系在科學內容的覆蓋上的異同,我們以NAEP的4年級和8年級自然科學和TIMSS中的4年級自然科學以及8年級的物理和化學內容進行比較。從表2中可以看出,TIMSS實際覆蓋的內容范圍比NAEP要大,而且TIMSS內容體系的4年級和8年級的類目名字雖然相同,但是實際內容和要求則不同,8年級的內容不是4年級的重復,而是在4年級的基礎上深化。比如:聲這一部分內容在4年級只要求知道聲音是振動引起的,在8年級則要求區分音量,振幅,頻率和音高,并了解聲音通過介質傳播,在表面會反射和吸收,以及在不同介質中的速度不同。在對比光、聲、磁方面的內容時,就會發現NAEP和TIMSS有很大的不同。以光的內容為例,NAEP里包括光的直線傳播和折射(4年級),光可以傳遞能量和太陽的光能(8年級),TIMSS在4年級要求分辨光源和光的直線傳播和折射,在8年級要求了解光速,光的反射、吸收和色散,光和物體的顏色關系,透鏡的使用。從以上對比可以了解,TIMSS在這一部分內容的廣度和深度上比NAEP要高。這從一個側面上可以解釋為什么美國學生在TIMSS測試中表現欠佳。但是在一些基本內容上,比如物質、力和運動這些內容上兩個體系基本沒有差別。
從以上對比可以看出,這兩種評估體系在科學內容的覆蓋面上基本一樣,但是在不同年級的各部分內容側重點有所不同;另外TMISS的覆蓋面比NAEP要大一些。
二、NAEP和TIMSS在科學認知能力上的異同
NAEP的科學認知能力包括四個層次:識別科學原理、應用科學原理、實施科學探究和技術設計。這四個層次NAEP有明確的要求:識別科學原理要求學生能夠理解、記憶、關聯和敘述基本科學原理;應用科學原理要求學生能夠解釋現象,預判某一現象可能的結果和能夠舉出和科學原理相關的事例;實施科學探究則關注學生設計一個科學調查或者評判一個科學調查的能力,即利用合適工具和技術進行科學探索的能力,找出實驗數據的規律或者與其相關的理論模型的能力,利用實驗數據證實或評估結論的能力;技術設計則關注學生在真實的環境中系統地應用科學知識和技能處理問題的能力。這些能力要求貫穿于每個年級,但是各年級有所區別。從表3可看出4年級的科學認知能力主要強調前三個層次,這也更加符合低年級的認知特點;8年級則特別重視應用科學原理。
TIMSS的科學認知能力則分為三個層次:知道、應用和推理。在TIMSS中對這三種認知能力有如下要求:知道認知要求學生了解科學概念和模型,并能使用合適的工具和實驗方法用于科學探索中;應用認知要求學生使用科學概念和原理比較、區分和解釋科學信息,并能利用概念和原理解決問題或者解釋現象;推理認知則要求學生能夠分析問題并了解其中的科學原理,設計和解釋處理問題的方法,使用合適的公式和分析方法評估解決問題的方案。這些認知方面的要求也是適用于每個年級,但是從表3中可看出在4年級更關注知道和了解科學知識,即基本認知能力的培養,在8年級則提高對推理方面的要求。
為了更好地區分它們在科學認知方面的不同,把這兩種體系中的試題按照TIMSS的認知體系分類后進行比較可以看出:對于4年級來講,在NAEP中18%的試題屬于知道認知,這個比例比TIMSS的一半還少;NAEP中53%的試題屬于應用認知,比TIMSS多18%;推理認知在兩個體系都差不多;另外NAEP還有6%的綜合性認知,即不能簡單歸為某一類。對于8年級來講,NAEP減少了知道認知,TIMSS雖然也減少了,但是這一比例仍然是NAEP的3倍,而這個比例在4年級是2倍;在應用認知部分NAEP增加了一部分比例,而TIMSS沒有增加,從而使這一部分的比例差擴大;推理部分NAEP基本沒有什么變化,TIMSS則增加到35%,比NAEP多10%左右。綜合以上信息可看出,不管是NAEP還是TIMSS從4年級到8年級都減少了知道認知方面的比例,分別增加了應用和推理方面的比例;而NAEP更加強調應用認知,TIMSS更加強調推理認知。這種安排顯示了這兩種體系對這兩個年級的認知發展有不同的期望。
在對基本科學規律和現象的認知上,TIMSS比NAEP更重視學生這方面的能力,在更深層次的科學認知能力上,兩種體系都強調解決問題的能力,但NAEP更重視科學內容的應用,TIMSS更重視學生的邏輯和推理能力。
三、NAEP和TIMSS在科學課程評估中試題形式和分布的異同
NAEP和TIMSS試題都包含單項選擇題和開放性試題(Constructed Response or Open Ended Question)。TIMSS中的開放性試題包括簡答題(Short Constructed Response Question)和拓展題(Extended Constructed Response Question)。簡答題用一個單詞或者短語簡要回答。解答拓展題時,由于需要利用相關知識和技能解決問題或解釋現象,所以學生可以根據題意安排自己的答題內容。根據學生回答的完整程度給出拓展題相應的分數,而其評價的重點在問題的解決方法上而不是在寫作的能力上。比如單詞和句子寫得是否規范,這樣的評分細則和我國的小學考試評分標準還是有很大的區別。
NAEP的開放性試題包含簡答題、拓展題和概念圖任務(Concept Mapping Tasks)。其中概念圖任務題要求學生在6-8個概念間用箭頭建立聯系,并在箭頭上用單詞或短語簡要描述概念間的聯系,這種題主要考查學生對于科學內容或者概念有精準的認識,并要求有一定的聯想能力。這和目前國內流行的思維導圖和相類似。另外,考慮到工作量和評估的有效性,NAEP還對一小部分的測試對象進行加試,這部分內容的題型主要包含實驗題(Hand-on Performance Task)和計算機交互模擬試題(Interactive Computer Task),通過對這些內容的評價,可以得到更加全面和豐富的學生學業成就信息。由于TIMSS中沒有相應的內容,所以加試的題型不在這次對比的內容里。
兩個體系中的開放性試題評分標準也不相同。在TIMSS中簡答題有正確和錯誤兩個評分等級,拓展題有三個:正確、部分正確、錯誤。在NAEP中,簡答題則可能有兩個或者三個評分等級,拓展題有四個:正確、部分正確、少量正確和錯誤。需要說明的是,TIMSS有些題沒有唯一答案,要求學生對這個問題有兩種回答,根據回答內容對其評價,評價的結果分為三類(兩個都正確,一個正確和都不正確)。
圖1(a)和(b)分別是NAEP和TIMSS中選擇題和開放性試題考查各種認知能力試題的百分比
在比較了NAEP和TIMSS在科學課程學生學業成就評估體系后,發現NAEP和TIMSS都不僅僅關注學生科學內容的掌握,而且關注學生科學認知能力的發展,它們的這種方法是值得我國在對學生學業成就進行評估時借鑒和學習的。兩個體系在評估這兩個方面方式和側重雖然不同,但是都能很好地對教育活動起到引導和指導作用,這些是值得我國教育機構反思的。
參考文獻
[1] NAEP.Science Framework for the 2009 National Assessment of Educational Progess.http://nces.ed.gov/nationsreportcard/science/moreabout.asp
[2] IEA. TIMSS 2007 Assessment Frameworks..http://timssandpirls.bc.edu/TIMSS2007/frameworks.html.
(責任編輯 任洪鉞)