羅國忠
(廣西教育學院教研部,廣西 南寧 530023)
美國康涅狄格州每年都對公立中小學學生進行統測,并根據統測結果適時調整教學,加強教學針對性和有效性,確保“不讓一個孩子掉隊”.它不僅測評學生是否“學會”,還測評學生是否“會學”,因此科學學科的統測內容包括知識和探究,探究測評又包括過程性測評和終結性測評:首先,由學校組織學生小組完成州教育部布置的一個探究任務,并鼓勵教師對學生的探究表現進行過程性測評,即這些測評結果不計入統測分數,但把測評結果和改進建議反饋給學生,促使學生改進后續學習;幾周后,由州教育部組織統一的科學學科終結性筆試,筆試成績計入統測分數.試題包括知識題和探究題,探究題是一系列集束型問題,這些問題全都與小組完成的一個探究任務有關.
2003年10年級科學學科統測的探究任務“隕石坑”:行星被隕石撞擊時,表面會形成隕石坑,坑口大小受很多因素的影響.請你與伙伴合作,首先探究隕石的下落高度對坑口大小的影響,然后探究另一個因素對坑口大小的影響.
探究材料:1袋沙子、2個碟子、3個不同質量的玻璃球、3個不同質量的塑料球、3個不同質量的木球、2個小塑料杯、2個小舀的橙色粉末、1個小勺、1把米尺(用來測量球的下落高度)、1把刻度尺(用來測量坑口大小)、安全護目鏡和圍裙等.
探究程序:(1)確定探究問題,明確自變量和因變量.(2)設計有效實驗,要詳實、具體,確保別人能重復、驗證實驗;要有控制和重復,確保實驗有效.注意:要把橙色粉末均勻撒在沙面上,以確保球撞擊沙面時形成的坑口清晰可見.(3)動手操作,要用表格記錄數據,用圖描繪數據.做完實驗后,每人要根據自己的實驗記錄,獨立撰寫實驗報告.實驗記錄和報告都不用評分,但會影響到你的后續獨立答題,而這些答題要評分.
學生完成探究幾周后,統一參加州教育部組織的科學學科筆試,獨立作答一份試卷.試卷包括知識題和探究題,探究題是8道集束型問題,它們與探究任務“隕石坑”有關,分別測評明確問題、設計實驗、得出結論、反思評估等探究要素.
A組學生的探究問題是:球下落的高度和撞擊地面的角度對坑口形成有何影響?他們的做法是:(1)在碟子中放沙子,然后讓球下落;(2)輕輕把球拿走,然后測量坑口大小.實驗結果如表1所示.

表1
問題1:A組的探究問題是否清晰、明確?請詳細說明.
問題2:把A組的實驗結果描成一個標示清楚的線圖.
問題3:根據A組的做法和結果,可得出什么結論?結論的有效性如何?請詳細說明.
B組學生的實驗:(1)把沙子平鋪在碟子中,然后再撒上一薄層橙色粉末;(2)測量所有球的質量;(3)依次讓不同的球下落,并測出坑口直徑.實驗結果如表2所示.

表2
問題4:B組實驗存在缺陷,需要怎樣改進?請詳細說明.
評析:問題1主要測評能否識別科學問題的能力.A組的探究問題不夠清晰、明確,因為A組實驗只研究“球的下落高度”一個自變量,但其問題包含“球的下落高度”和“球的撞擊角度”兩個自變量;A組實驗研究的因變量是“坑口直徑”,很明確,但其問題包含的因變量是“坑口形成”,模糊籠統.
問題2主要測評數據處理的能力,即把數據描成線圖,包括自變量和因變量是否與橫縱坐標軸對應、坐標軸的標示和標度是否適當、描點是否準確、連線是否順滑等.
問題3主要測評概括結論、反思評估的能力.從A組的做法和結果中,可得出“球下落的高度增大,形成的坑口直徑也會增大”的結論,但其有效性受到諸多不確定因素的影響,如每次下落的球是否相同?撞擊角度是否相同?撞擊位置是否相同?沙面是否平整?是否給沙面撒上橙色粉末,使坑口清晰可見?坑口直徑如何測量?每次測量手段是否一致?實驗有沒有多次重復等,這些不確定因素都會影響結論的有效性.
問題4測評實驗設計、反思評估的能力.根據B組的做法和結果,可看出他們研究“球的質量對坑口直徑的影響”,有諸多地方需要明確或改進,如應給出球的下落高度并保持不變;應給出球質量的明確數據,或說明“大、中、小”的含義(質量或直徑);應改變球的質量,并保持球的直徑不變;應說明球的撞擊位置(理想位置是沙面中心);應說明球的撞擊角度;每次實驗前應平整沙面;應說明怎樣測量、什么時候測量坑口大?。ㄈ缒米咔蛑斑€是之后);應在沙面撒上橙色粉末,使坑口清晰可見;實驗應重復多次,取平均值等.
如果學生確實做過探究,小組成員之間必然會有思維碰撞,會不斷地討論、嘗試和調整,給自己留下深刻的體驗,這些體驗無疑有助于答題;然而,球撞擊沙面現象不復雜、也不陌生,學生即使未做過該探究,也可在生活經驗基礎上運用空間想象和推理,在思維空間構想球撞擊沙面的過程模型,推想出影響坑口大小的諸多因素,然后再運用控制變量法進行分析,需要控制哪些無關變量,需要怎樣可靠測量因變量等.應該說,這些問題測評到的更多是學生平時探究形成的一般性探究能力,較少是與具體任務“隕石坑”相關的情境性探究能力.
C組學生的實驗:(1)把沙子平鋪在碟子中;(2)在沙面上撒一層橙色粉末;(3)測出每個玻璃球的質量;(4)讓大玻璃球從30cm處落下;(5)用其他玻璃球重復以上步驟;(6)從60cm高處重復實驗.實驗結果如表3所示.

表3
問題5:根據C組的實驗和結果,可知哪些因素會影響坑口深度
(A)球的質量.
(B)球的下落高度.
(C)球的質量和下落高度.
(D)球的質量或下落高度都不影響.
問題6:在C組實驗中,哪個變量保持不變
(A)球的直徑. (B)球的下落高度.
(C)球的材料. (D)球的質量.
D組學生的實驗:(1)在碟子中平鋪沙子,然后撒上一層橙色粉末;(2)測出每個球的質量;(3)讓球下落到沙中,測量坑口直徑;(4)重新平整沙面,換其他球進行實驗.實驗結果如表4、表5、表6所示.

表4

表5

表6
問題7:D組在實驗報告中有一句陳述:球的質量越大,坑口直徑就越大.這個陳述是
(A)被D組數據支持的結論.
(B)不被D組數據支持的結論.
(C)D組實驗中所作的觀察.
(D)D組實驗中被控制的一個變量.
問題8:在實驗中,計量沙子質量最精確的單位應是
(A)茶匙. (B)勺. (C)毫升. (D)克.
評析:問題5測評識別自變量的能力,要求學生從實驗設計中找出自變量,答案是(C).問題6測評識別無關變量的能力,要求學生從實驗設計中找出無關變量,答案是(C).問題7測評概括結論的能力以及區分結論和結果的能力,答案是(A).問題8測評識別單位精確度的能力,答案是(D).
與問答題類似,這些題目都與所做探究有關,如果學生做過該探究,有一定體驗,思維得到“預熱”,就會有助于作答.即使學生未做過該探究,只要具備一定的控制變量法知識、數據分析能力,亦可順利答題.
筆試是目前測評科學探究能力的主要方式之一,其優點是擅長測評心智性的探究思維,缺點是較難測評實踐性的動手操作、交流合作,以及體驗性的情感反應等.從試題評析中看到,如果學生做過探究,會有助于答題,但如果未做過探究,似乎也不太影響答題.究其原因,是因為這些試題其實是測評探究思維,學生平時探究形成較強的探究思維,就能有效應對.因此,美國康涅狄格州統一要求用低成本的筆試作為探究思維的終結性測評手段,鼓勵但不統一要求教師用高成本的觀察作為過程性測評手段.
這種做法與我國的探究測評大體類似,但兩者仍有一些不同:(1)康涅狄格州采用集束型問題,所有問題都聚焦一個探究任務,而我們國內較少有一套試卷的所有探究題聚焦一個探究任務,多數是分散于不同探究任務.那么,集束型問題和分散型問題的測評效度究竟有何差異?(2)康涅狄格州的有些探究題更細致而深入.例如,問題4要求改進實驗、問題3要求分析結論有效性,表面上似乎是測評實驗設計、概括結論的能力,其實也測評反思、評估等深層的綜合性能力,需要學生具有更全面、細致而深入地探究思維,要知其然也要知其所以然,而我們國內測評主要是要求設計實驗、概括結論,較少進一步要求反思、評估實驗設計或結論的有效性,停留于知其然這一層次.那么,兩種做法的測評效度又有何差異?盡管這兩個問題暗含著筆者的一些看法,但筆者還是不敢肯定,還是留給感興趣的研究者用實踐和證據去探索回答吧,相信進一步的研究能拓展我們的視野和思路.
1 Connecticut Department of Education.The Connecticut Academic Performance Test[EB/OL].http://www.csde.state.ct.us/public/cedar/assessment/capt/capt.htm,2012-12-28.