一、引言
新課程提倡科學探究,并強調(diào)以多種方式來評價學生的科學探究能力。然而,迄今為止,我國仍然只采用被國際公認為低效的紙筆測驗來評價學生的科學探究能力。在國際上,工作單是評價科學探究能力的主流方式,即讓一群學生各自動手探究,同時把探究過程和結(jié)果寫在一個單子上,然后評分者對單子中的內(nèi)容進行延時評價。國際研究表明,工作單能可靠、有效地評價學生的科學探究能力,因此,工作單備受國際科學教育界的青睞。本研究以基本要素分析(Primary Trait Analysis,PTA)為理論依據(jù),在這些國際項目的基礎(chǔ)上,構(gòu)建一個優(yōu)化的工作單評價體系,并研究初三學生在這種評價方式中的探究表現(xiàn)水平及特點。
二、方法
1.被試
被試選自貴州省10個中學,每個中學各一個初三完整班,共612人,這些學生在初中階段做過兩三次比較完整的科學探究。
2.過程
(1)構(gòu)建工作單的評價體系
以PTA為理論依據(jù),在國際評價項目的基礎(chǔ)上,構(gòu)建工作單(見表1)和評分標準(見表2)。探究內(nèi)容為“單擺的周期與單擺的長度、質(zhì)量有什么關(guān)系”,學生之前未探究過該內(nèi)容。
猜想假設(shè)、制訂計劃和概括結(jié)論三個探究要素的最高分值各為3分,每一個探究要素的關(guān)鍵成分最高分值1分,每一關(guān)鍵成分分為完全、部分、錯誤三個等級,其分值分別為1分、0.5分、0分。進行實驗是科學探究的核心要素,因此,該要素最高分值為6分,每個關(guān)鍵成分最高分值2分,其完全、部分、錯誤三個等級的分值分別為2分、1分、0分。

3.實測及評分
把每個學校的學生分成兩組,分別安排在本校兩個實驗室。學生單人單桌,獨立完成探究,探究時間為45分鐘。每個實驗室由兩個物理老師負責巡視,負責排除臨時出現(xiàn)的器材故障,以及回答學生不清楚的問題,但不能提示如何做。
評分前,兩個評分教師對探究任務親自動手做一次,了解可能的數(shù)據(jù)范圍、誤差的來源及范圍等。然后,隨機抽學生的5張工作單進行預評,找出兩個評分者的差異,討論之后再隨機抽5張工作單進行預評,評分者信度達到0.81,表明評分教師基本達成了共識。實評時,兩個教師各自評分,互不干擾。
三、結(jié)果與分析
1.猜想假設(shè)
對于猜想假設(shè),不適當?shù)膯栴}主要有兩方面:①復雜水平低。本探究的問題是“單擺的周期與單擺的長度、質(zhì)量有什么關(guān)系”,而不是“單擺的周期與單擺的長度、質(zhì)量是否有關(guān)系”。前者屬于趨向聚焦類型問題,要探究這種類型的問題,需要多次改變自變量;后者屬于區(qū)別聚焦類型問題,要探究這種類型的問題,只需要改變一次自變量。很顯然,區(qū)別聚焦類型問題的復雜性低于趨向聚焦類型問題。從學生的假設(shè)來看,接近一半的學生假設(shè)類似于“單擺的周期與單擺的長短有關(guān)系、質(zhì)量有關(guān)系”等,這些假設(shè)屬于區(qū)別聚焦類型假設(shè),其復雜水平低于趨向聚焦類型假設(shè)。②假設(shè)不合理或部分不合理。例如,較多學生的假設(shè)類似于“單擺擺長越長、質(zhì)量越大,擺動周期越大”。對于這個探究內(nèi)容,初中物理沒有關(guān)聯(lián)知識,但在5分鐘預操作中可以大幅度改變擺長,即使有誤差,也不難得出“擺長越長,擺動周期越大”的定性結(jié)論;但是,質(zhì)量難以大幅度改變,再加上誤差,較難在5分鐘內(nèi)得出正確結(jié)論,以致很多學生受“擺長越長,擺動周期越大”影響,得出“質(zhì)量越大,擺動周期越大”的假設(shè)。
2.設(shè)計方案
對于制訂計劃,不適當或錯誤表現(xiàn)在幾個方面:①不控制相關(guān)變量。例如,“用細繩拴住小球,掛在鐵架臺下,讓它擺動;分別增加細繩長度、小球質(zhì)量,讓它擺動,測它的擺動周期”,接近一半學生沒有提到擺角及其控制。②空白或模糊。例如,“先吊好小球在鐵架臺上,然后測量細繩長度、單擺與豎直方向的夾角、擺動的時間、擺動的次數(shù),最后算出單擺周期,這樣進行多次條件不同的實驗,以作對照”。從這些模糊的表述中,看不出這些學生如何操縱自變量、控制相關(guān)變量、測量因變量的。
3.進行實驗
對于實驗,評分者無法觀察到操作和測量過程,只能通過表格中的數(shù)據(jù)來判斷學生對自變量的操縱和測量、相關(guān)變量控制、因變量的測量等方面的適當性。只用學生表格中的數(shù)據(jù)來判斷學生的實驗過程,會有一些判斷失真,從而導致兩個評分者的不一致。例如,盡管一些學生獲得的一些實驗數(shù)據(jù)不適當,但他們也會把全部數(shù)據(jù)記錄在表格中,但在概括結(jié)論時可能會把某些數(shù)據(jù)排除,保留某些數(shù)據(jù)。因此,需要結(jié)合后面的概括結(jié)論步驟來判斷,概括結(jié)論步驟要求學生在工作單中“說明你用了哪些數(shù)據(jù)來得出這個結(jié)論”,以便評分者判斷學生究竟用了哪些數(shù)據(jù)。結(jié)果發(fā)現(xiàn),一些學生提供的數(shù)據(jù)很清晰,如“用了第一和第三次實驗的數(shù)據(jù)”,這時兩個評分者的判斷沒有歧義;但是,一些學生并沒有提供數(shù)據(jù),或提供的數(shù)據(jù)比較籠統(tǒng)、模糊,如“用了表格中的數(shù)據(jù)”,這時評分者需要分析學生表格中的數(shù)據(jù),會出現(xiàn)一些歧義。
自變量的操縱和測量,不適當或錯誤表現(xiàn)在幾方面:①自變量的起始點不適當。例如,單擺長度過短,導致擺動周期太小,使得計數(shù)擺動次數(shù)困難,容易出現(xiàn)誤差。②自變量改變次數(shù)不夠,只改變一次。③自變量變化間隔過小。由于誤差不可避免,單擺長度改變間隔過小,再加上實驗次數(shù)少,使得測出的擺動周期不變,甚至出現(xiàn)相反趨勢。
4.概括結(jié)論
對于概括結(jié)論,不適當或錯誤表現(xiàn)在幾方面:①沒有提供支持結(jié)論的數(shù)據(jù);②提供的數(shù)據(jù)模糊;③結(jié)論合理,但與數(shù)據(jù)不一致;④結(jié)論不合理,但與數(shù)據(jù)比較一致;⑤結(jié)論不合理,也與數(shù)據(jù)不一致;⑥結(jié)論過于簡略、模糊;⑦重復描述數(shù)據(jù),沒有概括出一般性結(jié)論。其中,一些實驗數(shù)據(jù)誤差大,難以歸納出一般結(jié)論,但其中另一些數(shù)據(jù)并不太大,數(shù)據(jù)之間的關(guān)系已顯端倪,但這些學生還是沒有把其關(guān)系概括出來,對結(jié)果與結(jié)論不加區(qū)別,直接把結(jié)果當成結(jié)論。
四、討論及結(jié)論
研究發(fā)現(xiàn),運用工作單能夠有效評價學生的科學探究能力。評分者無法從工作單“觀察”到學生的操作細節(jié),而是通過學生記錄在工作單中的文字敘述、數(shù)據(jù)來進行間接推斷。盡管工作單損失了一些探究信息,但保留了大部分探究信息;一些學生的文字能力較差,還有一些學生沒有提供支持結(jié)論的數(shù)據(jù),這可能會導致評分者產(chǎn)生一些歧義,但總的來說評分者信度較高,這些都說明運用工作單能可靠有效地評價學生的科學探究能力。這些發(fā)現(xiàn)表明,科學探究能力是一種具有復雜結(jié)構(gòu)的高層次能力,不僅與探究任務的情境有關(guān),也與學生的背景因素有關(guān)。很顯然,對于這種復雜能力的測評,純化情境、要素分離的紙筆測驗是難以完成的。
(責任編輯 關(guān)燕云)