李玉冰 丁格曼,2
(1.華南師范大學物理與電信工程學院,廣東 廣州 510006;2.華南師范大學物理學科基礎課實驗教學示范中心,廣東 廣州 510006)
哲學家基切爾和薩爾蒙曾說過:“為自然現象提供假設是科學探究的基本目的”.[1]隨著時代發展,科學的本質從探究與實驗逐漸改變為解釋與論證.[2]這樣的社會背景下,在《普通高中物理課程標準(2017年版)》中,科學解釋被納為物理學科核心素養中科學探究的一個重要組成要素.[3]由此可見,基于物理學科背景,評價并診斷學生的科學解釋能力發展情況顯得尤為重要.因此,本研究在Rasch模型的基礎上,開發物理實驗探究過程中的科學解釋能力測評工具,并對測評工具進行質量檢驗,嘗試測評高一學生在物理實驗探究過程中的科學解釋能力,并分析其特點.
筆者初始分析國內外學者對科學解釋、能力、實驗探究的相關研究,[4-7]其中黃蕙歡[7](2017)學者在科學解釋CER框架的基礎上界定了學生物理科學解釋能力.本文沿用該框架,細化界定物理實驗探究過程中的科學解釋能力,即學生在物理實驗探究過程中能利用已有的物理知識和從觀察、實驗或模型中獲取的新證據、對問題或現象通過邏輯推理的方式進行判斷、說明的能力,具體包括實驗論斷提出能力、證據提取能力、科學推理能力和輔助能力,如表1所示將其再進行細分.

表1 物理實驗探究過程中的科學解釋能力
此外,學生在實驗探究過程中的科學解釋能力是所界定的各部分能力彼此作用下的綜合情況,不能簡單地加減各部分能力.
在界定什么是科學解釋能力后,要想測評學生在物理實驗探究過程中的科學解釋能力,還需要對該能力進行水平劃分.考慮到SOLO分類理論具有較強的可操作性,[8]并且可以將質性評價與量性評價相結合,[9]本文結合SOLO分類理論以及《普通高中物理課程標準(2017版)》中學業質量水平部分關于科學解釋的劃分,考慮到抽象拓展水平有時候連專家都不一定可以達到,故將科學解釋能力劃分成4個水平,具體如表2所示.

表2 物理實驗探究過程中的科學解釋能力水平劃分
物理實驗探究過程中的科學解釋能力是一種內隱的、從后天習得的能力類型.該能力可以依據學生回答問題的思維方式進行測量與評價.在比較訪談法、問卷調查法、紙筆測試法等常見且行之有效的測量方法后,考慮到紙筆測試法容易獲取大量數據,并且與學生的適配性較強,測試時學生容易發揮出正常、真實的水平,因此本研究采用紙筆測試法對學生在實驗探究過程中的科學解釋能力進行測評.題目類型選擇開放式問題和封閉式問題相結合.
而為保證所開發的測量工具具有較好的信效度,本文選擇項目反應理論作為理論支撐,其基本思想是展現被測試的對象在各個試題上的回答情況與其內在的某種品質之間的關系,其項目特征曲線就是用來表示這種關系的.[10]如圖1項目特征曲線所示,其顯示具有θ能力的被試者答對某個項目的概率為P.利用該理論建立起具有固定不變的參數的測評項目,統一對比不同的測驗量表分數.

圖1 IRT理論的項目特征曲線
上文已經劃分了學生在實驗探究過程中的科學解釋能力水平層次,而科學解釋在實驗探究過程中主要體現在對實驗進行假設、分析實驗數據、解釋實驗現象和形成實驗結論等環節上.故本研究圍繞科學地解釋實驗情況、對實驗中的變化情景做出解釋性假設、分析實驗證據和總結實驗結論、論證和辯護自己的實驗觀點,通過舉例、使用圖像或模型等方法輔助說明實驗問題等內容進行試題命制.
根據測評內容和要求命制試題后,邀請物理教學研究者和部分骨干教師對試題提出修改意見,并邀請部分學生進行試做后提出答題體驗,結合兩者的意見對試題進行修改后試測.統計試測結果后運用 Winsteps軟件進行數據分析,基于Rasch模型檢驗試題的信度、效度、區分度以及數據—模型擬合參數等,對不符合要求的試題進行修正后再進行實測.
本文在試測對象上選擇高一年級中選修物理科目的A班、B班兩個班級的學生,其中A班為重點班,B班為平行班,該群體學生的物理成績跨越30分到100分,具有較好的代表性.本輪共發放120份試題,回收的有效試卷為70份,試卷的有效回收率為68%.根據各個題目的評分標準,對學生的回答進行賦分,從而得到本研究的數據.
由于本測評工具具有較多的開放性試題,為保證評分者賦分的可靠性,本文運用Kendall's W(肯德爾和諧系數)考查評分者評分的一致性.在評分過程中隨機抽取10份試卷,利用SPSS數據處理軟件統計3位評分者間的肯德爾和諧系數為0.893,漸近顯著性系數為0.004,說明此份試題的評分標準比較公平公正,受主觀因素影響較小(表3).

表3 初測評分者信度統計表
在此基礎上,將所得到的數據輸入Winsteps軟件,檢測所編制的測評工具是否符合Rasch模型.結果表明,該測評工具的整體信度為0.97,分離度為5.70(正常需要大于2),總體的數據—模型擬合參數MNSQ接近1、ZSTD接近0,說明該試題的信度比較理想,同時分離度也較好,符合Rasch模型的要求,可進一步進行分析.而從單維性檢驗上看,試題的總體單維性較好,但有4道試題不符合單維性要求,需要進行調整.而對各道試題進行單獨分析發現,只有項目7的數據與模型不擬合,說明有部分能力水平低的測試對象回答正確,部分能力較好的測試對象卻在此題上回答錯誤.
實測選擇了廣州市某高中高一年級的5個物理班級,其中2個為重點班,3個為平行班.本次共回收130份測評試題,有效份數為112份,有效回收率為86.2%,其中男生樣本57份,女生樣本55份.首先,再次檢驗該試題的有效性和可靠性,其中利用SPSS計算其評分者信度為0.952,漸近顯著性系數為0.002,符合要求.而利用Winsteps軟件計算其信度為0.98,區分度為6.52,除項目9和項目1的非加權標準差均方略超出-2到2的可接受區間外,其余均符合Rasch模型的使用要求.然后繼續檢驗單維性、項目—被試反應、點—測相關系數、模擬標準誤差均大致滿足Rasch模型的使用要求,適合用此模型進行后續分析.
Rasch模型可以通過將原始分轉換為logit得分,將被試能力、項目難度放在同一把量尺上進行比較.表4是實測學生科學解釋能力分布情況的統計數據,樣本學生的最高logit得分和最低logit得分相差3.14,說明測試對象具有較廣的科學解釋能力水平分布;而標準差為0.64,說明測試對象的科學解釋能力水平存在較為顯著的差異.如圖2,依據學生的logit得分繪制各個分數的頻率分布直方圖,可以發現所測對象的科學解釋能力整體呈正態分布.

圖2 學生logit得分的頻率分布直方圖

表4 學生logit得分的描述性統計
另外,本研究根據整體懷特圖來劃分樣本學生在實驗探究過程中的科學解釋能力,劃定的水平分界值具體如下:處于水平4的學生應該是大部分項目得3分的,logit≥1;處于水平3的學生應該大部分項目得2分,-0.67≤logit<1;處于水平2的學生應該是大部分項目得1分的,-1.88≤logit<-0.67;處于水平1的學生,logit<-1.88.
根據劃定的能力值范圍,統計樣本學生數,得到學生在各個能力水平上的百分比如圖3所示.由圖可發現,學生的科學解釋能力水平集中在水平2和水平3,占總人數的94.64%.

圖3 學生實驗探究過程中的科學解釋能力水平分布情況
將所測學生的科學解釋能力得分和其物理成績進行相關分析,運用學生高一上學期期末考試的物理成績作為本次物理成績的衡量標準,該階段學生已經具備此份科學解釋能力測評試題所需的全部知識,且高一上學期期末考試學生相對比較重視,故用此份成績作為學生的物理成績進行分析.
根據圖4的散點圖可以大致看出學生在實驗探究過程中的科學解釋能力與物理成績之間存在線性相關關系.在此基礎上進行科學解釋能力和物理成績間的雙變量相關分析.表5、表6為皮爾遜相關的分析結果.

表5 描述性統計資料

表6 相關性統計數據

續表

圖4 科學解釋能力得分與物理成績的相關散點圖
從表中可以看出,學生物理成績平均分為60.46,能力測評平均分為12.13,雙變量相關性檢驗得到的皮爾遜相關系數為0.475,在0.01水平上顯著相關,說明學生在實驗探究過程中的科學解釋能力與學生的物理成績具有正相關性,平時物理成績較好的學生在實驗探究過程中的科學解釋能力也比較好.這是因為進行科學解釋其實是需要一定的科學知識作為依托的,但兩者間的相關性系數小于0.5,說明并不具備強烈相關性,也就是并不是平時物理成績好的學生就一定具備良好的科學解釋能力.
將男生和女生的科學解釋能力進行獨立樣本T檢驗,看看兩者之間是否存在顯著性差異.
從表7中數據上看,男生的科學解釋能力平均值為12.44分,女生的科學解釋能力平均值為11.82分,男生的能力均值比女生高0.62分,說明男生的表現比女生稍微要好.但從方差齊次檢驗結果顯示,如表8中數據,對于學生的能力水平,其F值為0.942,顯著性概率為0.334,大于顯著性水平0.05,符合方差齊次.而均值方程的t檢驗結果顯示,雙側顯著性概率為0.417,大于0.05,說明男生和女生之間在實驗探究過程中的科學解釋能力無顯著性差異.

表7 不同性別學生實驗探究過程中科學解釋能力的描述性統計

表8 獨立樣本T檢驗
考慮到物理課堂是學生實驗探究過程中的科學解釋能力的主要培養陣地,本研究設計了針對教師的科學解釋能力培養調查問卷.該問卷涉及對科學解釋的認識和科學解釋的培養現狀兩方面的內容,經過一周的網絡問卷發放后,共回收81份有效問卷,其中教齡10年以上的教師占69.51%,35.37%的調查對象是高級教師,40.24%的調查對象是中學一級教師.他們多是教學經驗豐富的教師,對中學物理教學較為熟悉.
將調查結果回收統計發現,高達91.36%的教師認為在實驗探究過程中很需要科學解釋能力,肯定了培養學生科學解釋能力的重要性,但實際上仍有54.32%的教師對科學解釋了解甚少.而在培養現狀上,61.73%的教師認為自己在日常教學中會較為注重學生科學解釋能力的發展,但仍會因考學壓力、課時緊張、系統性理論指導的匱乏以及沒有具體的實施方案等多種影響因素,無法順利培養學生的科學解釋能力.
本文以測評學生在物理實驗探究過程中的科學解釋能力為目標,構建測評框架并開發相應的測評工具,通過檢驗發現設計的測評工具符合Rasch模型的相關質量指標,具有可信度.而分析被試在實測過程中的科學解釋能力表現可發現,總體來看被試在實驗探究過程中的科學解釋能力得分呈正態分布,絕大多數學生都處于水平2和水平3,并且其能力與物理成績具有正相關性,但并不是強烈相關.雖然男生被試在實驗探究過程中的科學解釋能力測試得分略高于女生被試,但不同性別的被試在實驗探究過程中的科學解釋能力無顯著性差異.而從被試的答題情況上分析發現具有3點不足:一是被試在解釋過程中依賴于定性分析,定量解釋上欠缺明顯;二是部分學生在科學解釋過程中難以抓住關鍵研究量,避開干擾量;三是部分學生在嘗試解釋過程中存在證據與推理混亂的現象,無法準確獲取證據信息并運用其進行推理解釋.
科學解釋能力作為物理核心素養中的重要組成部分,將會影響學生的未來成長以及對復雜問題的應對情況.而物理課堂是學生實驗探究過程中的科學解釋能力的主要培養陣地,在剖析教師調查數據后可察覺,部分教師不太了解科學解釋,自身對于科學解釋的知識儲備也不足,雖能意識到科學解釋的重要性但缺乏實踐,因此提出以下建議.
(1)吸納相關知識,聯動互補共建.
培養學生的科學解釋能力首先需要教師具備充足的科學解釋知識,筆者認為可以從教師的繼續教育出發:一方面是可以利用線上、線下等多種形式進行科學解釋的相關研討,疫情期間各大線上會議軟件的頻繁使用,無疑也給現階段的教學研討提供新的方式,通過組織線上的分享會、研討會聯系教師們進行科學解釋材料的相關分享與研讀;線下則可以參與各地的名師工作室、教師培養計劃等,從中汲取相關知識,使科學解釋培養有法可施、有路可循;另一方面是教育主管部門或學校可以適當召開關于科學解釋培養、核心素養解讀的相關教育培訓,有意識地為提高學生的科學解釋能力出謀劃策,落實立德樹人的培養目標.
(2)顯化科學解釋,營造解釋氛圍.
要想培養學生的科學解釋能力,最先要在課堂上顯化科學解釋,讓學生知道科學解釋包括論斷、證據、推理等三要素,并且要嘗試運用教學語言為學生們示范如何進行科學解釋,引導學生在之后的實驗探究環節中如何形成有依據的論斷、如何獲取證據、如何從證據中總結規律、如何基于有效的邏輯推理解釋實驗現象或結論等,在實驗探究的過程中落到實處、強化培養學生的科學解釋能力.此外,在教學中,教師可以適當改變以往傳統的命題方式,創設情景設計結構不良試題,引導學生在解決真實物理問題的過程中鍛煉科學解釋.