冷 靜 路曉旭
(華東師范大學 教育學部教育信息技術學系,上海 200062)
批判性思維作為21世紀人才必備能力,有助于人們在信息社會開展有邏輯、獨立的思考,甄別信息并快速作出決定(Reinstein et al., 2008)。批判性思維能力作為核心素養(yǎng)的重要組成部分,是我國教育現(xiàn)代化建設的戰(zhàn)略重點(褚宏啟,2016)。批判性思維能力包括分析、綜合和評估辨別信息的技能以及運用這些技能的傾向(National Center for Excellence in Critical Thinking Instruction, 1991)。對于學生來說,他們只有具備批判性思維能力,才能更好地理解和掌握學科知識,以及在真實的情境中運用這些知識解決具體問題(冷靜等,2018)。
盡管人們普遍認為培養(yǎng)學生的批判性思維能力十分必要,但對批判性思維的可教性以及如何培養(yǎng)批判性思維能力的討論一直存在爭議。一方面,研究者認為通過教學提高學生的批判性思維,效果甚微(Mcmillan, 1987;Jonassen, 1999)。另一方面,研究者認為批判性思維可以通過設計特定而系統(tǒng)的教學來培養(yǎng)(Pascarella et al., 2006)。當前,國內外已有許多學校將批判性思維能力的培養(yǎng)納入教學過程,并通過實證研究檢驗了教學干預對學生批判性思維的影響。然而,這些研究的實驗結果差異較大,主要有以下兩種截然相反的結論:一類研究結果表明,教學干預能有效促進批判性思維的提升。例如,有研究者以九年級學生為對象,在編程課中采用基于同伴評閱的在線教學策略學習。實驗結果證明,此策略能夠提高學生的批判性思維能力(Wang et al., 2017),再如,蒂魯內等(Tiruneh et al., 2015)采用前測后測準實驗設計在科學與技術課上實施系統(tǒng)設計“問題”教學策略,結果顯示,實驗組的得分顯著高于控制組;另一類研究結果則表明,教學干預是無效的。例如,內伯等(Naber et al., 2014)利用反思性寫作策略提高學生的批判性思維能力。然而,準實驗結果證明不能顯著提高學生的批判性思維能力。阿克于茲等(Akyüz et al., 2009)在課程設計課中采用混合式教學策略開展實驗,結果表明,前后學生的批判性思維能力不存在顯著差異,混合式教學策略無效。那么,批判性思維真的可教嗎?教學干預的有效性是否受學段、學科、實驗周期、實驗人數(shù)、技術介入與否、國家區(qū)域以及不同測評方式的影響?僅僅個別的實證研究對總體上理解教學策略是否有效是沒有幫助的。因此,本研究采用元分析方法分析教學干預對學生批判性思維的影響,并觀察不同調節(jié)變量對批判性思維提升效果的影響。
綜上,本研究分析與梳理了近十年國內外教學干預對學生批判性思維影響效果的79項實驗與準實驗研究,審視與評價教學干預對學生批判性思維能力的實際作用,以期為相關研究者了解有效的教學策略,開展后續(xù)研究與實踐提供借鑒和指引。
為確保有效性和可靠性,本研究檢索的文獻為Web of Science核心數(shù)據(jù)庫的期刊論文,以及中國知網(wǎng)(CNKI)收錄的中文社會科學引文索引(CSSCI)來源期刊論文。Web of Science的主題檢索詞包括:1) “critical thinking” 和 “pretest” 或 “posttest” ;2) “critical thinking” 和 “control group” 或 “quasi experiment” ;分類選擇education, educational research,和education scientific disciplines,文獻類別選擇article,檢索時間選擇2009年至2019年,檢索得到736篇文獻。研究者依據(jù)以下關鍵詞在中國知網(wǎng)進行主題檢索:1)“批判性思維”和“準實驗”;2)“批判性思維”和“實驗”;3)“批判性思維”和“前后測”,檢索時間為2009年至2019年,檢索得到502篇文獻。
由于檢索到的文獻并不全部符合要求,研究者對文獻又進行了篩選:1)研究方法為實驗研究或準實驗研究,排除綜述性文章及理論性文章;2)研究主題為教學方法或策略對學生批判性思維的影響;3)實驗對象僅為在校學生,排除對象為成人學習者的文獻;4)關注的是教學干預對學習批判性思維能力的提升效果,故文章應報告測量工具及評價指標;5)研究結果有充足的數(shù)據(jù)信息,如平均值、方差、t值及p值等,有可靠的統(tǒng)計數(shù)據(jù)結果,可以據(jù)此計算平均效應值,排除無法計算效應值的文獻;6)排除重復文獻,若同一篇文獻在不同期刊,或以不同形式發(fā)表,只取其一。樣本篩選完成后,共有79篇文獻符合標準。由于有的研究存在多組對照組與實驗組,有的衡量了批判性思維技能與傾向兩個方面,最終統(tǒng)計得到的有效效應值為103個(周榕等,2019)。
為了方便后期統(tǒng)計分析,本文對原始文獻的各項特征值進行了編碼,統(tǒng)計文獻作者、年份、地區(qū)、學段、學科、樣本量、實驗周期、教學干預、測評工具。由于批判性思維分傾向和技能兩個維度,因此本研究在教學效果上分傾向和技能兩方面展開。本研究將學段分小學、初中、高中和大學四個階段;在學科編碼上,將效應值在2個及以上的列為獨立學科,效應值不足2個且無法歸類為上述課程的被列為其他學科(如會計、商店管理與規(guī)劃、新聞文本閱讀等);教學干預在多學科課程實施的列為綜合課程,教學干預類型分有無技術介入兩類;在國家區(qū)域編碼上,按照東西方國家進行編碼;在測評工具編碼上,將經(jīng)典的量表編碼為標準化測試,其他為自編測驗。為保證編碼的準確性,兩位編碼者分別對20篇文獻(占總數(shù)的25%)進行預編碼,編碼結果的一致性為0.85,說明編碼的結果是可靠的。
元分析法是一種量化分析法,能夠根據(jù)以往的研究結果計算效應值,定量分析整體和系統(tǒng),揭示同類研究的分歧與共性,從而得出普適性和規(guī)律性的結論(Bowman, 2012)。元分析可以用系統(tǒng)的方法將不同研究結果和矛盾的研究結果進行定量合成得出結論(王翠如等,2018)。本研究采用綜合性元分析軟件進行數(shù)據(jù)處理,計算效應值。效應值是一種標準化度量標準,表示兩組平均值(通常是對照組和實驗組)之間的差異。科恩(Cohen,1988)提出的效應值計算方法為:
這個基本方程具備兩種情況的效應值計算:一種用于報告實驗組和對照組的預測試數(shù)據(jù)研究,另一種用于單組的預測試后設計。在其他情況下(如t檢驗、F檢驗、p水平),效應量指標根據(jù)赫奇斯等人(Hedges et al., 2009)提供的轉換公式估計。
由于不同研究實驗或準實驗的設計不同以及部分研究的樣本量較小,本研究采用赫奇斯效應值估計平均差,以消除樣本大小和不同實驗設計對估計值的影響,函數(shù)關系式如下(Borenstein et al., 2009):
標準誤差用以下公式計算:
本研究基于赫奇斯效應值計算出103個效應值的漏斗圖(見圖1)。橫軸表示赫奇斯效應值,縱軸表示效應值的標準誤。漏斗圖的中上部分是有效區(qū)域,中線表示平均效應值。從圖1可以看出,絕大多數(shù)研究的效應值落在漏斗圖的上部有效區(qū)域內,且相對均勻地分布在漏斗圖的平均效應值兩側,這說明存在出版偏差的可能性較小。以埃格(Egger)回歸法和貝格(Begg)的秩相關法對發(fā)表偏倚進行檢驗,結果為:t=3.946,p<0.001;Begg檢驗結果為:t=0.243,p<0.001,說明可能存在發(fā)表偏倚。

圖1 元分析漏斗圖
異質性檢驗結果顯示,Q值為1023.235,且統(tǒng)計結果達到顯著水平(p<0.001),說明各項研究之間存在異質性。研究采用I2統(tǒng)計量方法判斷樣本異質性程度。通常,I2>75%時采用隨機效應模型,0≤I2≤75%時采用固定效應模型消除異質性(Borenstein et al., 2009)。本研究中,I2=90%,即90%的異質性由效應值的真實差異造成,10%的異質性由誤差導致。真實差異導致異質性出現(xiàn)的原因可能是:實驗周期、研究學段、研究學科、國家區(qū)域、研究時間等。本研究中,由于79項元分析樣本的異質性結果大于75%,故采用隨機效應模型(Random Effects)評估教學干預對學生批判性思維提升的作用。
1.整體效應值
本研究通過計算79項研究的效應值及使用標準化測量作為結果變量,得出元分析教學干預對批判性思維的整體影響。科恩認為,當效應值在0.8以上時,教學干預對批判性思維提升的影響很大;當效應值在0.5左右時,具有中等影響;當效應值在0.2左右時,影響較小(Borenstein et al., 2009)。本研究計算的合并效應值g=0.683(p<0.001),介于0.5~0.8間,為中等偏上。因此,總體上教學干預對學生批判性思維能力的提升效果顯著。
2.教學干預對批判性思維技能和傾向的影響
教學干預對學生批判性思維的影響分技能和傾向兩個維度。結果顯示,傾向和技能維度的效應值分別為0.653(p<0.001)及0.732(p<0.001),說明教學干預對學生批判性思維的傾向和技能有中等偏上的正向顯著影響。異質性檢驗結果(Q=0.034,p=0.853)表明:學生批判性思維傾向和技能之間不存在顯著差異。這說明教學干預對學生批判性思維傾向和技能的影響效果是同等的。
1.不同學科中批判性思維教學有效性的差異
不同學科中教學干預對批判性思維提升效果的差異分析見表一。從結果可以看出,目前絕大多數(shù)學科采取的教學干預都是有效的。不同學科中教學干預對提升學生批判性思維的效果見表三,各學科的最終效應值最高的三位依次是數(shù)學(g=1.069,p<0.05)、科學(g=1.062,p<0.001)和物理(g=0.959,p<0.001)。從整體來看,各學科的教學干預對批判性思維作用的效應值大部分在0.5以上,說明大部分學科的教學干預都是有效的,且效果值偏高。也有個別學科未達到統(tǒng)計意義上的顯著,如生物。組間效應值結果(Chi2=19.788,p=0.019)顯示,不同學科的教學干預對學生批判性思維存在顯著差異。

表一 不同學科中批判性思維教學有效性差異

表二 文理科中批判性思維教學有效性差異
研究者進一步對學科再次進行編碼,將數(shù)學、計算機、生物、科學、綜合等編為理科,英語、教育學等編為文科,其他學科按照其教學內容進行編碼。文理科中批判性思維教學有效性差異見表二。結果顯示,文科、理科之間不存在顯著差異,但是在理科中開展批判性思維教學,效果稍優(yōu)于文科。
2.不同學段的批判性思維教學有效性差異
為了檢驗不同學段學生批判性思維教學效果差異,本研究對四個學段進行了效應值計算。不同學段的批判性思維教學效果的差異分析見表三。結果顯示,所有學段的效應值都大于0.5,且都達到了顯著性水平。這說明不同學段的教學干預對批判性思維提升具有正向顯著的影響。具體來看,高中階段的教學干預的效應值最高,為1.273(p<0.001),超過1,說明教學干預在高中階段對學生批判性思維具有高度的正向影響;小學、初中階段的效應值接近0.8,說明教學干預對初中和小學階段學生的批判性思維提升效果較好;大學階段的效應值在0.5左右,說明教學干預對大學生批判性思維的提升效果具有中等正向的影響。組間效應值結果顯示(Chi2=10.148,p<0.05),不同學段之間存在顯著差異,不同學段的批判性思維教學效果有所不同,高中學段的提升效果最強。
3.不同實驗周期批判性思維教學有效性差異
為檢驗不同實驗周期對批判性思維教學有效性的影響,本研究將實驗周期分三個時長進行比較。三類實驗周期對批判性思維提升效果的差異分析見表四。結果顯示,所有涉及實驗周期的效應值均大于0,說明三種實驗周期對學生學習成果都具有顯著正向影響。其中,實驗周期為“半年以上”的效應值高達0.995(p<0.001),說明半年以上的實驗周期對學生批判性思維提升產(chǎn)生了高度的正向影響;實驗周期為“2個月到半年”的效應值為0.711,表明2個月到半年的實驗周期對學生批判性思維的提升產(chǎn)生了中等偏上的正向影響;2個月內的實驗周期的效應值為0.455,說明具有中等影響。組間效應值檢驗結果(Chi2=6.455,p<0.05)顯示,不同實驗周期對學生批判性思維的教學效果存在顯著差異,也就是說,不同實驗周期對學生批判性思維的提升效果不同,教學時間越長,學生批判性思維的提升效果越好。

表三 不同學段中批判性思維教學有效性的差異

表四 不同實驗周期下批判性思維教學有效性的差異

表五 不同實驗人數(shù)批判性思維教學有效性的差異
4.不同實驗人數(shù)批判性思維教學有效性差異
本研究將實驗人數(shù)分為1~30人、31~50人及50人以上三個類別,三個不同實驗人數(shù)規(guī)模的效應值見表五。元分析結果顯示,三個規(guī)模的實驗效應值都在0.5以上,且都達到了顯著性水平,說明不同規(guī)模的實驗人數(shù)對批判性思維具有中等偏上的顯著正向影響。組間效應值結果顯示(Chi2=1.625,p=0.444),不同實驗人數(shù)規(guī)模不存在顯著差異。這說明教學干預的影響效果在不同實驗人數(shù)上不存在差異,具有同等的影響效果。
5.技術介入與否對批判性思維教學有效性的差異
本研究將教學干預的類型分為有無技術介入,技術介入與否對批判性思維教學有效性的差異分析見表六。結果顯示,效應值都在0.5以上,說明不論有無技術介入,教學干預都對學生批判性思維的提升存在正向顯著影響。分析Chi2組間值發(fā)現(xiàn),有無技術介入的教學手段之間對學生批判性思維的提升不存在顯著性差異(Chi2=2.217,p=0.137)。
6.東西方國家批判性思維教學有效性差異
為了檢驗教學干預在不同國家(或)地區(qū)的適用性,本文將原始數(shù)據(jù)編碼為東西方國家兩個類別。東西方國家的批判性思維教學有效性差異分析見表七。結果顯示,東西方國家的效應值分別為0.794(p<0.001)和0.419(p<0.01),說明東西方國家的批判性思維教學干預對能力提升具有正向影響。尤其是,東方國家的效應值接近0.8,說明教學干預的效果非常好。組間值顯示,東西方國家的教學干預對批判性思維的提升作用存在顯著差異(Chi2=5.367,p=0.021)。

表六 技術介入與否對批判性思維教學有效性的差異

表八 不同測評工具對批判性思維教學有效性的差異
7.不同測評工具對批判性思維教學有效性的差異
為了檢驗不同測評工具的適用性,本文將測評工具編碼為標準與自編測驗兩類。不同測評工具對批判性思維提升作用的差異分析見表八。結果表明,兩種測評工具的效應值都在0.5以上,且都達到了顯著性水平,說明兩種測驗對批判性思維具有正向顯著的影響。標準化測評工具效應值為0.561(p<0.001),具有中等程度的影響,而自編測驗的效應值是1.282(p<0.001),具有高度的影響。組間效應值檢驗結果Chi2=13.795(p=0.000),說明標準化的測試工具與自編測驗之間存在顯著差異。
本文采用元分析對79篇實驗或準實驗研究進行分析,得到如下研究結論:
1)教學干預對學生批判性思維具有顯著提升作用。教學干預對學生批判性思維的傾向和技能都有顯著影響。這說明存在有效的教學策略來培養(yǎng)學生的批判性思維。國外的元分析研究也支持本文的結論(Abrami et al., 2015; Niu et al., 2013)。
2)不同學科領域都有提升批判性思維的有效策略。其中,數(shù)學學科效果最好,而生物效果較弱;文理科對批判性思維的影響沒有顯著差異。部分學科的效應值未達顯著性水平,可能與樣本數(shù)量不足和研究方案的設計有關。
3)任一教育階段對批判性思維教育都能起到促進作用,但影響效果在不同學段存在顯著差異。分析結果顯示,對小學、初中、高中和大學階段的學生進行教學干預后,其批判性思維能力都有顯著提升;高中階段效果最佳,大學階段的教學效果最弱。這在一定程度上符合之前一項元分析的研究結果。小學生與中學生無顯著性差異,但均顯著高于本科生(Abrami et al., 2008)。這一現(xiàn)象說明,批判性思維教學在小學、初中的效果較好,高中階段則是培養(yǎng)學生批判性思維的最佳時期,這可能與學生的認知發(fā)展相關。
4)不同實驗周期對學生批判性思維教學的效果存在顯著差異,實驗周期越長,批判性思維的提升效果越明顯。研究結果表明,最有效的干預措施需持續(xù)8周以上。這一結果說明,高階思維能力不能在短時間內獲得大幅度提高,只能通過長期的努力培養(yǎng)。這一結果支持了貝哈爾霍倫斯坦(Behar-Horenstein,2011)的觀點。
5)不同人數(shù)對批判性思維的教學有效性不存在顯著差異,即不同規(guī)模班級的教學效果都差不多。因此,開展具體教學時,無需考慮班級規(guī)模的大小。
6)技術介入與否對批判性思維教學效果的影響不明顯。由此可見,以往十年的研究中技術的使用并未對教學效果產(chǎn)生顯著影響。產(chǎn)生這一現(xiàn)象的原因可能是學生在技術介入的課程中缺乏充足的時間開展批判性思維和探究性學習。因此,無論有無技術干預,都需要鼓勵和激發(fā)學生的批判性思維(Arnold et al., 2018)。
7)東西方國家對批判性思維教學有效性存在顯著差異,東方國家的教學效果明顯高于西方國家,原因可能是,相較西方國家,東方國家的批判性思維標準化測試起點低,因此有更多的提升空間(Huber et al., 2016)。由此聯(lián)系到東西方文化的差異,東方國家有 “為考試而學習”的共同社會文化,重視學科知識的掌握,而對批判性思維能力的培養(yǎng)重視程度不夠;西方國家已開設專門的批判性思維課程,將批判性思維能力的培養(yǎng)作為教育的目標(李晶晶等,2019)。
8)不同測評工具對批判性思維教學有效性存在顯著差異,自編量表測評的批判性思維的提升效果明顯高于標準的測評工具。這一結果支持了安德森等人(Anderson et al., 2001)的觀點,使用標準化的批判性思維測量工具通常無法測得批判性思維能力的增長,原因可能是批判性思維的教授大多與特定的學科內容相結合,標準化的測量無法衡量學生在具體領域中使用到的批判性思維技能,故而提升效果不明顯;自編量表大多結合特定的學科領域內容,因此更容易測得批判性思維能力的提升效果(Tiruneh et al., 2018)。
綜合對批判性思維教學效果元分析結果的討論,本研究提出以下建議:
第一,拓寬批判性思維與學科融合的范圍。本研究發(fā)現(xiàn),批判性思維主要應用在醫(yī)學、英語、物理學科,極少有學者在文學和藝術(如語文、歷史、美術等)學科中教授批判性思維,但不同學科性質對批判性思維的影響不具有差異性,因此,教學者應將批判性思維充分融入各學科,考察學科與批判性思維之間的關系,設計能夠提高學生批判性思維的教學方式與模式,打破批判性思維在學科上的壁壘,提高學生的各種核心素養(yǎng)(鄧莉等,2019)。例如,為培養(yǎng)學生的批判性思維,美國中小學的多種學科教材都設有獨立且完整的批判性思維專欄及專題活動。
第二,應把批判性思維的教授引入基礎教育,并保持教學的連續(xù)性與系統(tǒng)性。近十年來,大學階段的批判性思維研究成果較多。但是,元分析結果表明,批判性思維的提升效果在高中階段最佳,大學階段最低。因此,教學人員應積極在基礎教育階段開展教學實驗,為批判性思維在基礎教育的教授提供理論依據(jù)。另外,應將批判性思維的教學融入現(xiàn)有學科中,將其貫穿于整個教育體系。批判性思維屬于高階思維,需要長時間的教授才能產(chǎn)生明顯效果。
第三,在批判性思維的教學中,教師不應盲目地追趕技術潮流而摒棄傳統(tǒng)的教授方法。首先,教師應根據(jù)學習階段和學習內容選擇學習策略,增強學習的有效性(彭正梅等,2019)。同時,教師選擇教學策略要考慮學習環(huán)境的結構要素和特征,設計以培養(yǎng)批判性思維為導向的創(chuàng)新性學習環(huán)境(戚業(yè)國等,2020)。其次,若將技術引入進教學,教師應考慮學生對技術的接受程度以及該內容是否適用于批判性思維教授的內容,同時也要明確技術提升批判性思維的機理,這樣才能夠更好地設計將技術融入學科內容的教學策略(畢景剛等,2020)。再者,教師應該注重培養(yǎng)人的認知與情感的統(tǒng)一,實現(xiàn)學科特色、主體人典型特征與素養(yǎng)教育核心培養(yǎng)目標之間的互動與聯(lián)系(顏士剛等,2018)。
第四,使用多元的測評工具測量批判性思維的變化。測評工具是影響學生批判性思維的教學有效性的變量之一。因此,教學者需要關注測評工具的選擇,教師可以先采用經(jīng)典量表和自編量表,但是量表的編制和改編應考慮本土學生的思維過程和習慣,以及語言、文化、成長環(huán)境和社會背景等(沈紅等,2019)。除使用經(jīng)典量表,也應該關注結合學科內容或具體問題情境的測評工具,如游戲測評方式(冷靜等,2020)。
綜上,本研究采用元分析方法,通過綜合分析已有的研究數(shù)據(jù),得出了教學干預對學生批判性思維作用的綜合效應值,用量化結果表明了批判性思維是可教的,并發(fā)現(xiàn)學科、學段、教學周期、技術介入、東西方文化以及測評工具對學生的批判性思維的教學效果具有一定的調節(jié)作用。
本研究局限性在于:由于數(shù)據(jù)庫選取的原因,樣本量有限。元分析方法屬于探索性分析工具,得出的結果是推斷性結論,且受調節(jié)變量的影響,因此在使用其結論時仍需謹慎(王翠如等,2018)。另外,圍繞批判性思維是否適用于具體學科,恩尼斯主張將教學干預分成四種方式(Ennis,1989):一般方法(general approach)、灌輸法、沉浸法以及混合法。之前的元分析中也使用了這種分類來分析哪種教學干預更有效(Abrami et al., 2008; Abrami et al., 2015)。然而,本研究選取的研究樣本中,很多研究并沒有使用恩尼斯(Ennis,1989)的分類方法,因此本研究沒能對教學干預進行詳細劃分。