






摘 " 要: 為探究STEM教育對學生數學學業成就的影響,本研究采用元分析方法對國內外43項相關主題的實證研究進行系統分析。研究發現,STEM教育對中小學生數學學業成就具有中等偏上的正向影響,能夠顯著地積極促進學生數學認知、數學能力以及數學情感的發展。此外,STEM教育對中小學生數學學業成就的作用效果受不同年代、學段、樣本規模、國別、班級規模、實踐方式、教學場所及實驗周期的影響,但不受男性占比、女性占比、測試類型、教學方法及出版類型的調節作用。
關鍵詞: STEM教育;數學學業成就;元分析
一、問題提出
STEM教育作為一種培養創新型人才的教育范式,自1986年被首次提出以來,迅速風靡美國、韓國、英國等國家,成為全球性的教育發展戰略。1 然而,學界關于STEM教育效果的評價褒貶不一,對其影響因素的探討也尚未達成共識。2 眾多研究者圍繞“STEM教育能否提升學生數學學業成就”這一核心議題開展了大量實證研究,但所得結論卻各不相同。數學學業成就是指學習者通過階段性學習后所輸出的數學成果表現,集中體現在數學認知、數學能力、數學情感等方面的發展,是衡量教育過程有效性的重要指標。3 有研究表明,STEM教育能夠顯著提升學生的數學學業成就。45 但也有研究指出,STEM教育對學生的數學學業成就無顯著影響;1 甚至還發現,STEM教育效果明顯差于傳統教育。23
上述研究結論呈現爭議態勢,這導致STEM教育對學生數學學業成就的影響效果仍難以闡釋,可以推測二者并非直接的因果關系,還可能受到多個邊界條件的制約。4 鑒于此,本研究采用元分析方法整合梳理相關實證研究成果,評估和分析STEM教育與數學學業成就間的總體影響強度,探析潛在的調節因素,以期澄清二者關系,得出科學合理的結論,為后續開展STEM教育的研究與實踐提供依據。
二、研究設計
1.研究方法與工具
元分析(Meta-Analysis)是對同一研究主題的多項獨立研究結果進行二次分析的量化研究方法。5它通過匯總計算各項研究的平均效應量,分析異質性來源,探尋出結論不一致的單項研究之間的共性,從而獲取更具可靠性和穩健性的研究結論。本研究主要采用元分析軟件Comprehensive Meta-Analysis Version 3.0(以下簡稱“CMA 3.0”)作為數據分析工具。
2.研究過程
(1)文獻檢索
為獲取盡可能全面的文獻樣本,本研究共進行兩輪文獻檢索。第一輪,依據布爾檢索規則進行數據庫檢索。其中,英文文獻檢索主要使用Web of Science、Springer Link、EBSCO、ProQuest Dissertations amp; Theses四個數據庫,檢索主題詞分為3組,第一組為“STEM”“STEM Learning”“STEM Teaching”“STEM Education”“Integrated STEM Education”,第二組為“Math”“Mathematics”“Mathematical”,第三組為“Achievement”“Record”“Performance”“Competence”“Learning Outcomes”“Ability”“Emotion”“Attitude”“Capacity”,組內主題詞以布爾運算“OR”組合,組間用“AND”組合。中文文獻檢索主要使用中國知網、萬方和維普三個數據庫,檢索主題詞也分為3組,第一組為“STEM”,第二組為“數學”,第三組為“學業成就”“成績”“態度”“能力”“學業表現”“學習效果”,檢索詞的布爾運算規則與英文檢索一致。第二輪,采取引文回溯法對已獲文獻的參考文獻進行追溯補充。采用上述檢索策略獲得文獻4396篇,導入excel軟件清洗后,最終得到文獻3971篇,檢索時間截至2024年5月10日。
(2)文獻遴選
鑒于檢索到的文獻并不都符合此次元分析的要求,此次研究制訂文獻遴選標準如下:研究主題為STEM教育對學生數學學業成就的影響,研究對象為中小學生,研究類型必須是實驗或準實驗研究,研究數據信息完整,確保能夠準確計算出效應量。依據上述遴選標準,有43項獨立研究符合要求被納入分析,共獲得70個效應量。
(3)特征值編碼
本研究借鑒了李珍、曾昭炳、許靜等人在STEM整體元分析研究中采用的調節變量方案,并結合43個樣本文獻的共性特征,選取了出版類型、樣本規模、測試類型等13個調節變量,其具體編碼說明如表1所示。123 整個編碼工作由兩名研究者以“背靠背”的方式獨立完成,一致性系數為0.879>0.75,表明編碼結果具有較高的可信度。對于不一致的編碼,兩人協商討論予以修正。
(4)元分析框架
由于此次研究納入的樣本文獻數量較少,故以Hedges’s g(以下簡稱“g”)作為效應量估計指標,以提高研究結果的精確度。依據布盧姆的教育目標分類理論,將STEM教育對學生數學學業成就的作用效果具體劃分為數學認知、數學能力、數學情感三個維度,形成如下元分析框架(見圖1)。
針對現有研究存在的問題,按照圖1呈現的研究框架開展元分析,以期回答如下關鍵問題:
問題1:整體而言,STEM教育能否真正提升中小學生的數學學業成就?若能,其作用效果的程度如何?
問題2:具體而言,STEM教育能否促進中小學生數學認知、數學能力以及數學情感的發展?若能,其作用效果的程度如何?
問題3:不同調節變量是否會影響中小學生在STEM教育中所獲得的數學學業成就?
問題4:若有調節變量存在顯著影響,具體哪些維度更有助于提升中小學生的數學學業成就?
三、研究結果
1.主效應檢驗
為探究STEM教育對學生數學學業成就的整體影響,本研究運用CMA 3.0進行了累積元分析檢測,結果如表2所示。異質性檢驗顯著,意味著各樣本間存在異質性,I2=91.91%>75%,表明異質性極高,需要采用隨機效應模型進行計算,以保證分析結果的科學性。從表2可以看出,合并效應量g=0.389,且p<0.001,達到統計顯著水平。根據科恩(Cohen)提出的效應量分類標準1,g=0.389>0.2,表明STEM教育對學生數學學業成就具有中等程度的積極正向作用。
本研究進一步分析STEM教育對數學學業成就的影響差異,結果如表3所示??梢钥闯?,STEM教育對學生數學學業成就的效應作用由大到小依次為:數學能力(g=0.783)>數學認知(g=0.325)>數學情感(g=0.316)。其中,對數學能力具有中上等效應,對數學認知和數學情感也有中等程度的促進作用。組間檢驗結果顯示,Q=4.445,且p>0.05,表明STEM教育對數學學業成就不同維度的影響沒有顯著性差異。
2.調節效應檢驗
調節效應檢驗分為元回歸分析和亞組分析兩類,其中,元回歸適用于連續變量的研究,亞組分析適用于分類變量的研究。納入元分析的調節變量中,數據類型為連續變量的有年代、男性占比和女性占比,其余10個變量均為分類變量。
(1)元回歸分析
元回歸分析分別將年代、男性占比和女性占比作為預測變量,考察3個變量對STEM教育與數學學業成就關系的影響,結果如表4所示。從年代來看,回歸系數為0.049,且p<0.05,說明年代能正向顯著預測STEM的教育效果。從男女性別占比來看,p值均大于0.05,說明男性占比或女性占比未能起到顯著的調節作用。
(2)亞組分析
為探究出版類型、學段、測試類型等10個分類變量對STEM教育與數學學業成就關系的影響,本研究進行了相應的亞組分析,結果如表5所示。由表5可知,學段(Q=9.058,p<0.05)、樣本規模(Q=24.899,p<0.001)、國別(Q=55.952,p<0.001)、班級規模(Q=7.106,p<0.05)、實踐方式(Q=12.830,p<0.001)、教學場所(Q=4.348,p<0.05)、實驗周期(Q=28.220,p<0.001)能夠顯著調節STEM教育與學生數學學業成就的關系,而在不同出版類型(Q=0.280,p>0.05)、測試類型(Q=0.733,p>0.05)、教學方法(Q=5.991,p>0.05)等條件下,STEM教育的作用效果沒有顯著差異。
3.發表偏倚檢驗
本研究運用漏斗圖法對發表偏倚進行評估,發現標準線兩側的研究樣本點明顯不對稱,Egger回歸檢驗結果也呈現顯著性,說明可能存在發表偏倚。但是安全系數N=5151,遠大于規定標準5k+10(k為納入研究的文獻數量,k=43),意味著研究樣本不存在明顯偏倚,研究結果較為穩健。1 鑒于此,采用剪補法對效應量進行修正,修剪后的g=0.529(95%CI,0.387—0.670),在一定程度上消除了發表偏倚對分析結果的影響。
四、結論與討論
1.STEM教育對中小學生的數學學業成就具有正向作用,顯著體現在數學認知、數學能力及數學情感三個層面
元分析結果顯示,修正后的效應量處于中等偏上水平,表明STEM教育對中小學生數學學業成就具有顯著正向影響。研究結論支持了“STEM教育能夠提升學生數學學業成就”23 這一觀點。但是,之前的研究都是通過學科的亞組分析來整體考察STEM教育對學生數學成績的影響,未能從更精細、更全面的角度揭示STEM教育的作用機理,也沒有關注STEM教育與數學學業成就亞指標之間的關系。因此,可以認為本研究的結論更加穩健可信,對STEM教育與數學教育相融合的建設與實踐更有參考意義。
STEM教育對學生數學能力的促進作用最大,達到中上等效應,對數學認知和數學情感也有著中等程度的積極影響。組間檢驗結果不顯著,說明STEM教育對數學學業成就不同維度的影響較為穩健。STEM教育的最終目標,就是培養學生適應未來社會發展需求的必備能力。作為一種全新的教育范式,STEM注重打破學科壁壘,給予學生完整的知識學習,使他們像科學家一樣經歷完整的科學求證過程。在此過程中,學生以團隊協作的方式綜合運用多學科知識完成課程任務,積極主動地投入增強技能活動中,有助于提升問題解決、合作探究、批判創新等高階思維能力。由此可見,能力的發展是STEM教育的重要旨歸,這也解釋了為什么STEM教育對數學能力的作用效果更強。
然而,STEM教育對數學認知和數學情感的影響相對較弱,究其原因可能有三點:一是將數學認知和數學情感作為數學學業成就進行報告的樣本文獻中,呈現小效應量和負效應量的研究比例大于中上等效應量的比例,合并效應量的過程中存在正負抵消現象,導致總效應量偏?。欢荢TEM學習任務和學習材料的多維性與抽象性容易給學生帶來較大的認知負荷,阻礙了學生圖示的建構,進而影響他們的數學認知和數學情感;三是囿于教師STEM素養整體水平不高,在跨學科整合設計中容易出現數學學科知識的結構性缺失,致使STEM學習任務中的數學學科代表性不足,學生難以感知數學的有用性。此外,教師不恰當的教學方式或資料呈現組織方式也會給學生帶來較重的認知負擔,導致學生挫折感強,不能形成系統的數學認知結構。
2.STEM教育對中小學生數學學業成就的影響,受年代、學段、樣本規模、國別、班級規模、實踐方式、教學場所及實驗周期的調節作用
從年代來看,隨著時間的推移,STEM教育對學生數學學業成就的正向促進作用逐漸增強。這一趨勢的主要原因是自STEM教育提出以來,諸多國家將其視作培養創新人才、提升綜合國力的教育發展戰略,不斷推進相關教育政策的部署和研究項目的實施。這些重要舉措會持續優化STEM教育的實踐模式,反哺STEM教育效果,進而提升學生數學學業成就。
從學段來看,STEM教育對不同學段學生的數學學業成就的促進作用存在顯著差異,對小學生的作用效果最為明顯,這與曾昭炳、張妮等人的元分析結果相吻合。12 小學生正處于心智急速發展的關鍵階段,好奇心旺盛,STEM教育憑借其豐富有趣的教學內容以及多樣化的課堂活動形式,能夠有效激發小學生的積極情緒,增強他們的數學學習動機和興趣。相比之下,中學生的心智已較為成熟,學習訴求差異性較大,自我意識突出,且學習動機和方式相對固化,致使教育干預的邊際效應被逐漸弱化。
從樣本規模來看,小樣本研究的效應量顯著高于大樣本研究,也更接近合并效應量,這與李珍等人的元分析結論一致。34 在元分析研究中小樣本研究的效應量通常會更大,究其原因主要有三點:一是與大樣本研究相比,小樣本研究更容易實現高實施保真度;二是大樣本研究更有可能采用標準化測試,而標準化測試對教育干預效果不敏感,可能無法充分捕捉STEM的具體作用效果;三是受發表偏倚的影響,負效應或零效應的小樣本研究往往難以發表,而大樣本研究,尤其是由政府機構或非營利組織資助的研究,都需以技術報告或學術著作的形式出版公開。
從國別來看,STEM教育對不同國家學生的數學學業成就的影響效果存在顯著差異,這與索科洛夫斯基、瓦霍諾等人的整體元分析研究結果相一致。56 由于各國教育文化的差異,大到各個國家政府對STEM的戰略定位、政策支持和投入力度的區別,小到各國教師、家長和學生對STEM教育的態度和動機的不同,都會直接影響STEM教育的實施效果。研究表明,東方國家的STEM教育高度重視現實世界中復雜問題的解決,以培養學生問題解決、批判性思維、創造性思維等高階思維能力,從而直接或間接地提升學生的數學能力。此次元分析發現,STEM教育對中國、馬來西亞這兩個東方國家學生的數學學業成就的影響更大。
從班級規模來看,STEM教育在小型班額中的促進效果更佳,隨著班級人數的增多,作用效果會逐漸降低。這是由于相較于大型班額,小型班額有利于解決發言難、討論難等多項突出問題,更適合開展協作學習與同伴學習,從而最大限度地發揮STEM教育效果。此外,大型班額環境下教學資源被嚴重稀釋,教師在有限的教學時間內無暇兼顧每位學生的學習進程,學生思考、表達和交流的機會減少,只能在“大統一”的狀態下被動學習。1 這也可以解釋為什么STEM教育對于小型班額學習的促進效果更佳。
從實踐方式來看,將STEM教育作為一種統籌機智的教學策略實施,更有利于提升學生的數學學業成就。這是因為作為教學策略的STEM教育接近學校目前的課程模式,一線教師對此更加熟悉,所以更容易在實際課堂教學中有效應用。而整合課程作為一種新的課程結構,對教師提出了更高的要求和挑戰,教師對跨學科知識的掌握程度、課程設計的復雜程度以及教學實施的協調程度都會影響STEM的教育效果。2 此外,STEM教育與數學教學改革在理念上高度契合,通過明確、重構、改革、轉變等方式,STEM教育可以實現與數學教學的有機融合,進而幫助學生獲得更高的數學學業成就。
從教學場所來看,在普通課堂開展的STEM教育對數學學業成就的促進作用更強,設備精良的實驗室反而影響強度較弱,這與之前不少元分析結果有差異。造成這種現象的原因可能是多方面的:首先,實驗室較多設備的使用容易出現媒體資源配置不當的現象,造成注意力分散、瞬時效應、信息冗余等問題;其次,實驗室的新興設備可能較為復雜、不易操作,學生需要花費大量的時間和精力學習使用,這可能會增加學生的認知負荷,導致學習體驗感不佳;最后,實驗室設備故障、網絡卡頓等不可控因素也可能導致教師無法完成預期的教學任務,從而使學生學習效果下降。
從實驗周期來看,不同長短的STEM教育實驗周期對學生數學學業成就的影響效果存在顯著差異,且較短的實驗周期的作用效果更為顯著,該結論與許靜等人的元分析結果相似。34 這可能是因為短期的STEM教育實驗能夠激發學生的好奇心和學習熱情,這種初始的激情和求知欲會促使學生更富有挑戰精神,增加學習投入,因此作用效果會更加明顯。而隨著實驗周期的延長,學生對STEM教學內容以及教學形式的熟悉度和適應度越來越好,可能會因新鮮感減退而逐漸產生倦怠心理,削弱學習動力,從而導致作用效果不如以前顯著。5此外,STEM教育對師生雙方都提出了更高要求,需要師生投入大量的時間和精力,這種高強度的投入也會增加師生的負荷。
3.STEM教育對中小學生數學學業成就的影響,不受男性占比、女性占比、測試類型、教學方法及出版類型的調節作用
從男性和女性占比來看,STEM教育對男女學生數學學業成就的影響不存在顯著差異,這與許靜等人的整體元分析結果不相符。6 隨著社會的進步,人們受教育機會和受教育層次的差異逐漸縮小。在此背景下,STEM教育也在消除性別差異方面發揮積極作用,為男女學生在公平教育和未來成功中提供了同等機會7,因此,在接受STEM教育后男女學生在數學學業成就上的表現趨于一致。
從測試類型來看,非標準測試所報告的數學學業成就好于標準化測試,但不存在顯著性差異,這與現有的元分析研究結果相似。問卷量表等非標準測試本質上是一種自我評價,容易受到個人主觀因素的影響,所報告的效應量存有偏高的潛在可能性。結合樣本規模的調節效應檢驗結果可知,大規模研究多采用標準化測試,雖然報告的效應量較低,但其評測過程更為科學和系統,反饋的結果更加真實可信。
從教學方法來看,在STEM教育中不同教學方法對學生數學學業成就的影響沒有顯著差異,但問題式教學的作用效果相對更好。這可能是因為“問題”是數學的“心臟”,基于問題的教學更切合數學的核心特征,因此對學生數學學業成就的促進作用更大。
從出版類型來看,期刊論文報告的效應量略高于學位論文,二者不存在顯著性差異,這與曾昭炳、李珍的研究結果類似。12 這可能是因為期刊論文更傾向于選擇顯著性和正向性的結果發表,掩蓋了部分零效應或負效應的結果,因此效應量較大。
4.研究不足與展望
由于文獻資料和研究方法的限制,本研究仍存在諸多不足有待改進。首先,僅從整體上考察了STEM教育對中小學生數學學業成就的影響,未來可進一步關注不同STEM學科側重、整合方式或教學主題的作用效果,還可以將學段拓寬到學前和大學。其次,納入元分析的文獻樣本數量以及文獻信息有限,后續研究可進一步擴大元分析樣本數量,考慮家庭背景、STEM興趣等學習者因素與STEM教育效果的交互作用。最后,所獲研究結論由數據分析推斷而來,非完全的因果性論證,未來應持續關注STEM教育的最新研究成果,將元分析與質性分析相結合,進一步考察STEM教育對中小學生數學學業成就的作用機制。
The Impact of STEM Education on Primary and Secondary School Students’Mathematics Achievement:Evidence Based on Meta-analysis
XU Jinrun,HU Dianshun
(School of Mathematics and Statistics,Central China Normal University,Hubei Wuhan,430079)
Abstract: In order to investigate the impact of STEM education on students’mathematics achievement,this study employs meta-analysis to systematically analyze 43 empirical studies on relevant topics at home and abroad. Results indicate that STEM education has a moderately positive effect on primary and secondary school students’mathematics achievement,significantly enhancing their mathematical cognition,skills,and emotional development. In addition,the effectiveness of STEM education on students varies based on factors such as different time periods,educational stage,sample size,country,class size,implementation method,teaching location,and experimental duration,but is unaffected by the regulation effects of gender ratios,test types,teaching methods,or publication types.
Key words: STEM education,mathematics achievement,meta-analysis