單俊豪 宮玲玲等



摘要:人工智能時代讓“數字土著”感受到了科技的魅力。機器人作為人工智能時代的標志性產物,在教學實踐中得到了廣泛的應用。該研究選取49篇國內外實證文獻為研究對象,采用元分析的方法重點探究教育機器人對學生學習成果的作用效果,以及學科、實驗周期、學段、教學模式對學生學習成果影響的差異。研究結果表明:(1)教育機器人對學習成果作用的綜合效應值為0.501,教育機器人能夠有效提升學生的學習成果,且在認知維度方面的提升效果更為顯著;(2)教育機器人在不同學科都能起到正向顯著作用,對數學和科學學科作用效果最為顯著;(3)不同實驗周期對學生學習成果都有正向促進作用,但實驗周期長不意味著學習成果高;(4)教育機器人在不同學段都能有效促進學生學習成果,在小學階段效果最佳;(5)不同教學模式中使用教育機器人對學生學習成果提升不存在顯著差異等。基于研究結論,該文從教學者、制造者、研究者和推廣者四個群體職責出發,提出進一步提升教育機器人教學效果的實踐性建議。
關鍵詞:教育機器人;元分析;學習成果;教育應用
中圖分類號:G434 文獻標識碼:A
教育機器人是面向教育領域專門研發的以培養學生分析能力、創造能力和實踐能力為目標的機器人。2017年國務院也頒布了《新一代人工智能發展規劃》,規劃中強調機器智能在教育領域的深度領用,全面打造智能教育生態。2018年發布的《美國機器智能國家戰略》指出教育機器人在優化學生學習體驗、提升教師教學效率方面起到重要作用。隨著機器人技術的發展,教育機器人被認為是在STEM、文研究、社會學、舞蹈、音樂和美術等學科中培養學生認知能力的有效工具。開源編程技術的普及化以及機器人結構的高可重塑性為學生提供了發展計算思維的重要工具,也為學生了解科學知識提供了真實的體驗活動,更為學生鍛煉團隊合作、組織溝通等社會性技能提供了重要的鍛煉平臺。
對于教育機器人是否真的能夠提升學生學習成果,國際上雖然有一部分實證研究嘗試得到這個結論,但由于實驗對象數量較少、數據分析手段粗放、年齡分布不均,教學模式差異等現實原因,一直沒有對這一問題形成統一的結論。如Chang在英語學科中利用教育機器人幫助學生練習聽力理解,實驗結果表明機器人能夠有效幫助學生提升英語聽力理解成績;Korkmaz通過準實驗研究的方法驗證了教育機器人對于提升學生學習動機的積極作用。相反,Nugent指出教育機器人對學生學習結果并沒產生積極影響;Ching也指出教育機器人對學生的STEM學習態度起到了一定的消極作用。綜上,本文擬用元分析法,對2005-2018年間49篇國內外實驗或準實驗研究論文進行綜合分析,重點探索教育機器人對學生學習成果的影響程度,以及不同調節變量(學科、實驗周期、學段、教學模式)對學生學習成果的影響差異。
元分析法是一種綜合多條實驗或準實驗研究數據,并通過平均效應值來考察文獻總體效應的統計分析方法。該方法已經廣泛應用于醫學臨床試驗、診斷等領域。元分析法的主要作用有增加統計學檢驗效能、定量估計研究效應以及發現既往研究的不足三個方面。在正式開始元分析前需要完成七個步驟:研究問題界定、文獻檢索、文獻納入與排除、數據及相關信息提取、分析發表偏倚、異質性分析、效應值選擇。為保證元分析法過程的嚴謹性,本研究在分析數據前將從上述七個步驟開展研究,并對每一步驟進行詳細描述。
(一)研究問題界定
本文的研究問題是探究教育機器人對學生學習成果的影響效果。學習成果指的是學生在特定的學習、發展和表現方面的結果。學習成果主要包含知識、技能、情感態度與價值觀以及其他高階能力。本文借鑒顧小清等對學習效果的分類方法,將知識、技能、情感態度與價值觀等分為認知層面和非認知層面。其中認知層面包括知識、技能維度,如學習成績、問題解決能力、計算思維技能等;非認知層面主要包含情感態度與價值維度,如學習興趣、學習自我效能、學習參與度、學習動機等方面。
(二)文獻檢索
本研究選擇“中國知網(CNKI)”“Web of Science”“ERIC”“IEEE”等國內外期刊和碩博士數據庫,以及近10年知名教育技術國際會議“AERA”“AECT”等論文集作為文獻檢索的范圍。檢索時間限定在2005年1月-2018年12月31日(教育機器人教學效果的研究最早出現在2005年)。教育機器人關鍵詞包括:“教育機器人”“Educational Robotics”;學習成果關鍵詞包括:“Learning Outcome”“Learning Effectiveness”“Learning Performance”等。
(三)文獻納入與排除
為了保證元分析研究結果的嚴謹性,本研究對文獻的納入制定了相關規則:第一,研究主題必須是教育機器人對學生學習成果的影響;第二,研究類型必須是實驗研究或者準實驗研究;第三,研究必須包括實驗組和對照組,即實驗組有機器人進行教學干預,對照組沒有機器人進行教學干預,或者包括前測與后測,前測為使用機器人教學前,后測為使用機器人教學后;第四,研究中教育機器人僅作為教學工具輔助課堂教學,不能完全作為教學對象;第五,論文中提供了完整的計算效應值的數據,如平均數(M)、標準差(SD)、t值或者p值等;第六,實驗對象為在校學生,包括幼兒園學生、中小學生和大學生,不包含成人學習者。
本研究首先在預選數據庫中按照既定關鍵詞對文獻進行搜索,并按照文獻篩選規則對文獻進行篩選。研究者首先將所搜索文獻的第一作者、發表時間、論文標題整合到Excel中,去除重復文獻,并刪掉與既定實驗對象無關的文章(重點關注標準一、標準五和標準六),得到70篇文獻。其次,兩位編碼者對70篇文獻進行深入審核,重點關注實驗設計規范和研究數據全面性(重點關注標準二、三和四)。最終得到49篇國內外有效文獻,包含19篇國內期刊、30篇國外期刊、會議及碩博士論文。有效研究效應值為90個。
(四)數據及相關信息提取
1.編碼體系確立
本文的研究對象是教育機器人,因變量為學習成果,包含認知層面和非認知層面。同時,將學科、學段、實驗周期、機器人類別、教學模式作為調節變量。
2.特征值編碼
本研究將因變量編碼為認知層面(C)和非認知層面(N)。同時,將學科、學段等調節變量根據實際情況進行編碼,編碼表如表1所示。為保證編碼的準確性,本研究邀請兩位編碼者(一位博士生,一位碩士生)對15篇文獻進行預編碼。編碼后發現兩者編碼的一致性為0.85,說明編碼結果可信。

3.分析工具
常見的元分析工具有Review Manager、STATA、R、Comprehensive Meta Analysis2.0等軟件。根據研究的實際需求,本文選擇Comprehensive Meta Analysis2.0(CMA)軟件開展數據收集和分析工作。具體分析工作包括各文獻的效應值計算、整體效應值計算、發表偏倚分析、異質性檢驗以及調節變量影響分析。
(一)發表偏倚檢驗
發表偏倚是元分析法中常見的系統誤差,指有顯著意義的研究成果比沒有顯著意義的研究成果的發表可能性更大的一種傾向。判斷元分析法發表偏倚的方法有很多,本研究選用漏斗圖法、Begg秩相關法和失安全系數(Fail-safe N)來綜合評估本研究的發表偏倚情況。本研究90個效應值的漏斗圖如下圖所示。根據下圖可以看出,絕大多數研究的效應值散點均勻、對稱地分布在平均效應值兩側,初步說明了出版偏差的可能性較小。Begg秩相關檢驗結果顯示,t=0.288,p<0.05,說明可能存在發表偏倚。Classic Fail-safe N主要評估有多少未發表的研究才能使得已經發表研究的總體效應值達到不顯著的水平。衡量標準為5*n+10,其中n代表本研究中納人元分析的文獻數量,本研究中失安全系數為12107,遠大于265(49*5+10)。這一指標說明未發表研究的效應值對已經發表的總體效應值影響不大。綜合上述三種檢驗方法,筆者認為本元分析結果穩定,發表偏倚現象不明顯。

(二)異質性檢驗
研究樣本的異質性檢驗結果顯示,Q值是545.996(p<0.001),I2值為83.700%,大于70%,說明近84%的異質性源自效應值的真實差異,只有16%是由誤差造成的。這種真實差異可能源于國家差異、發表時間跨度、實驗周期差異等因素。結果表明研究樣本之間存在異質性。因此本研究采用隨機效應模型(Random Effects)來評估教育機器人對學生學習成果的作用效果。
(三)效應值選取
本研究選取標準化均差(SMD)作為效應值來評估教育機器人對學生學習成果的綜合影響,同時也選取SMD為效應值評估調節變量的影響差異。
(四)教育機器人對學習成果的整體影響
1.整體效應值
根據隨機效應模型的合并效應值情況顯示(如表2所示),教育機器人對學習成果的合并效應值SMD為0.501,合并效應值為正數,是正向影響,且達到了統計顯著水平(P<0.001)。Cohen(1992)認為當效應值為0.2左右,可以認為影響較小;當效應值在0.5上下時,被認為有中等影響;當效應值在0.8左右時,被認為是影響顯著。因此本研究認為,教育機器人對學生學習成果有中等正向影響。將教育機器人應用到學科教學中有助于提升學生的學習成果。

2.教育機器人對認知和非認知維度學習成果的影響差異
如上文所述,學習成果分為認知和非認知兩個維度。統計結果顯示,認知維度和非認知維度的效應值都大于0,且都達到統計顯著水平(p<0.001),說明教育機器人對于學生認知和非認知方面的學習成果都有著正向顯著影響。如表3所示,認知維度的效應值大于0.5,非認知維度的效應值大于0.2且小于0.5,說明教育機器人在學生認知維度方面有著中等偏上的正向顯著影響;教育機器人在學生非認知維度方面有著中等偏低的正向顯著影響。異質性檢驗結果(Q=8.492,p=0.004)顯示,兩類學習成果之間存在顯著差異,說明教育機器人對學生認知維度和非認知維度學習成果的影響效果是不同等的,教育機器人更有助于促進學生認知維度學習成果的提升。

統計歸納文獻發現,認知方面的學習成果主要包括:學習成績、創造性思維、社會技能和問題解決能力四個方面。下頁表4呈現出四種認知方面的學習效果情況,創造性思維、問題解決能力和學生學習成績的效應值都在0.6~0.8之間,且都有統計顯著性(p<0.001),說明教育機器人對這三者都具有中等偏上的顯著正向影響,對學生創造性思維培養效果最好;社會技能維度的效應值為0.327,p<0.01,表明教育機器人對于學生社會技能的提升具有中等偏低的正向顯著影響。根據異質性檢驗結果(Q=6.746,p=0.080),不同認知維度效果間不存在顯著差異,即說明教育機器人對學生四種認知維度都有積極的提升效果。

(五)調節變量對學習成果的影響
1.不同學科對教育機器人提升學生學習成果的影響差異
教育機器人的教學功能多樣,不同學科都在嘗試利用教育機器人輔助授課以提升學生的學習成果。根據編碼結果顯示,教育機器人主要用于課外STEM教學和計算機學科教學中,在數學、物理、小學科學和英語學科等基礎學科中也有少數應用。本研究著重分析了教育機器人在STEM、計算機、數學、物理、科學、英語六個學科的學習成果,如表5所示。結果顯示,五個學科的效應值都達到了統計顯著要求(P<0.01),說明教育機器人在這五個學科中都能對學生的學習成果產生正向影響。以學科為單位,教育機器人在科學、數學、物理三個學科中的效應值均大于0.5,而且在數學學科中的效應值超過了0.8。說明,教育機器人在數學學科中有高度正向影響,在科學、物理兩個學科中有著中等正向影響。STEM學科、英語和計算機三個學科的效應值在0.3~0.5間,屬于中等偏下等級,說明教育機器人在這三個學科中有著中等偏低的正向影響。根據異質性檢驗Q值結果(Q=14.235,p<0.05)表明不同學科之間的效應值存在顯著差異,教育機器人在不同學科間影響效果不同。

2.不同實驗周期對教育機器人提升學生學習成果的影響差異
筆者按照編碼表規定,將三個不同長度的實驗周期對教育機器人提升學習成果的影響進行了對比分析(如圖6所示)。結果顯示,“少于一個月”“一個月到半年”“半年及以上”三個長度的實驗周期的效應值均大于0,且都達到了統計顯著要求(p<0.001),說明這三種實驗周期對學生學習成果都具有顯著正向影響。其中實驗周期為“一個月到半年”這一維度的效應值最高,為0.755,說明一個月到半年的實驗周期對學生學習成果產生了中等偏上影響;實驗周期為“半年以上”和“少于一個月”的效應值也都大于0.35,說明這兩個實驗周期對學生學習成果產生了中等偏低的正向影響。異質性檢驗結果(Q=7.967,p<0.05)表明不同實驗周期之間存在顯著差異,也就是說不同實驗周期對學生學習成果的作用程度是不同的。結果顯示,實驗周期為一個月到半年的作用效果最顯著。這一現象說明,使用教育機器人時間越長,并不意味著學生的學習成果越高。

3.不同學段對教育機器人提升學生學習成果的影響差異
為了檢驗不同學段對機器人提升學生學習成果的影響差異,筆者計算了六個學段所對應的效應值。從下頁表7可以看出,小學階段效應值最高,為0.685(p<0.001),說明教育機器人在小學階段具有中等偏高的積極影響;在高中階段的效應值為0.5~0.6之間,且都達到了顯著水平(p<0.001),說明教育機器人在高中階段對學生學習成果具有中等的正向顯著;大學、幼兒園和初中階段的效應值為0.4~0.5之間,且都達到了顯著水平(p<0.05),說明教育機器人在大學、幼兒園和初中階段對學生學習成果具有中等偏低的正向顯著影響;然而對于混合學段(本研究中為初中+小學的混合),效應值僅有0.023,不足0.1,且沒有達到顯著水平(p>0.05),這初步說明教育機器人在混合學段中并沒有起到顯著正向作用。深入分析異質性檢驗結果(Q=85.407,p=0.000),不同學段之間存在顯著差異,即教育機器人在不同學段之間的作用效果是不同的。

4.不同教學模式對教育機器人提升學生學習成果的影響差異
教學模式指在一定教學理論指導下所建立起來的教學活動結構框架和活動程序。STEM教育教學理念的核心是跨學科整合,關注學生在項目和實際問題中的解決能力;基于設計的教學是創新教育的新型教學模式。綜上,創新教學實踐中,基于項目的教學以及基于設計的教學是常見的教學模式,本研究將這兩種教學模式界定為創新教學模式,并將教學模式分為傳統教學模式和創新教學模式。如表8顯示,兩類教學模式的效應值均在0.4~0.6之間,且均達到顯著水平(p<0.001),因此傳統教學模式和創新教學模式對學生學習成果都存在正向顯著影響。傳統教學模式的教學效果稍好于創新教學模式,但從異質性檢驗中能夠看到,兩種教學模式的教學效果并不存在顯著差異(Q=1.432,p>0.05)。深入分析不同學科中教學模式對學習成果的影響可以發現,創新教學模式中使用教育機器人(SMD=0.503,P<0.001)在STEM學科中的作用效果要好于傳統教學模式(SMD=0.477,P<0.001)。

本文采用元分析法對49篇實驗或準實驗研究進行分析,主要得到如下研究結論:
第一,教育機器人對學生學習成果具有顯著促進作用。教育機器人在學生認知層面和非認知層面都有積極顯著影響,且在認知層面的作用效果高于非認知層面的作用效果。同時,教育機器人對學生的創造性思維能力、問題解決能力和學習成績等方面都有著積極的提升作用。進一步說明教育機器人在培養學生多元能力方面具有較大的潛力。充分利用教育機器人的教學輔助功能優勢設計課程將會為學生帶來不同維度認知能力的提升。
第二,教育機器人在各學科中都有正向教學效果,在數學和科學學科中影響顯著。通過表5的數據不難發現,教育機器人在各學科中都有正向顯著效果,在科學、數學、物理學科中有著中等偏上乃至高度正向效果,在英語和STEM學科課程中也有著中等偏低的積極影響。這一發現表明教育機器人的基本教學功能已經在單學科中得到了有效使用,相比之下STEM學科的作用效果雖然正向顯著,但并沒有突出優勢。這一發現并不是說明教育機器人在STEM學科中應用效果不好。筆者認為造成這一結果的原因在于STEM課程中教學內容和教學活動眾多,教育機器人的使用頻率有限,而單學科課程教學內容更聚焦,對教育機器人某一特定教學功能的使用更有深度,因此對學生某一維度的能力提升效果更顯著。
第三,不同實驗周期對學生學習成果的提升效果不同,實驗周期長并不代表學習成果好。數據結果表明課堂使用機器人1個月到半年,學生學習成果最佳。同時,當使用機器人輔助教學超過半年,學生學習成果反倒降低。筆者認為這種結果可能的原因在于實驗周期過長,學生對機器人的熟悉程度增高,新鮮感大大降低,學習的積極性變差,因此學習效果的提升情況并不如想象的樂觀。
第四,教育機器人在不同學段都有積極作用效果,小學作用效果最佳。分析結果顯示,教育機器人在小學、初中、高中和大學階段都有正向顯著效果,且在小學階段效果最佳,達到了高度顯著作用。本研究認為,這一現象說明了小學階段是學生掌握機器人基本功能和利用機器人進行創新學習活動的重要階段。筆者在數據分析階段還發現,混合學段中,教育機器人的作用效果非常不顯著。因此筆者認為,教育機器人課程應該以準確的年級或相近年級開展,不能將跨學段的學生放在一起授課。
第五,不同教學模式對學生學習成果提升不存在顯著差異,創新教學模式中利用教育機器人開展STEM教學更有效。本研究發現,基于項目以及基于設計教學模式的整體教學效果并沒有明顯好于傳統教學模式。這種現象不能說明創新教學模式對學習成果作用不大,而是應該根據學科特性分類看待。研究結果顯示利用教育機器人開展STEM教學在創新教學模式中的效果要好于傳統教學模式。STEM課程強調培養學生綜合素養,教學活動相對復雜、教學目標相對多元分散。因此在使用教育機器人進行STEM的教學過程中,創新教學模式更容易迎合學生培養的需求。
本研究結論不僅證明了教育機器人作為教學輔助工具,對于學生學習成果具有積極促進作用,也從學科、學段、教學模式等視角綜合分析了教育機器人對學生學習成果的影響。筆者從教學者、制造者、研究者和推廣者四個角色的工作職責出發,為有效構建未來機器人輔助教學生態提出了若干理論與實踐層面的建議與展望。
(一)教學者:分析機器人功能,打造STEAM教育新樣態
本研究發現,國內外的機器人教育應用主要集中在數學、計算機、物理、科學學科中,可見教育機器人是開展STEM教育的重要輔助技術。然而,極少有學者關注教育機器人在文學和藝術(如語文、歷史、美術等)學科中的教學應用。機器人技術高速發展的今天,技術問題已經不在成為阻礙機器人教育創新應用的壁壘。教學者需要做的是深入挖掘和分析機器人在文科學科中潛在的教學輔助功能,如對機器人外觀結構的設計與美化可以成為美術課堂的新教學命題;利用教育機器人糾正學生朗讀發音和發現演講問題(如停頓,語調,語病等)也將成為提升語文課堂活躍度的重要利器。STEAM教育是在STEM教育的基礎上增加Art(藝術與人文)學科所形成的新型跨學科教育模式。機器人功能的多元化為多種學科提供優質的教育支持服務,同時也給以STEAM教育為代表的跨學科課程帶來了重要的知識融合渠道和知識內化途徑。筆者認為,深入分析挖掘機器人在各學科,尤其是文科和藝術學科的教育輔助功能,將進一步拓寬機器人的教育應用渠道,為真正實現多元知識與技能內化以及STEAM教育生態提供必要的技術平臺和工具載體。
(二)制造者:引人人工智能技術,在學材中融入創新思維支架
人工智能技術的興起與高速發展為創客教育帶來了寶貴的技術資源。大數據分析與挖掘、物聯網、云計算和人機交互等人工智能核心技術帶動了如計算機視覺、機器學習、自然語言處理、規劃調度、口語識別、智能機器人等人類認知技術的發展。教育機器人引入先進的人工智能技術不僅僅是機器人功能的飛躍性進步,也為未來機器人輔助教育應用帶來了更多的契機,其教育輔助功能也趨向多元化和人性化。對于機器人生產廠商而言,緊跟技術潮流開發機器人功能服務可以拓寬機器人使用范疇,也讓學生更形象理解人工智能技術的原理和應用前景。
元分析法的結果表明教育機器人對學生創造性思維、問題解決能力和社交能力的提升具有促進作用。已有研究表明,學生多元能力培養需要思維框架的支持,如設計思維關注培養學生設計師層面的高階思維和技能。楊緒輝和鄭東芳通過教學實踐驗證了設計思維在培養學生創新能力、社交技能和其他認知能力方面的積極作用。因此,在教育機器人課程中增加相關思維或能力教學支架,教育機器人的教學效果有希望進一步得到提升。
(三)研究者:關注教師機器人教學應用能力,構建能力培養體系
大量實證研究表明機器人對教學存在積極輔助作用。然而不可忽略的是,教師的信息素養對機器人輔助教學的效果也存在直接的影響。我國從2014年就開始了教師信息技術應用能力標準和評估方法的研究與實踐。然而標準中對信息技術的描述并未精細到教師的機器人教學應用能力。為進一步促進教師理解教育機器人的教學輔助功能、熟練教育機器人的操作和教學技巧以及設計基于機器人的學科拓展課程,研究者首先應將研究視角放在教師機器人教學應用能力的標準研制與能力評估上面。值得注意的是,教師機器人教學應用能力并不簡單指教師使用、操作機器人的能力,而是在此基礎上靈活應用機器人教學輔助功能改善課堂環境、提升學生學習成效、構建良好課堂學習生態的能力。
我國目前以樂高、Arduino機器人為技術載體的教師培訓日趨火熱,但仍無法脫離技術本位的困擾。能力標準及評估指南的研發將有助于課程研究者進一步研發面向教師機器人教學應用能力提升的師資培訓課程。其中,培訓課程內容應以實踐知識導向為特色,培訓的評估應以微認證為驅動。具體來講,課程內容以教師實踐性知識培養為導向,減少不必要理論知識的灌輸,增加教師體驗互動和課堂實操的教學比重;課程評估關注教師的機器人教學相關微能力的發展與認證,以微認證為技術路徑取代傳統教師水平考核體制。
教師機器人教學應用能力是保證機器人教學輔助效果的重要基石,它是教師信息技術應用能力的具象表征,也是機器人這一技術載體教學功能得以充分發揮的重要保障。筆者認為,要想建立面向教師機器人教學應用能力培養體系,需要從能力標準制定→教師培訓課程開發→教師能力微認證三個步驟陸續開展研究工作。
(四)推廣者:基于區域教育水平現狀,探索虛擬機器人的教育應用
我國不同區域基礎教育階段信息化資源建設水平正在逐步縮減差距。但教育機器人作為一種新型的教育類技術產品,部分偏遠地區仍無法有效惠及。因此,虛擬教育機器人將成為解決機器人教育服務差異的有效工具。虛擬教育機器人除無法完成拼接、組裝等真實動手操作外,在程序編寫、仿真模擬、人工智能技術體驗等方面均有著較大的優勢。如我國自行研發的虛擬智能機器人設計平臺“蘿卜圈”,它是國內首款3D機器人在線互動平臺,學生可以在平臺上進行模塊化編程,設計3D虛擬現實項目。百度公司也于近期成功研發了人工智能機器人,學生可以在線體驗人臉識別、文字及語言識別等先進的人工智能技術。互聯網技術的發展極大促進了教育公平。虛擬機器人以互聯網技術為基礎,為更多偏遠地區的學生帶來先進的機器人教學互動體驗與學習機會。隨著虛擬機器人功能的不斷完善,面向不同學科的虛擬教育機器人也將營運而生,為全面、普惠性地提升學生學習成果服務。
本研究采用元分析法綜合評估了教育機器人對學生學習成果的影響效果,并討論了不同學科、實驗周期、學段、教學模式對學生學習成果的影響差異情況。基于實驗結論,筆者提出了后續開展機器人輔助教學相關研究與實踐的建議。人工智能時代的到來讓教育機器人的功能得到了豐富,STEAM教育和創客教育的蓬勃發展讓教育機器人有了更廣闊的應用市場。如何充分整合教育機器人的功能特點以支持教學,幫助學生提升核心素養是中小學階段的重要教育研究課題。未來,將會有更多實證研究來驗證學生多元能力的提升效果,本研究的研究主題甚至結論將會得到進一步的補充和細化。