摘要:智能教研是人工智能熱潮下的政策導(dǎo)向與實(shí)踐熱點(diǎn),然而,當(dāng)前普遍存在對(duì)智能教研本質(zhì)的認(rèn)識(shí)不清,由此導(dǎo)致對(duì)其的盲目追捧及實(shí)踐誤區(qū)頻現(xiàn)。基于對(duì)人工智能本質(zhì)和教研本質(zhì)的雙重考察,智能教研在本質(zhì)上是一種以可信模型采集的教研數(shù)據(jù)為基礎(chǔ),通過“人—機(jī)—人”協(xié)同教研決策,實(shí)現(xiàn)“三性”(即科學(xué)性、技術(shù)性和經(jīng)驗(yàn)性)優(yōu)化的循證實(shí)踐。據(jù)此審視智能教研的典型誤區(qū)主要體現(xiàn)在囿于可疑模型的教研數(shù)據(jù)、高估數(shù)據(jù)效用的教研決策、陷入單性異化的教研循證實(shí)踐三個(gè)方面。為走出現(xiàn)有誤區(qū),未來智能教研亟須通過三大途徑實(shí)現(xiàn)理性回歸:一是聯(lián)合研發(fā)保障智能教研數(shù)據(jù)質(zhì)量的可信基礎(chǔ)模型;二是借鑒相關(guān)領(lǐng)域的已有研究,合力探索智能教研“人—機(jī)—人”協(xié)同決策的實(shí)踐新課題;三是內(nèi)外聯(lián)動(dòng)推進(jìn)科學(xué)性證據(jù)庫的建設(shè),正視經(jīng)驗(yàn)性證據(jù)的合理價(jià)值,持續(xù)優(yōu)化智能教研的循證實(shí)踐。
關(guān)鍵詞:智能教研;可信模型;“人—機(jī)—人”協(xié)同決策;循證實(shí)踐
中圖分類號(hào):G434 " 文獻(xiàn)標(biāo)識(shí)碼:A " "文章編號(hào):1009-5195(2025)02-0033-09 "doi10.3969/j.issn.1009-5195.2025.02.004
基金項(xiàng)目: 國家社會(huì)科學(xué)基金“十三五”規(guī)劃教育學(xué)一般課題“近70年中小學(xué)教研活動(dòng)的中國經(jīng)驗(yàn)研究”(BHA190131)。
作者簡(jiǎn)介: 王麗華,博士,教授,博士生導(dǎo)師,浙江師范大學(xué)教育學(xué)院,浙江全省智能教育技術(shù)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室(浙江金華 321004);時(shí)一帆,碩士研究生,浙江師范大學(xué)教育學(xué)院(浙江金華 321004);盧國成(通信作者),講師,廣西職業(yè)技術(shù)學(xué)院馬克思主義學(xué)院 (廣西南寧 530226)。
智能教研既是新生事物,又是人工智能熱潮下的政策關(guān)切與實(shí)踐熱點(diǎn)。在《新一代人工智能發(fā)展規(guī)劃》《教育部關(guān)于加強(qiáng)和改進(jìn)新時(shí)代基礎(chǔ)教育教研工作的意見》等政策指引下,教育部教育技術(shù)與資源發(fā)展中心(中央電化教育館)組織研發(fā)了中央電化教育館智能研修平臺(tái),并于2020年在全國范圍內(nèi)組織遴選了81個(gè)試點(diǎn)工作區(qū)和165所試點(diǎn)工作學(xué)校(李陽等,2022),以探索智能教研。與此同時(shí),醍摩豆智慧教育、科大訊飛、希沃、翼課網(wǎng)與鯤翼教師學(xué)苑等先后開發(fā)了智能教研平臺(tái),這些平臺(tái)的教師用戶量超過20萬(穆肅等,2024)。與平臺(tái)研發(fā)熱遙相呼應(yīng)的是,全國各地紛紛舉辦各類智能教研展示活動(dòng)和論壇。從智能教研熱的實(shí)踐來看,關(guān)于智能教研大致有如下兩種認(rèn)識(shí):一是智能教研就是利用智能教研平臺(tái)采集課堂教學(xué)數(shù)據(jù),生成報(bào)告并為教師提供決策和建議的過程。持此類觀點(diǎn)的以各大公司居多,他們往往宣傳智能教研能節(jié)省教研時(shí)間、提高教研效率、切實(shí)為教師減負(fù)。二是智能教研就是利用智能教研平臺(tái)進(jìn)行備課、觀課、評(píng)課并生成教研數(shù)據(jù)的過程。持此類觀點(diǎn)的以一線教師居多。在智能教研火熱的背后,我們亟待理性剖析智能教研的本質(zhì)是什么,并據(jù)此澄清當(dāng)前實(shí)踐中的誤區(qū),以為智能教研的未來發(fā)展提供指引。誠如有學(xué)者所指出的:“考察人工智能教育應(yīng)用本質(zhì)既是人工智能教育應(yīng)用基本理論研究的重要內(nèi)容,也是推動(dòng)其實(shí)踐必須廓清的認(rèn)識(shí)問題。”(何偉光,2023)
一、智能教研的本質(zhì)剖析
本質(zhì)是指“事物的根本屬性,它對(duì)事物的性質(zhì)、面貌和發(fā)展起決定作用”(字詞語辭書編研組,2016,p.54)。目前各大平臺(tái)宣稱其提供的智能教研涵蓋個(gè)人備課、集體備課、觀議評(píng)課、集體教研等,但這只是功能,而非本質(zhì)。智能教研的本質(zhì)可以從人工智能的本質(zhì)及教研的本質(zhì)考察得出。聯(lián)合國教科文組織國際人工智能研究中心主任韋恩·霍姆斯(Wayne Holmes)等學(xué)者提出:“人工智能本質(zhì)上應(yīng)同時(shí)考慮其技術(shù)維度和人的維度”(韋恩·霍姆斯等,2023)。對(duì)于智能教研而言,技術(shù)維度的核心在于基礎(chǔ)模型及其規(guī)則設(shè)定,即數(shù)據(jù)采集模型能通過智能教研平臺(tái)形成教研數(shù)據(jù)與相關(guān)實(shí)踐的關(guān)聯(lián),并提出教學(xué)決策建議;人的維度應(yīng)著重考慮智能教研應(yīng)用過程中人的價(jià)值的彰顯。近年來,伴隨教師教育研究逐步向循證轉(zhuǎn)向,教研亦開始向循證轉(zhuǎn)向。教師教育研究循證強(qiáng)調(diào)的核心要義是,教師教育應(yīng)超越經(jīng)驗(yàn)范式,向基于證據(jù)解決教師教育問題的循證實(shí)踐及其科學(xué)范式轉(zhuǎn)向(裴淼等,2020;閆予沨等,2020)。還有學(xué)者認(rèn)為證據(jù)等同于循證,提出教研應(yīng)向基于證據(jù)轉(zhuǎn)向(董洪亮,2021)或者向循證教研轉(zhuǎn)型(吳雨宸等,2023),亦有學(xué)者提出循證課例研究是智能教研實(shí)施的重要方式之一(穆肅等,2024)。然而,怎樣的教研數(shù)據(jù)可以作為證據(jù)?如何作出教研決策?教研到底應(yīng)向怎樣的循證轉(zhuǎn)向?對(duì)于這些本質(zhì)性的問題至今尚缺少系統(tǒng)研究。基于上述分析,本研究認(rèn)為智能教研的本質(zhì)是一種以可信模型采集的教研數(shù)據(jù)為基礎(chǔ),通過“人—機(jī)—人”協(xié)同教研決策,以實(shí)現(xiàn)“三性”優(yōu)化的循證實(shí)踐。
1.以基于可信模型的教研數(shù)據(jù)為基礎(chǔ)
教研數(shù)據(jù)可信,才可能為作為循證實(shí)踐的智能教研提供有效證據(jù)。關(guān)于智能教研數(shù)據(jù),已有研究主要關(guān)注兩個(gè)方面:一是數(shù)據(jù)的類型,如有研究提出教師畫像由五大類教研數(shù)據(jù)構(gòu)成(胡小勇等,2019);二是數(shù)據(jù)的用途,如教研數(shù)據(jù)可為教師提供決策建議和量化評(píng)估教研效果的依據(jù)(穆肅等,2024)。當(dāng)前研究極少關(guān)注教研數(shù)據(jù)是否可信,尤其是生成智能教研數(shù)據(jù)的模型是否可信的問題。
近年來,因人工智能快速發(fā)展引發(fā)了諸多信任危機(jī),因此“發(fā)展可信人工智能正在成為全球共識(shí)” (中國信息通信研究院等,2021)。與此同時(shí),可信人工智能領(lǐng)域的論文發(fā)表量、專利申請(qǐng)量均在快速增長,各國政府、國際標(biāo)準(zhǔn)化組織和行業(yè)組織也在積極推動(dòng)建設(shè)可信人工智能的相關(guān)原則和標(biāo)準(zhǔn)(胡曉萌等,2024)。此外,鑒于人工智能技術(shù)本身的“黑箱模型”問題 (中國信息通信研究院等,2021),亦有研究者提出“大模型如何更可信”的呼吁(宰飛等,2023)。值得一提的是,已有研究機(jī)構(gòu)梳理了全球范圍內(nèi)已發(fā)布的84份政策文件,總結(jié)出可信人工智能應(yīng)包括“可靠可控、透明可釋、數(shù)據(jù)保護(hù)、明確責(zé)任、多元包容”五項(xiàng)特征要素(中國信息通信研究院等,2021)。其中與模型相關(guān)的特征主要是“可靠可控”和“透明可釋”。教研數(shù)據(jù)是否可信的關(guān)鍵在于模型是否可信。關(guān)于可信基礎(chǔ)模型中的“可信”探討,已有研究更多強(qiáng)調(diào)技術(shù)視野下的信任,即個(gè)體對(duì)信息技術(shù)的功能性、可靠性和有用性的信任信念(McKnight et al.,2011)。
綜上分析,結(jié)合智能教研的實(shí)際需要,為確保智能教研數(shù)據(jù)可信,可信模型應(yīng)指向?qū)Σ杉悄芙萄袛?shù)據(jù)的智能教研平臺(tái)模型可信度的判斷,主要包括三個(gè)衡量指標(biāo):一是教研數(shù)據(jù)采集模型設(shè)定的依據(jù)及其詮釋;二是模型訓(xùn)練數(shù)據(jù)的質(zhì)量與數(shù)量;三是智能教研平臺(tái)實(shí)際采集并展示數(shù)據(jù)的準(zhǔn)確性與可靠性等。特別需要指出的是,如果訓(xùn)練數(shù)據(jù)的質(zhì)量差,即便模型及其功能再完美,也無法輸出可信的教研數(shù)據(jù)。
2.走向“人—機(jī)—人”協(xié)同的教研決策
在智能時(shí)代,因人機(jī)協(xié)同情境的普遍存在而催生出了新的決策范式(張志學(xué)等,2024),智能教研決策也不例外。有研究指出:“學(xué)校應(yīng)主動(dòng)利用人工智能等新技術(shù)……實(shí)現(xiàn)教研的精準(zhǔn)管理和決策”(鄭欣欣等,2023)。這里所指的智能教研決策主要是利用人工智能技術(shù)進(jìn)行決策,或者說是一種人工智能算法決策。誠如英國科學(xué)院院士斯蒂芬·鮑爾(Stephen Ball)所言,“教師作為課堂決策的最基本單位,正在被基于大數(shù)據(jù)收集和分析、算法設(shè)計(jì)的適應(yīng)性學(xué)習(xí)系統(tǒng)所取代。”(斯蒂芬·鮑爾等,2020)
智能教研不僅是一種人工智能算法決策,它還是一種人機(jī)協(xié)同決策。此處所指的“人”主要指智能教研平臺(tái)的研發(fā)者,據(jù)此智能教研決策實(shí)際上也是一種研發(fā)者和人工智能算法協(xié)同決策的過程。因此,從某種意義上說,教研過程中的教師決策極有可能被研發(fā)者協(xié)同人工智能算法決策所控制,教師職業(yè)也極有可能失去其賴以生存的自主自決。誠如有學(xué)者所指出的:“未來當(dāng)整個(gè)社會(huì)系統(tǒng)都被數(shù)字化以后,掌握數(shù)據(jù)的人更有可能利用數(shù)據(jù)對(duì)人進(jìn)行控制。”(周麗昀等,2021)總之,不論是人工智能算法決策,還是研發(fā)者協(xié)同人工智能算法決策,其基本邏輯是,依據(jù)智能教研數(shù)據(jù),機(jī)器助力教師或?qū)W校作出科學(xué)精準(zhǔn)的教研決策。其隱含的基本前提是算法必須可信。盡管已有證據(jù)表明,基于算法決策的智能教研決策的確有助于改進(jìn)教研實(shí)踐,但其背后的“算法模型”至今仍然不夠透明。
從教師作為“人”師的獨(dú)特性(如具有很強(qiáng)的個(gè)體性、情境性、語境性)出發(fā),智能教研亟待走向“人—機(jī)—人”協(xié)同決策。亦有學(xué)者指出,智能時(shí)代的人—機(jī)關(guān)系從來都是“人—機(jī)—人”三者之間的關(guān)系 (常晉芳,2019);人工智能的社會(huì)意義也不是機(jī)器與人的關(guān)系,而是人與人的關(guān)系,即掌控人工智能的一個(gè)或一群人與不掌控人工智能的大多數(shù)人之間的關(guān)系(安維復(fù),2017)。筆者認(rèn)為,“人—機(jī)—人”協(xié)同決策中的兩“人”應(yīng)分別指涉智能教研平臺(tái)(或終端)的研發(fā)者和使用者(主要是教師),如此“人—機(jī)—人”協(xié)同決策就是研發(fā)者、算法、教師多方力量交互合作并共同作出教研決策的過程,其本質(zhì)是一種“科學(xué)決策—算法決策—經(jīng)驗(yàn)決策”的協(xié)同過程。在智能教研過程中,教師決策具有不可替代的獨(dú)特作用,它“在很大程度上依賴于理性思維和創(chuàng)造性思維的結(jié)合,強(qiáng)調(diào)經(jīng)驗(yàn)的作用,……能夠快速地對(duì)不同情況進(jìn)行分類并做出有效的決定”(Terziyan et al.,2018)。此外,教師決策很多情況下還依賴具體的情境或語境,甚至有時(shí)是基于情境或語境通過直覺作出決策。這些都是遠(yuǎn)離學(xué)校情境和教研語境的技術(shù)研發(fā)者尚不具有的認(rèn)知能力(谷口忠大,2023,pp.164-165)。因此,智能教研平臺(tái)在研發(fā)之前,就要充分考慮教師協(xié)同決策的技術(shù)實(shí)現(xiàn)路徑,包括科學(xué)決策、算法及模型優(yōu)化等的反饋路徑,教師觀察數(shù)據(jù)的輸入路徑,教師決策的貢獻(xiàn)路徑等。
3.指向探索“三性”優(yōu)化的教研循證實(shí)踐
循證實(shí)踐(Evidence-Based Practice)的字面意義為“以證據(jù)為基礎(chǔ)的實(shí)踐”,引申為“遵循證據(jù)進(jìn)行實(shí)踐”,肇始于循證醫(yī)學(xué)。醫(yī)學(xué)循證實(shí)踐遵循“最佳證據(jù)”。最佳證據(jù)是指研究者提供的與解決所需問題最為契合的、級(jí)別最高的研究證據(jù),其往往是基于同類問題大量研究的元分析,遵循嚴(yán)格的科學(xué)規(guī)范,其目的是盡可能地接近事實(shí)的真相,揭示出問題的癥結(jié)并提出相應(yīng)的解決方案(楊文登,2010)。由此可知,科學(xué)性是醫(yī)學(xué)循證實(shí)踐證據(jù)的主要特性。在醫(yī)學(xué)循證實(shí)踐中,唯有基于最佳證據(jù)形成最佳的解決方案,才能讓不同的實(shí)踐者在面對(duì)相同的問題時(shí)做出大致相同的實(shí)踐決策。
與循證醫(yī)學(xué)類似,智能教研的證據(jù)也應(yīng)具有科學(xué)性(特指教育學(xué)意義上的科學(xué)性,而非醫(yī)學(xué)意義上的科學(xué)性)。但與循證醫(yī)學(xué)不同,智能教研是教師在具體學(xué)校情境中開展的,教研過程具有高度語境性,而現(xiàn)代的人工智能“通常不擅長理解語境依賴性高的句子”(谷口忠大,2023,pp.163-164)。比如,當(dāng)老師提出問題后引導(dǎo)學(xué)生思考或討論,幾分鐘后再問學(xué)生:“誰能回答剛才那個(gè)問題嗎?”在此例中,人工智能若無法找到與之前提問的對(duì)應(yīng)關(guān)系,它就無法理解“那個(gè)問題”是什么,因而也無法提供具有關(guān)聯(lián)意義的有效證據(jù),只能記錄下師生話語。而現(xiàn)場(chǎng)參與教研活動(dòng)的教師則可以毫不費(fèi)力地將“那個(gè)問題”與前面的提問建立關(guān)聯(lián),表現(xiàn)出人所特有的經(jīng)驗(yàn)性理解能力,這意味著智能教研的證據(jù)應(yīng)具有經(jīng)驗(yàn)性。此外,智能教研本身所依托的包括人臉識(shí)別、語音識(shí)別、肢體識(shí)別、OCR識(shí)別、自然語言處理、機(jī)器學(xué)習(xí)等技術(shù)優(yōu)勢(shì),生成的教研數(shù)據(jù)也是基于可信模型的,因而其證據(jù)也應(yīng)具有技術(shù)性。
綜上分析,就其本質(zhì)而言,作為循證實(shí)踐的智能教研的證據(jù)應(yīng)具有科學(xué)性、技術(shù)性和經(jīng)驗(yàn)性,這就是智能教研循證實(shí)踐應(yīng)具有的“三性”。與此相應(yīng),這三種性質(zhì)的證據(jù)可以分別稱作科學(xué)性證據(jù)、技術(shù)性證據(jù)和經(jīng)驗(yàn)性證據(jù)。在循證醫(yī)學(xué)中,科學(xué)性證據(jù)主要指“從事應(yīng)用研究(或?qū)嵺`相關(guān)的基礎(chǔ)研究)的研究者為實(shí)踐所提供的研究證據(jù)”(楊文登,2010),但該界定并未明確何謂證據(jù)。借鑒“證據(jù)”一詞是指“用以證明事物真?zhèn)蔚膽{據(jù)”(字詞語辭書編研組,2016,p.1636)的字面含義,筆者將智能教研中三類證據(jù)界定為:科學(xué)性證據(jù)是指從事教育教學(xué)應(yīng)用研究(或?qū)嵺`相關(guān)的基礎(chǔ)研究)的研究者為教研實(shí)踐提供的憑據(jù);技術(shù)性證據(jù)是指基于可信模型為教研實(shí)踐提供的憑據(jù);經(jīng)驗(yàn)性證據(jù)是指教師基于教研情境或語境為教研實(shí)踐提供的憑據(jù)。借鑒“優(yōu)化”一詞的字面含義是指“經(jīng)過改革或選擇使其變得優(yōu)良”(字詞語辭書編研組,2016,p.1540),筆者將三性優(yōu)化的教研循證實(shí)踐界定為智能教研應(yīng)基于學(xué)校教研需求、教師發(fā)展需要、學(xué)生成長需要,以集體審議的方式評(píng)估科學(xué)性、技術(shù)性和經(jīng)驗(yàn)性證據(jù),選擇優(yōu)良證據(jù)組合作為憑據(jù),作出符合學(xué)生成長需要和教師發(fā)展需求的教學(xué)改進(jìn)決策的行動(dòng)總稱。早在2008年,學(xué)者孟華在追溯王國維提出的著名的“二重證據(jù)法”基礎(chǔ)上,系統(tǒng)梳理并提出了包括語言(口語)、文字(書寫)和圖像三類符號(hào)證據(jù)綜合運(yùn)用的“三重證據(jù)法”,并認(rèn)為三重證據(jù)法起作用的關(guān)鍵在于證據(jù)間性。所謂證據(jù)間性是指一種證據(jù)符號(hào)的意義和價(jià)值不僅與原點(diǎn)事實(shí)有關(guān),同時(shí)也與其他證據(jù)符號(hào)發(fā)生關(guān)聯(lián)和交互作用(孟華,2008)。受此啟發(fā),筆者提出“三性”優(yōu)化的教研循證實(shí)踐,并認(rèn)為智能教研的證據(jù)是否有效,關(guān)鍵在于上述三類證據(jù)間的互動(dòng)及其優(yōu)化。
二、智能教研的現(xiàn)實(shí)誤區(qū)
1.囿于可疑模型的教研數(shù)據(jù)
不可否認(rèn),依托模型和技術(shù)的智能教研平臺(tái)的確在一定程度上實(shí)現(xiàn)了對(duì)量化類智能教研數(shù)據(jù)的精準(zhǔn)描述,如教師行為軌跡、師生特定教學(xué)或?qū)W習(xí)行為等,但精確描述的前提是教研數(shù)據(jù)可信。由于教研數(shù)據(jù)采集模型的不可信,導(dǎo)致當(dāng)前智能教研數(shù)據(jù)總體而言是可疑的。
一是教研數(shù)據(jù)采集模型設(shè)定的依據(jù)及其詮釋問題突出。主要?dú)w納為三類:(1)基本無依據(jù)但有詮釋。多數(shù)智能教研平臺(tái)都會(huì)基于采集的數(shù)據(jù)提供S-T曲線圖、Rt-Ch圖,前者統(tǒng)計(jì)師生互動(dòng)情況,后者統(tǒng)計(jì)某節(jié)課中采用的教學(xué)模式,但并未給出數(shù)據(jù)采集模型的依據(jù)且其詮釋難以令人信服。比如,有平臺(tái)對(duì)S-T曲線圖的詮釋是“橫軸方向代表老師在講話,縱軸方向代表學(xué)生在講話;當(dāng)曲線偏向橫軸時(shí),表示老師活動(dòng)占多數(shù);偏向縱軸時(shí),表示學(xué)生活動(dòng)占多數(shù);當(dāng)某段曲線整體平行于45度線時(shí),表示在此段時(shí)間內(nèi)師生互動(dòng)充分”。難道師生互動(dòng)就是師生說話嗎?顯然,任何一位研究師生互動(dòng)的學(xué)者都會(huì)極力反對(duì)。(2)依據(jù)和詮釋都未經(jīng)考證。比如,不少智能教研平臺(tái)都用統(tǒng)計(jì)圖和時(shí)序圖來呈現(xiàn)學(xué)生主動(dòng)學(xué)習(xí)和被動(dòng)學(xué)習(xí)的情況,其依據(jù)是“學(xué)習(xí)金字塔理論”,其詮釋采用了百分比圖。然而,學(xué)習(xí)金字塔理論通常被認(rèn)為來源于美國緬因州的國家訓(xùn)練實(shí)驗(yàn)室,該理論是否可以作為區(qū)分學(xué)生主動(dòng)學(xué)習(xí)與被動(dòng)學(xué)習(xí)的依據(jù),目前還未有與之相關(guān)的研究報(bào)告或論文。這種未經(jīng)考證的依據(jù)和詮釋顯然容易給人以誤導(dǎo)。(3)依據(jù)和詮釋高度雷同。比如,多數(shù)智能教研平臺(tái)都有對(duì)教師提問類型的統(tǒng)計(jì),其依據(jù)一般都是布盧姆教學(xué)目標(biāo)分類理論關(guān)于認(rèn)知領(lǐng)域的分類,其詮釋也大致參考布盧姆的理論。然而,每所學(xué)校都有自己的特色,雷同的數(shù)據(jù)采集模型顯然無法滿足學(xué)校教研特色化發(fā)展的需求。
二是教研數(shù)據(jù)采集模型的訓(xùn)練數(shù)據(jù)不透明。主要表現(xiàn)為:(1)來源不明確,無法判斷訓(xùn)練數(shù)據(jù)的質(zhì)量;(2)數(shù)量不透明,無法判斷訓(xùn)練結(jié)果能否平衡例外和反常情況;(3)處理過程不透明,包括數(shù)據(jù)的預(yù)處理、清洗和標(biāo)注等都缺乏必要的透明度。這既會(huì)嚴(yán)重影響模型的性能,又難以評(píng)估數(shù)據(jù)質(zhì)量和處理的合理性。而且多數(shù)智能教研平臺(tái)也未公開是否運(yùn)用差錯(cuò)訓(xùn)練模型來提高其輸出數(shù)據(jù)的準(zhǔn)確性。“如果沒有錯(cuò)誤反饋,大數(shù)據(jù)模型就會(huì)持續(xù)輸出錯(cuò)誤的結(jié)果”(凱西·奧尼爾,2018)。當(dāng)然,訓(xùn)練數(shù)據(jù)的不透明一定程度上與數(shù)據(jù)采集的復(fù)雜性、隱私保護(hù)需求、技術(shù)局限性等有關(guān),但也受商業(yè)機(jī)密的影響。
2.高估數(shù)據(jù)效用的教研決策
如前所述,智能教研平臺(tái)提供的量化數(shù)據(jù)的確能為可量化的教學(xué)研究提供教研決策。由于教研是高度依賴情境或語境的實(shí)踐性活動(dòng),除非智能教研平臺(tái)在與師生長期互動(dòng)中諳熟師生話語特點(diǎn),并能提供高度語境依賴的精準(zhǔn)教研數(shù)據(jù),否則很難單獨(dú)基于智能教研數(shù)據(jù)作出科學(xué)或精準(zhǔn)的教研決策。然而,要?jiǎng)?chuàng)造出兼具可以共享文本內(nèi)部語境和外部語境的人工智能,并與人類保持長期的相互作用,依然是一項(xiàng)很大的挑戰(zhàn)(谷口忠大,2023,p.165)。目前人工智能在教育中的應(yīng)用存在“炒作”現(xiàn)象,諸多關(guān)鍵性限制問題也未得到充分考量(韋恩·霍姆斯等,2023)。整體而言,智能教研中的數(shù)據(jù)效用及其教研決策依然受制于技術(shù)本身,盡管已有學(xué)者對(duì)此進(jìn)行了相對(duì)理性的探討,但仍然高估了基于數(shù)據(jù)的智能教研決策效用,具體表現(xiàn)在如下方面。
一是認(rèn)為基于數(shù)據(jù)的教研決策就是科學(xué)的教研決策。持該觀點(diǎn)的人們認(rèn)為,智能教研平臺(tái)提供的數(shù)據(jù)是真實(shí)、客觀的,據(jù)此作出的教研決策自然也是科學(xué)的。這類觀點(diǎn)集中體現(xiàn)在教師、校本教研、學(xué)校教研管理等層面。在教師層面,一些教師認(rèn)為智能教研數(shù)據(jù)有助于他們作出科學(xué)的教研決策,一般在智能教研展示及分享活動(dòng)中涉及較多,如智能教研展示課的執(zhí)教教師通過分析和解讀AI課堂數(shù)據(jù)報(bào)告(包括教學(xué)行為分布、S-T分析圖、Rt-Ch 圖等數(shù)據(jù)),指出根據(jù)教學(xué)經(jīng)驗(yàn)實(shí)施的教學(xué)與智能教研數(shù)據(jù)報(bào)告之間存在一定落差,并據(jù)此提出教學(xué)改進(jìn)的方向。在校本教研層面,一些學(xué)校認(rèn)為,相較于傳統(tǒng)校本教研以個(gè)人經(jīng)驗(yàn)與主觀判斷為導(dǎo)向,數(shù)據(jù)驅(qū)動(dòng)的校本教研更強(qiáng)調(diào)獲取與挖掘真實(shí)、客觀的過程性數(shù)據(jù),并在此基礎(chǔ)上進(jìn)行教學(xué)評(píng)估與決策,這有助于增強(qiáng)校本教研的科學(xué)性(陳禹辰等,2023)。在學(xué)校管理層面,體現(xiàn)為管理者可在眾多教研數(shù)據(jù)中,借助多維度可視化圖表全面了解學(xué)校教研情況,緊抓優(yōu)勢(shì)板塊與薄弱板塊,從而科學(xué)高效地做出教研決策(劉立杰,2024)。
二是認(rèn)為基于數(shù)據(jù)的教研決策就是精準(zhǔn)決策。持該種觀點(diǎn)的人們認(rèn)為,智能教研平臺(tái)基于自身的技術(shù)優(yōu)勢(shì),能夠采集精準(zhǔn)的教研數(shù)據(jù),據(jù)此作出的教研決策自然也是精準(zhǔn)的。在公司的大力宣傳和裹挾下,諸多區(qū)域和學(xué)校采納并進(jìn)行了試點(diǎn),特別是在學(xué)生作業(yè)的教研改革方面。如有些試點(diǎn)區(qū)域認(rèn)為,精準(zhǔn)決策有助于開展個(gè)性化輔導(dǎo)并布置分層作業(yè),理由包括:平臺(tái)能夠伴隨式實(shí)時(shí)采集數(shù)據(jù),診斷學(xué)生的學(xué)習(xí)情況,輔助教師做出精準(zhǔn)的教學(xué)決策;課后教師可以分析學(xué)生的作業(yè)數(shù)據(jù),發(fā)現(xiàn)學(xué)生的薄弱知識(shí)點(diǎn),及時(shí)開展個(gè)性化輔導(dǎo);可以根據(jù)學(xué)生的階段性學(xué)習(xí)情況,針對(duì)不同個(gè)體、分組或群體發(fā)布分層作業(yè)(朱靖等,2024)。事實(shí)上,上述所論的精準(zhǔn)決策是針對(duì)以客觀題為主的學(xué)科(如數(shù)學(xué)、英語等),而諸如語文等以主觀題為主的學(xué)科則很難實(shí)現(xiàn)精準(zhǔn)決策;而且由于操作方面的不便捷,致使教研平臺(tái)給出的精準(zhǔn)決策有時(shí)還不如教師自身目測(cè)更快。況且上述基于錯(cuò)題的個(gè)性化作業(yè)推送,總體而言并不精準(zhǔn),其原因是公司對(duì)作業(yè)庫中每道題標(biāo)注的知識(shí)點(diǎn)很不準(zhǔn)確,他們往往會(huì)把與某道題關(guān)聯(lián)的所有知識(shí)點(diǎn)都做標(biāo)注,這樣學(xué)生做錯(cuò)一道題,推送的練習(xí)題就可能是10道。如果真要實(shí)現(xiàn)精準(zhǔn)推送,必須由教師逐條審核,然而教師也無暇做此類審核工作。
上述兩類觀點(diǎn)所推崇的決策,實(shí)際上就是前文所述的算法決策或研發(fā)者協(xié)同人工智能算法決策的結(jié)果。總體而言,這類決策的實(shí)際績效并未經(jīng)過科學(xué)評(píng)估,因此,公司所宣稱的決策和教師真實(shí)感知的決策之間存在落差就在所難免了。
3.陷入單性異化的教研循證實(shí)踐
如前所述,技術(shù)性證據(jù)的確能為教研提供量化證據(jù),據(jù)此推動(dòng)智能教研循證實(shí)踐。比如,教師可以在課前依托平臺(tái)完成前測(cè),確定課堂教學(xué)的起點(diǎn);也可以在課堂教學(xué)過程中用量化的實(shí)時(shí)數(shù)據(jù)精準(zhǔn)調(diào)控課堂等。然而,由于師生的個(gè)性化需求差異、教學(xué)實(shí)踐具有的情境或語境依賴性和復(fù)雜性,使得僅依靠技術(shù)性證據(jù)無法實(shí)現(xiàn)三性優(yōu)化的教研循證實(shí)踐。過于強(qiáng)調(diào)技術(shù)性證據(jù),極易使教研循證實(shí)踐陷入單性異化的困境。這里的單性主要指證據(jù)的單一性,異化主要指基于技術(shù)性證據(jù)的循證實(shí)踐已成為教師的“異己”力量,它會(huì)反過來制約教師的發(fā)展。卡爾·馬克思(Karl Marx)將這樣的異化稱為“需要的異化”(馬克思,2018)。阿格妮絲·赫勒(Agnes Heller)在解讀馬克思的需要理論時(shí)指出,需要的異化在資本主義社會(huì)中主要有四種表現(xiàn),分別是“需要的手段與目的之關(guān)系的顛倒”“需要的質(zhì)量與數(shù)量倒置”“需要的貧困化”“需要受到特定利益群體的影響”(Heller,1976)。從智能教研探索的實(shí)踐看,單性異化的教研循證實(shí)踐突出表現(xiàn)為如下兩類。
一是需要的手段與目的之關(guān)系的顛倒。主要表現(xiàn)為:智能教研的本意是為了扭轉(zhuǎn)過于依賴經(jīng)驗(yàn)的局面,實(shí)現(xiàn)證據(jù)優(yōu)化的循證實(shí)踐,而通過智能教研平臺(tái)獲取技術(shù)性證據(jù)是實(shí)現(xiàn)循證實(shí)踐的手段。然而,在智能教研實(shí)踐中,一些區(qū)校卻把上述關(guān)系顛倒了,嚴(yán)重制約了教師教學(xué)的自主性和創(chuàng)造性,甚至為教師平添了諸多技術(shù)使用焦慮。如某區(qū)要求青年教師課堂教學(xué)中學(xué)生主動(dòng)學(xué)習(xí)的時(shí)間確保在30%以上,且以智能教研平臺(tái)生成的報(bào)告為評(píng)判依據(jù)。該舉措的本意是用平臺(tái)提供的證據(jù)引導(dǎo)青年教師多關(guān)注學(xué)生主動(dòng)學(xué)習(xí),而非“滿堂灌”;然而,實(shí)踐過程中由于前述的模型及其設(shè)定的問題,導(dǎo)致很多青年教師將關(guān)注焦點(diǎn)完全轉(zhuǎn)移到如何達(dá)標(biāo)上。而且在徒增技術(shù)焦慮的過程中,青年教師通過摸索和相互交流發(fā)現(xiàn),只要在課堂教學(xué)中持續(xù)準(zhǔn)確表述“小組合作”“隨堂練習(xí)”等關(guān)鍵詞,即可生成達(dá)標(biāo)的報(bào)告。
二是需要的貧困化。需要的貧困化并非指沒有需要,而是指智能教研過程中教師的需要高度同質(zhì)化和窄化。這種同質(zhì)化表現(xiàn)在:(1)教師所熟練運(yùn)用的智能教研技術(shù)是同質(zhì)化的,以確保教師能使用區(qū)域或?qū)W校購買的智能教研平臺(tái);(2)教師數(shù)據(jù)素養(yǎng)的同質(zhì)化,包括對(duì)智能教研數(shù)據(jù)的理解、分析和解讀等;(3)教師對(duì)教學(xué)模式理解的同質(zhì)化,即當(dāng)面對(duì)智能教研平臺(tái)提供的練習(xí)型、講授型、對(duì)話型、混合型教學(xué)模式時(shí),教師為了“彰顯”自身的教學(xué)理念往往傾向于選擇對(duì)話型教學(xué)模式;(4)教師所使用教學(xué)方法的同質(zhì)化,如為了在智能教研過程中獲得良好的數(shù)據(jù),教師往往會(huì)采用以學(xué)生為中心的教學(xué)方法;等等。長此以往,學(xué)校的特色、教師的教學(xué)風(fēng)格、學(xué)生的個(gè)性化成長需要都有可能被智能教研循證實(shí)踐所異化。同時(shí),課堂教學(xué)的高度同質(zhì)化也可能導(dǎo)致師生發(fā)展的需求被窄化。此外,智能教研平臺(tái)具有精準(zhǔn)滿足師生特定教學(xué)與學(xué)習(xí)偏好的優(yōu)勢(shì),那些對(duì)師生發(fā)展重要但不被師生喜歡的需要也可能被遮蔽,進(jìn)而帶來窄化師生成長的風(fēng)險(xiǎn)。需要指出的是,陷入單性異化的教研循證實(shí)踐,還與科學(xué)性證據(jù)匱乏、經(jīng)驗(yàn)性證據(jù)被輕視密不可分。
三、智能教研的理性回歸
早有學(xué)者指出:任何一項(xiàng)改革如要得到持續(xù)推進(jìn),則有賴于三級(jí)改革方案,即需要在學(xué)校和社區(qū)層面、學(xué)區(qū)/地區(qū)層面、州/聯(lián)邦層面進(jìn)行系統(tǒng)改革(Barber et al.,2005)。智能教研改革也不例外,其不僅涉及上述三個(gè)對(duì)應(yīng)層面,還涉及公司、高校、工業(yè)界等。唯有各個(gè)層面聯(lián)合研發(fā)、合力探索、內(nèi)外聯(lián)動(dòng),方有可能實(shí)現(xiàn)智能教研的理性回歸。
1.聯(lián)合研發(fā)保障智能教研數(shù)據(jù)質(zhì)量的可信基礎(chǔ)模型
從現(xiàn)狀來看,前述智能教研平臺(tái)的數(shù)據(jù)采集模型大多是預(yù)訓(xùn)練模型,其特點(diǎn)是針對(duì)智能教研應(yīng)用場(chǎng)景進(jìn)行訓(xùn)練,模型訓(xùn)練需要大規(guī)模地標(biāo)注數(shù)據(jù),而且只有通過訓(xùn)練后的模型才能完成智能教研數(shù)據(jù)的采集任務(wù)。但實(shí)際上智能教研平臺(tái)只能根據(jù)公司自身設(shè)定的模型來采集數(shù)據(jù),很難滿足學(xué)校個(gè)性化智能教研數(shù)據(jù)采集的需要。盡管這些模型基本上都是多模態(tài)的,但上述局限依然存在。為此,亟待跨界聯(lián)合研發(fā)保障智能教研數(shù)據(jù)質(zhì)量的可信基礎(chǔ)模型。
基礎(chǔ)模型是一種基于通用類模型構(gòu)建AI系統(tǒng)的新興范式,既與凸顯技術(shù)維度的預(yù)訓(xùn)練模型、自監(jiān)督模型等不同,也與過于偏向語言的“大語言模型”不同。基礎(chǔ)模型中的“基礎(chǔ)”是指作為通用基礎(chǔ),許多限定任務(wù)的模型是通過對(duì)其適配而構(gòu)建的。用“基礎(chǔ)”一詞同時(shí)也是為了凸顯架構(gòu)的穩(wěn)定性和安全性(Bommasani et al.,2021)。關(guān)于教育領(lǐng)域基礎(chǔ)模型的研發(fā),有學(xué)者認(rèn)為應(yīng)該整合直接調(diào)用和專門訓(xùn)練兩條技術(shù)路線。前者指“直接調(diào)用通用大模型,通過微調(diào)或提示學(xué)習(xí)的方式使之具備一定的專業(yè)能力”,后者指“利用教育領(lǐng)域?qū)I(yè)數(shù)據(jù),專門訓(xùn)練用于解決教育任務(wù)的大模型”(曹培杰等,2024)。盡管該研究提出了整合路線的思路和由基礎(chǔ)能力層、專業(yè)能力層、應(yīng)用服務(wù)層組成的整體架構(gòu),但其主要限于技術(shù)層面對(duì)模型開發(fā)的探討,并沒有考慮到模型研發(fā)所需的基礎(chǔ)研究。如前文所論,當(dāng)前智能教研模型大多借用或套用國外的相關(guān)理論,顯然無法滿足我國課堂教學(xué)快速發(fā)展的現(xiàn)實(shí)需求,因此亟待開展本土化的基礎(chǔ)研究。
聯(lián)合研究的關(guān)鍵是在政府支持下,組建跨界、跨學(xué)科的教育領(lǐng)域可信基礎(chǔ)模型研究團(tuán)隊(duì)。跨界主要指學(xué)術(shù)界和工業(yè)界的聯(lián)合。學(xué)術(shù)界的基礎(chǔ)研究能為工業(yè)界的模型研發(fā)提供指導(dǎo),反過來工業(yè)界也能為學(xué)術(shù)界的研究提供更明確的方向。跨學(xué)科研究團(tuán)隊(duì)主要由教育學(xué)、理學(xué)、工學(xué)、文學(xué)、交叉學(xué)科等學(xué)科領(lǐng)域的研究人員構(gòu)成,鼓勵(lì)他們基于我國已有的本土教研實(shí)踐,開展適合智能教研需要的可信基礎(chǔ)模型研究。其研究重點(diǎn)包括:(1)可信基礎(chǔ)模型建構(gòu)的理論,且應(yīng)將可能造成的教育影響和倫理風(fēng)險(xiǎn)考慮其中,而非等投入學(xué)校使用后再作補(bǔ)救。(2)持續(xù)開展跨學(xué)科研究的對(duì)話。由于可信基礎(chǔ)模型研究是一個(gè)全新課題,研究人員之間的頭腦風(fēng)暴、深度研討和文獻(xiàn)研究同等重要。(3)系統(tǒng)調(diào)研已有的智能教研數(shù)據(jù)采集模型,深入調(diào)研一線教師的使用感受及真實(shí)需求,以便為基礎(chǔ)研究貢獻(xiàn)鮮活的實(shí)踐資料。
為確保基礎(chǔ)模型的可信,研發(fā)過程中的模型訓(xùn)練要向智能教研的個(gè)性化方向傾斜。為此應(yīng)當(dāng)積極探索基礎(chǔ)模型訓(xùn)練的新思路,如斯坦福大學(xué)的學(xué)者們所指出的:“盡管教育中的很多數(shù)據(jù)流因?yàn)檫^于有限而無法單獨(dú)用于基礎(chǔ)模型的訓(xùn)練,但可以利用領(lǐng)域外(如互聯(lián)網(wǎng))的相關(guān)數(shù)據(jù)以及利用跨多個(gè)模態(tài)(如教科書、數(shù)學(xué)公式、圖表、基于視頻的教程等)的數(shù)據(jù),共同為基礎(chǔ)模型廣泛應(yīng)用于教育任務(wù)提供幫助”(Bommasani et al.,2021)。但該思路面臨的瓶頸是,需要充分考慮模型訓(xùn)練所使用作品的版權(quán)問題(謝惠加等,2024)。
2.合力探索智能教研協(xié)同決策的實(shí)踐課題
已有研究基本認(rèn)為人機(jī)協(xié)同決策就是人類決策和機(jī)器決策(或稱為“算法決策”)的協(xié)同,極少考慮控制機(jī)器決策之人與不控制機(jī)器之人的不同,因此,實(shí)現(xiàn)“人—機(jī)—人”協(xié)同決策是改進(jìn)當(dāng)前智能教研決策的關(guān)鍵。由于人機(jī)協(xié)同決策研究起步相對(duì)較早,故可為“人—機(jī)—人”協(xié)同決策研究提供借鑒;同時(shí),其他領(lǐng)域(如人力資源管理、經(jīng)濟(jì)管理等)對(duì)人機(jī)協(xié)同研究的推進(jìn)實(shí)踐亦為智能教研協(xié)同決策實(shí)踐研究提供了借鑒。
關(guān)于人機(jī)協(xié)同決策實(shí)踐,相關(guān)領(lǐng)域已開展了積極探索,主要包括如下三個(gè)方面:(1)用戶對(duì)算法決策和人類決策的感知及可接受性。例如,在人力資源管理領(lǐng)域,有學(xué)者通過實(shí)證研究發(fā)現(xiàn),員工覺得AI算法決策比上級(jí)主管決策的信息透明度更低,認(rèn)為AI算法并不能提供具有可獲得、可理解、可辨認(rèn)以及準(zhǔn)確清晰等特征的決策信息。該研究挑戰(zhàn)了現(xiàn)有文獻(xiàn)中認(rèn)為AI算法決策比人類決策更客觀公正的主流觀點(diǎn)(裴嘉良等,2021)。又如,在經(jīng)濟(jì)管理領(lǐng)域,有學(xué)者通過研究揭示了對(duì)算法的接受程度受員工對(duì)算法欣賞或厭惡態(tài)度的影響,他們指出:“算法欣賞或厭惡都不是普遍規(guī)律,而是隨著情境而發(fā)生變化的。在一些情況下(如決策結(jié)果不利時(shí)),人們欣賞算法;在另一些情況下(如決策結(jié)果有利時(shí)),算法或人工決策不會(huì)帶來差異化的感知。”(魏昕等,2021)(2)人機(jī)協(xié)同決策方式。例如,雅什·拉杰·什雷斯塔(Yash Raj Shrestha)等人將組織成員與人工智能決策相結(jié)合的方式劃分為三類,分別是全人類向人工智能的委托式?jīng)Q策(Full Human to AI Delegation)、混合式(人類到人工智能與人工智能到人類)序貫決策(Hybrid—Human-to-AI and AI-to-Human—Sequential Decision Making),以及聚合式人類—人工智能聯(lián)合決策(Aggregated Human-AI Decision Making),并將后兩種統(tǒng)稱為人機(jī)協(xié)同決策方式(Shrestha et al.,2019)。(3)人機(jī)協(xié)同決策的影響因素。例如,有研究發(fā)現(xiàn),決策者在主觀決策情境中會(huì)傾向于采納人的建議,而在客觀決策情境中則傾向于采納機(jī)器的建議;在客觀決策情境中,高認(rèn)知閉合需要的個(gè)體對(duì)人和機(jī)器建議的采納無顯著差異,而低認(rèn)知閉合需要的個(gè)體則更傾向于采納機(jī)器的建議;決策者在面對(duì)困難任務(wù)時(shí)更傾向于采納機(jī)器的建議,而在面對(duì)簡(jiǎn)單任務(wù)時(shí)對(duì)人和機(jī)器建議的采納無顯著差異(惠青山等,2024)。上述其他領(lǐng)域的人機(jī)協(xié)同決策實(shí)踐為智能教研協(xié)同決策研究開闊了視野。
為走出高估數(shù)據(jù)效用的教研決策誤區(qū),亟待引導(dǎo)地方、學(xué)校、公司、高校等多主體合力探索智能教研協(xié)同決策中的實(shí)踐課題。結(jié)合當(dāng)前智能教研決策實(shí)踐中存在的典型問題,筆者將智能教研決策實(shí)踐課題歸納如下:智能教研實(shí)踐中教師對(duì)“人—機(jī)—人”協(xié)同決策的可接受程度如何?“人—機(jī)—人”是如何協(xié)同決策的?“人—機(jī)—人”協(xié)同決策的影響因素有哪些?哪些教研問題適合“人—機(jī)—人”協(xié)同決策?“人—機(jī)—人”協(xié)同能否產(chǎn)生更加科學(xué)、精準(zhǔn)的決策?
3.內(nèi)外聯(lián)動(dòng)優(yōu)化推進(jìn)智能教研的循證實(shí)踐
優(yōu)化證據(jù)是智能教研循證實(shí)踐最大的挑戰(zhàn)。如前所述,單性異化是循證教研實(shí)踐最大的誤區(qū),為此亟須重視科學(xué)性證據(jù)的建設(shè)和經(jīng)驗(yàn)性證據(jù)的價(jià)值,從而推動(dòng)三性優(yōu)化的智能教研循證實(shí)踐真正落地。對(duì)此筆者提出以不同的內(nèi)外聯(lián)動(dòng)方式來突破證據(jù)建設(shè)困境,實(shí)現(xiàn)智能教研循證實(shí)踐的優(yōu)化推進(jìn)。
一是外主內(nèi)輔聯(lián)動(dòng)建立智能教研科學(xué)性證據(jù)庫。這既是突破科學(xué)性證據(jù)匱乏的關(guān)鍵,又能為智能教研平臺(tái)研發(fā)突破目前低層次重復(fù)建設(shè)困境提供科學(xué)依據(jù)。證據(jù)庫本質(zhì)上是“對(duì)經(jīng)過驗(yàn)證的單個(gè)證據(jù)在進(jìn)行分類的基礎(chǔ)上進(jìn)一步系統(tǒng)化,是對(duì)科學(xué)經(jīng)驗(yàn)的總結(jié)性提升”(安文霞,2016)。從智能教研實(shí)踐來看,目前智能教研平臺(tái)依據(jù)的科學(xué)性證據(jù)總體上呈個(gè)體性、零散性、非系統(tǒng)性等特點(diǎn),不利于智能教研循證實(shí)踐的系統(tǒng)推進(jìn)。科學(xué)性證據(jù)的構(gòu)建是一項(xiàng)系統(tǒng)、復(fù)雜的工作,亟須外主內(nèi)輔聯(lián)動(dòng)推進(jìn)。外主是指以外部為主導(dǎo),外部主導(dǎo)者包括政府部門、教研管理者、教學(xué)研究者、專業(yè)技術(shù)人員、證據(jù)庫錄入人員等。其中,政府部門和教研管理者負(fù)責(zé)教研實(shí)踐的統(tǒng)籌和協(xié)調(diào),研究者負(fù)責(zé)科學(xué)性證據(jù)文獻(xiàn)的系統(tǒng)歸類和深化,專業(yè)技術(shù)人員負(fù)責(zé)科學(xué)性證據(jù)工具的研發(fā)及智能平臺(tái)的搭建。內(nèi)輔是指以學(xué)校利益相關(guān)者作為輔助,并基于學(xué)校需求視角提出證據(jù)庫建設(shè)的建議。
二是內(nèi)主外輔正視經(jīng)驗(yàn)性證據(jù)的合理價(jià)值。經(jīng)驗(yàn)性證據(jù)是指教師基于教研情境或語境為教研實(shí)踐提供的憑據(jù),教師經(jīng)驗(yàn)是其主要來源。然而,在智能教研熱潮中,教研經(jīng)驗(yàn)成了理論界和實(shí)踐界批判的“靶子”,如“傳統(tǒng)教研較為依賴教師或?qū)<医?jīng)驗(yàn),缺乏針對(duì)教學(xué)過程數(shù)據(jù)和材料的科學(xué)分析” (穆肅等,2024);又如“學(xué)校迫切需要學(xué)科教研活動(dòng)從‘基于經(jīng)驗(yàn)’走向‘基于實(shí)證’,從基于‘主觀臆斷’走向‘精準(zhǔn)診斷’”(胡曉紅等,2019)。在法學(xué)界同樣存在輕視經(jīng)驗(yàn)的問題,由于經(jīng)驗(yàn)證明在司法實(shí)踐中具有不可或缺的作用,為此法學(xué)界提出了和教研中經(jīng)驗(yàn)性證據(jù)類似的“經(jīng)驗(yàn)法則”,認(rèn)為經(jīng)驗(yàn)法則“指代對(duì)事實(shí)認(rèn)定中經(jīng)驗(yàn)知識(shí)的運(yùn)用”,“具有可信性、蓋然性、公共性、具體性及隱蔽性五大內(nèi)部特征”(李汀,2023)。參照法學(xué)界的已有探索,教育界也亟待以學(xué)校為主體,連同教研員、高校研究者、公司相關(guān)人員等,探索怎樣的教研經(jīng)驗(yàn)可以作為經(jīng)驗(yàn)性證據(jù),以及這類證據(jù)應(yīng)具有何種獨(dú)特性,據(jù)此真正推進(jìn)三性優(yōu)化智能教研循證實(shí)踐的落地。
參考文獻(xiàn):
[1][德]馬克思(2018).1844年經(jīng)濟(jì)學(xué)哲學(xué)手稿[M].中共中央馬克思恩格斯列寧斯大林著作編譯局.北京:人民出版社:118-119.
[2][美]凱西·奧尼爾(2018).算法霸權(quán):數(shù)學(xué)殺傷性武器的威脅與不公[M].馬青玲.北京:中信出版社:前言Ⅸ.
[3][日]谷口忠大(2023).愛麗絲計(jì)劃:人工智能的現(xiàn)在與未來[M].丁丁蟲.北京:人民文學(xué)出版社.
[4][英]斯蒂芬·鮑爾,埃米利亞諾·格里馬爾迪(2020).新自由主義教育與新自由主義課堂[J].金津,劉紅霞.教育學(xué)報(bào),16(3):4-14.
[5][英]韋恩·霍姆斯,孫夢(mèng),袁莉(2023).人工智能與教育:本質(zhì)探析和未來挑戰(zhàn)[J].中國教育信息化,29(2):16-26.
[6]安維復(fù)(2017).人工智能的社會(huì)后果及其思想治理——沿著馬克思的思路[J].思想理論教育,(11):23-27.
[7]安文霞(2016).簡(jiǎn)析循證矯正證據(jù)庫的構(gòu)建[J].中國司法,(6):76-79.
[8]曹培杰,謝陽斌,武卉紫等(2024).教育大模型的發(fā)展現(xiàn)狀、創(chuàng)新架構(gòu)及應(yīng)用展望[J].現(xiàn)代教育技術(shù),34(2):5-12.
[9]常晉芳(2019).智能時(shí)代的人-機(jī)-人關(guān)系——基于馬克思主義哲學(xué)的思考[J].東南學(xué)術(shù),(2):75-82.
[10]陳禹辰,唐曉航,聶姿等(2023).數(shù)據(jù)驅(qū)動(dòng)的校本教研路徑探索與實(shí)踐[J].中小學(xué)數(shù)字化教學(xué),(9):27-31.
[11]董洪亮(2021).基于證據(jù)的教研轉(zhuǎn)向——基本概念問題的初步討論[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),39(5):108-115.
[12]何偉光(2023).走向解放:人工智能教育應(yīng)用本質(zhì)的哲學(xué)沉思[J].中國遠(yuǎn)程教育,43(7):11-20.
[13]胡小勇,林梓柔(2019).精準(zhǔn)教研視域下的教師畫像研究[J].電化教育研究,40(7):84-91.
[14]胡曉紅,凌偉(2019).發(fā)現(xiàn)與改進(jìn):基于數(shù)據(jù)的精準(zhǔn)教研的路徑與實(shí)踐[J].中國信息技術(shù)教育,(Z4):7-10.
[15]胡曉萌,陳力源,劉正源(2024).大語言模型的信任建構(gòu)[J].中州學(xué)刊,(5):171-176.
[16]惠青山,趙俊峰,姜紅梅等(2024).人與機(jī)器,誰的建議更容易被采納?不同決策情境下建議者類型對(duì)建議采納的影響研究[J].管理工程學(xué)報(bào),38(1):74-87.
[17]李汀(2023).經(jīng)驗(yàn)法則與印證的功能歸屬:一個(gè)敘事理論的視角[J].證據(jù)科學(xué),31(6):752-767.
[18]李陽,曾祥翊(2022).人工智能賦能教研高質(zhì)量發(fā)展:智能精準(zhǔn)教研的理論框架、實(shí)踐藍(lán)圖與發(fā)展脈絡(luò)[J].中國電化教育,(11):99-107,122.
[19]劉立杰(2024).依托希沃?jǐn)?shù)字校園基座,構(gòu)建教育生態(tài)新模式[J].安徽教育科研,(2):15-18.
[20]孟華(2008).符號(hào)學(xué)的三重證據(jù)法及其在證據(jù)法學(xué)中的應(yīng)用[J].證據(jù)科學(xué),(1):16-26.
[21]穆肅,陳孝然,胡小勇(2024).教師專業(yè)發(fā)展視域下智能教研平臺(tái)功能分析[J].現(xiàn)代遠(yuǎn)距離教育,(2):23-32.
[22]裴嘉良,劉善仕,鐘楚燕等(2021).AI算法決策能提高員工的程序公平感知嗎?[J].外國經(jīng)濟(jì)與管理,43(11):41-55.
[23]裴淼,靳偉,李肖艷等(2020).循證教師教育實(shí)踐:內(nèi)涵、價(jià)值和運(yùn)行機(jī)制[J].教師教育研究,32(4):1-8.
[24]魏昕,黃鳴鵬,李欣悅(2021).算法決策、員工公平感與偏差行為:決策有利性的調(diào)節(jié)作用[J].外國經(jīng)濟(jì)與管理,43(11):56-69.
[25]吳雨宸,宋萑,徐興子(2023).循證教研:指向教師實(shí)踐性知識(shí)生成的教研轉(zhuǎn)型[J].教師教育研究,35(1):13-19.
[26]謝惠加,譚鈞豪(2024).基礎(chǔ)模型訓(xùn)練使用作品的版權(quán)保護(hù)困境及出路[J].中國出版,(15):5-12.
[27]閆予沨,付鈺,劉麗莎等(2020).我國循證教師教育決策:內(nèi)涵、價(jià)值與路徑[J].教師教育研究,32(6):21-26.
[28]楊文登(2010).循證實(shí)踐:一種新的實(shí)踐形態(tài)?[J].自然辯證法研究,26(4):106-110.
[29]宰飛,吳丹璐(2023).大模型如何更可信可靠可及[N].解放日?qǐng)?bào),2023-07-08(004).
[30]張志學(xué),華中生,謝小云(2024).數(shù)智時(shí)代人機(jī)協(xié)同的研究現(xiàn)狀與未來方向[J].管理工程學(xué)報(bào),38(1):1-13.
[31]鄭欣欣,曾媛,曾祥翊等(2023).智能精準(zhǔn)教研中學(xué)校支持服務(wù)對(duì)教研效果影響的組態(tài)研究——基于定性比較分析方法[J].中國電化教育,(10):111-119.
[32]中國信息通信研究院,京東探索研究院(2021).可信人工智能白皮書[EB/OL].[2024-05-05].http://www.caict.ac.cn/kxyj/qwfb/bps/202107/P020210709319866413974.pdf.
[33]周麗昀,王天恩,王國豫等(2021).人工智能與人類未來的跨學(xué)科對(duì)話——從“交叉”到“融合”[J].哲學(xué)分析,12(5):181-195.
[34]朱靖,劉太如(2024).建設(shè)區(qū)域精準(zhǔn)教學(xué)支持體系 助力教育數(shù)字化轉(zhuǎn)型整體推進(jìn)——以上海市閔行區(qū)為例[J].中小學(xué)數(shù)字化教學(xué),(5):9-13.
[35]字詞語辭書編研組(2016).新編現(xiàn)代漢語詞典[M].長沙:湖南教育出版社.
[36]Barber, M., amp; Fullan, M. (2005). Tri-Level Development[EB/OL]. [2024-05-05]. https://www.edweek.org/leadership/opinion-tri-level-development/2005/03.
[37]Bommasani, R., Hudson, D. A., amp; Adeli, E. et al. (2021). On the Opportunities and Risks of Foundation Models[EB/OL]. [2024-05-05]. https://crfm.stanford.edu/assets/report.pdf.
[38]Heller, A. (1976). The Theory of Need in Marx[M]. New York: ST. Martin’s Press:48-66.
[39]McKnight, D. H., Carter, M., amp; Thatcher, J. B. et al. (2011). Trust in a Specific Technology: An Investigation of Its Components and Measures[J]. ACM Transactions on Management Information Systems, 2(2):1-25.
[40]Shrestha, Y. R., Ben-Menahem, S. M., amp; von Krogh, G. (2019). Organizational Decision-Making Structures in the Age of Artificial Intelligence[J]. California Management Review, 61(4):66-83.
[41]Terziyan, V., Gryshko, S., amp; Golovianko, M. (2018). Patented Intelligence: Cloning Human Decision Models for Industry 4.0[J]. Journal of Manufacturing Systems, 48:204-217.
收稿日期 2024-11-09 責(zé)任編輯 劉選
Intelligent Teaching Research: Essence, Misunderstanding and Return
WANG Lihua, SHI Yifan, LU Guocheng
Abstract: Intelligent teaching research (ITR) is a policy direction and practical hotspot under the trend of artificial intelligence. However, there is currently a widespread lack of understanding of the essence of ITR, which leads to blind pursuit and frequent practical misunderstandings. Based on a dual examination of the essence of artificial intelligence and teaching research, it is proposed that ITR is an evidence-based practice of “three-essence” (scientific, technical and empirical) optimization, which is realized by human-machine-human collaborative decision making from the teaching research data by trusted models. Based on this, the typical misconceptions of ITR are mainly reflected in three aspects: teaching research data constrained by suspicious models, teaching research decisions that overestimate the utility of data, and evidence-based teaching research practice that fall into singularity. In order to avoid misunderstandings, ITR urgently need to achieve rational regression through three ways in the future: first, it is essential to jointly develop trustworthy basic models to ensure the quality of ITR data; the second is to draw on existing research in related fields and work together to explore new practical topics for ITR “human-machine-human” collaborative decision making; the third is to promote the construction of a scientific evidence base through internal and external linkage, recognize the reasonable value of empirical evidence, and continuously optimize the evidence-based practice of ITR.
Keywords: Intelligent Teaching Research; Trusted Models; Human-Machine-Human Collaborative Decision Making; Evidence-Based Practice