一、引言
智能導(dǎo)學(xué)系統(tǒng)(Intelligent Tutoring System,ITS)是基于建構(gòu)主義學(xué)習(xí)理論,融合教育學(xué)、認知科學(xué)與計算機科學(xué)等多學(xué)科視角,通過人工智能模擬教師身份與學(xué)習(xí)者進行實時個性化交互,促進有效學(xué)習(xí)發(fā)生的學(xué)習(xí)輔助系統(tǒng)[12]。與傳統(tǒng)計算機輔助學(xué)習(xí)(Computer-AssistedLearning,CAL)相比,智能導(dǎo)學(xué)系統(tǒng)實現(xiàn)了從“千人一面”向“千人千面”的個性化服務(wù)能力躍進3。但在實際應(yīng)用中存在研發(fā)成本高4、智能化水平有限[5]、需求深度理解、跨領(lǐng)域應(yīng)用能力不足等問題,阻礙了將智能化融人學(xué)習(xí)全過程的教育數(shù)智化轉(zhuǎn)型目標實現(xiàn)。大語言模型(LargeLanguageModels,LLM)作為新一代智能技術(shù)正掀起智能革命的新浪潮。大模型利用深度學(xué)習(xí)技術(shù)基于海量通用數(shù)據(jù)和專業(yè)領(lǐng)域知識進行預(yù)訓(xùn)練,具備與學(xué)習(xí)者自由對話并生成多模態(tài)內(nèi)容以滿足其個性化學(xué)習(xí)需要的能力8。聯(lián)合國教科文組織2023年發(fā)布的《教育與研究領(lǐng)域生成式人工智能指南》中指出,大語言模型應(yīng)在人本主義的權(quán)威測試與嚴格監(jiān)管下,充分發(fā)揮輔助個性化、探究式、自我調(diào)節(jié)學(xué)習(xí)等方面的巨大潛力,促進學(xué)習(xí)者高階思維培養(yǎng)與大模型素養(yǎng)養(yǎng)成9。隨著大模型的持續(xù)更迭與功能進化,其強大的自然語言理解與生成能力將成為智能導(dǎo)學(xué)系統(tǒng)從“簡單智能”邁向“高級智能”的重要支撐。但若將大模型直接接入現(xiàn)有智能導(dǎo)學(xué)系統(tǒng)并不一定能帶來更好的用戶體驗,大模型“幻覺”現(xiàn)象[10]、深度邏輯缺失[1]、隱私信息泄露[2]風(fēng)險等問題尚未得到較好解決,這些不可控因素將對智能導(dǎo)學(xué)系統(tǒng)可信度、安全性和可靠性帶來嚴峻挑戰(zhàn)。鑒于此,研究將基于檢索增強生成(Retrieval-AugmentedGeneration,RAG)技術(shù),探索一套大語言模型與私有知識庫本地化部署的智能導(dǎo)學(xué)系統(tǒng)“低代碼”構(gòu)建方案,旨在抑制大模型“幻覺”現(xiàn)象產(chǎn)生,保障智能導(dǎo)學(xué)系統(tǒng)的可靠性與安全應(yīng)用,為實現(xiàn)教育智能化目標邁出關(guān)鍵一步。
二、文獻回顧:大語言模型之于智能導(dǎo)學(xué)系統(tǒng)的革 新與局限
(一)智能導(dǎo)學(xué)系統(tǒng)發(fā)展歷程與相關(guān)研究
20世紀70年代,Carbonell首次將人工智能引入計算機輔助學(xué)習(xí)系統(tǒng),開發(fā)用于南美洲地理教學(xué)的SCHOLAR[13],正式開啟智能導(dǎo)學(xué)系統(tǒng)時代,受當時主流的行為主義學(xué)習(xí)理論影響,智能導(dǎo)學(xué)系統(tǒng)的設(shè)計強調(diào)通過刺激產(chǎn)生反應(yīng),能夠按照預(yù)定的線性或分支程序基于學(xué)習(xí)者的問題作出文本模態(tài)回答;20世紀80年代,受認知主義影響智能導(dǎo)學(xué)系統(tǒng)開始重視認知的復(fù)雜過程,強調(diào)學(xué)習(xí)者通過與系統(tǒng)之間的交互逐漸形成和完善認知結(jié)構(gòu),此時智能導(dǎo)學(xué)系統(tǒng)開始有了推理能力,支持個性化學(xué)習(xí)的價值進一步凸顯;20世紀90年代到21世紀初,信息技術(shù)領(lǐng)域的顯著成就使學(xué)習(xí)理論步人建構(gòu)主義時代,同時為智能導(dǎo)學(xué)系統(tǒng)帶來了自然語言理解、智能代理、神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù),使其具備自適應(yīng)學(xué)習(xí)支持和多模態(tài)交互的能力。有學(xué)者認為智能導(dǎo)學(xué)系統(tǒng)架構(gòu)應(yīng)至少分為四個模塊:領(lǐng)域知識模塊,包含要傳達給學(xué)生的特定領(lǐng)域事實與規(guī)則,即專家知識;學(xué)習(xí)者模塊,用來動態(tài)描述學(xué)習(xí)者當前獲得的知識與技能,反應(yīng)學(xué)習(xí)者的認知特點;導(dǎo)學(xué)模塊,也稱教學(xué)決策模塊,主要根據(jù)學(xué)習(xí)者模型與學(xué)習(xí)目標針對性提供導(dǎo)學(xué)策略,并提交系統(tǒng)執(zhí)行;用戶界面,用于控制學(xué)習(xí)者與智能導(dǎo)學(xué)系統(tǒng)之間的交互[14]。Vanlehn提出智能導(dǎo)學(xué)系統(tǒng)的內(nèi)外雙循環(huán)架構(gòu),外循環(huán)通過分析學(xué)習(xí)者相對于學(xué)習(xí)目標的優(yōu)勢與劣勢,以自適應(yīng)的方式選擇系統(tǒng)下一步執(zhí)行的學(xué)習(xí)任務(wù);內(nèi)循環(huán)用來引出學(xué)習(xí)任務(wù)的具體執(zhí)行方案,并為學(xué)習(xí)者提供交互[15]。劉華等人將雙循環(huán)架構(gòu)進一步細化,在內(nèi)外循環(huán)之間添加了中循環(huán)的概念,負責根據(jù)學(xué)習(xí)任務(wù)與對應(yīng)的學(xué)習(xí)資源匹配傳給內(nèi)循環(huán)執(zhí)行,并跟蹤分析學(xué)習(xí)者學(xué)習(xí)行為傳給外循環(huán)保存[6]。
智能導(dǎo)學(xué)系統(tǒng)在語言學(xué)習(xí)[17、計算機編程[18]、醫(yī)學(xué)[19]特殊技能訓(xùn)練(如元認知2等領(lǐng)域的應(yīng)用均展現(xiàn)出其對輔助學(xué)習(xí)的獨特優(yōu)勢。但有研究發(fā)現(xiàn)智能導(dǎo)學(xué)系統(tǒng)在部分場景中應(yīng)用效果不如預(yù)期,如Saiying等人采用元分析方法調(diào)查發(fā)現(xiàn),智能導(dǎo)學(xué)系統(tǒng)對K-12學(xué)生數(shù)學(xué)學(xué)習(xí)僅有較小程度的促進作用,但對于學(xué)習(xí)動機與自我調(diào)節(jié)能力強的學(xué)生更有效[21]。Vanlehn的另一項研究發(fā)現(xiàn)智能導(dǎo)學(xué)系統(tǒng)輔導(dǎo)的粒度越精細效果越好,輔導(dǎo)質(zhì)量幾乎與人類輔導(dǎo)效果接近,但系統(tǒng)輸出的內(nèi)容準確性仍不達標,需通過調(diào)整算法參數(shù)等方式提高性能[22]。這可能是由于原有智能導(dǎo)學(xué)系統(tǒng)中智能算法主要依靠隨機森林[23]、樸素貝葉斯[24]、K-means[25等機器學(xué)習(xí)算法,人機對話、對學(xué)習(xí)者感知能力較弱,在知識密集型導(dǎo)學(xué)任務(wù)中表現(xiàn)不佳;其次,領(lǐng)域知識庫中僅包含學(xué)習(xí)者需要學(xué)習(xí)的相關(guān)內(nèi)容,缺乏其他多領(lǐng)域的知識,無法支持對學(xué)習(xí)者的跨領(lǐng)域、跨學(xué)科個性化學(xué)習(xí)需求。為此,智能導(dǎo)學(xué)系統(tǒng)亟需接入新一代人工智能技術(shù)以實現(xiàn)智能水平提升與功能進化。
(二)大語言模型引領(lǐng)智能導(dǎo)學(xué)系統(tǒng)智能革新
大語言模型基于大規(guī)模語料庫訓(xùn)練,能夠生成、理解和處理自然語言文本,從而在多語言、多模態(tài)、多領(lǐng)域任務(wù)中展現(xiàn)出高度的智能和廣泛的應(yīng)用潛力。大語言模型作為代理教師、學(xué)習(xí)伙伴、知識共創(chuàng)者等角色接入智能導(dǎo)學(xué)系統(tǒng),提升了系統(tǒng)在自然語言理解、內(nèi)容生成和適應(yīng)性方面的能力,推動智能導(dǎo)學(xué)系統(tǒng)邁向高級智能發(fā)展階段。
首先,大模型提升智能導(dǎo)學(xué)系統(tǒng)學(xué)習(xí)者感知能力。大模型能夠基于文本、聲音、圖像等多模態(tài)信息深入感知、分析和理解學(xué)生不同層面的狀態(tài),如學(xué)習(xí)習(xí)慣、興趣、知識水平和情感等,實現(xiàn)對學(xué)習(xí)者的精準畫像,為個性化的學(xué)習(xí)路徑和內(nèi)容推薦提供支持[2。如在徐升等基于大語言模型開發(fā)行為統(tǒng)計學(xué)智能導(dǎo)學(xué)系統(tǒng)中,僅分析學(xué)習(xí)者與系統(tǒng)交互的自然語言即可評估其對知識的學(xué)習(xí)情況,并基于此提供具體的導(dǎo)學(xué)方案。Chen在MicrosoftTeams平臺上整合GPT-4與MicrosoftCopilotStudio開發(fā)智能導(dǎo)學(xué)系統(tǒng),通過分析學(xué)習(xí)者在系統(tǒng)中的交互行為和學(xué)習(xí)數(shù)據(jù),獲取學(xué)習(xí)者的學(xué)習(xí)時間、問題回答情況等信息,從而了解學(xué)習(xí)者的學(xué)習(xí)狀態(tài)和進展并向教師反饋,教師可以根據(jù)這些信息更好地了解學(xué)習(xí)者的需求和困難,為學(xué)習(xí)者提供人機協(xié)同學(xué)習(xí)支持與指導(dǎo)[27]
第二,大模型賦予智能導(dǎo)學(xué)系統(tǒng)生成式對話能力。憑借先進的生成技術(shù),大模型可以模擬師生、生生之間的互動對話,提供即時的解答、指導(dǎo)和討論,提高導(dǎo)學(xué)效率和互動質(zhì)量。Abdelghani等人開發(fā)了一款由GPT-3驅(qū)動的導(dǎo)學(xué)系統(tǒng)KidsAsk,旨在通過回答孩子的問題并提供提示來引導(dǎo)他們提出問題,幫助9一10歲的兒童激發(fā)求知欲、培養(yǎng)好奇心、提高提問能力,并鼓勵他們在探索過程中嘗試提出更深人的問題[28]。Gautam等人將GPT-4接入智能導(dǎo)學(xué)系統(tǒng)CTAT,學(xué)習(xí)者可通過與大模型對話搭建與自身興趣有關(guān)的個性化情景,在該情境中學(xué)習(xí)和解決問題,并在這個過程中通過CTAT平臺獲得大模型的指導(dǎo)與反饋,顯著提高了學(xué)習(xí)者參與度和學(xué)習(xí)效果[29]。
第三,大模型助力實現(xiàn)智能導(dǎo)學(xué)系統(tǒng)跨領(lǐng)域應(yīng)用。大模型具備不同學(xué)科和多領(lǐng)域的知識儲備,能夠靈活適應(yīng)學(xué)習(xí)者多樣化學(xué)習(xí)需求,并融合多個視角解決復(fù)雜問題。可汗學(xué)院在其學(xué)習(xí)平臺中引入了基于GPT-4的專業(yè)虛擬助手Khanmigo,Khanmigo能夠在數(shù)學(xué)、人文、編程、社會研究等多個領(lǐng)域為學(xué)習(xí)者提供個性化導(dǎo)學(xué)服務(wù)[30。翟雪松等人通過利用多個基于大模型的智能體構(gòu)建智能導(dǎo)學(xué)系統(tǒng),使系統(tǒng)能夠動態(tài)適應(yīng)不同領(lǐng)域,提供多樣化的觀點,并為復(fù)雜學(xué)習(xí)問題提供強大且可擴展的解決方案,優(yōu)化學(xué)習(xí)體驗的同時促進學(xué)習(xí)者的認知和社會情感發(fā)展3。
(三)大語言模型之于智能導(dǎo)學(xué)系統(tǒng)的局限
盡管大語言模型在智能導(dǎo)學(xué)系統(tǒng)中展現(xiàn)了非凡潛力,但現(xiàn)階段大模型本身仍具有不可預(yù)估的應(yīng)用風(fēng)險,教育者仍需回歸技術(shù)理性,維護人工智能教育應(yīng)用的人本價值。
其一,大模型多領(lǐng)域應(yīng)用能力與專業(yè)領(lǐng)域?qū)W(xué)需求之間存在矛盾。目前大模型訓(xùn)練數(shù)據(jù)主要來自互聯(lián)網(wǎng)通用型資料,且主要基于西方語言,在智能導(dǎo)學(xué)系統(tǒng)中解決學(xué)習(xí)者的專業(yè)學(xué)習(xí)領(lǐng)域前沿問題時,由于缺乏專業(yè)領(lǐng)域的知識及深入理解,可能產(chǎn)生“信息幻覺”(InformationHallucination)[32],從而作出無意義或虛假的回答,也使得其在文化和價值觀上更傾向于西方觀念,具體表現(xiàn)為以漢語為對話語言時,大模型對學(xué)習(xí)者需求的理解能力及生成回答的質(zhì)量不佳[33]。
其二,導(dǎo)學(xué)過程的決策外包與去人性化風(fēng)險加劇。大模型在智能導(dǎo)學(xué)系統(tǒng)中模擬并替代了傳統(tǒng)學(xué)習(xí)輔導(dǎo)過程的教師參與,以“決策外包”的形式彌補教師的“缺陷存在”,突破教師個體的認知能力限制[34,但同時人在教育教學(xué)過程的主體性地位受到挑戰(zhàn)。盡管大語言模型能夠生成連貫且具有表面合理性的文本,但它們在處理復(fù)雜的邏輯推理和深層次理解時存在顯著不足。學(xué)習(xí)者在接受導(dǎo)學(xué)服務(wù)過程中需要辯證看待大模型生成內(nèi)容,如若過度依賴大模型給出的答案而又缺少人類教師的即時引導(dǎo),將對學(xué)習(xí)者批判性思維、問題解決能力的發(fā)展產(chǎn)生不可逆負面影響。
其三,教育信息與學(xué)習(xí)者隱私泄漏導(dǎo)致安全倫理危機。大語言模型在處理和存儲學(xué)習(xí)者數(shù)據(jù)的過程中,可能會面臨信息泄漏和隱私侵犯的風(fēng)險。此外,在抓取互聯(lián)網(wǎng)數(shù)據(jù)時,往往難以獲得數(shù)據(jù)所有者的明確許可,引發(fā)知識產(chǎn)權(quán)糾紛[35]。這些問題不僅威脅學(xué)習(xí)者的個人隱私,還可能引發(fā)廣泛的安全倫理問題,嚴重影響智能導(dǎo)學(xué)系統(tǒng)的合法性和可靠性。
綜上,大語言模型憑借其強大的自然語言處理和生成能力,顯著提升了智能導(dǎo)學(xué)系統(tǒng)在學(xué)習(xí)者感知、對話生成和跨領(lǐng)域應(yīng)用等方面的智能化水平,使其能夠更好地滿足個性化學(xué)習(xí)需求。大語言模型接人智能導(dǎo)學(xué)系統(tǒng)已成為不可阻擋的趨勢,助力智能導(dǎo)學(xué)系統(tǒng)向最理想的形態(tài)演進。然而,在此過程中大語言模型本身存在的幻覺現(xiàn)象、去人性化風(fēng)險與安全倫理危機等問題不容忽視,教育者必須謹慎看待大模型的技術(shù)優(yōu)勢,避免濫用。在推動二者有機融合的過程中,高度重視并積極應(yīng)對新的挑戰(zhàn),確保人工智能技術(shù)應(yīng)用的人本價值,維護學(xué)習(xí)者的權(quán)益和智能導(dǎo)學(xué)系統(tǒng)的安全性。
三、系統(tǒng)框架:本地大模型與私有知識庫增強智能導(dǎo)學(xué)系統(tǒng)
(一)RAG技術(shù):大模型與私有知識庫檢索增強生成技術(shù)(RAG)是一種用來解決傳統(tǒng)大語言模型生成內(nèi)容缺乏準確性和特定性的增強生成模型,能夠結(jié)合參數(shù)化和非參數(shù)化的記憶,從預(yù)備的知識庫中檢索與輸入問題有關(guān)的索引(非參數(shù)化記憶),整合在含參數(shù)化記憶的大模型中,以生成更高質(zhì)量的內(nèi)容,滿足用戶在特定領(lǐng)域的專業(yè)需求[3。RAG通常有兩個重要組件:一是用于生成文本的參數(shù)化生成器,即大語言模型;二是非參數(shù)化檢索器,即私有知識庫,用于從源于外部的、經(jīng)過處理的、與特定需求相關(guān)的信息和知識資源中檢索內(nèi)容,并將其與生成器結(jié)合起來增強生成內(nèi)容的質(zhì)量和準確性。RAG支持以熱交換(IndexHot-swapping)方式更新非參數(shù)記憶,允許在系統(tǒng)運行期間動態(tài)地更新私有知識庫,無需停機或重啟,也無需重新訓(xùn)練大模型[3。這一特性使得私有知識庫的管理、更新與維護變得更加靈活高效,能夠在不依賴外部服務(wù)的本地環(huán)境中,隨時根據(jù)需要為知識庫添加最新信息和知識。另外,避免大模型數(shù)據(jù)泄露問題的最佳方式是進行本地化部署[38],用戶將開源大模型算法下載到個人計算機中,利用本地計算機的硬件資源支撐大模型運行。隨著個人計算機AI本地部署逐漸普及,大模型本地化運行將成為新的發(fā)展趨勢。這意味著開源大語言模型和私有知識庫可以在更安全的本地環(huán)境中實現(xiàn)無縫集成,基于大模型的私有知識庫能為智能導(dǎo)學(xué)系統(tǒng)的本地化部署和運行創(chuàng)造有利條件。
(二)基于RAG的智能導(dǎo)學(xué)增強生成系統(tǒng)框架
為實現(xiàn)大語言模型與私有知識庫的本地化集成,共同賦能智能導(dǎo)學(xué)系統(tǒng)構(gòu)建,研究提出基于RAG的智能導(dǎo)學(xué)增強生成系統(tǒng)框架,如下頁圖1所示。整體來看,該框架可被劃分為本地空間與外部空間,圖中虛線框內(nèi)為本地空間,框外為外部空間。本地空間是指學(xué)習(xí)者個人的計算機系統(tǒng)中所有本地化部署的資源、數(shù)據(jù)和計算能力。在本地空間內(nèi),計算任務(wù)能夠不依賴外部網(wǎng)絡(luò)獨立完成,并且各類數(shù)據(jù)穩(wěn)定地存儲在本地設(shè)備中,有效確保數(shù)據(jù)安全和隱私性。外部空間則需要通過外部網(wǎng)絡(luò)或人工方式進行訪問或交互,數(shù)據(jù)被存儲在云端服務(wù)器或數(shù)據(jù)中心,具有海量存儲、實時性強、靈活訪問等優(yōu)勢。但來自外部空間的數(shù)據(jù)可能面臨安全、版權(quán)和隱私風(fēng)險,必須采取適當?shù)陌踩胧﹣肀U蠑?shù)據(jù)的可靠性。
1.外部空間
系統(tǒng)框架的外部空間主要包括智能導(dǎo)學(xué)系統(tǒng)的交互對象、多模態(tài)外部知識源、學(xué)習(xí)者數(shù)據(jù)等。智能導(dǎo)學(xué)系統(tǒng)的交互對象為學(xué)習(xí)者,學(xué)習(xí)者通過本地空間中的用戶界面與智能導(dǎo)學(xué)系統(tǒng)進行交互,系統(tǒng)識別并解決學(xué)習(xí)者學(xué)習(xí)過程遇到的困難和問題以達到有效學(xué)習(xí)的目的[39]。多模態(tài)外部知識源指的是與某專業(yè)領(lǐng)域?qū)W習(xí)高度相關(guān)的,存儲在其他教學(xué)平臺、學(xué)習(xí)平臺及社交平臺中,或教師日常教學(xué)常使用的資源,通常以文本、圖片、代碼、音頻、視頻等多種模態(tài)形式存在,即教材、教輔資料、教學(xué)音視頻、虛擬教學(xué)資源等40]。這些資源能夠為學(xué)習(xí)者提供多元化的學(xué)習(xí)體驗,將作為私有知識庫的儲備知識源,為智能導(dǎo)學(xué)系統(tǒng)的“檢索”過程作準備。但由于資源來源和制作標準各異,其質(zhì)量并不穩(wěn)定,且在使用時常涉及知識產(chǎn)權(quán)問題。因此在將其整合并上傳至智能導(dǎo)學(xué)系統(tǒng)之前,需要進行嚴格的篩選并從原作者處獲取明確的使用權(quán)限,確保私有知識庫的知識源是優(yōu)質(zhì)且合法的。學(xué)習(xí)者數(shù)據(jù)主要包括學(xué)習(xí)者知識水平、學(xué)習(xí)行為、學(xué)習(xí)風(fēng)格、學(xué)習(xí)者個人信息等,通常源自教師在日常教學(xué)中的記錄以及借助智能手環(huán)、攝像頭等設(shè)備進行采集,為學(xué)習(xí)者診斷及學(xué)習(xí)者畫像構(gòu)建提供數(shù)據(jù)基礎(chǔ)。與此同時學(xué)習(xí)者的個人隱私將變得完全透明[41],因此,將學(xué)習(xí)者數(shù)據(jù)納入本地私有知識庫必須獲得學(xué)習(xí)者本人的許可,并對數(shù)據(jù)進行脫敏處理(如隱匿姓名、泛化年齡等),以最大程度保障學(xué)習(xí)者的隱私與信息安全。

2.本地空間
本地空間是承載智能導(dǎo)學(xué)系統(tǒng)本地化運行的核心區(qū)域,檢索增強生成過程均發(fā)生在本地空間,可被分為四個模塊:本機硬件、用戶界面、大語言模型和私有知識庫。其中本機硬件作為智能導(dǎo)學(xué)系統(tǒng)的“大腦”,指的是學(xué)習(xí)者計算機中配備的硬件設(shè)備。由于其他三者均部署在本地環(huán)境中,因此其運行需要完全依靠本機硬件來提供算力及存儲資源,如本地大模型及私有知識庫的數(shù)據(jù)存儲需要依靠較大容量硬盤,知識庫向量檢索、大模型的增強運算及內(nèi)容生成需要高性能CPU或GPU提供算力等。本機硬件的性能將直接影響智能導(dǎo)學(xué)系統(tǒng)的響應(yīng)速度和處理能力,為此在部署本地智能導(dǎo)學(xué)系統(tǒng)時應(yīng)盡可能選擇高性能計算機或工作站。
用戶界面模塊是學(xué)習(xí)者與智能導(dǎo)學(xué)系統(tǒng)之間的“交互門戶”,負責將學(xué)習(xí)者提出的問題翻譯為系統(tǒng)可識別的語言傳遞給智能導(dǎo)學(xué)系統(tǒng),也能夠?qū)⑾到y(tǒng)生成的回答轉(zhuǎn)化為人可讀懂的界面語言反饋給學(xué)習(xí)者。Wenger提出,用戶界面看似功能簡單,但也承載著把控智能導(dǎo)學(xué)系統(tǒng)接受程度的重要作用,用戶界面是智能導(dǎo)學(xué)系統(tǒng)的最終呈現(xiàn)形式,因此其易用性、畫面呈現(xiàn)質(zhì)量決定了學(xué)習(xí)者對智能導(dǎo)學(xué)系統(tǒng)的接受程度[42]。為此優(yōu)化用戶界面設(shè)計是提高智能導(dǎo)學(xué)系統(tǒng)成功率的關(guān)鍵環(huán)節(jié),必須注重用戶體驗和界面美學(xué),同時保證響應(yīng)速度、可訪問性和多設(shè)備兼容性,從而提升學(xué)習(xí)者的使用體驗和系統(tǒng)接受度。
大語言模型模塊是智能導(dǎo)學(xué)系統(tǒng)增強生成的“智慧引擎”,賦予大模型身份、角色及任務(wù)使其成為代理智能體,是導(dǎo)學(xué)系統(tǒng)“增強生成”的主要承擔者。在研究構(gòu)建的系統(tǒng)框架中,至少需要兩個智能體分別負責處理智能導(dǎo)學(xué)系統(tǒng)的兩個關(guān)鍵任務(wù):導(dǎo)學(xué)分析和回答生成。大模型和智能體之間可以形成“一對多”或“多對多”的關(guān)系,由于大模型參數(shù)被穩(wěn)定部署在本地,而本地存儲資源有限,含參數(shù)量較大的模型將占用更多本地空間,因此可基于單一大模型的參數(shù)資源構(gòu)建多個智能體,亦可在本地部署多個大模型以供給不同功能的智能體。智能體的生成任務(wù)遵循“刺激-反應(yīng)”模式,其中刺激代表以自然語言方式輸入大模型的提示語,反應(yīng)代表生成內(nèi)容,刺激的質(zhì)量直接影響智能體生成反應(yīng)的質(zhì)量[43]。為了優(yōu)化生成任務(wù)需要借助教育提示語工程,例如在提示語中整合語境、目標、角色和示例四大元素[44]。語境指與智能體任務(wù)相關(guān)的關(guān)鍵信息,包括領(lǐng)域背景知識和學(xué)習(xí)者特征,為智能體提供理解問題背景和用戶需求的基礎(chǔ);目標指明確生成需求及結(jié)果的呈現(xiàn)形式;角色表示要為智能體賦予特定身份,以便其能夠更加專業(yè)、精準地完成任務(wù)或回應(yīng)問題;示例則提供生成樣例或結(jié)構(gòu)化的模板,指導(dǎo)智能體生成符合期望的結(jié)果。智能體接收到高質(zhì)量提示語后,將依靠本地CPU和GPU提供的算力調(diào)動大模型參數(shù)進行分析,以實現(xiàn)對“刺激”的精準處理進而作出有效的增強“反應(yīng)”。
私有知識庫是智能導(dǎo)學(xué)系統(tǒng)增強生成的“知識倉庫”,主要負責處理、存儲和管理向量形式的私有知識,并實現(xiàn)精準“檢索”。研究將私有知識庫界定為專為智能導(dǎo)學(xué)系統(tǒng)量身定制的,包含某相關(guān)專業(yè)領(lǐng)域特定知識及學(xué)習(xí)者數(shù)據(jù)的本地化知識庫,相較于領(lǐng)域知識庫更加強調(diào)數(shù)據(jù)的保密性與訪問控制。來自外部空間的多模態(tài)知識及學(xué)習(xí)者數(shù)據(jù)等需要經(jīng)過嚴格的篩選、脫敏與權(quán)限獲取后方可導(dǎo)人私有知識庫。經(jīng)過智能分段后,外部知識源將通過嵌入模型被導(dǎo)入向量化的私有知識庫,私有知識庫中包含多個獨立向量庫,如領(lǐng)域?qū)I(yè)知識、教學(xué)策略、教育教學(xué)理論、專業(yè)考試題庫及學(xué)習(xí)者畫像等。為保障知識的時效性并適配不同類型學(xué)習(xí)者,需要定期將庫中過時的、低質(zhì)量的知識,及需要更換的學(xué)習(xí)者信息進行廢棄處理。同樣,經(jīng)過大模型分析導(dǎo)學(xué)需求也將被向量化,并根據(jù)具體任務(wù)在私有知識向量庫中訪問一個或多個知識庫,采用語義相似度計算、向量檢索、關(guān)鍵詞檢索等方法檢索出與需求最相似的知識片段回傳給大模型模塊作為增強生成的內(nèi)容依據(jù)。
3.系統(tǒng)框架中的內(nèi)外雙循環(huán)
研究將系統(tǒng)框架劃分為外循環(huán)與內(nèi)循環(huán):外循環(huán)作為導(dǎo)學(xué)分析單元,負責分析處理學(xué)習(xí)者提出的問題,決定要執(zhí)行何種導(dǎo)學(xué)任務(wù)并提交對應(yīng)的私有知識庫進行檢索;內(nèi)循環(huán)作為導(dǎo)學(xué)執(zhí)行單元,基于檢索結(jié)果、導(dǎo)學(xué)任務(wù)及用戶問題等構(gòu)建增強提示語,增強智能導(dǎo)學(xué)智能體的生成結(jié)果。兩個循環(huán)中的任務(wù)均有至少一個智能體參與,需要大語言模型與私有知識庫的緊密配合。
在外循環(huán)中,大語言模型首先處理來自用戶界面的學(xué)習(xí)者問題,判斷學(xué)習(xí)者導(dǎo)學(xué)需求和其自身特征。系統(tǒng)基于用戶問題、對話歷史、導(dǎo)學(xué)分析指令、角色限定及導(dǎo)學(xué)任務(wù)類型庫組建提示語輸入導(dǎo)學(xué)分析智能體,智能體將依據(jù)導(dǎo)學(xué)任務(wù)類型生成學(xué)習(xí)者的導(dǎo)學(xué)需求,并分析學(xué)習(xí)者自身特征(學(xué)段、學(xué)科、掌握程度等)。隨后導(dǎo)學(xué)分析智能體的生成內(nèi)容將被向量化,并導(dǎo)入私有知識向量庫進行檢索,每次檢索并不需要訪問所有知識庫,而是根據(jù)導(dǎo)學(xué)任務(wù)類型選擇檢索一個或多個向量庫。例如,導(dǎo)學(xué)需求為“出練習(xí)題”時,要求訪問專業(yè)考試題庫和學(xué)習(xí)者畫像庫;導(dǎo)學(xué)需求為“知識講解”時,則訪問領(lǐng)域?qū)I(yè)知識庫和教育教學(xué)理論庫。
內(nèi)循環(huán)接收私有知識向量庫創(chuàng)建的索引結(jié)果并進行質(zhì)量檢查。如果檢索結(jié)果不佳或檢索失敗,則需要調(diào)整檢索參數(shù)或更換檢索方法,直至得到有效的索引結(jié)果。此索引結(jié)果作為檢索增強生成的“增強內(nèi)容”返回給大語言模型,并結(jié)合用戶問題、對話歷史、導(dǎo)學(xué)任務(wù)與學(xué)習(xí)者特征、角色限定及輸出指令等,構(gòu)建增強提示語,導(dǎo)人智能導(dǎo)學(xué)智能體完成“增強生成”任務(wù),最終生成更準確且高質(zhì)量的回答。學(xué)習(xí)者收到系統(tǒng)回復(fù)后,會繼續(xù)思考并提出新的問題,新問題將再次進入外循環(huán)處理,確保整個系統(tǒng)在不斷反饋和優(yōu)化中形成一個高效的閉環(huán),促進學(xué)習(xí)者知識掌握的同時實現(xiàn)批判性思維、創(chuàng)新與問題解決能力的全面提升。
四、應(yīng)用場域:“人智共生”智能導(dǎo)學(xué)增強共同體
基于RAG技術(shù)的大語言模型與私有知識庫造就了新一代智能導(dǎo)學(xué)系統(tǒng)。可見教育數(shù)智化離不開技術(shù)的發(fā)展,技術(shù)與教育者、學(xué)習(xí)者之間形成相互塑造、協(xié)同共生的諧和樣態(tài),因此處理好人技關(guān)系是保障教育過程中人類主體地位的關(guān)鍵[45]。鑒于此,研究參考探究社區(qū)模型(CommunityofInquiry,CoI)并基于人機協(xié)同學(xué)習(xí)視角,構(gòu)建“人智共生”智能導(dǎo)學(xué)增強共同體,并從中衍生出以學(xué)習(xí)者為主體、教師主導(dǎo)的智能導(dǎo)學(xué)系統(tǒng)應(yīng)用場域,如下頁圖2所示。探究社區(qū)模型指出,探究型學(xué)習(xí)共同體由教學(xué)存在、認知存在和社會存在組成[4。其中,教學(xué)存在體現(xiàn)教師的教學(xué)方法與策略,需要教師創(chuàng)設(shè)相應(yīng)的教學(xué)情境;認知存在需要選擇學(xué)習(xí)內(nèi)容和任務(wù),并促進學(xué)習(xí)者的信息加工與知識建構(gòu);社會存在則注重師生通過交互,實現(xiàn)高階思維培養(yǎng)與情感支持[47]。智能導(dǎo)學(xué)增強共同體由教師、學(xué)習(xí)者和新一代智能導(dǎo)學(xué)系統(tǒng)組成,他們在智能導(dǎo)學(xué)應(yīng)用中擁有各自的“場域”,并以歐拉圖形式交織。如教師需明確教學(xué)目標及對應(yīng)的學(xué)習(xí)者信息,擁有豐富的多模態(tài)教學(xué)資源,并掌握有效的教學(xué)策略與方法;智能導(dǎo)學(xué)系統(tǒng)能夠在本地環(huán)境中基于私有知識庫及大語言模型,創(chuàng)設(shè)多個代理智能體并通過用戶界面實現(xiàn)智能導(dǎo)學(xué)交互;學(xué)習(xí)者則應(yīng)有明確的學(xué)習(xí)目標,了解自己當前的學(xué)習(xí)情況,并為實現(xiàn)學(xué)習(xí)目標而產(chǎn)生學(xué)習(xí)行為,在此過程中能夠及時調(diào)節(jié)自己的元認知策略,不斷提出新的個性化學(xué)習(xí)需求。三者所屬場域可產(chǎn)生三處交界:“師-智”“生-智”和“師-生”應(yīng)用場域,并派生出三類新一代智能導(dǎo)學(xué)系統(tǒng)增強應(yīng)用,分別映射于導(dǎo)學(xué)增強共同體的教學(xué)存在、認知存在與社會存在。
(一)“師-智”應(yīng)用場域
“師-智”應(yīng)用場域作為教學(xué)存在,要求教師在智能導(dǎo)學(xué)中擔任學(xué)生學(xué)習(xí)過程的主導(dǎo)者角色,利用自身場域優(yōu)勢完成新一代智能導(dǎo)學(xué)系統(tǒng)維護和導(dǎo)學(xué)活動設(shè)計,實現(xiàn)人類教師與代理智能體導(dǎo)師的優(yōu)勢互補[48]。
其一,教學(xué)目標制定及智能導(dǎo)學(xué)系統(tǒng)功能預(yù)設(shè)。教師要根據(jù)學(xué)習(xí)者實際情況制定明確具體的教學(xué)目標,并據(jù)此設(shè)定智能導(dǎo)學(xué)系統(tǒng)將為學(xué)習(xí)者提供何種導(dǎo)學(xué)功能,如學(xué)習(xí)資源及習(xí)題生成、個性化答疑等,另外教師應(yīng)參考適當?shù)慕虒W(xué)策略與方法為具體功能編輯導(dǎo)學(xué)提示語的上下文,指定輸出內(nèi)容的形式,使其能夠適應(yīng)學(xué)習(xí)者的理解能力及接受程度。其二,本地私有知識庫更新與維護。教師將授權(quán)的高質(zhì)量多模態(tài)教學(xué)資源及學(xué)習(xí)者數(shù)據(jù)導(dǎo)人私有知識庫,同時需注意其格式規(guī)范,可設(shè)定明確的標志符(如“#”“/”等)或進行難度分級便于智能導(dǎo)學(xué)系統(tǒng)識別、分析和向量化處理,避免因格式問題使得系統(tǒng)識別錯誤或效率降低,最終導(dǎo)致“檢索”失敗。其三,代理智能體創(chuàng)建與調(diào)試。教師需根據(jù)導(dǎo)學(xué)系統(tǒng)所在的本地主機性能,選擇并部署參數(shù)量適宜的一個或多個大模型確保其能夠在本地高效運行。并將大模型與私有知識庫進行鏈接,為大模型賦予特定角色構(gòu)建代理智能體以創(chuàng)建智能導(dǎo)學(xué)應(yīng)用。在智能導(dǎo)學(xué)系統(tǒng)投入正式使用前,教師需要通過測試來檢查系統(tǒng)能否從私有知識庫中檢索高質(zhì)量內(nèi)容,并根據(jù)測試結(jié)果調(diào)整檢索方案或大模型提示語,確保代理智能體能夠依據(jù)索引提供準確的“增強生成”內(nèi)容。
(二)“生-智”應(yīng)用場域
新一代智能導(dǎo)學(xué)系統(tǒng)大模型與 本地環(huán)境 個答檢索微調(diào) 私有知識庫大語言模型教學(xué)存在 大模型本地部署 用戶界面 學(xué)習(xí)資源生成 認知存在私有知識庫更新 代理智能體 自適應(yīng)習(xí)題生成元認知調(diào)節(jié)支持導(dǎo)學(xué)提示語設(shè)計學(xué)習(xí)效果評價教學(xué)策略應(yīng)用有意義知識建構(gòu)學(xué)習(xí)者數(shù)據(jù)維護 “師—智” “生一智”應(yīng)用場域 C 應(yīng)用場域教學(xué)目標 智共生 學(xué)習(xí)目標學(xué)習(xí)者信息 共同體 知識掌握情況多模態(tài)教學(xué)資源 “師一生” 學(xué)習(xí)行為教學(xué)策略 應(yīng)用場域 元認知策略教學(xué)方法 個性化需求教師 學(xué)習(xí)者情感支持 面對面交流 大模型素養(yǎng)培育個性化答疑 高階能力發(fā)展偏誤糾正學(xué)習(xí)體驗社會存在“生-智”應(yīng)用場域作為認知存在,應(yīng)充分體現(xiàn)學(xué)習(xí)者的學(xué)習(xí)主體地位,智能導(dǎo)學(xué)系統(tǒng)需要為學(xué)習(xí)者提供促進有意義學(xué)習(xí)的建構(gòu)性導(dǎo)學(xué)支持,輔導(dǎo)學(xué)習(xí)者進行主動的有效認知加工,著重提升學(xué)習(xí)者認知水平和自主學(xué)習(xí)能力[49]
其一,開放、專業(yè)、個性化的知識問答。學(xué)習(xí)者在學(xué)習(xí)過程中可隨時提出問題,智能導(dǎo)學(xué)系統(tǒng)將根據(jù)其學(xué)習(xí)背景和個性化需求,同時記錄與學(xué)習(xí)者的對話歷史,通過外循環(huán)與內(nèi)循環(huán)的往復(fù)接力完成檢索增強生成任務(wù),通過持續(xù)對話交互幫助學(xué)習(xí)者實現(xiàn)知識建構(gòu)。其二,學(xué)習(xí)資源與習(xí)題個性化生成。智能導(dǎo)學(xué)系統(tǒng)具備強大的數(shù)據(jù)分析能力,能夠?qū)崟r監(jiān)控和評估學(xué)生的學(xué)習(xí)情況,通過對話動態(tài)感知學(xué)習(xí)者的知識掌握情況變化。當學(xué)習(xí)者需要輔助資源和習(xí)題時,系統(tǒng)能夠從私有知識庫中動態(tài)檢索與學(xué)習(xí)者水平適應(yīng)的索引結(jié)果,并返回智能體生成最適合該學(xué)習(xí)者的增強內(nèi)容。其三,個性化學(xué)習(xí)支持。智能導(dǎo)學(xué)系統(tǒng)應(yīng)具備獨立的學(xué)習(xí)支持模塊,可由獨立的學(xué)習(xí)支持代理智能體承擔,主要包括學(xué)習(xí)者情感調(diào)節(jié)、元認知調(diào)節(jié)、學(xué)習(xí)策略與方法指導(dǎo)等[50。系統(tǒng)可以提示學(xué)習(xí)者進行自我反思,幫助學(xué)習(xí)者主動調(diào)整學(xué)習(xí)策略,同時識別學(xué)習(xí)者的情緒狀態(tài),適當提供情感支持與激勵,維持學(xué)習(xí)者的學(xué)習(xí)動機。
(三)“師-生”應(yīng)用場域
“師-生”應(yīng)用場域作為社會存在,主要通過教師與學(xué)習(xí)者之間的交互來實現(xiàn)“人-機”互補的導(dǎo)學(xué)模式,充分發(fā)揮教育過程的人本主義思想,消解人本危機。此應(yīng)用場域中雖然沒有智能導(dǎo)學(xué)系統(tǒng)的直接參與,但需要借助師生交互來對智能導(dǎo)學(xué)系統(tǒng)的應(yīng)用效果進行評估并提出優(yōu)化策略。
其一,學(xué)習(xí)者疑難問題答疑與大模型錯誤糾正。由于大模型的深度邏輯缺失問題難以完全解決,智能導(dǎo)學(xué)系統(tǒng)可能無法解決復(fù)雜的疑難問題,或在部分復(fù)雜問題的回答中出現(xiàn)錯誤,教師需要通過師生交互發(fā)現(xiàn)這些問題并及時糾正學(xué)習(xí)者,同時定期對智能導(dǎo)學(xué)系統(tǒng)中大模型進行微調(diào)或優(yōu)化提示語。其二,整體把控學(xué)習(xí)者學(xué)習(xí)進度并提供情感支持。雖然當前人工智能僅能通過學(xué)習(xí)者學(xué)習(xí)行為、面部表情等數(shù)據(jù)識別出高興、難過等簡單情緒,而困惑、沮喪等復(fù)雜情緒仍難以區(qū)分[51,且情緒感知能力遜于人類教師。為此需要教師通過與學(xué)習(xí)者的互動,了解學(xué)習(xí)者的學(xué)習(xí)進展與情感變化,以即時提供情感上的支持及鼓勵,維持學(xué)習(xí)者的學(xué)習(xí)動機與積極性。另外,也可在私有知識庫中嘗試構(gòu)建情感支持策略庫,并逐漸培養(yǎng)情感支持代理智能體來實現(xiàn)情感支持的“增強”。其三,大模型素養(yǎng)培育及高階能力發(fā)展。大模型素養(yǎng)指學(xué)習(xí)者應(yīng)用大模型輔助學(xué)習(xí)時應(yīng)該具備的高階私有模式,包括理解、介入、提示語、印證和整合五個階段[52。除此之外,大模型素養(yǎng)還應(yīng)包括如何有效、安全地使用大模型輔助學(xué)習(xí),以及理解大模型的局限性和潛在風(fēng)險。教師應(yīng)承擔學(xué)習(xí)者大模型素養(yǎng)培育和高階能力發(fā)展的責任,為學(xué)習(xí)者提供智能導(dǎo)學(xué)系統(tǒng)的使用指南,并培養(yǎng)其批判性思維和問題解決能力等高階能力。
“人智共生”智能導(dǎo)學(xué)增強共同體不僅實現(xiàn)了技術(shù)、人與教育的三位一體,更通過三者之間的協(xié)作共生,開創(chuàng)新一代智能導(dǎo)學(xué)模式,使智能導(dǎo)學(xué)系統(tǒng)成為學(xué)習(xí)者有效學(xué)習(xí)的輔助工具與促進師生深度交互的橋梁。
五、實踐案例:來華留學(xué)預(yù)科教育“理工中文”智能導(dǎo)學(xué)系統(tǒng)
研究以面向來華留學(xué)預(yù)科生開設(shè)的“理工中文”課程為例,構(gòu)建了來華留學(xué)預(yù)科教育“理工中文”智能導(dǎo)學(xué)系統(tǒng),旨在演示與驗證基于RAG的智能導(dǎo)學(xué)增強生成系統(tǒng)框架在國際中文教育中應(yīng)用的可行性,并具體闡釋在“人智共生”智能導(dǎo)學(xué)增強共同體中衍生出的功能應(yīng)用。
國際中文教育除通用中文教學(xué)外,專業(yè)學(xué)習(xí)用途中文教學(xué)同樣是重中之重。據(jù)調(diào)查,理工類留學(xué)生在進入專業(yè)學(xué)習(xí)后面臨的最主要問題就是在閱讀專業(yè)教材、理解課堂講授內(nèi)容及完成書面作業(yè)等方面存在障礙,學(xué)生們普遍反映專業(yè)知識特別是掌握的專業(yè)詞匯量極其不足,嚴重影響專業(yè)學(xué)習(xí)成效。在來華留學(xué)本科預(yù)科教育中,理工類預(yù)科生規(guī)模占比較大,理工中文作為預(yù)科階段的必修課程,更是普通漢語課和專業(yè)基礎(chǔ)知識課銜接的橋梁[53]。但預(yù)科生學(xué)習(xí)時間通常僅有10個月,理工中文課程課時安排有限,學(xué)習(xí)效果仍舊不夠理想[54]。為此研究借助基于RAG的開源知識庫問答系統(tǒng)MaxKB(MaxKnowledgeBase),結(jié)合本地大語言模型與理工中文私有知識庫,以低成本、低代碼的方式高效搭建“理工中文”智能導(dǎo)學(xué)系統(tǒng),以理工中文學(xué)習(xí)助手身份通過即時反饋為理工類預(yù)科生解答疑難問題,提高專業(yè)詞匯量,為后續(xù)理工專業(yè)學(xué)習(xí)奠定扎實的語言基礎(chǔ)。
根據(jù)研究提出的“人智共生”智能導(dǎo)學(xué)增強共同體,“理工中文”智能導(dǎo)學(xué)系統(tǒng)的設(shè)計主導(dǎo)者為理工中文教師,導(dǎo)學(xué)交互對象為來華理工類預(yù)科留學(xué)生,下面將從“師-智”“生-智”“師-生”三大應(yīng)用場域具體闡釋“理工中文”智能導(dǎo)學(xué)系統(tǒng)的核心應(yīng)用模式。
(一)“師-智”場域:系統(tǒng)構(gòu)建
理工中文教師具備豐富的教學(xué)經(jīng)驗和足量的教學(xué)資源儲備,需肩負起開發(fā)高質(zhì)量“理工中文”智能導(dǎo)學(xué)系統(tǒng)的重任,參與到大語言模型本地部署、理工中文私有知識庫構(gòu)建、導(dǎo)學(xué)應(yīng)用搭建、提示語設(shè)計與檢索調(diào)優(yōu)等核心應(yīng)用中,形成系統(tǒng)的完整構(gòu)建流程(如圖3所示)。

步驟一,大語言模型本地部署。選用Meta發(fā)布的大模型Llama3,其優(yōu)點是開源、輕量級且允許在本地硬件上部署和運行,8億參數(shù)量的Llama3模型僅占用本機約4.7GB內(nèi)存空間,將其下載至本地后在MaxKB系統(tǒng)中設(shè)置好大模型的本地API域名即可本地運行。
步驟二,理工中文私有知識庫構(gòu)建。研究將構(gòu)建理工中文詞表庫和理工中文語料庫兩個知識庫并準備原始資源:詞表庫整合HSK詞表及理工中文詞表,并進行明確分級以適應(yīng)不同中文水平的學(xué)習(xí)者,語料庫整合理工中文課文語料、理工中文常用表達式及理工中文習(xí)題庫等;這些知識庫原始資源需要經(jīng)過語料清洗、智能分段、人工分段調(diào)整,最后被向量化以備“檢索”。研究通過以下三個方法來提高“檢索”命中率:進行語料清洗篩去特殊字符、圖片、公式等內(nèi)容;創(chuàng)建知識庫時針對知識庫中包含的文檔撰寫詳盡的知識庫介紹;人工篩查并精細化調(diào)整MaxKB的智能語料分段,并為每個分段設(shè)置小標題輔助“檢索”命中。
步驟三,理工中文智能導(dǎo)學(xué)應(yīng)用搭建與調(diào)優(yōu)。此步驟是將部署好的本地大模型、理工中文私有知識庫及前端界面進行整合與磨合的過程。首先對用戶界面的應(yīng)用名稱、描述與開場白進行設(shè)置,為學(xué)習(xí)者創(chuàng)設(shè)美觀、易用的導(dǎo)學(xué)界面,并引導(dǎo)學(xué)習(xí)者主動提出理工中文詞匯、概念及知識的問題;其次設(shè)置好本地大模型并構(gòu)建結(jié)構(gòu)化提示語,如限制大模型采用簡單的漢語表達來回復(fù)以適應(yīng)預(yù)科生的漢語水平等;最后將知識庫關(guān)聯(lián)至應(yīng)用中,并設(shè)置好檢索模式與相似度限制。在功能調(diào)試階段需要向?qū)W(xué)系統(tǒng)提出問題并根據(jù)輸出內(nèi)容質(zhì)量對提示語與檢索參數(shù)進行調(diào)優(yōu),優(yōu)化檢索增強生成質(zhì)量。
“生-智”場域:系統(tǒng)應(yīng)用
“理工中文”智能導(dǎo)學(xué)系統(tǒng)以“理工中文學(xué)習(xí)助手”的身份為預(yù)科留學(xué)生提供多維度的學(xué)習(xí)支持,旨在提升學(xué)習(xí)者理工中文能力和學(xué)習(xí)效能。系統(tǒng)通過與學(xué)生的個性化交互,提供針對性的理工中文詞匯講解、教材內(nèi)容答疑以及專業(yè)知識的深入解釋,成為課堂教學(xué)的有力補充,還能夠為留學(xué)生提供情感與元認知支持,幫助學(xué)習(xí)者在高強度的學(xué)習(xí)中保持積極性與自我調(diào)節(jié)能力。
(三)“師-生”場域:系統(tǒng)優(yōu)化
理工中文教師作為導(dǎo)學(xué)過程的主導(dǎo)者,需要與預(yù)科生開展面對面交流,并借助大語言模型的技術(shù)支持和教師自身的專業(yè)教學(xué)經(jīng)驗,動態(tài)優(yōu)化“理工中文”智能導(dǎo)學(xué)系統(tǒng),以更好地服務(wù)于理工中文教學(xué)需求。例如,研究在初步的留學(xué)生使用反饋中發(fā)現(xiàn)系統(tǒng)在處理復(fù)雜理工專業(yè)詞匯、技術(shù)術(shù)語及其多樣化表達時存在不足。教師應(yīng)定期查看學(xué)生在使用智能導(dǎo)學(xué)系統(tǒng)中的對話日志,分析學(xué)生的提問質(zhì)量及理工中文學(xué)習(xí)助手的回答質(zhì)量,調(diào)整提示語并對知識庫內(nèi)容進行動態(tài)管理。針對學(xué)生普遍難以理解的數(shù)學(xué)、物理等學(xué)科專有名詞和概念,逐步優(yōu)化系統(tǒng)的檢索邏輯,強化專業(yè)詞匯的分級講解功能,確保系統(tǒng)在解釋專業(yè)內(nèi)容時更加簡潔、精準,符合預(yù)科生的語言水平。

為維護大模型教育應(yīng)用的人本價值,理工中文教學(xué)不可過度依賴智能導(dǎo)學(xué)系統(tǒng),教師還應(yīng)承擔起智能導(dǎo)學(xué)系統(tǒng)無法勝任或表現(xiàn)不足的任務(wù)。如為預(yù)科生提供更深入的情感支持,輔助調(diào)節(jié)學(xué)習(xí)中的焦慮或困惑,維持積極的中文學(xué)習(xí)動機。此外,教師還需要解決導(dǎo)學(xué)系統(tǒng)難以回答的復(fù)雜問題,尤其是涉及深層次的邏輯推理和跨學(xué)科理解的部分。這種基于“人智共生”智能導(dǎo)學(xué)增強共同體的理工中文“人機協(xié)同”教學(xué)模式在提高留學(xué)生理工中文能力的同時,更在互動中引導(dǎo)學(xué)生發(fā)展批判性思維和問題解決能力,推動高階思維的培養(yǎng)。
六、風(fēng)險治理:新一代智能導(dǎo)學(xué)系統(tǒng)持續(xù)演進
RAG技術(shù)增強了通用大語言模型在專業(yè)領(lǐng)域的生成能力,助力智能導(dǎo)學(xué)系統(tǒng)從排演式簡單智能向系統(tǒng)性高級智能轉(zhuǎn)型。隨著智能技術(shù)的進一步發(fā)展,智能導(dǎo)學(xué)增強系統(tǒng)將結(jié)合“人智共生”理念,創(chuàng)生出自適應(yīng)高智能應(yīng)用,推動教育向個性化、智能化的終極目標邁進。雖然本地大模型和私有知識庫造就了新一代智能導(dǎo)學(xué)系統(tǒng),但與之伴隨的“下一代”危機仍不可避免。為此,研究針對可預(yù)見的風(fēng)險提出四條治理策略,旨在保障智能導(dǎo)學(xué)系統(tǒng)可持續(xù)發(fā)展與未來演進。
(一)突破語言屏障:自主打造中文版教育大模型與私有知識庫
新一代智能導(dǎo)學(xué)系統(tǒng)中采用的通用大模型,如ChatGPT-4,Llama3等,均采用多國語言和海量互聯(lián)網(wǎng)數(shù)據(jù)完成訓(xùn)練,但其中中文訓(xùn)練數(shù)據(jù)占比僅不足 5% 。這導(dǎo)致大模型在智能導(dǎo)學(xué)系統(tǒng)中完成中文導(dǎo)學(xué)任務(wù)時性能不佳,甚至出現(xiàn)中文語義偏誤等問題[55],不足以支撐中文自然語言交互導(dǎo)學(xué)任務(wù)。教育部部長懷進鵬提出要打造中國版人工智能教育大模型,探索基于中文數(shù)據(jù)的大規(guī)模因材施教、創(chuàng)新性與個性化教學(xué)[56。為此,自主打造中文版教育大模型與私有知識庫將突破大模型語言屏障,成為增強智能導(dǎo)學(xué)系統(tǒng)在中文環(huán)境下導(dǎo)學(xué)能力的關(guān)鍵舉措。
(二)嚴守隱私安全:堅持新一代智能導(dǎo)學(xué)系統(tǒng)本地化部署
為了使新一代智能導(dǎo)學(xué)系統(tǒng)實現(xiàn)更高程度的個性化導(dǎo)學(xué)服務(wù),通常需要將更多教育敏感信息、學(xué)習(xí)者個人數(shù)據(jù)投喂給大模型,來提升大模型對學(xué)習(xí)者學(xué)習(xí)情況的把控能力,這往往使得學(xué)習(xí)者變得愈發(fā)“透明”。另外,在學(xué)習(xí)者和智能導(dǎo)學(xué)系統(tǒng)交互的過程中,也會不經(jīng)意地將個人信息傳遞給大模型,算法黑箱問題使得教育者無法控制信息流向,極易發(fā)生隱私泄露問題。本研究提出將大模型和私有知識庫本地化部署來支持本地智能導(dǎo)學(xué)系統(tǒng)構(gòu)建,從技術(shù)、教師和學(xué)習(xí)者三個層面嚴守隱私安全。技術(shù)層面,大模型和所有知識庫的本地運行,避免了隱私數(shù)據(jù)通過網(wǎng)絡(luò)上傳至云端數(shù)據(jù)庫造成泄露的可能性,或可在智能導(dǎo)學(xué)系統(tǒng)中數(shù)據(jù)進行分級管理,嚴格限制隱私數(shù)據(jù)的訪問權(quán)限[57];教師層面,將負責學(xué)習(xí)者的隱私數(shù)據(jù)脫敏,所有上傳至私有知識庫的資料均需授權(quán)才可使用;學(xué)習(xí)者層面,將在教師的指導(dǎo)下,加強自身信息保護意識,讓學(xué)習(xí)者擁有維護自身信息安全的能力。
(三)縮小數(shù)字鴻溝:算力共享助力新一代智能導(dǎo)學(xué)系統(tǒng)低成本應(yīng)用
數(shù)字鴻溝問題是人工智能賦能教育數(shù)智化轉(zhuǎn)型過程中面臨的一項復(fù)雜挑戰(zhàn)。新一代智能導(dǎo)學(xué)系統(tǒng)的本地化部署需要高性能計算機提供算力及存儲資源支持,然而,高昂的硬件成本可能導(dǎo)致不同地區(qū)之間的數(shù)字鴻溝進一步加劇,不利于實現(xiàn)教育公平愿景[58。為應(yīng)對這一挑戰(zhàn),可基于算力共享實現(xiàn)新一代智能導(dǎo)學(xué)系統(tǒng)的低成本推廣應(yīng)用。系統(tǒng)在高性能服務(wù)器完成部署和調(diào)試后,可創(chuàng)建鏈接實現(xiàn)開放共享,共享對象可不受個人設(shè)備算力限制,通過網(wǎng)絡(luò)訪問智能導(dǎo)學(xué)系統(tǒng),但無法訪問系統(tǒng)中的本地大模型及私有知識庫。該方案即能打破地域及成本限制,又保障了智能導(dǎo)學(xué)過程的數(shù)據(jù)安全,讓智能技術(shù)驅(qū)動的數(shù)智化學(xué)習(xí)普惠每一位學(xué)習(xí)者。
(四)應(yīng)對技術(shù)沖擊:前沿技術(shù)賦能新一代智能導(dǎo)學(xué)系統(tǒng)迭代發(fā)展
人工智能技術(shù)發(fā)展迅速,智能導(dǎo)學(xué)系統(tǒng)必須緊跟時代步伐,主動融合和應(yīng)用最新技術(shù)成果,以實現(xiàn)自身的持續(xù)創(chuàng)新和升級,更好地服務(wù)于學(xué)習(xí)者個性化學(xué)習(xí)需求。如Gan等人提出一種多層思維增強的檢索增強生成框架METRAG,通過在檢索過程結(jié)合相似性思維、效用思維,并在增強過程使用任務(wù)自適應(yīng)摘要及知識增強,提高了檢索增強生成的性能[59],驗證了其在知識密集型任務(wù)中的卓越優(yōu)勢;2024年7月2日微軟開源了被稱為下一代RAG技術(shù)——GraphRAG,該技術(shù)通過大語言模型從私有數(shù)據(jù)源中提取信息并構(gòu)建知識圖譜,并利用知識圖譜中的結(jié)構(gòu)化信息來改進生成模型的輸出,以增強生成模型的準確性和可解釋性。面對技術(shù)的快速變革,智能導(dǎo)學(xué)系統(tǒng)需建立動態(tài)適應(yīng)和優(yōu)化機制,持續(xù)引入和集成前沿技術(shù),同時重視技術(shù)風(fēng)險管理,以確保系統(tǒng)在不斷升級過程中保持穩(wěn)定和安全,為教育的個性化和智能化提供強有力的支持。
參考文獻:
[1]Nwana HS.Intelligent tutoring systems:an overview[J].Artificial Intelligence Review,1990,4(4):251-277.
[2]MousavinasabE,ZarifsanaieyN,R.NiakanKalhoriS,etal.Intelligent tutoringsystems:a systematicreviewof characteristics,applications, and evaluation metnods[J].Interactive Learning Environments, 2021,29(1):142-163.
[3]屈靜,劉凱等.對話式智能導(dǎo)學(xué)系統(tǒng)研究現(xiàn)狀及趨勢[J].開放教育研 究,2020,26(4):112-120.
[4] 夏立新,楊宗凱等.教育數(shù)字化與新時代教育變革(筆談)[J.華中師范大 學(xué)學(xué)報(人文社會科學(xué)版),2023,62(5):1-22.
[5]Steenbergen-Hu S,Cooper H.A meta-analysis of the effectiveness of intelligent tutoring systems on K-12 students’mathematical learning [J]. Journal of educational psychology,2013,105(4):970.
[6]盧宇,駢揚等.新型智能導(dǎo)學(xué)系統(tǒng)構(gòu)建及其關(guān)鍵技術(shù)[J].中國遠程教 育,2023,43(7):30-38+46.
[7]徐升,佟佳睿等.下一代個性化學(xué)習(xí):生成式人工智能增強智能輔導(dǎo)系 統(tǒng)[J].開放教育研究,2024,30(2):13-22.
[8] Jeon J,Lee S.Large language modelsin education:A focus on the complementary relationship between human teachers and ChatGPT [J]. Educationand Information Technologies,2023,28(12):15873-15892.
[9]王煒,趙帥等.生成式人工智能教育創(chuàng)新應(yīng)用的人本主義追求——對 UNESCO《教育與研究領(lǐng)域生成式人工智能指南》的解讀[J].現(xiàn)代遠程 教育研究,2024,36(1):3-11.
[10]Ma Y,Zhang C,Zhu SC.Brain inavat:On missing pieces towardsartificial general intelligence in large language models [DB/OL].htps://arxiv.org/ abs/2307.03762,2023-07-07.
[11] Tang X,Zheng Z,etal.Large language models are in-context semantic reasoners rather than symbolic reasoners [DB/OL].https://arxiv.org/ abs/2305.14825,2023-06-08.
[12]Kasneci E,SeBlerK,et al.ChatGPT for good?Onopportunities and challenges of large language models for education [J].Learning and individual differences,2023,103:102274.
[13] Carbonell JR.AI in CAI:An artificial-intelligence approach to computer-assisted instruction [J].IEEE transactions on man-machine systems,1970,11(4):190-202.
[14]劉清堂,吳林靜等.智能導(dǎo)師系統(tǒng)研究現(xiàn)狀與發(fā)展趨勢[J].中國電化教 育,2016.(10):39-44.
[15] VanLehn K.The behaviorof tutoring systems[J].International journal of artificial intelligence in education,20o6,16(3):227-265.
[16]劉華,祝智庭.大模型支持的會話輔導(dǎo)系統(tǒng)開發(fā):范式轉(zhuǎn)換、架構(gòu)設(shè)計 與能力訓(xùn)練[J].現(xiàn)代遠程教育研究,2024,36(3):11-19.
[17]McNamaraDS,LevinsteinIB,Boonthum C.iSTART:Interactive strategy training for active reading and thinking [J].Behavior Research Methods, Instruments,amp; Computers,2004,36(2):222-233.
[18]Lane H C,VanLehn K.Teaching the tacit knowledge of programming to novices with natural language tutoring[J].Computer Science Education,2005,15(3):183-201.
[19] Suebnukarn S,Haddawy P.A collaborative intelligent tutoring system for medical problem-based learning [C].New York:Association for Computing Machinery,2004.14-21.
[20] Aleven V,Mclaren B,et al.Toward meta-cognitive tutoring:A model of helpseeking witha Cognitive Tutor[J].International Journal of Artificial Intelligencein Education,2006,16(2):101-128.
[21] Steenbergen-Hu S,Cooper H.A meta-analysis of the effectiveness of intelligent tutoring systems on K-12 students’mathematical learning [J]. Journal of educational psychology,2013,105(4):970-987.
[22]VanLehnK.Therelatiefetivenessofumanttoringintelligenttoring systems,and other tutoring systems[J].Educational psychologist,2O11,46(4): 197-221.
[23] Jaques N,Conati C,etal.Predicting affect from gaze data during interaction with an intelligent tutoring system [C].Cham:Springer,2014.29-38.
[24]Pardos ZABakerRSJD,etalAffctivestatesandstateests:Investgating how affect and engagement during the school year predict end-of-year learning outcomes [J].Journal ofLearning Analytics,2O14,1(1):107-128.
[25]VaessenBE,PrinsFJJeuring J.University students’achievement goals and help-seeking strategies inan intelligent tutoring system [J].Computers amp; Education,2014,72:196-208.
[26]廖劍,劉選,劉革平.理感聯(lián)通:人工智能賦能智慧教育新范式[J].中國 電化教育,2023,(6):18-24.
[27] Chen WY.Intellgent Tutor:Leveraging ChatGPTand Microsoft Copilot Studio to Deliver a Generative AI Student Support and Fedback System within Teams [DB/OL].https://arxiv.org/abs/2405.13024,2024-05-15.
[28]Abdelghani R,WangY H,etal.GPT-3-Driven Pedagogical Agents to Train Children's Curious Question-Asking Skills [J].International Journal ofArtificial Intelligencein Education,2024,34(2):483-518.
[29] Yadav G,Tseng YJ,NiX.Contextualizing problems to student interests at scale in intelligent tutoring system using large language models [DB/OL]. https://arxiv.org/abs/2306.00190,2023-05-31.
[30]FirdausMF,WibawaJN,RahmanFF.Utilization of GPT-4 to Improve Education Quality Through Personalized Learning for Generation Z in Indonesia[J].IT for Society,2023,8(1):6-14.
[31]翟雪松,季爽等.基于多智能體的人機協(xié)同解決復(fù)雜學(xué)習(xí)問題實證研 究[J].開放教育研究,2024,30(3):63-73.
[32] HuangL,Yu W,etal.Asurveyonhallucination inlargelanguagemodels: Principles,taxonomy,challenges,and open questions [DB/OL].https://arxiv. org/abs/2311.05232,2023-11-09.
[33]羅云鵬.大模型發(fā)展亟需高質(zhì)量\"教材\"相伴[N].科技日報,2024-01- 15(06).
[34]張家軍,閆君子.“道\"\"器\"融合:教師減負的技術(shù)旨歸與實現(xiàn)路徑[J]. 中國電化教育,2022,(12):68-73+83.
[35]任玉鑫,王光臣等.數(shù)字賦能背景下研究生使用ChatGPT實際效能、風(fēng) 險檢視及治理路徑[J].黑龍江高教研究,2024,42(5):73-79.
[36] Dong C.How to build an AI tutor that can adapt to any course and provide accurate answers using large language model and retrieval-augmented generation [DB/OL].https://arxiv.org/abs/2311.17696,2024-06-21.
[37]LewisP,Perez E,etal.Retrieval-augmented generation for knowledgeintensive nlp tasks[J].Advances in Neural Information Processing Systems,2020,33:9459-9474.
[38]王明程,王高開等.基于大模型智能體的安全風(fēng)險態(tài)勢感知框架構(gòu)建[J] 情報理論與實踐,2024,47(7):190-198.
[39]盧宇,駢揚等.新型智能導(dǎo)學(xué)系統(tǒng)構(gòu)建及其關(guān)鍵技術(shù)[J].中國遠程教 育,2023,43(7):30-38+46.
[40] Zhao P,Zhang H,et al.Retrieval-augmented generation for ai-generated content:A survey [DB/OL].https://arxiv.org/abs/2402.19473,2024-06-21.
[41]楊霞,范蔚.許諾與虛諾:數(shù)字化學(xué)習(xí)空間的異化與消解[J].中國遠程 教育,2024,44(10):46-59.
[42]WengerBE,SeeFBJ.Artificial intelligence and tutoring systems [M]. Burlington:Morgan Kaufmann,1987.
[43]杜修平,王羽等.AIGC賦能“中文 + 職業(yè)教育\"資源智能生成與質(zhì)量進 化—內(nèi)涵、機理與模式構(gòu)建[JJ.電化教育研究,2024,45(5):121-128.
[44]趙曉偉,祝智庭等.教育提示語工程:構(gòu)建數(shù)智時代的認識論新話語 [JJ.中國遠程教育,2023,43(11):22-31.
[45]童慧,楊彥軍.基于\"技術(shù)道德化\"理論的生成式人工智能教育應(yīng)用潛 能與風(fēng)險研究[J].電化教育研究,2024,45(7):12-18.
[46]劉清堂,黃景修等.PST視角下智能導(dǎo)師系統(tǒng)的設(shè)計與新發(fā)展——以 句酷批改網(wǎng)為例[J].現(xiàn)代教育技術(shù),2017,27(5):81-87.
[47]GarrisonDR,AndersonT,ArcherW.Critical inquiryina text-based environment:Computerconferencingin higher education [J].Theinternet and highereducation,1999,2(2-3):87-105.
[48]謝曉雪,柳士彬.數(shù)智時代人類教師與虛擬教師融合的目標、場景與 路徑[J].現(xiàn)代遠程教育研究,2024,36(2):45-51.
[49]戴嶺,趙曉偉等.智慧問學(xué):基于ChatGPT的對話式學(xué)習(xí)新模式[J].開放 教育研究,2023,29(6):42-51+111.
[50]龔禮林,劉紅霞等.情感導(dǎo)學(xué)系統(tǒng)(ATS)的關(guān)鍵技術(shù)及其導(dǎo)學(xué)模型研 究—一論智能導(dǎo)學(xué)系統(tǒng)走向情感導(dǎo)學(xué)系統(tǒng)之意蘊[J].遠程教育雜 志,2019,37(5):45-55.
[51]王凱,余發(fā)碧等.基于情緒識別技術(shù)的學(xué)科情感目標達成檢測與教學(xué) 改進[J].中國電化教育,2023,(6):83-89.
[52]王志軍,滕志強等.國際生成式人工智能教育應(yīng)用創(chuàng)新—一全球人工 智能學(xué)習(xí)和教育研究聯(lián)盟之\"人工智能賦能學(xué)習(xí)者會議\"綜述[J].遠程 教育雜志,2024,42(2):65-74.
[53]杜修平,楊小榮等.構(gòu)建科技漢語\"預(yù)本全鏈條銜接\"教學(xué)新模式[J].云南 師范大學(xué)學(xué)報(對外漢語教學(xué)與研究版),2024,22(2):76-84.
[54]杜修平,尹曉靜.理工中文[M].北京:北京語言大學(xué)出版社,2024.
[55]馮志偉,張燈柯.語言模型與人工智能[J].外語研究,2024,41(1):1- 19+112.
[56]劉邦奇,聶小林等.生成式AI賦能教育:技術(shù)框架、應(yīng)用場域及價值- 2024智能教育發(fā)展研究報告[J].中國電化教育,2025,(3):61-70.
[57]盧宇,余京蕾等.基于大模型的教學(xué)智能體構(gòu)建與應(yīng)用研究[J].中國電 化教育,2024,(7):99-108.
[58]蘭國帥,杜水蓮等.技術(shù)何以賦能未來高等教育教學(xué):趨勢、實踐和場 景—《2024年EDUCAUSE地平線報告(教學(xué)版)》要點與啟示[EB/OL]. http://kns.cnki.net/kcms/detail/32.1843.G4.20240702.1011.002.html,2024- 07-30.
[59]GanC,YangD,etal.SimilarityisNotAllYouNeed:EndowingRetrieval Augmented Generationwith Multi Layered Thoughts[DB/OL].https://arxiv. org/abs/2405.19893,2024-05-30.
作者簡介:
杜修平:教授,博士,博士生導(dǎo)師,副院長,研究方向為學(xué)習(xí)科學(xué)、國際中文教育。王鑒羽:在讀博士,研究方向為學(xué)習(xí)科學(xué)、國際中文教育。
Retrieval-Augmented Generation Empowering Intelligent Tutoring Systems
—BasedonLocalLargeModelsandPrivateKnowledgeBases
Du Xiuping1.2, Wang Yinyu'
1.School of Education,Tianjin University,Tianjin 300350
2.School of International Education,Tianjin University,Tianjin 300072
Abstract:argengageodelsMs)avesignifantlancedteapabiliofintellgtutoigstsS)inesa perceptiontatiodsoerosicdtele. suchashalisceicaldcysodoeatstoeof ITS.Toaddressteseisses,tisstudyproposesthelocalzedeplomentofLsandprivateowlegebasesempowerdbyRetrevalAugmentedGeneration(RAG)techologytoenablelocalizedoperationofITS.ThestudyfirstconstructsaRAG-basedframeworkforthe enhancedgenerationofI.Thisfameworkcomprisesextealandlocalspaces:mutimodalknowledgesourcesandleaerifoationi theextemalseedoddodeglodinateodgssctie localITSoecealaedaldaeteceateo dual-loopstrucuedtorotetealoodlyuon” inteligenttutorgcetoityetteeiosoftTch”L-”andeacLsi risetoapafsftgeatifcteedynbotioLstlyddsal suchaslaguagesaccuitygialiidedoloicaliactseyoposfousoeaeate aimedatensuringthesustaiabledvelopmentoftenextgenerationISandpromotingthedigitaltansformationofeducationinChina.
Kewords:itelinttutongsts;gelaeodels;iateodgeseeaaugmetedgeea;human-sbsis收稿日期:2024年8月2日
責任編輯:宋靈青