摘 要:人工智能大模型的興起對我國各領域產生了巨大影響,不僅推動了技術產業的進步,也促進了教育事業的繁榮。通過提供個性化學習方案、優化教學資源分配以及輔助教學決策,人工智能大模型展現出巨大潛力,但其在數據處理、技術創新和實踐應用中仍面臨著數據處理水平不足、用戶隱私泄露風險、軟硬件實力有待提升、模型優化和泛化能力不足、培訓引導缺少等問題。因此,該研究旨在通過加強模型數據處理水平、構建安全保護框架,提升模型性能和穩定性、開發課程培訓、完善智能評估系統等多個方面解決難題,以期人工智能大模型在個性化學習、智能輔導和定制化教學中發揮作用。為提升整體教育質量,構建包容、公平的“人工智能+教育”環境提供新思路和新視角,在優化人工智能大模型和深化教育應用的同時,減少智能技術對教育產生的不利影響。
關鍵詞:人工智能大模型;個性化學習;定制化教學;智能教育;數據隱私
中圖分類號:G4 文獻標志碼:A 文章編號:2096-0069(2024)05-0032-06
收稿日期:2024-03-04
基金項目:陜西省“十四五”教育科學規劃 2023年度課題“輕量化信息技術在薄弱中小學校應用策略與實踐研究”(SGH23Z0010)
作者簡介:祝淼(1998 — ),女,陜西安康人,碩士研究生,研究方向為信息技術教育應用;乜勇(1970 — ),男,藏族,青海貴德人,教授、博士生導師,研究方向為信息技術教育應用、課程與教學論、人工智能教育應用。
引言
人工智能大模型應用于教育領域,不但有效提升了教學效率,而且推動了整體教育工作的發展進步。但是,如何確保人工智能大模型在教育中的應用始終發揮正效應和符合倫理規范,以及如何與現行的教育體制、教學手段進行有效的整合,以實現個性化學習和定制化教學等,仍是目前亟須解決的問題。本文以人工智能大模型的教育應用為視角,以個性化學習、智能輔導、定制化教學為主線,深入剖析我國教育領域中人工智能大模型的發展現狀、面臨的技術挑戰和具體的實踐應用,力圖為“人工智能+教育”的深度融合和應用探索提供新的研究思路。
一、我國人工智能大模型的發展現狀
1.人工智能大模型的相關概念
①人工智能大模型是指人工智能預訓練大模型,其具有海量參數和復雜架構,能夠完成深度學習任務,擁有強大的處理能力和表征能力[1]。該模型通過在大規模數據集上進行訓練,并從中學習到更加高級和抽象的特征表示,從而提升模型的性能和泛化能力。預訓練語言表征模型和自然語言處理模型都是人工智能大模型的典型代表模型之一。②教育大模型是適用于教育場景、具有超大規模參數、融合通用知識和專業知識訓練形成的人工智能模型,是大模型技術、知識庫技術及各類智能教育技術的集成,能推動人類學習和機器學習的雙向建構。它能在人機對話交互中引導學習者深入思考,為學習者的自主探索提供指導和支持,并在此過程中不斷更新升級,達到更高專業水平[2]。③語言大模型是指通過大規模無標注數據進行預訓練,并學習到豐富的語言知識與世界知識的人工智能模型。該模型通常基于深度學習技術,尤其是自注意力機制架構,能夠理解和生成自然語言文本。該模型通常包含數十億個甚至數千億個參數,能夠捕捉到語言中的復雜模式和結構,具有高度準確的語言理解和生成能力[3]。④多模態大模型是指能夠處理和理解多種模態(如文本、圖像、聲音、視頻等)數據的人工智能模型。這些模型融合了多種感知途徑和表達形態,能夠同時處理來自不同感知通道的信息,并以多模態的方式進行學習和輸出。多模態大模型的核心在能夠整合和理解不同類型的數據,并發現它們之間的相互關聯,實現對多模態信息的綜合理解和分析[4]。⑤生成式人工智能是一種根據自然語言對話提示詞自動生成響應內容的人工智能技術[5],其通過學習大規模數據集,能夠創造出文本、圖像、聲音、視頻、代碼等多種形式的原創內容。生成式大模型通常基于深度學習技術,尤其是神經網絡架構,如生成對抗網絡、變分自編碼器等。
上述概念源于人工智能領域,其核心思想是通過海量數據和復雜算法進行訓練,以提高自身性能和適用范圍。人工智能大模型是一種較為寬泛的概念,涵蓋了由人工智能技術發展而來的各類大模型,其中就包括語言大模型和多模態大模型,前者側重于對語言文本數據的處理,后者側重于對圖像、語音、視頻等多模態數據的處理與輸出。教育大模型是專門針對教育領域而開發的人工智能模型,其能夠幫助教師通過運用人工智能技術提高教學效率和總體教育質量,特別是在個性化學習、智能輔導和定制化學習方面表現十分出色。生成式人工智能主要關注新內容的創造和多樣性數據的生成,包括但不限于文本、圖像、代碼等。
2.人工智能大模型在教育領域的應用現狀
①政策支持與推動:科技部等六部門發布的《關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》中提出,要在教育領域積極探索各類場景,鼓勵高校院所參與場景創新,支持人工智能技術在教育領域的應用[6]。教育部等六部門發布的《關于推進教育新型基礎設施建設構建高質量教育支撐體系的指導意見》中提出,要利用人工智能技術普及教學應用、拓展教師研訓應用、增強教育系統監測能力等。這些均表示要深入應用5G、人工智能、大數據、云計算、區塊鏈等新一代信息技術,充分發揮數據作為新型生產要素的作用,推動教育數字轉型[7]。②教育專用大模型研發現狀:由中國教育科學研究院和之江實驗室發布的《重構教育圖景:教育專用大模型研究報告》,分別從技術基礎、應用案例、挑戰與機遇、創建構思、未來展望等多個方位詳細闡述了如何利用大模型技術革新教育領域,以技術助力學生進步、教師成長和教育發展,并提出要整合應用各類智能教育技術,將已經發展起來的各類智能教育技術集成于教育專用大模型之中[8]。此外,華東師范大學發布了教育通用人工智能大模型系列標準,旨在從總體框架、構成要素、功能要求、數據集構建原則、測評框架、安全隱私以及教學應用要求等方面,為人工智能大模型在教育領域的應用提供詳細的規范和指導,確保技術的可信性、安全性和高效性[9]。這些均表示我國要構建出一個以人為本的教育通用智能體系,以更好地賦能和賦智教育,在推動教育數字化轉型的同時激發教育創新,以實現高質量的教育發展。
二、問題與挑戰
當前,人工智能大模型正蓬勃發展,帶動了國內人工智能大模型的創新熱潮。隨著研究技術的成熟與進步,各類大模型如雨后春筍般相繼涌現,使得越來越多的產品可以應用于教育。然而,如何甄別、篩選并有效地將人工智能大模型應用于教育領域,以及如何解決因模型架構的不可解釋性而導致人們的信任缺失等問題,成為當前教育高質量發展面臨的現實挑戰。
1.數據挑戰
數據技術發展依托于數據支持,因此,在人工智能大模型的構建與應用中,數據問題帶來的挑戰不容小覷。首先,人工智能大模型需要基于大規模數據完成預訓練,海量的參數和復雜的架構會為數據的收集與處理增加難度,只有具備足量的數據規模,才能支持大模型進行深度學習。由于預訓練數據集規模廣、涉獵深,因此在處理數據時,任何人都無法徹底閱盡其中數據或評估數據質量。大量非常相近、幾乎算是重復的數據,基準數據遭受污染,預訓練的數據域模糊不清,微調任務混在一起難以處理等[10],這些問題可能會影響學習效果或教學質量。其次,既涉及用戶,就必然要思考個人隱私保護。造成隱私安全風險的根本原因在于人工智能大模型的內在特性,即在處理數據的過程中很容易造成信息泄露。因此,學生在使用人工智能大模型的過程中,需要加強個人信息安全保護。最后,由于人工智能本質上為類人智能,即一種類似于人腦的軟硬件系統,因此,它并不具備人類的道德倫理觀念,在實際應用中也會引發算法偏見、責任歸屬等道德倫理問題。另外,部分學生可能會利用人工智能大模型等技術投機取巧,從而引發學術倫理問題[11]。同理,當人工智能大模型作出錯誤決策而導致用戶損害時,該將責任歸屬于開發者、用戶還是人工智能本身,也值得我們深思。
2. 技術挑戰
在人工智能大模型研究中,涉及算法優化、模型泛化能力、軟硬件協同等多個層面的技術問題。首先,算法優化是提高大模型推理能力的關鍵因素之一。算法優化既要確保準確性,還要保證高運行效率和低資源消耗。例如,如何在資源受限的條件下,通過模型壓縮和優化算法性能,開發出一種具有通用性的人工智能大模型,使其能在不同地區的各種設備上為師生提供優質的教學資源。其次,為了保證模型在遇到未知數據時依然能有出色的表現,必須增強模型的泛化能力。鑒于學生的知識背景和學習風格存在顯著差異,當面對學生提出的各種難題時,必須著重考慮如何提升模型處理新問題的能力,以便幫助學生更好地應對在學業中遇到的多重困難和挑戰。最后,深度學習框架是保障人工智能大模型良好運作的基礎軟件技術。雖然我國在這一技術領域已經取得了顯著的成效,但與國際先進水平相比,仍有進步的空間。國內開源框架雖然技術不斷進步,但在生態構建、社區支持等方面仍需加強。此外,人工智能芯片作為人工智能大模型的硬件基礎,對提升模型計算效率和降低能耗具有決定性作用。目前,我國在人工智能芯片的研發上雖然獲得了一系列成果,但云端訓練、推斷等大算力通用芯片的發展仍相對落后,與國際巨頭相比仍有提升空間。
人工智能大模型技術的快速發展為教育事業開辟了廣闊的前景,同時也帶來了技術不穩定、潛在故障風險等挑戰。在教育領域,人工智能大模型的不完全可靠性也會影響教學內容的準確性和教學過程的連貫性,進而對學生的學習成效造成不利影響。
3. 實踐挑戰
將人工智能大模型引入教育領域意味著一場革命性變化,可通過重塑教與學的方式來實現個性化教育、提高教學效率、增強學習體驗。盡管這些技術擁有極大潛力,但在實際應用中也面臨一系列復雜的挑戰。首先,教師作為教育的直接執行者,他們需要與時俱進,不斷地接受專業培訓和學習,以便將人工智能大模型工具與教育有效整合。然而,人工智能技術的培訓資源相對匱乏,導致部分一線教師未能接受系統的專業技術培訓。在應對教育領域變革帶來的挑戰時,部分教師缺乏信心,這在一定程度上抑制了他們的積極性和參與度。在知識儲備不足的情況下,部分教師的不自信情緒不僅會影響其對新技術的接受度,還可能削弱教師在教學中的積極性和創新性。不同于教師,學生對技術的興趣和接受度通常較高,但也需要教師的適當引導來確保技術的正確使用。教師應當幫助學生從多方位了解人工智能大模型的優勢和風險,提高學生的認知水平,從而避免他們對技術的濫用和依賴。若學生過度依賴人工智能大模型,可能會導致教師的部分職能被取代,在此情況下,教師的指導和榜樣作用難以充分發揮,同時也不利于學生構建自我的心靈世界。其次,應用人工智能大模型技術可能會加劇教育資源不均衡的現狀。在教育資源豐富的城市,學生可以享受到由人工智能大模型提供的個性化學習體驗,通過智能輔導和定制化教學輕松完成學習任務和學習目標;在教育資源相對匱乏的部分鄉村,由于各種因素的影響,學生可能難以完全觸及這種技術。最后,將人工智能大模型引入教育領域還可能會對教育評估系統產生深遠影響。傳統的考試和評估方法會被更加靈活、更加智能的評估系統取代,并且相較于傳統評估手段,人工智能教育評估有助于減少教師在重復性工作上的負擔,實時監測學生的學習進度和知識理解程度,幫助教師全面快速掌握學生學習動態,從而提高教學效率。但與此同時,如何確保評估的公正性和準確性,以及如何保護學生數據的隱私成為新的挑戰。
三、人工智能模型應用于教育領域的實踐路徑
1.數據保護與治理
首先,數據是大模型發展的基礎,在決策過程中,人工智能大模型依賴于大量數據進行預訓練,因此對數據的質量和數量有著嚴格的要求,特別是在教育領域,面對海量的教育數據和知識體系,其處理過程的復雜性往往難以預見。若想打開人工智能大模型的算法黑盒,需提高大模型的透明度和可解釋性,使用戶了解模型的決策邏輯,從而增強用戶信任。相應地,數據體系的復雜性也增加了人工智能大模型的處理負擔。為了減少認知偏差并提升知識多樣性,除了整合多源數據,還需要加入自動化程序來清洗和預處理數據,包括消除重復項、糾正錯誤信息、統一文本格式等,以構建一個綜合性教育數據庫,為在教育領域中應用人工智能大模型提供堅實的數據支撐。該數據庫不僅應包含豐富的教學資源,還應內置先進的教學決策程序和數據糾錯系統,在分析和生成、輸出數據時,能夠自動檢測并修正錯誤,確保信息的準確性。同時,還可設立用戶反饋渠道,允許用戶報告模型輸出中的錯誤,一旦收到反饋,系統會迅速響應,重新校驗數據并進行必要的修正。這種結合自動糾錯和用戶參與的雙向機制,不僅能夠提高模型的自我完善能力,也能夠增強數據的實時性和可靠性,從而為教育領域提供一個動態更新、高效運作的知識平臺。
其次,確保數據安全是實現人工智能大模型長期有效應用于教育的基石。構建多層次的教育數據隱私保護框架,運用嚴格的數據分類和分級管理策略,以及先進的加密技術及差分隱私算法,用以區分教育中的敏感數據和非敏感數據,并為敏感數據提供額外的安全層級,限制一般用戶的訪問權限。監督機制的建立同樣不可或缺,應由專業人員對模型的數據輸出進行定期審查并做好記錄。借助這些綜合性策略,我們能夠在確保用戶隱私和數據安全的前提下,促進人工智能大模型在教育領域的良性發展,也有助于充分發揮其在提升教育品質和推動個性化學習方面的潛力。
最后,持續的技術創新和研究是應對未來挑戰的關鍵。隨著人工智能技術的快速發展,我們需要不斷探索和開發以人為本的數據技術和方法,將一系列倫理道德觀念整合進人工智能大模型系統的核心設計中,確保系統的行為準則能夠逐漸趨同于人類的倫理道德標準。這意味著在模型的決策過程中,嵌入了對人類價值觀的尊重和隱私的維護,通過這種方式,可在一定程度上避免算法偏見和歧視,確保大模型應用在教育實踐中的合規性。針對責任歸屬問題,需要學術界、教育界以及技術提供者共同努力,形成一套完善的人工智能大模型使用標準規范,并且建立預防和處理機制,對學術不端行為進行持續的監督和評估,一旦發現問題,須及時進行處理。
2.技術融合與創新
為了使人工智能大模型更好地服務于教育,在技術研發過程中,研發人員應盡可能提供更高效的算法和硬件,以保證模型能在不同教育地區的不同設備環境下進行廣泛應用。首先,在實現算法優化層面,應聚焦于模型壓縮與加速,可以通過知識蒸餾提高模型性能和泛化能力,采用參數量化技術加快運算速度,降低設備能耗,以減少模型的復雜度,同時采用自適應學習和聯邦學習策略,以增強模型在多樣化教育場景中的適應性和泛化能力。其次,在發揮模型泛化能力層面,人工智能大模型通過習得多任務學習和遷移學習技術,增強了其在教育領域的適應性和泛化能力。這些技術使得模型能夠跨領域學習,將上一個任務中學到的知識應用于接下來的其他任務中,從而更好地適應多樣化的教育場景。針對不同教育主體,精準識別他們的問題和需求,生成定制化的教學內容和個性化的教學策略。未來,隨著大模型技術的不斷進步,人工智能在教育中的應用將更加深入,為提升教育質量和教學效率提供強大助力。最后,在軟硬件協同發展方面,我們要多關注深度學習框架的持續改進,尤其是國內企業研發出的開源框架,應當致力于構建更加完善的生態系統,提供堅實的社區支持。以此提高框架的可用性和普及度,進而支持教育工作者和學生更有效地利用人工智能技術進行智能教學和個性化學習。同時,人工智能芯片的硬件研發也應與深度學習框架的軟件發展相協調,以實現更高效的云端訓練和本地推理能力,進一步推動教育技術的發展。
若想在教育領域中廣泛應用人工智能大模型,需要高度提升技術的穩定性。這意味著在模型部署前,必須進行嚴格的測試,以確保其在教學內容的準確性和教學過程的連貫性上達到高質量和高標準。當教師或學生使用人工智能大模型時,應當優先選擇那些技術成熟、穩定性高的產品,以確保學生學習問題的順利解決和教師教學活動的展開。大模型的有效應用不僅能為學生提供富有個性化的學習體驗,輔助教師高效地開展教學活動,還能促進教育改革事業的飛速發展,更能為人工智能技術的未來發展開辟出新的空間。
3.應用培訓與監督
師生如何快速適應并正確運用人工智能大模型?針對這一問題,首先,在教師層面,國家應當著手設計并實施一系列專門課程和培訓項目,這些課程和培訓應全面覆蓋人工智能技術的基本概念、在教育領域的應用策略以及具體的操作技能,經過系統的學習,讓教師掌握人工智能的基本理論知識和專業技能,具備利用好人工智能進行課堂教學的能力[12]。學校可建立校內教師社群,鼓勵教師跨學科協作,共同研究如何將人工智能大模型融入各自的教學實踐。通過這種方式,教師之間可共享經驗、交流知識,從而促進教學方法的創新。學校還可以選擇特定的班級或課程作為試驗點,引入人工智能大模型,讓教師在真實的教學環境中實踐和探索。對教師個人來說,保持積極進取的心態十分重要。教師應該樂于學習、勇于嘗試,這樣才能不斷在理論與實踐中提升自己的專業技能,增強自己對于教育變革的信心。另外,教師還可以參與或發起相關研究,這不僅能夠提高教學質量,還能增強他們應用人工智能技術的能力。通過持續的反饋和自我評估,教師可以更有效地利用人工智能工具,為學生提供更優質的教育體驗。其次,在學生層面,應側重于提高學生的高階思維能力,而不是一般技能。應加強學生批判性思維、創造性思維、問題解決能力和決策能力的培養,當面對復雜的人工智能大模型時,引導學生積極探索如何更有效地利用人工智能來輔助學習,有效地解決各種學業難題。同時,也要注重對學生情感智力和社交技能的培養,使學生理解并采用適當的方法來正確運用人工智能,認識到這些技術僅能作為學習的輔助工具,是對知識的補充和積累,而非替代人腦進行深入探究與反思的工具。對于教育資源相對匱乏的地區,可構建一個城鄉一體化的人工智能資源共享平臺,通過這個平臺,定期向一些偏遠鄉村學校提供高質量的技術資源和專業的教師支持,做好人工智能大模型的普及教育和應用推廣工作,以期從多方面惠及更多學生。政府和企業應當共同合作努力,為資源不足的地區提供必要的硬件和軟件資源支持,同時推廣混合學習模式,實現教育資源利用的最大化。最后,在教育領域引入智能評估系統,須確保這些系統的公正性和準確性。可以通過采用多元化的評估手段,如自我評估、同伴評估和教師評估等,以降低單一評估方法可能產生的偏差;定期對評估系統進行校準和驗證,確保其評估結果與教育目標和標準保持一致,從而真實全面地反映出學生的能力水平;在采集學生信息時,必須獲得學生及家長的完全知情權和信息采集同意權,在明確好數據的使用目的、存儲期限和訪問權限后,務必對收集完成的數據進行加密處理,確保數據在傳輸和存儲過程中的安全,以保護學生隱私。
四、結論
本研究深入分析了人工智能大模型在教育領域的多種應用,指出了其在數據處理、技術革新和實際應用中所面臨的挑戰。研究發現,盡管這些技術在實現個性化學習、智能輔助教學等方面展現出巨大潛力,但同時也帶來了如數據處理水平不足、用戶隱私泄露風險、軟硬件實力有待提升等問題。本研究提議構建一個多層次的數據保護體系,提高數據的透明度,并采用模型優化技術,以提高模型的適應性和效率。同時,強調通過一系列措施提高教育質量,推動教育資源的公平分配,在確保技術安全和遵守倫理標準的基礎上,持續改進算法,以提高模型性能。期待未來人工智能大模型在教育領域的應用更成熟普遍,精準滿足學習者的需求,并為學生創造一個安全、公平、包容的教育環境。
參考文獻
[1]國家工業信息安全發展研究中心.AI大模型發展白皮書[R].北京:國家工業信息安全發展研究中心, 2023.
[2] 曹培杰,謝陽斌,武卉紫,等.教育大模型的發展現狀、創新架構及應用展望[J].現代教育技術,2024,34(2):5-12.
[3][4] 中國人工智能學會. 中國人工智能系列白皮書:大模型技術[R]. 北京: 中國人工智能學會, 2023.
[5] 聯合國教科文組織.教育和研究中的生成式人工智能指南(Guidance for generative AI in education and research)[R]. 巴黎:聯合國教科文組織,2023.
[6] 科技部等六部門.關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見[R].北京:科技部等六部門,2022.
[7] 教育部等六部門.關于推進教育新型基礎設施建設構建高質量教育支撐體系的指導意見 [EB/OL].(2021-07-08)[2024-02-02]. http://www.moe.gov.cn/srcsite/A16/s3342/202107/t20210720_545783.html.
[8] 中國教育科學研究院數字教育研究所,之江實驗室智能教育研究中心. 重構教育圖景:教育專用大模型研究報告[R].北京:中國教育科學研究院數字教育研究所,2023.
[9] 華東師范大學.教育通用人工智能大模型標準體系研究報告[R].上海:華東師范大學,2023.
[10] KADDOUR, J, HARRIS J, MOZES M, et al.Challenges and applications of large language models[J]. arXiv preprint arXiv: 2307.10169.
[11] 吳砥,李環,陳旭.人工智能通用大模型教育應用影響探析[J].開放教育研究,2023,29(2):19-25,45.
[12] 王同聚,胡小勇,丁美榮.中小學人工智能師資培訓“AI-3S”教學模式構建與實踐[J].數字教育,2023,9(2):1-10.
(責任編輯 李強)
Current Status, Problems, Challenges and Practical Paths of the Application of
Large-Scale AI Models in China’s Education
Zhu Miao, Nie Yong
(Faculty of Education, Shaanxi Normal University, Xi'an, Shaanxi, China 710062)
Abstract: The rise of large-scale AI models has had a great impact on various fields in China, which not only promotes the progress of the technology industry, but also promotes the prosperity of education. By providing personalized learning solutions, optimizing the allocation of teaching resources, and assisting in teaching decision-making, large-scale AI models show great potential, but they still face problems in data processing, technological innovation, and practical application, such as short of data processing level, the risk of users’ privacy leakage, the inadequate strength of software and hardware, insufficient capacity of model optimization and generalization, and the lack of training guidance. Therefore, this study aims to solve the problems by strengthening the model data processing level, constructing a security protection framework, improving model performance and stability, developing curriculum training, and improving the intelligent evaluation system in several aspects, so as to enable the large-scale AI models play a role in personalized learning, intelligent tutoring and customized teaching. It will provide new ideas and perspectives for improving the overall quality of education and building an inclusive and fair “AI + Education” environment, and will reduce the negative impacts of smart technologies on education while optimizing the large-scale AI models and deepening their educational applications.
Key words:" Large-scale AI models; Personalized learning; Customized teaching; Smart education; Data privacy