999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

GenAI教育應用的未來:基于改進后的BERTopic工具的主題建模

2025-07-31 00:00:00胡藝齡陳煜何雨桐顧小清
現代教育技術 2025年7期
關鍵詞:聚類學習者維度

自從以ChatGPT為代表的GenAI問世以來,其便以其卓越的特征學習能力和獨特的自適應性,顛覆性地推動了教育智能化進程[]。基于生成模型和深度學習技術,GenAI重在從大規模數據的分布模型中抽象出內在結構與概率分布,實現文本、圖像等多種形式的信息自主生成[2]。聚焦教育場景,以“子曰”“訊飛星火認知大模型”等為代表的教育垂直大模型通過提供高度智能的個性化學習支持,推動GenAI從教育賦能工具向教育智能體變革[3]。在此過程中,GenAI教育應用呈星火燎原之勢,涵蓋GenAI教育應用策略、GenAI支持下的學習范式轉型、GenAI教育提示工程、GenAI支持的教育內在機制等多維度、深層次主題的理論探索與實踐驗證,其技術迭代帶來的應用革新倒逼教育領域的技術應用形態重塑。

一問題分析

為深入、科學地把握GenAI教育場景的應用現狀,研究者紛紛嘗試進行綜述性研究,圍繞教育場景變革、智能技術應用探索與潛在風險規避,剖析GenAI重塑教育新形態的路徑與挑戰[4]。但是,當前研究在學科視角與主題分析方法方面存在不足,無法滿足研究主題在應用場景、算法工具、評價方式等多維度呈現的主題特征復雜性和主題建模工具在文本挖掘深度、主題數選取等算法層面有效性的需求。

1局限于單一學科應用,缺少系統視域引領

現有的GenAI教育應用相關文獻多聚焦于單一學科,并以大語言模型在語言、醫學等課程中的應用為熱點。例如,Jeon等[5深入剖析了37項聊天機器人在語言學習場景的實證研究,依據目標導向、具身性、多模態化三個指標,構建了GenAI聊天機器人在語言學習的應用框架;Lucas 等基于醫學學科的學習特點,分析了GenAI在增強學習中的潛力,創新性地提出從批判性評估、跨學科合作兩個視角優化GenAI教育場景的應用策略。但是,目前GenAI教育應用領域尚缺乏一個融合學科特征、技術應用、風險倫理等多維因素的系統視域,來對現有的研究實踐進行系統性綜合分析,以明晰GenAI在教育領域的應用路徑,推動其在更廣泛學科和教育環節中的融合與創新。

2基于編碼的文獻分析,未能充分挖掘文本的深層信息

在GenAI教育應用的綜述性研究中,研究者多采用系統編碼的方法進行文獻分析。例如,Yan等[7]依據GenAI教育任務的自動化完成程度及其面臨的倫理風險,對GenAI在教育文本分析與生成領域的應用文獻進行系統編碼,以剖析該領域的研究現狀及其面臨的道德風險;Chen等8依托扎根理論,深入探討了GenAI教育應用的核心優勢和潛在風險。然而,基于編碼的綜述方法容易受主觀性偏差、語境解讀不足、數據過度簡化的制約,不能充分挖掘文本材料的內在深層信息,其雖然揭示了文獻中的顯性內容和模式,但對于理解文本背后的深層次含義、多段文本關聯性和文化語境等顯得力不從心。而在其他學科領域,為明晰主題發展脈絡,已有研究者開始引入深度學習算法,通過深層語義挖掘與跨文本關聯分析,突破傳統編碼局限,為揭示主題潛在邏輯提供洞察路徑。例如,徐漢青使用 BERTopic 主題建模工具,構建了 AI在圖書情報學的主題模型,用于進行更具前瞻性和應用價值的主題演化分析與趨勢預測。

綜上,在GenAI加速迭代、應用廣度與深度不斷拓展的背景下,本研究嘗試從領域特征出發,對自動化主題建模工具 BERTopic 進行改進,并將改進后的BERTopic工具用于GenAI教育應用主題聚類,通過主題聚類結果剖析,梳理該領域的研究脈絡、熱點與趨向,進而建構GenAI教育應用的主題模型,從主題建模工具探索與研究視角拓展層面為GenAI賦能教育場景提供參考。

二自動化主題建模工具BERTopic的改進

為深入挖掘GenAI教育應用的研究主題,克服當前研究在學科視角與分析方法中的局限,本研究引入Grootendorst[]提出的集成了預訓練大型語言模型特征分析優勢的自動化主題建模工具——BERTopic,并對其進行了改進。BERTopic 是一種基于文檔聚類的主題建模工具,其結合雙向編碼器表示轉換器(Bidirectional Encoder Representations from Transformers,BERT)預訓練模型與主題聚類算法,能通過語義嵌入提取文本深層特征并聚類生成主題,實現主題演化分析與趨勢預測,已被證明在處理非結構化文本數據、推導出文本中的共同主題和潛在語義結構等方面的效率與準確性均高于主流的主題聚類工具[1]。

1BERTopic工具的改進

為實現對特定學科領域核心概念的深度解構以提高主題凝練的準確性,本研究根據教育技術領域知識建模的需求,從結構和算法兩個維度對BERTopic主題建模工具進行了改進。

(1)結構維度的改進

BERTopic工具的架構關注聚類與特征工程,其應用主要按照嵌入、降維、聚類、主題表示四個步驟實施。BERTopic的主題聚類效果高度依賴通用預訓練模型(如 BERT)的語義表征能力和基礎聚類算法(如HDBSCAN)的適應性,而對于專業的教育技術領域知識體系缺乏深度理解,導致主題提取結果與教育技術學科的理論框架、實踐需求存在語義偏差。為此,本研究從以下方面對 BERTopic 進行了結構性的改進:

① 領域知識本體映射機制。為減少數據偏差,輔助聚類算法更準確地捕捉到文本的語義信息,本研究在數據預處理階段首先引入詞還原算法,將詞語還原成其詞典形式(如將網絡用語還原為書面語);之后,為確保文本輸入的語義一致性,本研究設計了領域關鍵詞映射表,通過對同義術語(如AI教育、智能教育、智慧教育)進行等價映射、對上下位概念(如學習分析與教育數據挖掘)進行層次映射,來確保聚類算法能夠理解文本基本概念,同時能夠采用標準化且高效的方式進行文本嵌入降維。

② 數據預探索。為提升主題建模結果的準確性與可解釋性,本研究在進行聚類分析之前運用KeyBERT關鍵詞提取算法,對摘要文本進行主題預探索。通過對高頻關鍵詞的綜合分析,在無指導信息的情況下,本研究挖掘了文本數據的潛在主題,并根據教育技術領域相關文獻綜述的主題分析結果,結合領域專家的專業意見,設計了零次聚類候選主題列表。該列表將同摘要文本一并嵌入,在后續使用余弦相似度時將文檔的嵌入與預定義的候選主題詞標簽進行比較,若大于設定閾值,則零樣本主題將分配給文檔。針對無法完成匹配的摘要文本,本研究采用BERTopic 的標準流程進行迭代聚類,通過動態調整聚類參數和密度峰值,發現并提煉新的潛在主題。

③ 多元主題表征與微調。在BERTopic主題表示階段,單一模型在主題表征的深度與多樣性方面存在局限。鑒于此,本研究構建了多算法協同優化機制,充分利用多種關鍵詞增強算法的優勢,優化主題關鍵詞的代表性、適用性和可解釋性;同時引入GPT接口,充分發揮大語言模型在文本分析方面的優勢,通過Prompt工程對各算法生成的主題關鍵詞列表、主題原始文檔信息、零次聚類候選關鍵詞信息進行整合,進一步闡明目標主題的學科場景定位,從而完成該場景下的精準定位與關鍵主題提取,最終構建出適配學科領域的GenAI教育應用主題名稱及其關鍵詞表征。

(2)算法維度的改進

本研究主要從兩個方面對BERTopic進行算法維度的改進: ① 嵌入模型微調,聚焦模型嵌入的領域適配性,采用領域內標注語料庫(涵蓋在線教育社區語料、教育技術研究論文摘要等)對BERT嵌入模型進行微調,提高其對GenAI教育應用領域專業術語的語義表征能力。 ② 主題關鍵詞表征,關注算法選型,首先考慮權重計算中同一詞匯的不同形態(如時態、語態等)所引起的重復計算,引入最大邊際相關性(Maximal Marginal Relevance)算法,以降低此類冗余并增加關鍵詞的多樣性;其次,為優化關鍵詞提取過程并融入詞的語篇信息,采用詞性標注(Part-of-Speech Tagging)算法,通過分析關鍵詞的詞性并結合其上下文語境,對主題詞序列進行精準調整;最后,為進一步強化關鍵詞在語篇中的代表性,采用 KeyBERTInspired模型利用預訓練的BERT來捕捉文本中的深層語義信息,據此對主題詞序列進行微調。

圖1改進后的BERTopic主題聚類流程

2改進后的BERTopic主題聚類流程

對 BERTopic進行改進后,本研究設計了改進后的BERTopic主題聚類流程,主要包括數據預處理、數據探索、聚類與特征工程、主題挖掘與微調四個關鍵環節,如圖1所示。具體來說,在數據預處理環節,研究人員先設計領域關鍵詞映射表,并應用詞還原算法對原始摘要文本進行數據預處理,將其轉換為無詞性差異、無上下文歧義的標準化文本。在數據探索環節,研究人員可借助KeyBERT算法從標準化文本中提取核心關鍵詞,并通過文獻調研與專家研討,構建研究領域的候選主題詞表。在聚類與特征工程環節(圖1 的綠色模塊標識了該環節的算法選型),標準化文本與候選主題詞表首先會在嵌入過程中被轉換為詞向量,并通過降維算法將詞向量映射為低維表征,以提升聚類精度;接著,依據詞向量之間的相似度計算,形成主題群;之后,經過標簽化和權重化處理,文本向量將依據文本詞頻轉變為詞頻數值表征的特征向量,且在權重化時會充分考慮特征向量在主題聚類和文檔中的重要性;最終,標準化文本會被轉換為與文本特征同聚類主題相對應的主題-文檔矩陣。在主題挖掘與微調環節,本研究采用OpenAI、MMR 等多種算法依據主題代表性、上下文關聯性等參數進一步挖掘潛在主題,并結合候選主題詞表完成對主題模型的微調,以發揮大語言模型在特征分析與內容生成方面的優勢,完成GenAI教育應用研究主題的命名與描述,進而通過主題聚類結果剖析,構建GenAI教育應用主題模型。

經過上述流程,原始摘要文本被系統轉換為結構化的主題-文檔語義網絡,其包括主題層級關系、關鍵詞權重分布、文檔關聯強度三個核心要素。綜合文獻分析與三要素特征,研究人員不僅能直觀展示研究領域的主題演變趨勢和研究熱點分布,還能通過主題之間的語義關聯分析,構建領域主題模型。

3改進后的BERTopic成效

在教育文本主題建模領域,LDA作為經典的概率主題模型,能夠從大量文本數據中識別出隱含主題,已形成應用范式[12]。為驗證改進后的 BERTopic 工具在GenAI教育應用場景摘要主題分析方面的有效性,本研究采用離群點數、輪廓系數(Silhouete Score,SC)和卡拉欽斯基-哈拉巴斯(Calinski-Harabasz,CH)指數3個指標,將改進后的BERTopic與BERTopic、LDA的主題聚類效果進行了對比,結果如表1所示。其中,離群點數表示聚類結果中未被歸入任何簇的異常樣本數量,其值越小,表示聚類算法對數據結構的包容性越強;SC用于衡量主題的內聚性,其值越接近1,表示同一主題下的樣本點距離越近而不同主題下的樣本距離越遠;CH指數用于衡量聚類主題內部的緊密度與主題之間的分離度,其值越大,表示主題內部越緊密且不同主題之間越分離。表1顯示,無論是否改進,BERTopic在3個指標的表現均優于LDA,這一結論與Khodeir 等[3]提出的“BERTopic 能全面、連貫地區分和提取各種主題”基本一致;與 BERTopic和LDA相比,改進后的BERTopic的SC值、CH值均為最大,說明此工具的主題聚類效果最佳。

表1主題聚類效果對比結果

三GenAI教育應用的主題聚類結果剖析

立足國際視域,為建構GenAI教育應用的主題模型,汲取GenAI教育應用的相關國際經驗,本研究以 Web of Science 數據庫的核心期刊為數據來源,使用檢索式“ TS=[Ω Generative Artificial Intelligence’ OR“Generative AI’ OR‘Artificial Intelligence Generated Content’ OR‘AIGC’ OR‘Large Language Model*’ OR‘ChatGPT' OR GPT*'OR GAI' OR ‘GenAI']AND TS=['Education*'OR Teach*'OR‘Student*'OR Learn*']\",其中截詞通配符“*”用于匹配詞干的派生詞,檢索時間設為2000年1月1日至2024年12月31日,共檢索到相關文獻5398篇。經過三輪滾雪球篩選檢索,按照“ ① 英文; ② 刊發日期為2000年1月1日至2024年12月31日; ③ 包含摘要且頁數不少于4頁; ④ 設計或者優化GenAI工具,調查教育各方主體對GenAI應用工具的看法或接受度的文章,評估分析GenAI在教育應用中的效能和影響”的納入標準,剔除與研究主題不一致的文獻,最終得到有效文獻 462篇,作為改進后的BERTopic工具進行主題建模的初始文本。

1GenAI教育應用研究主題的核心特征剖析

為更加清晰地識別和理解GenAI教育應用的研究主題,本研究采用可視化技術將研究主題的聚類結果映射到二維坐標系中,并對研究主題中的文檔數量加以標注,得到研究主題聚類結果的可視化圖,如圖2所示。圖2顯示,GenAI教育應用主要包含六大研究主題,且各研究主題在空間上的分布彼此獨立,沒有出現數據點的交叉,表明主題聚類具有良好的區分度和效果。下文將聚焦于剖析GenAI教育應用六大研究主題的核心特征,來呈現GenAI教育應用的研究現狀。

圖2研究主題聚類結果的可視化
圖3GenAI教育應用的主題演變趨勢

(1)GenAI教育效能評估

本研究主題以GenAI 智能為出發點,探究其在教育領域的應用效能。“chatbot”“potential”等關鍵詞揭示了本研究主題聚焦于通過問答方式測試以ChatGPT為代表的GenAI驅動的聊天機器人在特定學科知識測試中的問答表現[14]。測評方法主要有兩種: ① 通過標準化測試,對GenAI的學業表現進行量化,并與學習者的學業成績進行比較,以評估GenAI在學術知識理解方面的深度。例如,Stribling 等[15]對 GPT-4在生物醫學研究生水平考試中的表現進行了評估,結果顯示GenAI的得分整體高于學習者的平均成績,但在圖表和手繪題的理解方面存在不足,甚至答案中還出現了幻覺效應和剽竊嫌疑。 ② 通過內容分析法,考察GenAI 對問題解釋的可靠性及其是否具備高層次的批判性思維和多元邏輯推理能力。例如,Tsoutsanis等[1]從知識獲取能力、專業性、準確率等維度對主流大型語言模型在醫學教育場景中的應用進行了評估,以衡量GenAI在教育應用中的思維能力和質量。

(2)智能教育與GenAI工具

本研究主題關注GenAI技術智能與智能化教學實踐需求的交匯點,以“education”“physics”為代表的關鍵詞顯示其立足于學科教學的具體特征,致力于挖掘GenAI在知識檢索、即時反饋等方面的技術智能優勢,以構建針對特定學科的教學輔助工具。例如,Kortemeyer[17]從作業評分的多元性與繁瑣性切入,根據GenAI對物理作業中的論證推導題目作答情況進行評分;Guo等[18]關注課堂辯論場景,設計了GenAI機器人模擬辯論中的正反方角色,引導學習者在辯論稿撰寫的過程中進行思維發散與邏輯建構。綜合本研究主題的相關文獻內容來看,GenAI工具在理解和生成文本方面表現出色,為其在教學設計和評估中充當輔助角色提供了可能,但因其在具體學科知識的準確性、可靠性等方面仍然有限,讓其作為“無所不知”的信息資源提供者為時尚早,需要人工智能工程師、教育研究者等多方協作來克服這些挑戰[19],以確保 GenAI工具在教育領域能夠最大程度地發揮輔助作用。

(3)GenAI協作寫作的反饋機制

本研究主題聚焦ChatGPT在教育寫作場景中的應用機制研究,其從ChatGPT的文本生成能力出發,探索GenAI輔助學習者進行學術寫作的新型應用路徑。關鍵詞“writing”“feedback”等顯示,本研究主題著重剖析ChatGPT輔助學習者進行學術寫作時針對寫作內容提供個性化反饋的內在機制,探索如何借助GenAI卓越的文本生成功能,培養學習者寫作任務中的文本創造性能力。例如,Wang等[20采用質性研究方法,對50組經教師評分的議論文樣本展開分析,發現ChatGPT反饋全面,能夠依據學習者寫作的上下文特征做出響應。但是,GenAI協作寫作的反饋機制存在局限,如易受文本長度、標記符號的影響,且在個性化教學方面多局限于單一的對話情境。

(4)教育領域對GenAI的技術接受度

本研究主題圍繞“perceive”“use”等關鍵詞,關注學習者的GenAI使用動機、技術接受度和安全倫理等。技術接受模型(Technology Acceptance Model,TAM)為理解學習者對 GenAI這一新型智能工具的接受度提供了一個有力的理論框架,其通過感知有用性、感知易用性等維度來評估學習者對技術的接受度,不僅有助于預防GenAI技術的濫用,還能推動GenAI更深層次地滿足學習者的學習需求。例如,Rahman等[21]從感知有用性、感知易用性和感知信息性三個維度,調查了學習者使用ChatGPT輔助學習的態度,并預測了學習者的使用意圖。然而,學習者信息泄露、模型“黑盒”的不可解釋性等問題,構成了GenAI教育應用情境中人-機交互倫理方面的挑戰。這些挑戰要求我們在推動GenAI教育應用的同時,必須對相關的倫理風險進行全面的考量和嚴格的管理。

(5)GenAI賦能自我調節學習

本研究主題圍繞“student”“self”等關鍵詞,從學習主體、人機交互過程、自我調節機制三個維度,揭示了學習者在學習體驗過程中與GenAI的深層次人機交互過程。例如,復合腦賦能的自我調節學習強調學習者主動選擇并調用合適的GenAI支持[22],通過主動發揮主體責任,對反饋結果進行自我審辨與判斷,決定是否納入已有認知結構,并基于自我認知策略的調節實現認知目標。Lee等[23]創新性地引入了一種基于指導的ChatGPT輔助學習工具,以“指導者角色”給予提示和鼓勵,引導學習者在求助GenAI之前先嘗試獨立解決問題,并強調學習者主動進行自我知識建構,改變了以往以問題指令性回復為主的ChatGPT教育應用模式。此外,Wang 等[24將引導性的GenAI工具融入物聯網,根據學習者在虛擬環境中的實時表現,以反饋性支持的形式輔助調整知識內化活動。上述研究遵循學習者的自我調節學習規律,利用GenAI智能、實時地分析學習者特征并提供引導性支持,充分喚醒學習者進行知識建構的主觀能動性。

(6)GenAI輔助的人機協作編程

本研究主題圍繞“programming”“code”等關鍵詞,聚焦于GenAI工具在人機協作編程場景中的應用表現與實施路徑。隨著GenAI模型算法的迭代優化,集成AI優勢的智能體(AIAgent)展現出模擬人類智能決策的能力,這種進步推動著以人類認知為主導的單向協作模式向人與智能體的深度融合模式演進。本研究主題通過剖析GenAI在編程教學中的知識補償、情感支持等功能,探索其賦能學習者深度學習的有效策略。例如,Sun等[25]采用準實驗研究方法,系統考察了ChatGPT輔助編程對大學生編程行為、表現及認知發展的影響,構建GenAI編程導師的教學支持框架,為GenAI在編程教育領域的實踐提供理論參考。

2GenAI教育應用的主題演變趨勢

依據各研究主題的文獻頻次分布,本研究采用折線圖呈現GenAI教育應用的主題演變趨勢。如圖3所示,GenAI教育應用的相關研究主要分布在2023年3月之后。隨著GenAI教育應用的不斷深入,教育場景中的GenAI研究主題自2023年4月起呈現出顯著的多元化趨勢:以GenAI教育效能評估的探索性研究為起點,持續吸引著研究者的目光,各主題研究頻次持續上升;伴隨教育教學與GenAI工具融合應用的逐步深入,研究主題拓展到學習者與GenAI工具交互時的自我調節學習和知識體系建構;研究者對技術接受度與倫理風險方面的問題也越來越重視。GenAI技術的不斷革新,特別是GPT-4和以“文心大模型 $4 . 0 ^ { \dprime }$ 為代表的大語言模型的迭代升級,使智能工具在文本理解能力上取得了突破性進展,催生了GenAI支持的協作寫作反饋、人機協作的編程學習等具體教育情景下的全新應用主題。這些突破不僅拓展了GenAI教育應用的深度與廣度,也為教育技術的發展和教育實踐的創新帶來了新的機遇與挑戰。

3聚類主題的層級關系剖析

通過剖析GenAI教育應用六大研究主題的核心特征,本研究明晰了當前GenAI教育應用的研究現狀。然而,主題模型的構建需要進一步聚焦主題之間的語義關聯性與邏輯層級性。根據各主題之間的相關性,本研究梳理了聚類主題的層級關系(如圖4所示),可以看出聚類主題的層級結構鮮明:主題 ② 與主題 ⑤ 構成內部層級,主題 ① 、主題 ③ 與主題 ⑥ 形成外部層級,而主題 ④ 與這兩個層級相互聯結,形成完整的GenAI教育應用主題網絡。這種層級化的結構展現了聚類主題的內在聯系,為構建GenAI教育應用主題模型提供了直接的依據。

圖4聚類主題的層級關系
圖5GenAI教育應用的主題模型

四GenAI教育應用的主題模型構建

基于上述GenAI教育應用的主題聚類結果,結合主題內部的關鍵詞特征,本研究將GenAI教育應用的六大研究主題凝練為教學應用、技術應用、風險倫理三個維度,并通過智能教育內化、技術倫理風險、技術接受度三個關聯樞紐實現維度聯結,形成GenAI教育應用的主題模型,如圖5所示。

1三個維度

(1)教學應用維度

在GenAI教育應用的主題研究中,主題 ② “智能教育與GenAI工具”與主題 ⑤ “GenAI賦能自我調節學習”之間高度關聯成為了一個研究焦點,組成了教學應用維度。本維度堅持“學習者為中心”原則,以學習者的主動探究行為作為教學活動的主要驅動力,致力于有效發揮GenAI增強智能在學習過程的中介作用,構建一套系統化的教學應用策略,通過有效的問答反饋輔助提升學習者在知識建構過程中的主動性和自主性,促進學習者的深度學習和創新思維發展。

(2)技術應用維度

GenAI技術的文本特征處理與內容生成能力,不僅在主題 ① “GenAI教育效能評估”方面展現出了其卓越的應用潛力,也進一步催生了主題 ③ “GenAI協作寫作的反饋機制”和主題 ⑥ “GenAI輔助的人機協作編程”兩個新主題,這些構成了技術應用維度的核心內容。本維度強調發揮GenAI在文本生成、數據分析等領域的智能優勢,構建人機協作的智能反饋與編程范式,探索技術工具賦能教育多維場景的可行路徑。

(3)風險倫理維度

本維度聚焦主題 ④ “教育領域對GenAI的技術接受度”,從教育主體對GenAI教育應用的滿意度與信任度、GenAI潛在的倫理風險與應用邊界問題兩個方面,探討技術賦能教育的長效機制與發展路徑。

2三個關聯樞紐

上述三個維度的交叉關聯,是通過以下三個關聯樞紐來實現的: ① 智能教育內化,主要聯結教學應用維度和技術應用維度,強調智能教育工具設計與學習者學習過程的深層關聯,其核心在于:教育技術開發必須以學習者需求和學習行為為核心,有效發揮技術智能的應用潛力,以切實服務于教育實際需求。 ② 技術倫理風險,主要聯結技術應用維度與風險倫理維度,既關注技術設計視角下算法黑盒的可解釋性、隱私數據的泄露風險,又關注技術應用視角下的技術依賴性、情感缺失和內容濫用的倫理風險。 ③ 技術接受度,主要聯結教學應用維度與風險倫理維度,其核心在于:探索人機融合智能代理協作模式在深度學習中的適應性,遵循“學習者為中心”的原則,強調GenAI教育應用需以技術有效性、倫理合規性、學習者需求的三元平衡為基石。

五結語

本研究引入自動化主題建模工具BERTopic,并從結構和算法兩個維度對 BERTopic工具進行了改進,實現了對GenAI教育應用的主題聚類分析。通過剖析GenAI教育應用的主題聚類結果,本研究發現:GenAI教育應用主要包括六大核心主題,即GenAI教育效能評估、智能教育與GenAI工具、GenAI協作寫作的反饋機制、教育領域對GenAI的技術接受度、GenAI賦能自我調節學習和GenAI輔助的人機協作編程;教育場景中的GenAI研究主題從早期的工具應用探索逐漸拓展至技術接受、人機協作等多元領域,且各主題的研究頻次也在持續上升;主題 ② 與主題 ⑤ 構成內部層級,主題 ① 、主題 ③ 與主題 ⑥ 形成外部層級,而主題④ 與這兩個層級相互聯結,形成完整的GenAI教育應用主題網絡。在此基礎上,本研究構建了GenAI教育應用的主題模型,包含教學應用、技術應用、風險倫理三個維度,以及智能教育內化、技術倫理風險、技術接受度三個關聯樞紐。

展望未來,我們要從教學應用出發,立足教育育人本質和自我調節學習的認知機制,以學習者核心素養培養為牽引,發揮技術智能優勢,驅動GenAI從“知識傳遞者”向“指導者”身份轉變;同時,必須嚴格審視GenAI在倫理與不公平性問題的潛在風險,精準把握GenAI育人本質,實現教育個性化、教育公平的美好愿景。此外,本研究提出的改進型 BERTopic 工具可以在更廣泛的學科領域進行測試與應用,通過科學優化主題模型的效果驗證維度,進一步提高其在學科領域的適用性與主題建模的準確性。

參考文獻

[1]黃星云,焦建利,曾君,等.GenAI重塑課堂活動:應用路徑與實踐樣態[J].現代教育技術,2025,(2):26-34.

[2]LiuM, ZhangLJ,Bebricher C.Investigatingstudents’cognitiveprocessesingenerativeA-asisted digitalultimodal composing and traditional writing[J]. Computers amp; Education, 2024,211:104977.

[3]柳晨晨,王欣穎,倚楊瑩,等.GenAI 教育落地的多案例因分析——基于教師愿景、學生參與和課堂技術集成的三維 分析框架[J].現代教育技術,2025,(2):35-45.

[4]Francis NJ,Jones S,SmithDP.GenerativeAIinhighereducatio: Balancing inovationandintegrity[J].BritishJoual of Biomedical Science, 2025,81:14048.

[5]Jeon J,Lee S,Choe H. Beyond ChatGPT: Aconceptual framework and systematic reviewof speech-recognitionchatbots for language learming[J]. Computers amp; Education, 2023,16:104898.

[6]Lucas HC, Upperman JS,Robinson JR.A systematic review of large language models and their implications in medical education[J]. Medical Education,2024,(11):1276-1285.

[7]YanL,ShaL, ZhaoL, et al. Practical and ethicalchallengesoflarge language models ineducation: Asystematic soping review[J]. British Journal of Educational Technology, 2024,(1):90-112.

[8]Chen X,Hu Z, Wang C.Empowering education development through AIGC: A systematic literature review[J].Education and Information Technologies,2024,(13):17485-17537.

[9]徐漢青.融合 BERTopic 和LSTM的LIS 學科 AI研究主題演變分析及趨勢預測[J].情報科學,2024,(12):1-22.

[10]Grootendorst M. BERTopic: Neural topic modeling with a class-based TF-IDF procedure[OL].

[1]Chang Y, Wang X, Wang J,etal.Asurvey on evaluation of large language models[J].ACMTransactions on Inteigent Systems and Technology, 2024,(3):1-45.

[12]柴少明,賀振海,李作錕.網絡問答社區公眾對 AIGC在教育中影響及應用的關注與認知研究——LDA主題建模與時 間序列分析[J].現代教育技術,2024,(10):42-52.

[13]KhodeirN,ElghanamFEficient topic identificationforurgentMOOC forumposts usingBERTopic andtraditionaltopic modeling techniques[J]. Education and Information Technologies, 2024,(30):1-27.

[14]Rawas S.ChatGPT:Empowering lifelong leaming in the digital ageof higher education[J].Education and Information Technologies,2024,(6):6895-6908.

[15]Stribling D,Xia Y,AmerMK,etal.The model student: GPT-4 performance on graduate biomedical science exams[J]. Scientific Reports, 2024,(1):5670.

[16]Tsoutsanis P,Tsoutsanis A.Evaluationof large language model performance on the Multi-Specialty Recruitment Assessment (MSRA) exam[J]. Computers in Biology and Medicine, 2024,168:107794.

[17]Kortemeyer G.Toward AI grading of student problem solutions in introductory physics: A feasibility study[J]. Physical Review Physics Education Research, 2023,(2):020163.

[18]GuoK,ZhongYLiD,etal.Efectsofhatbot-asisted in-lassdebatesonstudents’argumentationskillsadtask motivation[J]. Computers amp; Education, 2023,203:104862.

[19]LuQ,YaoY,XiaoL,eal.CanCatGPffctivelyomplementacheraessmentofudergraduatesudentsacademic Writing?[J].Assessment amp; Evaluation in Higher Education, 2024,(5):616-633.

[20]Wang L,Chen X,Wang C,etal. ChatGPT'scapabilies inproviding feedbackonundergraduate studentsargumetation: A case study[J]. Thinking Skills and Creativity, 2024,51:101440.

[21]Rahman MS,Sabbir MM,Zhang J,etal.Examining students’intentiontouse ChatGPT:Does trustmater?[J]. Australasian Journal of Educational Technology, 2023,(6):51-71.

[22]韓悅,趙曉偉,沈書生.人機協同調節:復合腦視角下自我調節學習的新路徑[J].電化教育研究,2024,(5):20-26、34. [23]Lee HY,ChenPH,WangWS,etal.Empowering ChatGPTwith guidancemechanisminblended learning: Effectofselfregulatedlearning,higher-orderthinkingskils,andknowledgeconstruction[J].InternationalJournalofEducational Technology in Higher Education, 2024,(1):16.

[24]WangL,Chen X,Wang C,etal. ChatGPT’scapabilitiesinprovidingfeedback onundergraduatestudents'argumentation: A case study[J]. Thinking Skills and Creativity, 2024,51:101440.

[25]Sun D,BoudouaiaA,Zhu C,et al. Would ChatGPT-facilitated programming mode impact colege students'programming behaviors,performances,andperceptions?Anempirical study[J].International JournalofEducational TechnologynHigher Education, 2024,(1):14.

The Future of GenAI Education Applications: Topic Modeling Based on the Improved BERTopic Tool

HU Yi-Ling CHENYu HE Yu-Tong GU Xiao-Qing

(DepartmentofEducation Information Technology,East China Normal University,Shanghai,China 200062)

Abstract: Theaccelerated penetrationof generativeartificialintelligence (GenAI)technologyanditsapplicationhas brought moreunstablefactors totheglobal talentcompetition patern,and thechanges ithastriggeredareredefiningknowledge and learning.Due to the limitations ofperspectivesand methods,currnt review studies on GenAIempowering education have not fully exploredthe depsemanticsbetween texts,norhave theyconstructedasystematicapplicationframework.Therefore,the paper exploratory improved the automated topic modeling tool BERTopic from two aspects of structural adjustment and algorithmic selection.Then,thetopic clustering process ofimproved BERTopic was designed,andthe topic clusterngeffect of the improved BERTopic was verified through comparative analysis.By applying the improved BERTopic tool, his paper analyzed the topic clustering results of GenAI educational applications from three aspects of topiccore features,evolution trends,and hierarchical relationships.Onthis basis,a topic model for GenAIeducational applications wasconstructed.The research in this paper explored the application of topic modeling tools,broadened the perspective of GenAI’s educational application, and could provide theoretical references for promoting GenAI's empowerment of education.

Keywords: GenAI; BERTopic; application of artificial intelligence in education; topic clustering

猜你喜歡
聚類學習者維度
基于認知-心理-疼痛指導的專項護理在晚期胰腺癌疼痛患者中的應用效果
健康之家(2025年12期)2025-08-27 00:00:00
初中物理教科書跨學科內容與課程標準的一致性研究
數智時代學習者的身體存在:應然、實然及使然
基于泛化中心聚類的時間序列缺失數據填補方法
注意力分配視角下對大學生碎片化學習注意力失焦現象的積極理解
基于FCM聚類的電力用戶需求響應潛力評估
基于改進K-means十十聚類算法的汽車行駛工況構建
混合式教學模式下參與度調查分析與提升策略研究
高教學刊(2025年19期)2025-08-03 00:00:00
協作學習中不同梯度問題支架對學習者批判性思維發展差異分析
數字教育(2025年3期)2025-07-31 00:00:00
新時代高職學生心理健康素養現狀與干預研究
主站蜘蛛池模板: 久久男人资源站| 久久综合色天堂av| 福利国产微拍广场一区视频在线| 91久久偷偷做嫩草影院| 香蕉99国内自产自拍视频| 高清国产va日韩亚洲免费午夜电影| 久热精品免费| 日韩中文字幕免费在线观看| 91香蕉视频下载网站| 99在线视频精品| 色婷婷啪啪| 91免费在线看| 亚洲精品日产AⅤ| 亚洲免费人成影院| 久久午夜夜伦鲁鲁片无码免费 | 好紧太爽了视频免费无码| 免费A级毛片无码免费视频| 国产综合欧美| 性喷潮久久久久久久久| 97青草最新免费精品视频| 欧美激情伊人| 一本久道热中字伊人| 永久免费无码日韩视频| 婷婷激情亚洲| 国产精品国产三级国产专业不| 午夜少妇精品视频小电影| 九色91在线视频| 亚洲欧洲国产成人综合不卡| 国产美女91呻吟求| 青青操国产视频| 亚洲综合狠狠| 亚洲欧美天堂网| 这里只有精品在线播放| 波多野衣结在线精品二区| 先锋资源久久| 在线无码av一区二区三区| 亚洲欧美另类专区| 精品伊人久久久香线蕉| 在线欧美日韩| 日韩国产综合精选| 55夜色66夜色国产精品视频| 亚洲人成色77777在线观看| 影音先锋丝袜制服| 91久久青青草原精品国产| 毛片网站在线播放| 中文字幕永久在线看| 久久 午夜福利 张柏芝| 97成人在线视频| 国产无码在线调教| 日韩在线2020专区| 中文字幕资源站| 蜜桃视频一区二区| 亚洲男人天堂网址| 欧美日本中文| 九九免费观看全部免费视频| 国产精品成| 亚洲天堂色色人体| 九色免费视频| 亚洲国产精品一区二区高清无码久久| 亚洲v日韩v欧美在线观看| 久久中文字幕2021精品| 国产成人免费观看在线视频| 日韩美一区二区| 国产99在线观看| 亚洲免费福利视频| 色哟哟国产精品| 亚洲AV无码乱码在线观看代蜜桃| 国产丝袜91| 亚洲无码高清一区| 国产精品hd在线播放| 综合色区亚洲熟妇在线| 91在线丝袜| 日本成人精品视频| 久久亚洲国产一区二区| 欧美不卡视频在线观看| jizz在线观看| 亚洲开心婷婷中文字幕| 亚洲成a人在线观看| 亚洲精品制服丝袜二区| 亚洲免费毛片| 亚洲色精品国产一区二区三区| 99热这里只有精品在线播放|