999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大語言模型支持的元綜合研究:基于智能體的方法

2025-01-16 00:00:00仇星月陳向東陳鵬褚樂陽崔萌
現代教育技術 2025年1期

摘要:大語言模型憑借強大的分析與推理能力正在變革教育研究范式,特別是其在智能體技術方面取得的顯著進步,為系統性解決科研領域的復雜問題提供了有力支持。基于此,文章聚焦元綜合這一典型的研究任務場景,探討如何基于智能體的方法提供更加系統化的支持:首先,文章提出了多步驟規劃、協同模式構建、提示賦能、工具集成的元綜合智能體應用原則,設計了由6個智能體協同的應用模式,并基于該模式開發了元綜合智能體工具。然后,文章通過案例研究將智能體工具應用于典型的元綜合任務,發現與人類團隊相比,智能體更能遵照元綜合研究流程執行任務,生成結果更全面;人類團隊在應用過程中對智能體的準確性和使用體驗給予了積極評價。最后,文章基于研究發現提出了智能體在教育研究中的應用策略,以期為深入解決教育研究實踐問題提供新的人機協同思路。

關鍵詞:大語言模型;智能體;元綜合;教育研究

【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2025)01—0063—10 【DOI】10.3969/j.issn.1009-8097.2025.01.007

引言

教育研究領域一直重視人工智能的應用及其效果,特別是如何規范使用這些技術,以及如何借助它們改變傳統的知識創造方式[1]。隨著以大語言模型(Large Language Model,LLM)為代表的新型人工智能在學習科學領域的深入應用,教育研究的思路、方法與工具迎來前所未有的拓展機遇,正如2024年世界數字教育大會發布的“人工智能賦能教育發展”倡議所指出的:“發揮人工智能在數據獲取、實驗設計、結果分析等方面的優勢,探索數據驅動的循證研究范式。”[2]

與傳統人工智能在教育研究中的應用相比,大語言模型經過海量跨領域數據集的預訓練,已具備廣泛的知識覆蓋面,能勝任多學科科研場景的知識問答[3]。憑借大語言模型的語義理解、摘要生成等能力,將其引入教育研究場景,有助于對教育領域文本、音視頻等非結構化材料進行摘錄、主題分析、關系編碼等內容分析工作[4]。然而,當前大語言模型在教育研究中的應用面仍然受限,聚焦于解決特定的分析問題,尚未系統地覆蓋整個教育研究的方法論范疇。特別是在復雜的教育研究場景中,大語言模型還面臨諸如長文本處理、跨文檔的內容關聯分析和研究過程的可解釋性等挑戰[5]。隨著智能體技術的成熟,基于智能體代理框架協同多個大語言模型的模式,能夠實現問題解決、外部工具應用和任務規劃等功能[6],這為教育研究范式的重構提供了新的可能性,有望實現研究方法層面的結構轉型。

本研究嘗試以循證研究中的元綜合研究為切入點,探索智能體在教育研究場景中的典型應用,探討智能體如何更加系統地為元綜合研究提供支持。為此,本研究將設計元綜合智能體的應用模式、開發元綜合智能體工具并進行工具測評和案例應用,最終對其效果展開綜合評估,以期通過人工智能助推教育研究范式轉型,為利用智能體解決教育研究領域的任務提供實踐示范。

一 相關研究

元綜合是循證研究體系的一種重要方法,用于對不同研究中的定性證據進行跨研究比較與綜合[7],通過系統地組織和整合證據中的知識與概念,形成累積性的理論體系。與元分析通過統計方法綜合定量結果不同,元綜合采用解釋性和敘述性的方法來綜合多項定性研究的結果。在教育研究中,元綜合有助于加深對教育現象的理解,為教學實踐提供科學的模式與方案,是推動教學實施科學化的重要途徑。然而,元綜合是一個工作量龐大、對科研能力要求較高的復雜過程。隨著大語言模型在科研領域應用的深入,本研究將梳理相關文獻,探索解決元綜合這一復雜問題的技術路徑。

1"大語言模型在科研領域的應用進展

大語言模型在科學研究中的應用日益廣泛,主要用于提升科研自動化和支持分析推理任務。研究者采用了多種方法進行嘗試:①通過在特定科研數據集上的微調模型提升專業能力。例如,Zheng等[8]通過對大量生物與醫學文本、數據的微調,使大語言模型掌握學科領域知識,提高了其對相關科學文本的理解和處理能力。②優化使用策略,提升科研任務回答的準確性。例如,Liu等[9]在論文評審任務中采用少樣本提示策略,通過評審者角色、論文標題和要求等提示,使大語言模型的評審水平接近人類專家。③采用思維鏈提示策略,使大語言模型闡明推理過程。例如,Liang等[10]利用ChatGPT-4進行文本編碼分析時,要求大語言模型同步闡明編碼原因,以幫助編碼人員在面對復雜定性材料時作出更準確的判斷。

以上研究表明,合理的知識來源和大語言模型的策略性使用是解決科研問題的重要保障。然而,當前這些策略僅解決的是研究中的局部問題,如論文評審、內容編碼、總結概括等,對于元綜合這一復雜研究工作流程的支持范圍尚顯不足,難以支持元綜合結果的自動、準確且高效生成。此外,分析過程欠缺解釋性、上下文處理受限等問題,也降低了大語言模型在科研場景應用的可信度。

2"智能體技術的發展

隨著大語言模型技術的不斷發展,引入智能體技術成為針對以上問題的一種可行的解決方案,能夠更全面、系統地支持元綜合工作。智能體起源于20世紀70年代分布式人工智能的理念,被定義為能夠自主學習和行動的實體[11]。現今,智能體應用的典型模式是通過“思維鏈”(Chain-of-Thought,CoT)推理技術,在對話中激發大語言模型的世界知識,提升其感知、記憶和推理能力[12]。智能體的典型應用模式包括以下程序:①基于用戶指令,對復雜任務進行規劃、分解、組織等。②任務可由單個大語言模型獨立執行,或由多個大語言模型通過交流、合作、競爭等方式共同執行。③智能體通過整合知識庫、數據庫和插件等外部工具,增強環境感知和推理能力,提升最終輸出的有效性[13]

可見,大語言模型支持下的智能體理念,強調從單一功能到綜合能力的轉變,目的是使大語言模型更靈活地應對復雜環境中的多樣化任務,展現出更接近人類認知過程的智能行為。目前,智能體研究已經深入到軟件開發、模擬仿真等領域,如Qian等[14]開發的ChatDev平臺模擬軟件公司的組織結構,將產品經理、設計師、程序員和測試人員等不同角色的智能體進行協同,實現了從產品設計到編碼和測試的軟件開發流程;Park等[15]構建了一個包含25個智能體的虛擬小鎮,模擬人類的記憶、反思和計劃等心智活動并還原到日常生活與工作中,為教育領域中的自主探究、情景學習等活動的技術應用提供了借鑒。

二 應用模式與工具實現

1"應用原則

根據前文,元綜合旨在對特定主題的研究論文進行比較和綜合,其核心步驟包括評估證據質量、提煉核心觀點、總結主題和概念、關系編碼等,最終形成新的理解、理論或模式[16]。基于對智能體應用框架的總結和對元綜合的深入理解,本研究提出了元綜合智能體應用原則,包括:①多步驟規劃。基于元綜合流程規劃研究任務,并明確每個任務的子步驟。②協同模式構建。模擬科研團隊,通過指令協調多個大語言模型的任務分工,確定工作銜接和執行順序。③提示賦能。通過提示指令,讓大語言模型扮演指定任務角色;利用思維鏈策略,明確解決步驟和參考范例,并解釋推理過程。④工具集成。在多個大語言模型協同過程中,嵌入外部工具,實現過程數據存儲、邏輯判斷和信息反饋等功能。

2"應用模式

基于上述原則,本研究設計了元綜合智能體的應用模式,明確了智能體的協同過程、角色實現及工具應用,其中元綜合的核心功能由證據評價與證據綜合兩大智能體模塊組成,如圖1所示。

(1)證據評價模塊

證據評價模塊以三個智能體為核心,旨在實現兩大目標:參照元綜合流程中的指標和標準,對提供的論文質量進行評價;根據用戶需求,從達標論文中提煉出可用于問題解決的核心觀點。起點為需評審的論文全文及提煉核心觀點的主題詞。

三個智能體的工作分別為:①質量評審者,負責接收用戶輸入的內容,參考論文質量評價標準對論文質量進行逐條打分并提供解釋。②精準評定者,基于質量評審者提供的評價結果與解釋,依據元綜合的篩選標準對論文等級進行精準劃分,給出論文等級并闡述評定理由。本智能體需要借助判斷工具剔除不符合元綜合分析要求的論文,只保留質量高且等級高的論文。③觀點提煉者,對等級評定過關的論文中的核心觀點進行提煉,之后用外部存儲工具整理提取到的核心觀點,形成核心觀點集合。這種模式設計能確保元綜合過程中論文篩選的嚴謹性和核心觀點提取的精準性,為證據綜合奠定基礎。

(2)證據綜合模塊

證據綜合模塊同樣由三個智能體負責協同執行任務,其目標在于:基于元綜合流程,將上一階段對所存儲的各篇論文的核心觀點進行核心概念歸納、主題歸納、關系編碼,并以結構化的方式表達元綜合結果,以便用戶在此基礎上繼續深入應用。

三個智能體的工作分別為:①主題、概念總結者,用于對多篇論文中提取的核心觀點行文本分析。該智能體需要扮演內容分析專家的角色,按照嚴謹的科研步驟,逐步完成核心觀點的摘要、核心概念提煉及主題歸納等子任務,并依次呈現這些步驟的結果。②表格匯總者,將前一階段獲得的主題、核心概念和相關聯的核心觀點摘錄,以表格形式清晰呈現。③關系總結者,基于匯總表中的主題或核心概念,從核心觀點中識別它們之間的關系,統計各種關系的出現頻次,并把每種關系概括為一個準確名稱。這個智能體將所有信息整理成表格,清晰展示信息之間的關系、關系的數量及名稱。該智能體應用模式將分散的核心觀點整合成結構化的知識體系,確保了研究過程的可解釋性。

3"工具實現

為支持元綜合智能體應用模式,本研究利用COZE平臺的工作流功能開發了元綜合智能體工具,并用于后續案例研究。該平臺集成了多個大語言模型和工具,能夠通過輸入輸出方式串聯智能體,有效實現應用模式,元綜合智能體的工具實現如圖2所示。

本研究采用了多項實現策略:①在模型選擇上,證據評價模塊的智能體均采用GPT-3.5 4k模型,由于證據綜合模塊涉及更復雜的問題解決,因此采用推理和上下文處理能力更強的GPT-4 8k模型。②通過連接智能體,設計元綜合工作流程,明確智能體之間的銜接,以及需處理的信息來源和范圍。③在證據評價模塊中,根據元綜合的評價需求,為承擔評價功能的智能體提供合適的評估指標。例如,質量評審者智能體使用JBI-QARI中的9大定性研究評估指標,并在提示指令中要求“……你只能選擇‘是、否、不清楚、不適合’這四個選項對每個評估主題進行打分”,還要為每個指標的打分提供解釋[17]。精準評定者智能體則使用JBI-QARI中的論文篩選標準,針對四種論文類型進行分類:“A.關鍵論文”“B.令人滿意的論文”“C.不適合的論文”“D.有致命缺陷的論文”,提示指令同樣要求提供詳細合理的解釋。④通過思維鏈提示、少樣本提示等策略規范推理過程,確保智能體按照明確步驟執行任務。例如,主題、概念總結者智能體在提示指令中被要求扮演質性分析專家角色,并按照任務步驟進行分析。⑤利用外部工具管理工作流程。例如,判斷工具接收精準評定智能體的論文評定結果并剔除低于B等級的論文;消息通知工具實時告知用戶每個智能體的輸出結果;數據庫則記錄智能體的累積輸出結果。

三 案例研究

為進一步探索智能體工具在元綜合任務場景中的應用,本研究開展了智能體工具應用的案例研究,首先評估了智能體工具的應用效果,然后記錄了人類團隊使用該工具開展元綜合實踐的過程。

1"案例簡介

本研究選取的智能體應用場景是對高中物理“運動學”課程教學模式設計的相關論文進行元綜合分析。應用目標是通過智能體工具,對典型研究論文中的理論觀點和應用案例進行元綜合,形成科學合理且理論指導實踐的教學模式。為確保論文質量,本研究制定了篩選標準,即教學模式設計具有理論依據、清晰介紹教學模式應用過程、對效果進行評估等。前期準備包括:確定檢索范圍為2020~2024年;通過CNKI數據庫,使用“高中物理”“運動學”等關鍵詞結合布爾運算符進行檢索;根據標題和摘要初篩后,通過全文閱讀和評估,最終選定20篇高質量論文作為元綜合智能體應用的基礎材料。這些論文被平均分為兩組(每組10篇),分別用于案例的兩個階段:第一階段使用10篇論文評估智能體效果,并比較人類團隊與智能體的元綜合結果差異;第二階段用另10篇論文,供參與者通過操作體驗智能體工具。

2 案例設計

(1)研究對象

本案例選取了一個由12名廣東省G大學J專業的大三本科師范生組成的教育研究團隊作為研究對象。該團隊成員在過去完成了學習科學、教育技術學研究方法課程的學習,并共同參與過多個教師指導的科研項目,具備進行論文閱讀與評價、內容分析的研究能力和團隊協作經驗。

(2)案例活動與評價

案例活動被設計為兩個階段:①人類團隊元綜合階段,參與者組成團隊,共同完成10篇論文的元綜合工作,包括證據評價和證據綜合兩個環節。同時,智能體工具獨立完成相同10篇論文的元綜合任務。為確保公平比較人類團隊和智能體的元綜合結果,研究者事先向參與者詳細說明元綜合的任務要求,指導其通過分工完成各項工作。參與者獲得與智能體相同的評估指標、標準材料和活動支架,保證任務執行順序和要求的一致性。研究者詳細記錄人類團隊和智能體的元綜合結果,為后續比較提供基礎數據。②智能體輔助元綜合階段,參與者使用元綜合智能體工具針對另外10篇論文完成元綜合任務。該階段將開展半結構化訪談,收集參與者對智能體的準確性、使用體驗等方面的反饋。

(3)工具測評方法

評測內容主要關注智能體工具在論文評價、觀點提煉、主題與核心概念總結、關系編碼等方面的一致性表現,這對于提高用戶體驗、確保模型可靠性和提升實際應用表現至關重要。有研究者指出,高一致性不僅能減少用戶的困惑和誤解、增強信任感,還能反映模型的魯棒性和可靠性,對于元綜合這類準確性要求較高的任務尤為重要[18]。因此,針對證據評價模塊,本研究選擇一篇代表性研究論文,進行10次重復操作,分析智能體每次輸出結果的一致性;針對證據綜合模塊,本研究則利用從多篇論文中提煉出的核心觀點作為輸入,進行10次重復操作,比較證據綜合模塊在處理核心觀點時的一致性。

3"研究結果與分析

(1)證據評價智能體模塊的一致性表現

對證據評價智能體模塊的一致性進行評價時,本研究抽取了一篇研究論文《SNP教學模式在促進物理科學思維發展中的應用與思考》作為測評樣本,除給智能體輸入該論文的全文外,還提煉了該論文核心觀點的主題詞——“物理教學模式”。經過比較,10次操作中智能體均能完全參照指令中的評價指標、標準按步驟完成任務并對解決思路形成清晰解釋。

以下是三個智能體的一致性表現:①對質量評審者智能體的10次評價結果進行Kendall一致性分析,發現p值=0.000<0.001,Kendall W系數=0.544,說明該智能體的10次輸出對該論文9個維度的打分一致性處于中等水平。②精準評定者智能體的10次論文等級評定結果都為B級,一致性達到100%。③觀點提煉者智能體提煉的10次核心觀點均來自論文原文。本研究參考Zambrano等[19]提出的人工智能輔助方法分析觀點提煉者的一致性表現,通過GPT-4模型對每次提煉的觀點進行語義切片與主題提取,并由兩名研究者人工校對。此外,本研究采用杰卡德系數計算不同輪次中主題之間的相似度,該方法通過衡量兩個集合的交集與并集比,反映不同提煉結果在主題上的重合度,最終形成一致性矩陣,如表1所示。分析結果表明,觀點提煉的一致性大多處于中等水平。

(2)證據綜合智能體模塊的一致性表現

在證據綜合智能體模塊的測試中,本研究使用證據評價模塊將從10篇論文中提取的核心觀點作為樣本,并對每個樣本進行編號。通過對10次操作的輸出結果進行內容分析,發現在同一操作下三個智能體都能按照規劃完成任務,并確保前后輸出的一致性;在不同操作之間,智能體在核心概念歸納、主題提取和關系提取方面存在一定的一致性差異。

①核心概念歸納情況:在10次操作中共歸納了20個類型的核心概念。值得注意的是,某些概念在不同的提取結果中被歸入不同主題,如“證據意識”有時是獨立主題,有時被歸入“能力培養”或“教學理念”。②主題提取情況:每次操作提取的主題數量為4~6個,類型差異較大。有些主題聚焦教學過程,如第3次的“教學方法”“教學效果和評價”;有些則更關注理論與能力,如第7次的“物理模型建構”“核心素養與思維能力”。③關系提取情況:提取的關系數量為6~10對,部分關系注重理論與實踐的聯系,如第2次的“教學理論和方法對學生能力培養的影響”“教學理論和方法對教學工具和技術的影響……”等;有些則更關注不同設計環節之間的聯系,如第8次的“評價與反饋對物理模型的理解與應用”“教學理論與方法對教學工具與方法的選擇……”等。盡管存在以上差異,本研究也發現,隨著操作次數的增加,從第7次操作開始,智能體不再產生新的主題、概念或關系,表明文本分析已達到飽和狀態。

總體而言,智能體工具展現出了基于任務規劃、以模擬研究團隊的方式解決研究問題的能力。然而,本研究也觀察到了該工具每次生成的結果都具有概率性,整體一致性處于中等水平。而通過多次操作,本研究發現可以在一定程度上彌補單次生成結果的概率性問題。

(3)案例研究結果總結

在第一階段(人類團隊元綜合),參與者通過團隊共同合作,完成了對10篇論文的證據評價和證據綜合工作,并且以教學模式圖的形式表達元綜合結果。與此同時,智能體的元綜合工作同步進行,最終研究者按照智能體的元綜合結果繪制教學模式圖。如圖3所示,通過比較人類團隊和智能體的元綜合結果,不難看出:元綜合智能體給出的物理教學模式圖所涵蓋的主題和關系更加全面、更具有解釋性。這表明元綜合智能體相比人類研究型團隊,更擅長定位文本中容易忽視的關鍵點和關鍵點之間的聯系。

在第二階段(智能體輔助元綜合),人類團隊在智能體工具的支持下完成了對剩余10篇論文的元綜合任務。隨后,對團隊成員進行現場調查,結果顯示:在12名成員中,認為智能體生成的結果非常準確、準確的分別占83%、17%。在進一步詢問智能體與人類的合作體驗時,參與者均給出了積極反饋,但對智能體的角色認知存在差異。例如,林同學認為“它是一個可靠的隊友。我給它一個點,它可以給不同維度的思路”;吳同學表示“它比較像一個有思考的信息搜集官。我們把東西給它,它就能在里面收集到我們想要的信息,經過提煉再返回給我們”;謝同學覺得“它就像得力的秘書,可以處理各類工作的初稿。你可以將任務給它,然后自己再審閱細節,進行必要優化”;王同學認為“它像雷達一樣可以在儀表上定位我們最需要的東西,然后做一個準確的研究”;而李同學指出“它有兩個角色。第一個是翻譯官,它可以把長篇文章簡單地翻譯給你聽。第二個是總裁的特別助理,因為它能夠簡單地梳理出各種關系,并幫助你快速解釋這些關系”。本研究認為,參與者對智能體角色的不同認知,可能與個人特征(如科研能力和對人工智能的熟悉程度)有關。

四 總結與建議

大語言模型為教育研究帶來了重要的技術支持。本研究以“元綜合”為典型示范場景,采用智能體方法設計應用模式,開發元綜合智能體工具,并通過工具測評和案例研究評估了智能體在教育研究中的應用表現,重構了元綜合的工作模式,通過引入智能體工具,為定性研究提供了新的人機協同方式。此外,本研究中的探索性案例揭示了智能體優化教育研究過程的可行性,智能體實現了對元綜合任務的有效規劃、保障了分析過程的規范性、強化了對推理過程的感知。工具測評結果顯示,智能體能按要求執行任務,但每輪生成結果的一致性整體偏中等。基于對元綜合智能體應用模式、工具實現和案例研究的總結,本研究提出以下策略,以充分發揮智能體的優勢,同時應對其局限性,為教育研究提供更有效的支持:

①智能體的應用要始終對齊教育研究過程。這種對齊主要體現在兩個方面:首先,智能體的問題解決步驟和文本處理過程應與教育研究實施操作的步驟保持一致,這意味著智能體在教育研究中的應用建立在對研究過程充分理解的基礎之上。因此,可以根據研究過程對智能體的工作進行細致劃分,使不同智能體像緊密合作的研究團隊一樣共同完成科研任務。其次,需要將開展研究所需的方法規范、評價標準和參與角色等嵌入每個智能體的提示指令,從而規定智能體輸出結果的范圍。在這一過程中,每個智能體的輸出代表研究過程的階段性結果,不僅確保了研究每一步驟的規范性,也使每個步驟變得可解釋。

②對智能體生成結果的反思強化。本研究通過多輪測試發現,元綜合智能體對同一問題的解決結果具有概率性,但在實踐案例中,智能體生成結果的可靠性得到了人類團隊的肯定。基于這一現實情況,本研究提出了智能體反思強化的應用策略,用于優化人機協同:可以將智能體多輪生成的結果視為多個評委專家對同一問題的決策結果,用戶基于自己的專業能力,針對每個“專家”提供的結果和解釋過程作出評判。此外,這種人機共同開展科研工作的方式還可以進一步拓展為“多人類成員+教育研究智能體”的模式,通過對智能體結果進行集體反思,確保人工智能應用的規范性。

③對用戶的更高能力要求。按照大語言模型應用的“人在回路中”標準,智能體的生成結果仍需經過人類決策后才能付諸實踐[20]。本研究認為,科研人員利用智能體解決研究問題的前提,是其本身須具備相關教育研究問題的扎實方法論知識和豐富實踐經驗。這些基礎能力使研究者能夠準確甄別智能體的輸出結果,并將其有效轉化為研究決策。另外,用戶還需具備對科研智能體的輸出和應用流程進行持續優化的能力,以確保在研究需求不斷變化的過程中,用戶能夠靈活調整智能體的應用方式,使其始終適應研究的動態需求。

值得一提的是,本研究通過案例分析發現了幾個值得深入探討的研究方向,包括用戶的能力特征對智能體協同過程可能產生的影響、智能體在不同類型科研團隊中可能承擔的角色等。對這些內容的深入研究,將有助于提出更加直接的智能體應用策略,從而進一步優化教育研究過程。

參考文獻

[1]張惠彬,許蕾.生成式人工智能在教育領域的倫理風險與治理路徑——基于羅素大學集團的實踐考察[J].現代教育技術,2024,(6):25-34.

[2]中華人民共和國教育部.2024世界數字教育大會發布“人工智能賦能教育發展”倡議[OL]."lt;http://www.moe. gov.cn/

jyb_xwfb/xw_zt/moe_357/2024/2024_zt02/pxhy/pxhy_znll/pxhy_znll_mtbd/202402/t20240201_1113848.htmlgt;

[3]董艷,陳輝.生成式人工智能賦能跨學科創新思維培養:內在機理與模式構建[J].現代教育技術,2024,(4):5-15.

[4]陳向東,趙麗娟,劉澤民.拓展學科的疆域:大模型的涌現能力對學習科學的影響[J].現代教育技術,2024,(1):44-54.

[5]張鵬,汪旸,尚俊杰.生成式人工智能與教育變革:價值、困難與策略[J].現代教育技術,2024,(6):14-24.

[6]鄭永紅,王辰飛,張務偉.生成式人工智能教育應用及其規制[J].中國電化教育,2024,(5):114-119.

[7]Bronstein J, Reihlen M. Entrepreneurial university archetypes: A meta-synthesis of case study literature[J]. Industry and Higher Education, 2014,(4):245-262.

[8]Zheng Y, Koh H Y, Ju J, et al. Large language models for scientific synthesis, inference and explanation[J]. arXiv Preprint arXiv:2310.07984, 2023.

[9]Liu R, Shah N B. ReviewerGPT?"An exploratory study on using large language models for paper reviewing[J]. arXiv Preprint arXiv:2306.00622, 2023.

[10]Liang W, Zhang Y, Cao H, et al. Can large language models provide useful feedback on research papers? A large-scale empirical analysis[J]. NEJM AI, 2024,(8):AIoa2400196.

[11]翟雪松,季爽,焦麗珍,等.基于多智能體的人機協同解決復雜學習問題實證研究[J].開放教育研究,2024,(3):63-73.

[12]Zhang Z, Yao Y, Zhang A, et al. Igniting language intelligence: The hitchhiker’s guide from chain-of-thought reasoning to language agents[J]. arXiv Preprint arXiv:2311.11797, 2023.

[13]Xi Z, Chen W, Guo X, et al. The rise and potential of large language model based agents: A survey[J]. arXiv Preprint arXiv:2309.07864, 2023.

[14]Qian C, Cong X, Yang C, et al. ChatDev: Communicative agents for software development[J]. arXiv Preprint arXiv:2307.07924, 2023.

[15]Park J S, O’Brien J, Cai C J, et al. Generative agents: Interactive simulacra of human behavior[A]. Proceedings of the 36th Annual ACM"Symposium on User Interface Software and Technology[C]. New York:"Association for Computing Machinery,"2023:1-22.

[16]仇星月,陳向東,褚樂陽,等.協作學習中的群體感知:概念的發展與融合[J].遠程教育雜志,2022,(3):85-96.

[17]Munn Z, Tufanaru C, Aromataris E. Recognition of the health assistant as a delegated clinical role and their inclusion in models of care: A"systematic review and meta-synthesis of qualitative evidence[J]. International Journal of Evidence-Based Healthcare, 2013,(1):3-19.

[18]Shen X, Chen Z, Backes M, et al. In ChatGPT"we trust? Measuring and characterizing the reliability of ChatGPT[J]. arXiv Preprint arXiv:2304.08979, 2023.

[19]Zambrano A F, Liu X, Barany A, et al. From nCoder to ChatGPT: From automated coding to refining human coding[A]. International Conference on Quantitative Ethnography[C]. Cham: Springer, 2023:470-485.

[20]禇樂陽,潘香霖,陳向東.AI大模型在教育應用中的倫理風險與應對[J].蘇州大學學報(教育科學版),2024,(1):87-96.

Meta-synthesis Research Supported"by Large Language Model: An Agent-based Approac

QIU"Xing-Yue1""""CHEN Xiang-Dong2""""CHEN Peng2""""CHU"Le-Yang3""""CUI"Meng1

1. College of Teacher’s Education, Guangdong University of Education, Guangzhou"Guangdong, China"510310;

2. Department of Educational Information Technology, East China Normal University, Shanghai, China"200062;

3."Journalism and Media College, Yangzhou University, Yangzhou"Jiangsu, China 225009

Abstract:"With their robust analytical and inferential capabilities,"large language model (LLM) are transforming educational research paradigms, particularly made"significant advancements in agent technology, which provides strong support for systematically solving complex problems in the scientific research field. Based on this, the paper focused"on the typical research task scenarios of meta-synthesis, and discussed how to provide more systematic support with an agent-based approach. Firstly, this"paper introduced"the application principles for meta-synthesis agent application, including multi-step planning, collaborative mode"construction, prompt empowerment, and tool integration, designed an application mode involving the coordinated efforts of six agents,"as well as"developed a"meta-synthesis agent tool based on this mode. Then, the agent tool was applied to typical meta-synthesis tasks"through case studies. It was found that"compared to human teams, the agent can"perform the task in accordance with the meta-synthesis research process better and generate more comprehensive results. Meanwhile, human teams gave"positive evaluation"on the accuracy and user experience"of the agent during the application process. Finally, based on the research findings, this paper put forward the application strategy of the"agents in educational research, in order to offer"a"new insight"of"man-machine"collaboration for solving the practical problems of"educational research.

Keywords:"large language model; agent; meta-synthesis; educational research

*基金項目:本文受2023年度全國教育科學規劃一般課題“基于大語言模型的青少年人工智能教育研究”(項目編號:BCA230276)、廣東省普通高校特色創新類項目(人文社科)“多模態數據支持的在線自主學習路徑個性化規律挖掘與應用研究”(項目編號:2022WTSCX083)資助。

作者簡介:仇星月,講師,博士,研究方向為大語言模型教育應用、協作學習、群體感知和共享調節,郵箱為qiuxingyue@gdei.edu.cn。

收稿日期:2024年8月5日

主站蜘蛛池模板: 国内视频精品| 欧美色视频网站| 香蕉久人久人青草青草| 亚洲男人的天堂视频| 2021国产v亚洲v天堂无码| 日韩高清欧美| 91久久偷偷做嫩草影院| 99久久精品国产精品亚洲| 久久精品一品道久久精品| 四虎永久在线精品影院| 国产精品成人免费视频99| av尤物免费在线观看| 97精品伊人久久大香线蕉| 黄片在线永久| 成人在线欧美| 最新痴汉在线无码AV| 国产在线观看第二页| 天天躁夜夜躁狠狠躁图片| 欧美人人干| 久久久久久高潮白浆| 国产日韩精品欧美一区喷| a级免费视频| a毛片在线免费观看| 白浆免费视频国产精品视频| 中文字幕中文字字幕码一二区| 日韩一区二区三免费高清| 亚洲美女久久| 国产精品第一区| 福利视频久久| 亚洲欧美人成电影在线观看| 四虎成人在线视频| 99视频有精品视频免费观看| 亚洲国产精品日韩欧美一区| 中国一级特黄大片在线观看| 一级爆乳无码av| 日韩欧美网址| 国产91高清视频| 91青青草视频在线观看的| 熟妇丰满人妻| 天天躁夜夜躁狠狠躁躁88| 在线观看国产小视频| 午夜啪啪福利| 日本精品影院| 伊人久久大香线蕉aⅴ色| 18禁黄无遮挡网站| 欧美成人精品一区二区| 婷婷99视频精品全部在线观看| 一本一道波多野结衣一区二区| 欧美日韩国产在线观看一区二区三区 | 99青青青精品视频在线| 77777亚洲午夜久久多人| 日韩一二三区视频精品| 亚洲国产理论片在线播放| 国国产a国产片免费麻豆| 亚洲中文字幕97久久精品少妇| 欧美日韩国产精品综合| 中文无码日韩精品| 精品久久久久成人码免费动漫| 成人亚洲天堂| 国产成人啪视频一区二区三区| 日本草草视频在线观看| 国产成人调教在线视频| 欧美啪啪视频免码| 欧美国产日韩在线| 国产成人免费| 免费国产在线精品一区| 久操中文在线| 精品一区二区三区自慰喷水| 在线观看亚洲国产| 中国成人在线视频| 日韩国产 在线| 成年人国产视频| 久操线在视频在线观看| 国产精品亚洲专区一区| 美女一区二区在线观看| 不卡无码h在线观看| 国产一区在线观看无码| 97人人做人人爽香蕉精品| 亚洲一区精品视频在线| 欧美区一区| 国产日本欧美在线观看| 欧美另类视频一区二区三区|