馬志強 王文秋
面向協作知識建構會話的智能觀點分類研究——基于深度神經網絡與會話分析的融合方法
馬志強 王文秋
(江南大學 江蘇“互聯網+教育”研究基地,江蘇無錫 214100)
在面向知識建構的會話智能分析研究中,如何改善原有互動行為分析視角的局限,從會話觀點的角度精準描述會話的語義特征以實現對會話進行自動分類,是研究者關注的核心問題。基于此,文章融合深度神經網絡與會話分析方法,構建了包含相關度、縱深度、聚斂度三種會話分類特征的面向協作知識建構會話的智能觀點分類框架,并設計包含六個環節的智能觀點分類流程,引入到自然語言處理領域的BERT、TextCNN、Fasttext模型,從精確率、召回率、F1值、準確率四個指標對三種模型的會話分類特征進行比較,發現BERT模型在整體語義特征、單一會話類型的分類性能上均擁有更高的準確率。文章探索數智融合的會話分析框架與分析路徑,證明了深度神經網絡在協作知識建構會話智能量化分析中的可行性,有助于改善智能會話分析的質量與效率。
人工智能教育;學習分析;會話分析;知識建構;觀點改進
大數據、人工智能等新興信息技術的進步,為教育評價帶來了新的發展契機,不斷推動教育評價向科學化、精準化、智能化的方向發展[1]。在復雜、真實的教育評價實踐中,師生、生生之間的交流會話是實現教與學互動的關鍵手段,也是新興技術賦能教學評價的重要著力點[2][3]。這是因為會話蘊含著復雜、動態的教學互動信息,能夠體現個體或群體獨特的思想意識、價值與立場,技術賦能的會話分析能夠發展更具準確性與解釋性的評測方法,來揭示會話隱含的教與學互動規律,并為教學改進提供充分依據[4]。
具體到協作知識建構教學中,會話是群體內部觀點共享與意義協商的中介,對于理解多主體間的耦合作用關系和知識制品的形成發展過程具有重要價值[5]。協作知識建構會話分析是分析學習者協作知識建構過程與狀態的重要方法,目前主要從會話過程、會話類別、會話質量三個角度開展。其中,會話過程分析將會話理解為群體成員觀點共享、協商、升華等一系列認知參與活動,旨在分析其流程與關鍵環節[6];會話類別分析關注協作知識建構會話所達成的認知與社會性互動功能[7];會話質量分析從可讀性、相關度、聚斂度、縱深度和探究度等維度,評價會話對于觀點建構與意義協商的促進作用[8]。綜合上述研究成果,可知目前面向協作知識建構的會話分析重于對會話特征進行定性描述,而缺乏對會話量化特征的定義,導致編碼一致性較低,影響了分類算法的準確性,難以應用于大規模、伴隨式的會話分析場景之中。
鑒于此,有研究者提出了面向協作知識建構會話智能化分析的基本路徑,其實現的關鍵路徑是從觀點分類的角度精準描述會話的語義特征,揭示會話內容中持續的觀點改進進程[9][10]。也有研究者認為,目前智能技術支持的協作知識建構會話分析實現的主要路徑是將會話表示為相應交互行為的集合,將會話分析問題轉化為行為單元及其相互關系分析[11]。此外,有研究者采用會話內容聚類、話題演化等方法,針對會話詞語層級的含義進行分析,但詞語層級的分析脫離了具體會話情境,忽略了會話語句中語義的功能指向[12];有研究者開始嘗試基于自然語言處理中的觀點分類方法,以觀點制品為分析對象,開展智能觀點分類研究[13]。自然語言處理的觀點分類方法旨在識別會話內容中表達的觀點和立場,主要通過傳統機器學習模型與深度神經網絡模型實現文本分類[14]。而相較于傳統機器學習方法,深度神經網絡基于對詞語在不同情境中指向不同對象而表達出特定含義的理解,注重相鄰詞語之間的關聯,在理解語義結構方面具有更好的性能[15]。有少數研究者對此進行了初步探索,如宋宇等[16]首先提出了面向知識建構的課堂對話編碼體系,具體包含基礎知識、個體表達、分析、歸納、推理與遷移、回應與拓展、認同、質疑、指導九大類,為會話類別賦予知識建構的內涵,并圍繞以上編碼體系,采用人工編碼和機器學習相結合的方法對真實課堂中的協作知識建構會話文本進行分類,應用機器學習的方法創設了基于深度學習的行為類別自動序列標注模型CNN-BiLSTM,實現對話語文本的語義進行理解和自動識別,在會話類型識別方面取得了高于70%的準確率。然而,此研究會話數據來源于網絡平臺匯集的、以教師為中心的中小學課堂,無法代表真實的知識建構學習情境,此外,分類效果也需進一步優化。鑒于上述研究空缺,本研究融合深度神經網絡與會話分析方法,圍繞協作知識建構的觀點改進過程,從相關度、縱深度、聚斂度三個會話語義特征,構建面向協作知識建構會話的智能觀點分類框架,并提煉智能觀點分類的基本路徑,以實現從會話語義特征層面對會話類型進行精準識別[17]。
協作知識建構會話的核心功能是通過分享、協商觀點、達成共識等環節進行觀點改進,使知識建構過程與知識制品得以完成。因此,觀點改進是知識建構會話的主要功能指向。同時,還存在支持觀點改進過程的其他會話,包括協調任務的安排與進度、技術問題的交流與解決。此外,還包括極少數與知識建構任務無關聯的會話,可能會影響觀點改進的進度與效率。
基于此,本研究參考劉黃玲子等[18]提出的交互分析編碼框架進行構建,以蔣紀平等[19]提出的知識建構觀點分析框架指導觀點改進會話的分類,并以Zhu[20]的知識建構交互分析框架中提出的信息檢索與討論性兩大類問題來支撐其中的共享型觀點分類,以Pena-Shaff等[21]的在線討論知識建構過程評估框架中對沖突與支持的細致分類來支撐其中的協商型觀點分類。此外,本研究還綜合考慮了在線學習環境,為此提出技術型會話,最終從會話語義特征的角度對會話進行分類描述,以觀點改進為核心,凝練出相關度、縱深度、聚斂度三種會話分類特征,并構建了面向協作知識建構會話的智能觀點分類框架,如圖1所示。

圖1 面向協作知識建構會話的智能觀點分類框架
本研究根據會話內容與觀點改進的相關度,對協作知識建構會話進行第一層級分類。同時,觀點改進會話本身存在階段性的變化,為了對觀點改進會話進行更深入的挖掘,因此本研究根據縱深度對觀點改進會話進行第二層級分類。另外,不同觀點改進深度的達成由多個觀點類型推動,每一深度的多個觀點類型屬于并行關系,但存在邏輯順序的差異,因此本研究根據聚斂度對觀點改進三個深度的會話進一步分類。三種會話分類特征均以觀點改進為核心,并逐步分解、逐層深入。
第一種會話分類特征是相關度,指會話內容與協作知識建構觀點改進任務的相關程度,具體分為三個類目:①觀點改進會話,是指與最終知識制品直接相關的會話觀點,包括共享型觀點、協商型觀點、升華型觀點。②觀點改進支持會話,是指在知識建構過程中起到支持作用的會話,具體分為協調型會話、技術型會話兩類。其中,協調型會話是指小組內部圍繞小組任務進行計劃、監督、協調而推動觀點改進的會話;技術型會話則指小組排除技術因素的干擾,相互支持的會話——由于本研究采集的是基于在線同步協作知識建構會話,因此成員需要解決技術障礙完成會話交流。③無關聯會話,是指過于簡短且不包含明確觀點或與協作知識建構任務無關的會話,與觀點改進沒有直接關聯。
第二種會話分類特征是縱深度,用于區分觀點改進會話的作用深度,將觀點改進會話進行分類描述,具體分為三種觀點:①共享型觀點,是指成員之間的詢問與解釋,旨在對需要解決的任務與問題統一認知,并清楚掌握彼此觀點的含義;②協商型觀點是指在掌握彼此觀點含義的基礎上,對自己的觀點進行維護和對他人的觀點表明立場,旨在對任務拆解的問題方案達成初步一致;③升華型觀點是指小組成員對已經達成的方案和觀點進行梳理、匯總與優化,并對自身知識建構認知能力的提升情況進行反思。
第三種會話分類特征是聚斂度,針對觀點改進會話進行細分,指觀點圍繞對應深度的聚斂程度。共享型觀點對應的是共享信息、提出問題、闡釋解讀、表達觀點。其中,共享信息是指組員之間對查閱資料內容的分享、對當前協作知識建構任務內容的說明、對已有研究成果的表述、對他人觀點的轉述等;提出問題是指對術語概念解釋的請求、對任務問題的拆解;闡釋解讀是指對術語概念與觀點含義的闡釋、對任務問題的解讀;表達觀點則指對資料、他人觀點的想法,以及對他人拋出的問題的回答。協商型觀點對應的是分歧、支持。其中,分歧是指對他人觀點的質疑、面對質疑的自我辯護;支持是指對他人觀點表示贊同且表達自己贊成的理由。而升華型觀點對應的是整合、改進。其中,整合是指小組成員對當前知識建構成果的匯總;改進是指對協作知識建構成果進行完善與修改,以完成最終的知識制品。
智能觀點分類的基本流程旨在依照智能觀點分類框架,實現自動化的觀點分類,主要分為六個環節(如圖2所示):①第一個環節是分類框架構建。框架用于描述知識建構會話基于語義特征的功能指向。②第二個環節是數據采集與清洗。以錄音形式對各小組會話進行采集,通過機器轉錄與人工清洗,最終以一系列具有完整語義的會話作為分類對象。③第三個環節是特征提取與標注。編碼者按照會話觀點分類框架,考慮會話內容表達的語義特征,對數據進行編碼。④第四個環節是分類模型訓練,以編碼完成的數據作為數據集,采用預先選擇的三個模型進行觀點分類訓練。⑤第五個環節是模型效果評價。使用精確率、召回率、F1值、準確率四個指標作為模型分類效果的評價依據,并對比分析各模型的分類性能。⑥第六個環節是分類模型優化。針對分類效果,通過數據增強、組合模型等方式進行分類方法優化。本研究以實踐案例形式對具體環節進行說明,第一個環節采用上述第一部分提出的面向協作知識建構會話的智能觀點分類框架,下文對第二個、第三、第四個環節進行重點分析,第五環節將在第三部分具體描述,第六環節將在討論部分進行初步探索。

圖2 智能觀點分類流程圖
本研究的數據來源于2020年~2021年新冠肺炎疫情防控期間江蘇省無錫市J大學人文學院教育技術學專業開設的“教育技術研究方法”課程。該課程以小組協作的形式開展,每組4~5人開展協作知識建構活動[22]。首先,小組成員圍繞“技術支持的協作學習”主題,對小組選擇的研究議題開展分析與論證。同時,各小組組長通過錄音,對小組協作知識建構會話數據(包含實時在線會話數據、實時面對面會話數據等)進行采集。隨后,研究者按照時間順序對各小組會話錄音進行整理后,通過機器轉錄獲得錄音文本。最后,研究者對錄音文本進行人工校對,對口語化數據的表述邏輯、疊詞、口頭禪等進行適當的增加、刪除、替換、交換等清洗操作,清洗操作案例如表1所示。通過對數據的清洗操作,本研究最終整理出有效會話數據6933條。

表1 清洗操作案例
在本研究中,編碼者按照已構建的智能觀點分類框架進行編碼,在編碼過程中提取觀點改進會話內容的語義特征,以實現對特征的量化描述。從會話數據中隨機選擇5%的文本,由本研究團隊的兩名成員分別進行編碼。編碼結束后,計算編碼者間一致性系數(Cohen’s Kappa),得到相關度編碼一致性達到0.89、縱深度編碼一致性達到0.89、聚斂度編碼一致性達到0.89,說明編碼結果的信度可以接受。隨后,兩名編碼者協商存在分歧的編碼,明確各指標含義,直至達成一致意見。最后,照此方式完成剩余數據的編碼。
編碼完成后的每一條數據都對應三種會話語義特征,而完成編碼的數據將用于三種模型的訓練。本研究從總數據集中取出20%作為測試集來評估模型預測效果,剩余的80%數據作為訓練集。模型通過對訓練集會話語義特征與語法的提取,調整參數使模型反映現實,進而預測未來或其他未知的信息,而測試集用來評估模型預測性能。數據集中各會話分布情況如表2所示。

表2 數據集中各會話分布情況
本研究選擇了在自然語言處理領域中表現較為優異的BERT、TextCNN、Fasttext三種模型算法來進行訓練。其中BERT是Google在2018年提出的NLP預訓練模型,在NLP領域的11個方向都取得了優秀成果[23]。TextCNN模型是由Kim在2014年提出的一種深層前饋神經網絡模型,其將卷積神經網絡應用到文本分類任務,驗證了TextCNN在文本分類問題上有更加卓越的表現[24]。Fasttext是Facebook開源的一個詞向量與文本分類工具,屬于概率語言模型,典型應用場景是“帶監督的文本分類問題”,其性能可比肩深度學習算法且速度更快[25]。
值得注意的是,三種模型在特征提取方式、所基于的數據集方面存在差異。分類模型的主要作用,就是通過特征提取掌握字符的構造特征。BERT模型主要使用多層Transformer結構,該結構使用Attention機制對輸入的向量進行特征提取與計算權重,識別出更能代表會話語義的詞向量,并賦予其更大的權重[26];TextCNN模型利用卷積實現特征的提取,對文本淺層詞語級特征的抽取能力很強[27];而Fasttext利用n-gram進行特征的提取,對字符級特征的抽取能力很強[28]。此外,數據的樣本數量在訓練模型時十分重要。根據大數定律,樣本數量越多時,頻率越接近于概率;而樣本數量很少時,模型的準確率就相對比較低。三個模型中,只有BERT模型利用了極大量的網絡數據進行了預訓練,使預訓練模型已經學會了中文的語義表達與語法結構,并在此基礎上基于本地語料庫對模型的參數進行了微調,本地語料庫存儲著本研究采集到的協作知識建構這一特定領域的會話數據,可能會提高模型識別的準確性。而其他兩個模型只根據本地數據庫對模型進行了訓練。
本研究使用精確率(Precision)、召回率(Recall)、F1值(F1-score)和準確率(Accuracy),作為協作知識建構會話觀點分類效果的評價指標。精確率表示每一類別中被預測為正類的樣本中實際正類的比例;召回率表示每一類別中所有正類樣本中被預測為正類的比例;而F1值表示在調和精確率和召回率之后,對分類器性能的綜合評判,可以代表各個類別的分類準確率;準確率代表的是分類器的整體準確率[29]。F1值和準確率是評價分類器性能的核心指標。
對相關度而言,三種模型訓練分類結果比較如表3所示,可以看出:BERT模型的整體準確率為85%,高于其他兩個模型;其次是Fasttext模型,準確率為81%;最后是TextCNN模型,準確率為77%;同時,BERT模型的F1值相較于其他兩個模型更高。此外,從縱向視角即具體會話類型上各模型的表現來看,BERT模型在6個會話類型的F1值均明顯高于TextCNN模型、Fasttext模型;而Fasttext模型在大部分類別上高于TextCNN模型,僅在協商型觀點、非任務型會話的F1值與TextCNN模型持平。而從橫向視角即每個模型對6個會話類型的分類表現來看,BERT模型中5個會話類型的F1值均高于80%,其中3個會話類型的F1值接近甚至大于90%,僅協商型觀點的分類表現上較差;而TextCNN模型與Fasttext模型中均存在多個會話類型的F1值低于80%的情況。由此可見,BERT模型在分類模型整體表現、單一會話類型分類性能上均優于TextCNN模型和Fasttext模型。

表3 相關度三種模型訓練分類結果比較
對縱深度而言,三種模型訓練分類結果比較如表4所示,可以看出:BERT模型的整體準確率為87%,高于其他兩個模型;其次是Fasttext模型,準確率為80%;最后是TextCNN模型,準確率為79%。同時,BERT模型的F1值相較于其他兩個模型更高。此外,從縱向視角即具體會話觀點類型上各模型的表現來看,BERT模型在4個會話觀點類型的F1值均明顯高于TextCNN模型、Fasttext模型,Fasttext模型在共享型觀點、無縱深度會話上的F1值高于TextCNN模型,而在協商型觀點、升華型觀點上的F1值略低于TextCNN模型。從橫向視角即每個模型對4個會話觀點類型的分類表現來看,BERT模型中3個會話觀點類型的F1值均高于85%,僅協商型觀點的分類表現上較差,而TextCNN模型、Fasttext模型均存在在協商型觀點與升華型觀點兩個類型上F1值較低的情況。由此可見,BERT模型在分類模型整體表現、單一會話類型分類性能上均優于TextCNN模型和Fasttext模型。

表4 縱深度三種模型訓練分類結果比較
對聚斂度而言,三種模型訓練分類結果比較如表5所示,可以看出:BERT模型的整體準確率為83%,高于其他兩個模型;其次是Fasttext模型,準確率為76%;最后是TextCNN模型,準確率為69%。同時,BERT模型的F1值相較于其他兩個模型更高。此外,從縱向視角即具體會話觀點類型上各模型的表現來看,BERT模型在9個會話觀點類型的F1值均高于TextCNN模型、Fasttext模型;Fasttext模型在提出問題、闡釋解讀、表達觀點、分歧、無聚斂度會話5個會話觀點類型的F1值高于TextCNN模型,而在共享信息、整合、改進3個會話觀點類型的F1值略低于TextCNN模型,僅在支持的F1值與TextCNN模型持平。而從橫向視角即每個模型對9個會話觀點類型的分類表現來看,BERT模型在7個會話觀點類型的F1值均高于70%,其中3個會話觀點類型的F1值甚至高于85%;但在共享信息、闡釋解讀兩個會話觀點類型的分類表現上較差,低于70%。由此可見,BERT模型在分類模型整體表現、單一會話類型分類性能上均優于TextCNN模型和Fasttext模型。

表5 聚斂度三種模型訓練分類結果比較
本研究針對會話分析,建立了相關度、縱深度、聚斂度三個特征相結合的智能觀點分類框架。相對于已有會話分類框架從行為表現角度分析,忽略了對會話內容的語義特征及其功能指向的描述[30][31];重在刻畫會話的認知特征,忽略了知識建構中大量存在的非認知會話內容[32][33]。同時本研究采用觀點改進為核心的功能指向來描述會話的語義特征,兼顧考慮認知與非認知會話,并詳細定義會話的特征,滿足依據觀點進行會話自動分類場景的基本需求。
本研究選取了兩個經典深度神經網絡以及一個可以與深度神經網絡準確率相媲美的模型,探索深度神經網絡這類模型在知識建構會話智能分類上的可行性。結果表明,BERT模型相較于Fasttext與TextCNN存在一定的優勢,更適合協作知識建構會話的智能觀點分類。BERT模型通過多層特征轉換將非結構化數據變成更高層級、更抽象的表示,從而實現對數據的類別預測與識別,其本身算法結構更具優勢。另外,BERT模型基于龐大的預訓練數據庫,分類的質量與效率較高。為了進一步提升分類準確率,本研究還選擇采用數據增強方法,在對原數據分詞的基礎上,通過同義詞替換、隨機插入或刪除、交換實現數據量快速擴充[34]。研究結果顯示,上述增強方法并未顯著提升分類的準確率,原因可能是協作知識建構會話中的詞語及其順序攜帶了重要的語義與句法信息,單純進行同義詞替換、交換等很可能改變原有術語及語義,導致增加了無效數據,對機器學習產生了干擾,因此沒有能夠對分類的準確性產生足夠影響。
而本研究建立的會話智能觀點分類流程融合深度神經網絡與會話分析方法,建立了包含六個環節的循環模型。會話分析主要體現在流程的前三個環節,深度神經網絡主要體現在流程的后四個環節。其中第三個環節特征提取與標注是深度神經網絡與人工會話分析融合的關鍵銜接環節。編碼者根據智能觀點分類框架提取出會話中的特征,從而完成編碼標注。而模型利用人工已編碼的數據,提取并學習到每一個會話類型中應用的語義特征,從而順利完成訓練。
本研究將會話分析與深度神經網絡方法融合,從會話分析模型、分析過程以及分析算法角度探索了面向協作知識建構的智能觀點分類方法。未來針對分類框架,可對非認知會話進行更加細致、清晰的描述,以提升方法對非認知會話內容分類的準確性。此外,在分類模型訓練上,還要考慮會話前后語境的作用,通過組合模型,建立句與句之間的關聯,增強機器對語義的進一步理解,提高分類的準確率,并挖掘會話在話題層級的語義特征[35]。最后,研究者可以嘗試將智能觀點分類模型嵌入教學平臺,前設置知識建構會話實時轉錄功能獲得數據,后設置模型預測功能導出分類結果數據,實現對知識建構會話內容的伴隨式分析。
[1]胡小勇,孫碩,楊文杰,等.人工智能賦能教育高質量發展:需求、愿景與路徑[J].現代教育技術,2022,(1):5-15.
[2]鄭旭東,吳秀圓.教育研究取向轉變進程中的會話分析:真實場景下教學研究的一種工具性支持[J].電化教育研究,2015,(1):18-22.
[3][16][33]宋宇,鄔寶嫻,郝天永.面向知識建構的課堂對話規律探析[J].電化教育研究,2021,(3):111-119.
[4]凌建侯.話語的對話性——巴赫金研究概說[J].外語教學與研究,2000,(3):176-181、239.
[5][10][19]蔣紀平,胡金艷,張義兵.知識建構學習社區中“觀點改進”的發展軌跡研究[J].電化教育研究,2019,(2):21-29.
[6]Gunawardena C N, Lowe C A, Anderson T. Analysis of a global online debate and the development of an interaction analysis model for examining social construction of knowledge in computer conferencing[J]. Journal of Educational Computing Research, 1997,(4):397-431.
[7]Fransen J, Weinberger A, Kirschner P. Team effectiveness and team development in CSCL[J]. Educational Psychologist, 2013,(1):9-24.
[8][9][13]王麗英,張義兵.融合知識建構和機器學習的觀點質量評價[J].現代教育技術,2020,(11):62-69.
[11]胡金艷,蔣紀平,陳羽潔,等.知識建構社區中觀點改進的機理研究:知識進化的視角[J].電化教育研究,2021,(5):47-54.
[12]Hayati H, Chanaa A, Idrissi M K, et al. Doc2Vec &Na?ve Bayes: Learners’ cognitive presence assessment through asynchronous online discussion TQ transcripts[J]. International Journal of Emerging Technologies in Learning, 2019,(8):70-81.
[14]吳春葉.基于半監督學習的觀點挖掘算法的研究與實現[D].北京:北京郵電大學,2019:7.
[15]Liu G, Guo J. Bidirectional LSTM with attention mechanism and convolutional layer for text classification[J]. Neurocomputing, 2019,(337):325-338.
[17]李舟軍,范宇,吳賢杰.面向自然語言處理的預訓練技術研究綜述[J].計算機科學,2020,(3):162-173.
[18]劉黃玲子,朱伶俐,陳義勤,等.基于交互分析的協同知識建構的研究[J].開放教育研究,2005,(2):31-37.
[20]Zhu E. Meaning negotiation, knowledge construction, and mentoring in a distance learning course[A]. Proceedings of Selected Research and Development Presentations at the 1996 National Convention of the Association for Educational Communications and Technology[C]. Indeanapolis: Available from ERIC Documents, 1996:821-844.
[21]Pena-Shaff J B, Nicholls C. Analyzing student interactions and meaning construction in computer bulletin board discussions[J]. Computers & Education, 2004,(3):243-265.
[22]張義兵.知識建構:新教育公平視野下教與學的變革[M].南京:南京師范大學出版社,2018:90-91.
[23][26]Devlin J, Chang M W, Lee K, et al. BERT: Pre-training of deep bidirectional transformers for language understanding[OL].
[24]Kim Y. Convolutional neural networks for sentence classification[OL].
[25]Rospocher M. Explicit song lyrics detection with subword-enriched word embeddings-ScienceDirect[J]. Expert Systems with Applications, 2021,(163):113749.
[27][29]甄園宜,鄭蘭琴.基于深度神經網絡的在線協作學習交互文本分類方法[J].現代遠程教育研究,2020,(3):104-112.
[28]Joulin A, Grave E, Bojanowski P, et al. Bag of tricks for efficient text classification[OL].
[30]鄭勤華,郭利明.人機協同的敏捷教育建模及實踐應用[J].現代遠程教育研究,2021,(4):43-50.
[31]馬志強.從相互依賴到協同認知——信息化環境下的協作學習研究[M].北京:中國社會科學出版社,2019:223-231.
[32]馬志強,郭文欣,王萌.面向協作知識建構會話內容的智能挖掘分析[J].現代遠距離教育,2022,(1):3-13.
[34]Sun X, He J. A novel approach to generate a large scale of supervised data for short text sentiment analysis[J]. Multimedia Tools Appl, 2020,(79):5439-5459.
[35]馬志強.社會認知互動的多維刻畫:協作學習投入理論構建與實踐探索[M].北京:中國社會科學出版社,2021:156-158.
Research on Intelligent Viewpoint Classification for Collaborative Knowledge Construction Discourse——Based on the Fusion Method of Deep Neural Network and Discourse Analysis
MA Zhi-qiang WANG Wen-qiu
In the research of discourse intelligence analysis for knowledge construction, how to improve the limitations of the original interactive behavior analysis perspective, and accurately describe the semantic features of discourse from the discourse perspective, so as to realize automatic classification of discourse is the core concern of researchers. Based on this, fused with the deep neural network and discourse analysis method, an intelligent viewpoint classification framework for collaborative knowledge construction discourse was constructed, which contained three discourse classification features of relevance, depth, and convergence. Meanwhile, an intelligent viewpoint classification process consisting of six steps was designed, and further the process was introduced into the BERT, TextCNN, and Fasttext models of natural language processing, and the discourse classification characteristics of the three models were compared in terms of four indicators, namely precision, recall, F1-score, and accuracy. It was found that the BERT model has higher accuracy in overall semantic features and classification performance of single discourse type. This paper explored the analysis framework and analysis path of discourse analysis of the fusion of data and intelligence, which proved the feasibility of the deep neural network in the intelligence quantitative analysis of collaborative knowledge construction discourse, and was helpful for improving the quality and efficiency of intelligent discourse analysis.
artificial intelligence education; learning analysis; discourse analysis; knowledge construction; viewpoint improvement

G40-057
A
1009—8097(2022)06—0005—10
10.3969/j.issn.1009-8097.2022.06.001
馬志強,博士,教授,研究方向為計算機支持的協作學習、學習分析與評價的研究,郵箱為mzq1213@jiangnan.edu.cn。
2022年1月20日
編輯:小時