999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA模型的教育技術學研究主題挖掘及演化趨勢分析

2023-06-25 20:59:50陶勝陽許新華余亞烽葉伊陳蘇娜
現代信息科技 2023年6期

陶勝陽 許新華 余亞烽 葉伊 陳蘇娜

摘? 要:利用LDA模型對教育技術學領域核心期刊進行主題挖掘和演化趨勢分析。結果顯示:在2012—2021年間,教育技術學領域共有26個研究主題,其中有在線學習等8個熱點主題;在線學習等10個主題呈上升趨勢,遠程教育等5個主題呈下降趨勢,智慧教室、教學模式等11個主題演化趨勢較為曲折。由此可見,將LDA模型引入到教育技術學領域中進行主題挖掘是行之有效的,希望能對后續研究者提供幫助和借鑒。

關鍵詞:教育技術學;LDA模型;主題挖掘;演化趨勢

中圖分類號:TP391 文獻標識碼:A 文章編號:2096-4706(2023)06-0176-06

Topic Mining and Evolution Trend Analysis of Educational Technology Research Based on LDA Model

TAO Shengyang, XU Xinhua, YU Yafeng, YE Yi, CHEN Suna

(School of Computer and Information Engineering, Hubei Normal University, Huangshi? 435002, China)

Abstract: The topic mining and evolution trend analysis of core journals in the field of educational technology are carried out by using LDA model. The results show that from 2012 to 2021, there were 26 research topics in the field of educational technology, including 8 hot topics such as online learning. Ten themes such as online learning showed an upward trend, five themes such as distance education showed a downward trend, eleven themes such as smart classroom and teaching mode showed a tortuous evolution trend. It can be seen that it is effective to introduce the LDA model into the field of educational technology for topic mining, and it is hoped to provide help and reference for subsequent researchers.

Keywords: educational technology; LDA model; topic mining; evolution trend

0? 引? 言

2018年《教育信息化2.0行動計劃》的印發,標志著我國將全面推進教育信息化事業建設,開啟智能教育時代。在此背景下,我國教育技術學蓬勃發展,開設教育技術學專業的院校數量以及教育技術學專業的學生數量不斷增加,教育技術學的研究內容越來越廣泛,研究成果也越來越多。

期刊文獻是研究成果的重要載體,尤其是核心期刊文獻[1]。核心期刊文獻是某個領域的研究精華,既代表著文獻本身的研究主題和質量,也可以反映出該領域研究的熱點以及發展趨勢,具有較高的學術價值。近年來,國內學者紛紛采用文獻計量法[2]、關鍵詞共現[3]、共詞分析法[4]、因子分析法[5]、內容分析法[6]、關鍵詞共現分析[7]等方法對教育技術學研究熱點主題和趨勢進行分析。這些傳統的方法一般是利用關鍵詞作為核心數據進行主題挖掘,由于關鍵詞的“共生現象”以及沒有涉及文本的語義信息,所產出的研究結果往往存在全面性不足、研究層次不夠深入的現象[8]。LDA主題模型能夠對文本數據進行語義層面的分析和研究,得到比傳統方法更加細致的主題信息。它將整個文檔集看作是主題的概率分布,把每個主題看作是詞語的概率分布,降低了維度以及解決問題的難度,已經廣泛應用于文本分類、信息檢索、情感分析、話題挖掘等領域。LDA主題模型由文檔層、主題層、詞語層三層貝葉斯結構組成,如圖1所示。

因此,本文將在前人研究的基礎上,利用LDA模型對近十年教育技術學領域的中文核心期刊進行主題挖掘和演化趨勢分析,揭示研究的熱點及主題在時間維度上的發展變化過程,以厘清教育技術學的發展脈絡、學術熱點以及研究趨勢,幫助教育技術學專業的研究人員了解已有的研究基礎、明確當前的研究熱點,為其確定研究方向、研究內容和研究課題提供一定的參考。

1? 關鍵技術

1.1? LDA模型

2003年,Blei等人[9]在PLSI主題模型的基礎上提出了LDA主題模型。2004年,Griffiths等人[10]又對該模型進行了改進,如圖2所示。

圖2中,節點表示隨機變量,箭頭表示概率依存關系,矩形表示對里面的內容進行迭代[8]。LDA模型圖中所使用的字符含義如表1所示。

LDA模型生成文檔的流程如下所示:

(1)α隨機生成文檔對應主題的多項式分布θ。

(2)θ隨機生成一個主題z。

(3)β隨機生成主題對應詞語的多項式分布φ。

(4)綜合主題z和主題對詞語分布情況φ生成詞語w。

(5)如此循環,生成一個文檔,包含M個詞語。

(6)最終生成K個主題下的N篇文檔。

1.2? 主題演化趨勢分析

主題演化趨勢分析是指在主題模型中引入文本語料的時間信息,研究主題在時間維度上演化的動態性、發展性以及差異性。根據引入時間方式的不同,目前有三種不同的基于LDA模型的主題演化趨勢分析方法:第一種方法是Joint方法;第二種方法是后離散分析;第三種是先離散分析法[11]。下面依次對上述三種方法進行闡述。

(1)Joint方法是將文本及其時間信息作為實驗數據來進行主題建模,探究主題在時間上的演化趨勢。Topic Over Time(簡稱TOT)模型是這種方法的代表模型[12]。

(2)后離散分析法是對整個文本數據進行建模,得到主題分布之后,確定LDA模型的參數,讀取文本的時間信息并劃分時間窗口,將主題離散到各個時間窗口上,再根據主題強度進行主題演化趨勢分析。主題強度是判斷主題是否熱門的關鍵性指標,主題強度計算公式為:

(1)

表示主題k在時間窗口t上的主題強度,Dt表示時間窗口t上的文檔數目, 表示文檔d中主題k的后驗概率分布。通過公式計算出主題k在不同時間窗口t上的主題強度,并依次畫出各個主題隨時間演化的折線圖,即可分析主題在時間上的演化趨勢。

另一關鍵性指標是主題閾值,在計算出各個主題的主題強度之后,我們需要設定一個主題閾值來選取熱門主題進行分析,高于主題強度閾值的主題即可被確定為熱點主題[13]。主題閾值的計算公式為:

(2)

K表示主題數目,D表示文檔的個數,T表示主題強度閾值,其他符號含義與式(1)相同。

(3)先離散分析是先將文本數據離散到各個時間窗口上,再分別對各個時間窗口上的文本進行LDA主題建模,由于存在主題不對齊的問題,所以要利用主題相似度等方法,對各時間窗口上的主題進行關聯對齊,進而實現主題在時間上的演化。

2? 實驗過程

本文采用LDA模型對教育技術學領域的期刊文獻進行主題挖掘及演化趨勢研究,研究流程如圖3所示。

2.1? 數據采集及預處理

本文以中國知網數據庫為數據來源,以教育技術學領域的八種核心期刊為研究對象,期刊來源如圖4所示,抽取上述期刊于2012—2021年間刊載的文獻共12 847篇,剔除會議通知、摘要缺失等無關文獻后,得到12 240篇。

關鵬等[12]發現利用摘要構建語料庫進行LDA主題建模時,其生成的結果比關鍵詞更具代表性。因此,提取文獻的時間、摘要作為LDA模型的實驗語料,如表2所示,并以年為單位劃分為10個時間窗口并存檔,如表3所示。

jieba分詞工具是目前研究人員應用較為廣泛的一種Python中文分詞組件,并且支持自定義詞典以及過濾停用詞。因此,本文采用jieba分詞工具對實驗語料進行分詞和去除停用詞,獲得所需語料庫。

2.2? LDA建模

采用Python中的Scikit-learn庫進行主題建模,采用主題困惑度[14]來確定最佳主題數目,主題困惑度是衡量主題模型好壞的指標,主題困惑度越低,模型泛化能力越好。主題困惑度計算代碼如圖5所示,代碼運行結果如圖6所示。由圖6可知,當主題數目為26時,主題困惑度較小,且逐漸趨向穩定,因此可設定最優主題數目K=26。LDA模型運行后會輸出兩個分布文件,分別是文檔-主題分布和主題-主題詞分布,生成文檔-主題分布的代碼如圖7所示,生成主題-主題詞分布的代碼如圖8所示。根據模型生成的主題-主題詞分布文件,取每個主題下前10個主題詞作為主題的代表詞,并結合專業知識對每個主題的內容進行標注,結果如表4所示。

2.3? 熱點主題識別

通過第二章中的式(1)和式(2),我們可以計算出這26個主題在整個文本集上面的主題強度及主題閾值,具體的結果如圖9所示。

其中,Topic 1、Topic 6、Topic 8、Topic 9、Topic 11、Topic 16、Topic 20、Topic 24均高于主題強度閾值,被確定為熱點主題,即在線學習、教育人工智能、教師教育體系、在線教育、教學設計、協作學習、網絡學習、高等教育課程體系。

2.4? 主題演化趨勢分析

基于LDA模型的主題演化主要有三種方法,根據研究內容,本文選取后離散分析對主題進行演化趨勢分析,將26個主題分散到10個時間窗口上面,根據模型生成的文檔-主題概率分布計算主題各個時間窗口上的主題強度,并用python畫出主題強度隨時間演化的折線圖,如圖10所示。

由于主題數較多,在同一個圖里面呈現出來顯得比較混亂,難以發現各個主題的演化趨勢,故根據主題演化曲線圖,將具有相同演化趨勢的主題進行分組,把26個主題分為4組,分別為上升型、下降型和曲折型,并依次畫圖進行闡述。

2.4.1? 上升型

圖11展示了近十年間呈上升趨勢的主題,主要有在線學習、慕課、教育人工智能、計算思維、在線教育、教學設計、協作學習、教學評價、教師專業發展、教育信息化。

2.4.2? 下降型

圖12展示了近十年間呈下降趨勢的主題,主要有遠程教育、信息化教學、網絡學習、多媒體學習以及智慧學習環境。

2.4.3? 曲折型

圖13展示了近十年間呈曲折趨勢的主題,主要有泛在學習、終身學習、智慧教室、教育游戲、個性化教學、知識建構、高等教育課程體系、教學模式、教師教育體系、翻轉課堂以及教育公平。

3? 結? 論

本文采用LDA主題模型,對教育技術學領域2012—2021年間的核心期刊文獻進行主題挖掘和演化趨勢分析,得到了教育技術學領域2012—2021年間的26個研究主題,如在線學習、泛在學習、慕課等;通過設定主題閾值來進行熱點主題識別,確定了在線學習、教育人工智能、教師教育體系、在線教育、教學設計、協作學習、網絡學習、高等教育課程體系為教育技術學領域10年來的熱點主題;在主題演化趨勢分析上,運用后離散分析法,對26個研究主題進行演化趨勢分析,確定了上升型、下降型和曲折型3種演化趨勢。其中,上升型主題有在線學習、慕課、教育人工智能、計算思維、在線教育、教學設計、協作學習、教學評價、教師專業發展和教育信息化,下降型主題有遠程教育、信息化教學、網絡學習、多媒體教學以及智慧學習環境,曲折型主題有泛在學習、終身學習、智慧教室、教育游戲、個性化教學、知識建構、高等教育課程體系、教學模式、教師教育體系、翻轉課堂以及教育公平。

本研究將文本挖掘中的LDA主題模型引入到教育技術學領域中,對核心期刊進行主題挖掘,屬于應用創新;研究結果證明,這種方法對于教育技術學領域內研究的主題分析是有效的,希望能對后續研究者提供一些借鑒和建議。

參考文獻:

[1] 譚春輝,熊夢媛.基于LDA模型的國內外數據挖掘研究熱點主題演化對比分析 [J].情報科學,2021,39(4):174-185.

[2] 黃瓊珍.2000—2013年教育信息資源研究的熱點領域和前沿主題分析——基于八種教育技術學期刊刊載文獻關鍵詞共詞分析視角 [J].電化教育研究,2014,35(8):17-24.

[3] 劉勝男,張細呈,徐曉雄.近五年我國教育技術領域研究熱點及趨勢——基于國內八種教育技術類核心期刊的文獻分析 [J].寧波大學學報:教育科學版,2016,38(1):73-77.

[4] 趙呈領,阮玉嬌,梁云真.21世紀以來我國教育技術學研究的熱點和趨勢 [J].現代教育技術,2017,27(3):49-55.

[5] 陳巧云,李藝.中國教育技術學三十年研究熱點與趨勢——基于共詞分析和文獻計量方法 [J].開放教育研究,2013,19(5):87-95.

[6] 楊麗霞.我國教育技術學研究生學位論文的研究方向與研究熱點 [J].現代教育技術,2007(9):41-45+58.

[7] 田林,武濱,陳嬋.國際教育技術近十年研究熱點和趨勢分析——基于共詞分析法 [J].現代教育技術,2018,28(2):26-32.

[8] 吳查科,王樹義.基于LDA的國內圖書館學研究主題發現及演化研究 [J].新世紀圖書館,2019(7):90-96.

[9] BLEI D M,NG A Y,JORDAN M I. Latent dirichlet allocation [J].The Journal of Machine Learning Research,2003,3:993–1022.

[10] GRIFFITHS T L,STEYVERS M. Finding scientific topics [J].Proc Natl Acad Sci U S A,2004:5228-5235.

[11] 單斌,李芳.基于LDA話題演化研究方法綜述 [J].中文信息學報,2010,24(6):43-49+68.

[12] 關鵬,王曰芬,傅柱.不同語料下基于LDA主題模型的科學文獻主題抽取效果分析[J].圖書情報工作,2016,60(2):112-121.

[13] WANG X,MCCALLUM A. Topic over time:Anon-mark-ov continuous-time model of topical trends [C]/Proceedings of the 12th ACMSIGKDD International Conference on Knowledge Discovery and Data Mining.Philadelphia:ACM,2006:424-433.

[14] ARUN R,SURESH V,MADHAVAN C E V,et al. On finding the natural number of topics with latent dirichlet allocation:some observations [C]//PAKDD'10:Proceedings of the 14th Pacific-Asia conference on Advances in Knowledge Discovery and Data Mining.Hyderabad:Springer-Verlag,2010:391-402.

作者簡介:陶勝陽(1998—),男,漢族,湖北黃岡人,碩士研究生,研究方向:教育大數據;許新華(1968—),男,漢族,湖北孝感人,教授,研究方向:教育大數據、學習/教學模式研究、課程與教學論、計算機科學與技術;余亞烽(1995—),女,漢族,湖北黃石人,碩士研究生,研究方向:教育大數據;葉伊(1997—),女,漢族,湖北武漢人,碩士研究生,研究方向:教育大數據;陳蘇娜(1999—),女,漢族,湖北十堰人,碩士研究生,研究方向:教育大數據。

收稿日期:2022-11-05

基金項目:湖北師范大學2022年度研究生科研創新項目(20220550)

主站蜘蛛池模板: 午夜a级毛片| 极品国产在线| 亚洲AV无码乱码在线观看代蜜桃| 久久鸭综合久久国产| 亚洲精品福利网站| 亚洲无码熟妇人妻AV在线| 人妻中文久热无码丝袜| 国产福利大秀91| 欧美一区二区三区不卡免费| 3D动漫精品啪啪一区二区下载| av在线手机播放| 欧美黄网站免费观看| 一区二区三区在线不卡免费| 亚洲视频无码| 午夜无码一区二区三区在线app| 国产主播喷水| 2024av在线无码中文最新| 最新国语自产精品视频在| 噜噜噜久久| 日韩高清无码免费| 国产精品视频导航| 久久久亚洲国产美女国产盗摄| 精品久久香蕉国产线看观看gif | 美臀人妻中出中文字幕在线| 久久久四虎成人永久免费网站| 一区二区三区四区精品视频| 久久6免费视频| 国产精品手机视频| 人人91人人澡人人妻人人爽| 91毛片网| 国产97区一区二区三区无码| 国产欧美亚洲精品第3页在线| 少妇被粗大的猛烈进出免费视频| 亚洲视频三级| 久久人搡人人玩人妻精品一| 亚洲九九视频| 幺女国产一级毛片| 久草热视频在线| 真实国产乱子伦视频| 欧美国产在线精品17p| 亚洲三级影院| 五月婷婷综合网| 99免费视频观看| 一级爆乳无码av| 日本成人不卡视频| 亚洲黄网在线| 国产在线第二页| 亚洲毛片一级带毛片基地| 国产一线在线| 国产精品私拍99pans大尺度 | 欧美精品亚洲精品日韩专区| 毛片一级在线| 男女猛烈无遮挡午夜视频| 亚洲欧美日韩成人在线| 亚亚洲乱码一二三四区| 四虎影视8848永久精品| 国产精品人成在线播放| 国产迷奸在线看| 伊人久久综在合线亚洲91| 欧美日在线观看| 国产又色又爽又黄| 爆乳熟妇一区二区三区| 午夜视频www| 亚洲精品无码AⅤ片青青在线观看| 制服丝袜 91视频| 国产欧美日韩在线在线不卡视频| 欧美一级高清片欧美国产欧美| 在线观看欧美国产| 亚洲精品少妇熟女| 看国产毛片| 亚洲精品自拍区在线观看| 污网站在线观看视频| 亚卅精品无码久久毛片乌克兰| 日本AⅤ精品一区二区三区日| 永久免费av网站可以直接看的| 久久精品波多野结衣| 国产夜色视频| 欧美激情一区二区三区成人| 欧美午夜网| 成人午夜精品一级毛片 | 婷婷亚洲天堂| 老司国产精品视频91|