999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于LDA-LSTM模型在線課程評論情感分析研究

2023-09-25 11:07:26梁梓煜朱麗佳陳俊常國將
現代信息科技 2023年16期
關鍵詞:深度學習

梁梓煜 朱麗佳 陳俊 常國將

摘 ?要:終身化學習背景下,MOOC作為普及性在線學習形式已受到學術界的日益關注。同時,MOOC課程質量與學習者滿意度問題亟待解決。研究基于理性選擇理論與聯通主義理論構建LDA-LSTM深度主題情感分析模型,進而挖掘學習者理性因素與情感極性。實驗結果表明,學習者考慮的因素主要具備全面性與多樣性的特點;學習者對教師與學習效果普遍給予肯定評價,較少負面評價則針對教師授課風格、課程資源與平臺服務質量。研究據此給出了建議策略。

關鍵詞:在線課程評論;LDA-LSTM模型;主題挖掘;情感分析;深度學習

中圖分類號:TP391.1;G434 文獻標識碼:A 文章編號:2096-4706(2023)16-0079-06

Research on Sentiment Analysis of Online Course Reviews Based on LDA-LSTM Model

LIANG Ziyu1, ZHU Lijia2, CHEN Jun1, CHANG Guojiang1

(College of Education, Guizhou Normal University, Guiyang ?550025, China;

2.College of Foreign Languages, Guizhou Normal University, Guiyang ?550025, China)

Abstract: Under the background of lifelong learning, MOOC, as a popular form of online learning, has attracted increasing attention from the academic community. Meanwhile, the problems of the quality of MOOC courses and the satisfaction of learners need to be addressed urgently. Based on the theory of rational choice and the theory of connectivism, this paper constructs the LDA-LSTM deep topic sentiment analysis model, and then mines rational factors and sentiment polarity of learners. The experimental results show that the factors considered by learners are comprehensive and diverse. Learners generally give positive evaluation to teachers and learning effects, and less negative evaluation to teachers' teaching style, course resources and platform service quality. According to this, the research gives some suggested strategies.

Keywords: online course comment; LDA-LSTM model; topic mining; sentiment analysis; Deep Learning

0 ?引 ?言

在當今人工智能時代,在線學習需求呈現井噴式增長并且逐漸成為一種主流的學習方式,對在線學習產生了深刻影響[1]。中國大學慕課作為中國最大的在線學習平臺,使用與注冊用戶達到近5億人次,用戶所產生的過程性數據是一種教育大數據[2],具備體量大(Volume)、種類多(Variety)、速度快(Velocity)、易變性(Variability)、真實性(Veracity)和價值密度低(Value)六大特性[3],評論數據作為一種過程性數據,真實地反映了學習者在學習過程中最真實的感受與實際的學習效果[4]。面對數量如此龐大的數據,如何對于這些數據進行有效的分析與評估,如何能夠分析學習者的總體學習狀況以及解決學習者個性化的問題以便能夠更好地適應學生進行學習,是當今在線學習領域所面臨的發展瓶頸與亟待解決的難題。

針對以上的問題,已有研究在處理用戶生成的文本數據時借助文本情感分析技術這一方法。如劉三女牙[5]等以果殼網慕課學院的“財務分析與決策”課程為例,采取LDA無監督機器學習方法對評論文本信息進行數據挖掘,并追蹤了主題演化趨勢。李慧[6]提出一種融合情感詞典和機器學習模型的學習者情感分析模型,能夠實現對段落級、篇章級的學習體驗文本的多級情感分類。Onan[7]等對機器學習方法、集成學習方法與深度學習方法三種不同的方法進行對比分析,實驗結果表明長短期記憶網絡(LSTM)的預測結果最好。

已有研究已經取得了一些研究成果,但是對于課程評論文本的研究分析還不夠深入,大多是基于傳統的無監督算法與機器學習算法,很少有研究基于深度學習算法分析基于主題的文本評論情感傾向及其演變趨勢,因此本文在已有研究的基礎上,以理性選擇理論與聯通主義為理論基礎,使用潛在狄利克雷分布(Latent Dirichlet Allocation, LDA)融合長短期記憶神經網絡深度學習模型(Long Short-Term Memory, LSTM),分析不同時間序列下學習者主要考慮的理性影響因素,抽取其中的關鍵性因素并對其做出分析與解釋并形成最終結論。

1 ?研究設計

1.1 ?理論基礎

理性選擇理論源于對人們所做出的經濟決策背后的緣由所做出的合理性解釋,其代表人物馬克斯·韋伯將理論研究范圍擴展為社會學領域中,關注人的行動層面,并區分了四種社會行動的類型。理性選擇理論同樣適用于教育領域,教育抉擇歸根到底是人的抉擇。理性選擇理論強調既不忽視個體的主觀能動性,又同時強調了環境對于行動者決策的影響[8]。

聯通主義認為知識由實體間各種連接所組成,因為相互連接,一個實體的變化可能導致另一個實體的變化,學習指的是這些連接的生長、發展、變化或加強的過程[9]。在聯通主義看來,課程質量關聯到教師風格,課程資源,課程內容等多方面的內容。因此課程設計需要兼具深度與廣度,打破設計壁壘,形成具有生命感的整體課程設計。因此,本文以理性選擇理論與聯通主義理論為理論支撐,對課程評論數據進行主題挖掘與情感分析,探索影響學習者進行教育選擇決策的影響因素,為教師及平臺運行者提供支撐。

1.2 ?LDA-LSTM混合模型

南京大學心理學慕課課程作為評論數據量較多的熱門課程,在評論內容方面具有一定的廣泛性與代表性,涉及眾多不同的主題內容,且不同用戶對于不同的主題內容的關注程度與情感傾向也不盡相同。基于這樣的語料庫特征,需要篩選出大多數學習者關注的核心主題內容,并對評論內容進行基于主題的情感分析,以得出最為關心的核心主題的用戶情感傾向,因此選用較為流行的LDA主題模型,結合LSTM神經網絡模型,構建基于主題的情感分類模型,以便能夠更進一步對用戶情感進行分析?;贚DA-LSTM混合模型評論文本情感分類圖如圖1所示。

1.3 ?研究步驟

1.3.1 ?數據預處理

第一步,文本去重。在評論區中會出現與前面某一條評論完全重復的評論,這些評論對后續分析沒有價值和意義,且對后續分析起到干擾作用,僅保留第一條評論數據,其余需要剔除。第二步,去除無用評論。評論數據中夾雜著許多類似于“哈哈哈”“很好”等無用評論,需要去除。第三步,去停用詞。去除中性詞語,例如“老師”“課程”“學習”“知識”以及做語氣停頓的語氣用詞和標點符號等,本文使用自適應后的哈工大停用詞表對停用詞進行過濾處理。第四步,分詞。使用Jieba分詞工具對中文文本進行分詞,便于后續進行文本向量化處理。

1.3.2 ?文本建模

MOOC評論文本數據是高度非結構化數據,計算機程序無法對其識別并進行處理分析,因此需要對其進行向量化處理,本文借助Gensim工具包中的Word2Vec工具,將經過LDA主題模型聚類后的每個主題的主題特征詞映射到300維的高維向量空間中,轉換成LSTM神經網絡所需要的數據格式。

1.3.3 ?文本語義特征提取

LSTM深度學習網絡提取特征共分為三步,首先將經過向量化處理的詞向量矩陣作為權重值輸入,其次將詞向量矩陣作為權重值輸入到遺忘門層,當遺忘門值為0表示Ct-1中沒有任何信息傳遞給Ct進行計算,當遺忘值為1時表示Ct-1的全部信息都被保留下來并傳遞給Ct進行計算,當遺忘門值大小介于0~1之間表示Ct-1中有部分信息傳入到Ct進行計算,遺忘門值大小取決于輸入的詞向量矩陣中數值的大小,越重要的特征詞向量權重值越大,保留的信息越完整,反之則會被部分舍棄或者全部舍棄。最后經過激活函數將特征進行非線性化處理,可以使模型學習到更多的特征。

1.3.4 ?情感分類

本研究在Softmax分類器中對于文本情感做出分類,情感計算公式如式(1)所示:

zj = wj1 · x1 + wj2 · x2 + bj ? ? ? ? ? ? ? ? ?(1)

其中wj表示第j類特征的權重矩陣,例如wj1表示第一類(正向情感)的權重值,wj2表示第二類(負向情感)的權重值,x表示來自全連接層的最終保留下來的輸入值,bj表示偏置項,zj表示300維的列向量,首先對權重參數進行隨機初始化,隨后在訓練過程中不斷迭代優化權重參數矩陣,并將最終優化得到的權重參數矩陣經過Softmax激活函數映射為(0,1)之間的概率值,并取概率值最大的作為最終分類結果。

1.3.5 ?關注主題滿意度計算

在經過LSTM情感分類模型,得到最終情感分類結果后,依據每個主題的情感分類結果得到各個主題的主題滿意度,并繪制滿意度時間序列演化圖,主題滿意度計算式如式(2)所示:

(2)

其中vk,t表示t時間內主題k的滿意度,ht表示t時間內主題k的好評評論數量,Mk,t表示t時間內主題k所對應的評論總數。

2 ?實證研究

2.1 ?數據來源

本文通過使用Selenium爬蟲框架爬取中國大學MOOC的學習者文本評論數據,時間跨度從2018年1月17日至2022年12月13日,以南京大學心理學慕課課程評論留言區的學員評論數據作為數據來源,爬取內容包括評論用戶昵稱,評論內容,評論時間,點贊數以及開課次數,共形成13 562條初始評論數據,隨后對數據進行清洗操作,去除無用特征列,剔除重復數據以及對分析無效的評論數據,最終得到有效評論數據11 729條,根據已有標簽的評論數據對現有新數據進行打標簽操作,形成帶有標注的情感數據集。

2.2 ?實驗環境

本實驗的實驗環境參數如表1所示。

2.3 ?基于LDA的用戶評論主題挖掘

借助LDA主題模型挖掘慕課課程評論中隱含的主題,為了解學生的學習實際情況并做出及時教學反饋。本文利用Gensim工具包構建了LDA主題模型,將清洗后的數據集導入到LDA主題模型中,根據主題困惑度,經過多次采樣與反復測試,當主題數量為4時,每個主題下的主題詞為10個時,達到了最好的效果,超參數α與β最終確定為0.25與0.1。表2展示了課程評論文本主題詞-概率分布矩陣。

依據表1中每個主題下詞的概率分布,可將學習者主要關注的影響因素(主題)分為四類,分別是教師風格,知識學習,教與學評價,課程內容。

主題1是關于教師的授課風格和授課方式?!坝哪薄帮L趣”“生動有趣”“喜歡”,表明學生樂于接受教師的授課風格,這個主題主要是學生對教師的認可和表揚。

主題2是關于知識學習?!吧睢薄笆芤娣藴\”“通俗易懂”“生動有趣”等詞語,表明教學內容與生活實際緊密結合,學生能夠結合自身生活實際去更好地理解心理學知識,并且注重心理學的知識在日常生活中的運用,加深對于心理學的運用與理解。

主題3是關于教與學的整體評價?!坝哪薄帮L趣”“教學”“生動”等詞語表明學生對于教師的授課內容、整體的授課方式與授課風格是認可與贊賞的,認為能夠學習到對自己有用的知識,有部分學生還表明會期待教師后續其他有趣實用的課程。

主題4是關于課程內容?!罢n程內容”“有意思”“幽默”“易懂”表明對于課程內容與教學質量的認可,但是有部分學生反饋授課內容比較淺顯,以及存在平臺的技術方面的問題,還有待提升與改進。因此將學習者對于在線課程關注點歸納為:授課風格、知識學習、教師評價與課程內容四個方面。

2.4 ?基于LDA主題時間序列演化分析

在對評論文本進行主題抽取后,進行主題關注度計算,計算各主題關注度隨時間的變化,得到四個主題的演化趨勢如圖2所示。

在2018年至2022年期間,用戶評論主要關注Topic1,即學習者在進行選擇時主要考慮的是教師風格,關注度在26%~32%之間,明顯高于其他影響因素,并且從2020年至2022年關注度在持續上升,其次關注Topic2,即關注知識學習,浮動范圍在25%~30%之間,呈現出先上升后下降的趨勢,依據理性選擇理論說明用戶會根據授課教師的授課風格的好壞進行課程選擇,因為教師的授課質量的好壞會直接影響整體的課程質量,并且由于在新冠疫情期間,無法到校復課,因此更加關注教師的授課質量與知識學習方面的問題。

Topic3的關注度呈現明顯增加而后又下降的趨勢,最高值達23%,即對教師評價的關注度明顯增加,后又在一個穩定的范圍上下浮動。而Topic4的關注度即課程內容呈現一個明顯下降的趨勢,從25.56%下降到20.85%,表明用戶對于教師的整體授課質量,包括教學內容、教學風格、平臺服務等方面有較為綜合的考量與評價,而不僅僅關注于某一影響因素,表明學習者對于慕課課程質量有一個綜合的評估標準,課程的綜合質量正逐漸成為主要關注點,從理性選擇視角出發,學習者會從多個維度不同方面對課程質量進行評估,判斷從中能否獲得最大的學習收益。

2.5 ?基于LSTM的用戶關注熱點主題滿意度

在LSTM模型訓練方面,采取式(1)對評論進行情感分類。將整個數據集按照8:2的比例切分為訓練集和測試集,為了降低過擬合風險,達到理想的分類效果,進行了參數調整與測試,共分為20個訓練周期,在Softmax分類器上獲得最終分類結果。最終模型準確率在訓練集上達到90.6%,在測試集上達到86.2%,在訓練集上的損失值為23.7%,在測試集上的損失值為34.3%。最后由LSTM分類器得到的評論文本的分類結果為:正面評論11 525條,負面評論2 033條。如表3所示,分別展示了準確率、召回率、F1值三個反映模型性能的參數值。

依據式(2)對用戶關注主題滿意度進行計算,關注主題滿意度隨時間序列的演化圖如圖3所示。

3 ?結 ?論

依據理性選擇理論與聯通主義理論,基于學習者主題關注度與主題滿意度變化趨勢分析學習者主要關注以下三個方面,因此本文提出以下建議:

1)關注教師授課方式與風格,教師學生共同成長。對于課程評論的研究發現,絕大多數的學習者對教師的授課風格從2018年到2022年對于教師風格的滿意度呈現出下降的趨勢,從92.6%下降到88.3%。在聯通主義看來,教師作為課程具有核心影響力的中心節點,教師本身就會對學生的學習產生影響,因此教師本身應該是合格的學習者,用自身行為引領學習者前進,才能更好地提供學習支持服務,更好地融入學生群體,才能提升學生的學習滿意度,與學生一起共同成長。

2)關注課程內容資源與平臺服務質量建設,互補資源相輔相成。由實驗結果發現,對知識學習的滿意度介于91%至95%之間,教和學的整體評價從2018年至2021年一直是下降的趨勢,從90.76%至71.91%,2021年至2022年有所回升,從71.91%至83.34%,表明在課程資源質量提升與學習過程體驗方面仍有待加強。聯通主義主張既關注集體學習又關注個人成長,因此課程資源建設也應兼顧集體和個人兩個維度,既滿足集體學習訴求同時助力于學生個性化成長,因此可以在共有資源的基礎上進行個性化學習資源的推薦。同時教師也要鼓勵學習者從多角度對課程進行評價,以便能夠細化課程優化與改進的方向,提升課程整體質量。

參考文獻:

[1] 桑新民,謝陽斌,楊滿福.“慕課”潮流對大學影響的深層解讀與未來展望 [J].中國高等教育,2014(Z1):12-15.

[2] 楊現民,王榴卉,唐斯斯.教育大數據的應用模式與政策建議 [J].電化教育研究,2015,36(9):54-61+69.

[3] 祝智庭,沈德梅.基于大數據的教育技術研究新范式 [J].電化教育研究,2013,34(10):5-13.

[4] 江波,高明,陳志翰,等.基于行為序列的學習過程分析與學習效果預測 [J].現代遠程教育研究,2018(2):103-112.

[5] 劉三女牙,彭晛,劉智,等.面向MOOC課程評論的學習者話題挖掘研究 [J].電化教育研究,2017,38(10):30-36.

[6] 李慧.面向學習體驗文本的學習者情感分析模型研究 [J].遠程教育雜志,2021,39(1):94-103.

[7] ONAN A. Sentiment Analysis on Massive Open Online Course Evaluations:A Text Mining and Deep Learning Approach [J].Computer Applications in Engineering Education,2020,29(3):572-589.

[8] 王進,汪寧寧.教育選擇:理性還是文化——基于廣州市的實證調查 [J].社會學研究,2013,28(3):76-100+243.

[9] 史蒂芬·道恩斯,肖俊洪.聯通主義 [J].中國遠程教育,2022(2):42-56+77.

作者簡介:梁梓煜(1998—),男,漢族,安徽宿州人,碩士研究生在讀,研究方向:自然語言處理;朱麗佳(1984—),女,土家族,貴州銅仁人,碩士研究生在讀,研究方向:自然語言處理;通訊作者:陳俊(1979—),男,苗族,貴州銅仁人,教授,博士,研究方向:自然語言處理;常國將(1998—),男,漢族,云南昭通人,碩士研究生在讀,研究方向:中小學編程教育。

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 伊人成人在线视频| 丝袜无码一区二区三区| 天堂中文在线资源| 好紧好深好大乳无码中文字幕| 在线播放国产一区| 人人91人人澡人人妻人人爽| 亚洲人成成无码网WWW| 爽爽影院十八禁在线观看| 亚洲精品无码日韩国产不卡| 日本伊人色综合网| 国产精品成人观看视频国产 | 情侣午夜国产在线一区无码| 片在线无码观看| 国产成a人片在线播放| 色窝窝免费一区二区三区| 中文字幕日韩视频欧美一区| 伊人久久婷婷| 国产精品第三页在线看| 欧美在线三级| 国产精品9| 国产91久久久久久| 三上悠亚在线精品二区| 国产91av在线| 草逼视频国产| 国产欧美日韩va另类在线播放| 在线无码av一区二区三区| 日韩精品无码免费专网站| 久久中文字幕2021精品| 亚洲欧美另类专区| 久久大香香蕉国产免费网站| 91在线免费公开视频| 亚洲中文字幕97久久精品少妇| 婷婷亚洲综合五月天在线| www.日韩三级| 免费看av在线网站网址| 丁香婷婷久久| 黄网站欧美内射| 尤物成AV人片在线观看| 色悠久久久| 视频二区亚洲精品| 人妖无码第一页| 久久精品欧美一区二区| 国产屁屁影院| 国产福利在线免费观看| 91精品久久久无码中文字幕vr| 欧美日韩在线观看一区二区三区| 色欲色欲久久综合网| 真人免费一级毛片一区二区| 国产91高清视频| 99re这里只有国产中文精品国产精品 | 成人国产精品2021| 亚洲无码高清一区二区| 亚洲黄色高清| 精品国产成人三级在线观看| 色综合日本| 18禁不卡免费网站| 国产成人精品午夜视频'| 欧美日韩中文字幕在线| 夜夜操天天摸| 国产精品无码AⅤ在线观看播放| 婷婷色丁香综合激情| 91久久偷偷做嫩草影院电| 一区二区欧美日韩高清免费| 久草中文网| 免费av一区二区三区在线| 欧美视频在线观看第一页| 亚洲va视频| 日本人又色又爽的视频| 国产av剧情无码精品色午夜| 国产福利不卡视频| 国产免费久久精品99re不卡| 91蝌蚪视频在线观看| 亚洲一级无毛片无码在线免费视频 | 亚洲精品片911| 97青草最新免费精品视频| 国产在线自乱拍播放| 欧美三级日韩三级| 91小视频版在线观看www| 台湾AV国片精品女同性| 国产精品美女在线| 91精品久久久无码中文字幕vr| 国产成人免费视频精品一区二区|