李博 齊耀龍

摘要:“消費者就是上帝”對于教育行業來說也一樣,所以來自“上帝”——學生的反饋就是推動教學的助推劑。和各級教育機構一樣,在高校中也會有學生對教師的評教,有的分項打分,有的可以文字敘述。由于學生人數較多,直接打分還好處理,主觀評價的分析就比較困難了。在耗費了大量的T時后可能還是不能得到想要的結論,那就要考慮自動分析了。這里在比較了主流自動分析方法后,推薦使用深度學習的方法來進行數據挖掘達到了很好的效果。
關鍵詞:情感分析;深度學習;評教;自動分析;python
中圖分類號:TP311.1 文獻標識碼:A
文章編號:1009-3044(2020)20-0082-02
1引言
在高校的基礎計算機教學中,由于教師和學生見面的時間比較短,再加上班級人數有時比較多,所以學生評教就成為反饋中的重中之重。2020年初的學期由于疫情的影響,都在進行網上授課,與學生之間的見面時間更是基本為零,特殊時期教師與學生之間溝通的方法除了社交媒體就剩下網上評教系統了。
評教系統一般分為客觀打分和主觀評語兩部分,其中客觀打分可以直接在Excel中進行分析,形成圖表,而主觀評語部分以往都是人工進行查看,但是評語太多,工作人員往往走馬觀花,抓不住要點;或者直接發給教師自己看,也會因為太多,大部分教師根本不看。造成了本來最重要的學生的心聲反而被丟棄了,長此以往評教必將成為面子事,失去了教師學生間的最好最直接的溝通橋梁。
2解決思路
學生對教師的評語實質上就是情感問題,可以進行情感分析。情感分析也稱為意見挖掘(Opinion Mining),是自然語言處理(NLP)的一個領域,它構建的系統,用于在文本中識別和提取觀點。學生對于教師的評語主要分為主觀性評價和客觀性評價。客觀性評價是客觀性描述,不帶有感情色彩和情感傾向,主觀性評價則是學生對教師或者教學方法的看法或想法,帶有自己的喜好厭惡等情感傾向。區分主客觀評價主要以情感詞識別為主。
目前主觀性文本情感傾向性分析的研究工作,主要研究思路分為基于語義的情感詞典方法和基于機器學習的方法。基于語義的情感詞典方法主要利用已構建的詞典(目前中文情感詞典的構建主要是對知網How net的擴充),對語料庫進行中文分詞處理,然后掃描每個單詞,與情感詞典中的詞進行語義相似度計算,當相似度達到一定閾值時即可判斷該詞的情感傾向和權值。由于中文的多樣性靈活性,加上詞典龐大的詞匯量和不夠高效的匹配算法,這種方法的分析正確性難以突破。而另一方面,最近幾年,以Google公司和Facebook公司為首的企業在深度學習領域有了很大的突破。所以我們決定采用基于機器學習的方法,用Python這種在AI方面有突出應用的語言來對學生評價進行分析數據挖掘,形成有用的模型,反饋回教師進行改進提高。
3具體實現
評語分析,用的是Python的基于SnowNLP類庫的數據分析挖掘方法。原有庫的字典是以電子商務的買賣東西的評價為基礎的,所以我們又把以往對教師和教學的評價詞語,包括褒貶以及權值加入字典中,進行訓練后,再用來分析評教評語。
下面是對評價的具體分析步驟(以一條評語為例):斜體為輸出結果。
from snownlp import SnowNLP
text=‘備課充分,講的也還可以。但是不注意和學生的互動,尤其是對提問缺乏耐心。
s= SnowNLP(text)
1結果一:分詞
print(s.words)
[‘備,‘課,‘充分,‘,,‘講,‘的,‘也,‘還,‘可以,‘。,‘但是,‘不,‘注意,‘和,‘學生,‘的,‘互動,‘,,‘尤其,‘是,‘對,‘提問,‘缺乏,‘耐心,‘。]
l結果二:詞性標注
tags=[x for x in s.tags]
print(tags)
[(‘備,‘v),(‘課,‘n ),(‘充分,‘ad),(‘,,‘w),(‘講,‘v),(‘的,‘u),(‘也,‘d),(‘還,‘d),(‘可以,‘v),(‘。,‘w),(‘但是,‘c),(‘不,‘d),(‘注意,‘v),(‘和,‘c),(‘學生,‘n),(‘的,‘u),(‘互動,‘v),(‘,,‘w),(‘尤其,‘d),(‘是,‘v),(‘對,‘p),(‘提問,
收稿日期:2020-03-16
基金項目:河北大學工商學院第二批課程建設項目(2019KCJS38);河北大學第二批“課程思政改革試點課程”建設項目(KCSZ-02-117)
作者簡介:李博(1973-),男,河北保定人,講師,碩士,主要研究方向為計算機軟件設計、人工智能等。‘vn),(‘缺乏,‘v),(‘耐心,‘an ),(‘。,‘w )]
l結果三:斷句
print(s.sentences)
[‘備課充分,‘講的也還可以,‘但是不注意和學生的互動,‘尤其是對提問缺乏耐心]
l結果四:情緒判斷
返回值為正面情緒的概率,越接近1表示正面情緒,越接近0表示負面情緒
print(text, s.sentiments)
備課充分,講的也還可以。但是不注意和學生的互動,尤其是對提問缺乏耐心。0.6773729723566638
l結果五:關鍵字抽取
print(s.keywords(limit=10))
[‘互動,‘學生,‘不,‘耐心,‘缺乏,‘提問,‘課,‘備,‘還,‘講]
l結果六:概括總結文章
print(s.summary(limit=4))
[‘備課充分,‘講的也還可以,‘但是不注意和學生的互動,‘尤其是對提問缺乏耐心]
l結果七:信息衡量
TF-IDF是一種統計方法,用以評估某一字詞對于整體文件的重要程度。TF詞頻越大越重要,但是文中會的“我”,“你”,“的”,“得”等無意義詞頻很大,卻信息量幾乎為0,這種情況導致單純看詞頻評價詞語重要性是不準確的,因此加入了idf。lDF的主要思想是:如果包含詞條t的文檔越少,也就是n越小,IDF越大,則說明詞條t越重要。TF-IDF綜合起來,才能準確的綜合的評價一詞對文本的重要性。
s= SnowNLP([[‘講的一般,‘比較充分],[‘很好,‘有耐心,‘有耐心],[‘很好,‘易懂,‘比較好][‘好老師][‘比較好,‘好老師]])
print(s.tf)
[{‘講的一般:1,‘比較充分:1},{‘很好:1,‘有耐心:2},{‘很好:1,‘易懂:1,‘比較好:1},{‘好老師:1},{‘比較好:1,‘好老師:1}]
print(s.idf)
{‘講的一般:1.0986122886681098,‘比較充分:1.0986122886681098,‘很好:0.33647223662121295,‘有耐心:1.0986122886681098,‘易懂:1.0986122886681098,‘比較好:0.33647223662121295.‘好老師:0.33647223662121295}
l結果八:文本相似性
print(s.sim([‘好老師]))
[0,O, 0.44592706058233045. 0.3508241329699851]
print(s.sim([‘有耐心]))
[0,1.4052017645754893,0,0,0]
分析完成后,用圖表的方式把每個專業的分析結果直觀地顯示出來(圖l)。
4結論
目前系統經過幾次對學生主觀評價的分析,準確率能達到86%左右。而且隨著使用的次數數據越來越多,深度學習的優勢就會越來越明顯。把原有的人工分析方法占用的教師和教輔的時間釋放出來更好地為實際教學服務。
以前的評教基本上是每學期一次,因為原來分析方法落后,評教后的結論遲遲不能出爐。現在學生其實可以做到每次課后都提供實時評價,系統實時提供結論,就可以更好的在教學中做到揚長避短,根據每個班的實際情況進行教學的實時調整,真正做到因材施教。
參考文獻:
[1]厲小軍,戴霖,施寒瀟,等.文本傾向性分析綜述[J].江大學學報,2011,45(7): 1167-1175.
[2] Kuma R A, Sehastian T M. Sentiment analysis on twitter[J].International Journal of Computer ScienCe lssues, 2012, 9(4):628-633.
[3]李方濤.基于產品評論的情感分析研究[D].北京:清華大學,2011.
[4]朱嫣嵐,閔錦,周雅倩,等.基于How Net的詞匯語義傾向計算[J].中文信息學報,2006,20(1): 14-20.
【通聯編輯:王力】