趙帥 黃曉婷



摘 要:MOOC學生情感狀態與學習成績間的關系有助于教師了解學生學習狀況并優化教學設計,但少有深入研究。本文用文本分析法定義并計算了一門中文MOOC課程學生的“快樂指數”和“痛苦指數”,發現“快樂指數”與成績無顯著關聯,而“痛苦指數”能顯著、正向地預測成績,是MOOC課程的挑戰度指數。MOOC平臺可設置實時反饋機制,將“痛苦指數”等數據提供給教師,方便及時、針對性優化教學或者提供翻轉。同時,“痛苦指數”有潛力成為鑒別MOOC中“水課”的指標。
關鍵詞:情感指數;學業表現;MOOC;文本分析;挑戰度;水課
MOOC(Massive Open Online Course)全稱為大規模開放式在線課程。自2012年MOOC元年后[1],MOOC發展迅猛,三大平臺Coursera、Udacity、edX與世界高校合作,使MOOC席卷全球。在中國,2013年前MOOC相關論文在國內期刊上僅發表5篇,但到了2016年,這一數字變為2420篇[2]。與傳統課堂相比,MOOC的核心優勢是跨越了空間局限,也使學習時間更加靈活,因而促進了優質教育資源共享。MOOC也面臨許多問題,高輟學率①
是其中最嚴峻的一項。根據美國賓夕法尼亞大學統計,MOOC平均輟學率高達90%[3],這不免讓人對其教學效果產生疑問。因此,優化課程設計以提高學生學習動機、增加學習主動性并通過考核,成為MOOC發展的當務之急。
課程設計優化需要清楚地知道哪些變量影響學生學業表現。蔣卓軒等發現,學生觀看課程視頻及提交小測驗的次數能預測課程完成
率[4];Yang等證實學生論壇發帖數與輟學率關系密切[5];Ramesh等的研究表明,學生參與課程的行為類型能顯著預測成績[6]。
目前,少有研究關注MOOC學生的情感狀態是否能預測成績。按照維果斯基“最近發展區”理論,學生的發展水平有兩種,一種是學生自身所能達到的水平,另一種是通過教育所能達到的潛在水平,兩者間差異即為最近發展區。教育應向學生提供有難度、有挑戰的教學內容和教學要求以激發學生潛能,使學生到達或超越最近發展區。MOOC課程為高等教育課程,本質上屬于高深學問。學生要想在期末考核中取得好成績,需在學習過程中迎接挑戰、投入更多精力,也因此體驗更多痛苦情感。本文假設:在MOOC學習過程中學生體驗的痛苦情感越強,越可能取得較高成績。
傳統課堂中,教師潛意識中通過觀察學生面部表情、肢體語言了解學生情感狀態反饋,并據此調整語速、講解重點及改變提問策略,其過程異常迅速。越有教學經驗的教師對課堂中學生情緒反應的判斷越迅速和準確,后續教學調整也更有針對性和效率。相比傳統課堂,MOOC中教師授課主要是提前錄制視頻并上傳平臺,學生通過觀看視頻學習,教師講授過程相對固定。此外,MOOC并不能全面、廣泛提供翻轉課堂以方便線下討論,師生間少有后期面對面交流。除課程視頻外,教師與學生、學生與學生之間唯一可以交流的場景為在線課程論壇。學習越投入、越期待通過考試的學生,越可能就學習中遇到的問題參與討論,于是論壇發帖成為實時分析MOOC學生情感的一個可靠數據源。
本文基于一門中文MOOC的論壇數據,以大數據分析中的文本分析法提取學生情感信息,基于選定的情感詞典統計論壇討論中學生發布的積極、消極情感詞語及詞頻,據此計算“痛苦指數”和“快樂指數”,通過回歸分析檢驗情感指數是否能有效預測成績。
一、研究數據及方法
1.數據
本文數據源自北京大學在Coursera上開設的MOOC課程“計算概論A”,該課程開始于2014年9月,截止于2015年1月,共14 855名學生注冊。所有學生中90.9%輟學(沒有期末成績);9.1% 的未輟學學生中,僅1%及格,0.5%成績超過85分。在課程論壇上,450名學生參與討論,發布了3 864條帖子,共526 083字;平均每名學生發帖9條,共826字,其中最活躍學生發帖201條,共25 239字。在所有輟學學生中,僅2名在論壇上發言;在所有未輟學學生(共1 347名)中,434名在論壇上發言,其中及格學生有116名,占所有及格學生(共148名)的78.4%。
2.方法
(1)文本分析中的情感信息挖掘
人的情感與行為緊密聯系,情感因素因而逐漸被金融、教育等領域學者關注[7-10]。隨著大數據時代來臨,互聯網上積累了大量文本,如新聞稿、論壇發帖、微博等,這些文本成為分析情感信息的良好數據源,利用文本分析進行情感挖掘逐漸成為熱點。與教育研究中衡量學生情感狀態的問卷法相比,文本分析優勢有兩點[7]:首先避開了問卷法中學生自我評估的缺陷。自我評估一般事后完成,并非即時,其過程與結果受諸多不確定因素干擾,所得出的情感信息可信度較低;其次,基于積累的文本可以靈活分析一段時間內學生的情感信息,而問卷法僅能評估學生填寫問卷時對學習過程情感的回憶,且摻雜填寫問卷時的個人情感狀態。
文本分析進行情感信息挖掘的方法主要有兩類。
第一類是機器學習法。應用時可分三步:第一步,準備好一組打好情感標簽的文本。第二步,對文本量化處理。量化過程視不同語言而定,若分析中文文檔,需首先運用自然語言處理的分詞模型對文檔分詞;若分析英文文檔,因文字自然被空格隔開而無須分詞處理。之后,應用文本量化模型將文檔轉換成向量,常用模型為詞包模型(bag-of-words)。假設文檔集合對應的詞匯表中包含m個詞語,運用詞包模型將每篇文檔轉換為一個m維向量,每個分量的值對應一個詞語權重。計算詞語權重的方法主要有三種。第一種,將詞語權重賦值為0或1,指代詞語是否在文檔中出現;第二種,將詞語在文檔中出現的頻次設為權重,強調頻繁出現詞語的重要性;第三種,按照詞頻—逆文檔頻率(term frequency-inverse document frequency)計算詞語權重,權重為兩部分乘積:一部分是詞語出現頻率,即詞頻除以文檔長度;另一部分是逆文檔頻率,即計算總文檔數與包含具體詞語的文檔數之商,再取對數得出。詞包模型僅考慮詞語自身而忽略詞語順序(即語境信息),在一些文本分析中表現不盡如人意。為彌補缺陷,有許多更全面的文本量化模型被提出,其中最為直觀的是n-grams詞包模型(bag-of-n-grams),該模型將n個連續詞語組成的詞組視作分析單元,并基于詞包模型的權重計算方法計算詞組權重。第三步,基于量化后的文本訓練機器學習分類器,并利用訓練好的分類器識別新文本中的情感信息。早期研究中,傳統機器學習模型常被用作情感分類器,如林江豪等[11]通過樸素貝葉斯模型實現了微博情感分類。隨著深度學習技術崛起,學者發現深度神經網絡在情感分類上的表現優于傳統模型,如Lai等證實:相比于邏輯回歸與支持向量機,遞歸神經網絡、卷積神經網絡在文本數據集上的情感分類準確率較高[12]。機器學習法能識別否定、反問等特殊情感表達,準確判斷較細顆粒文本的情感,但所需數據量較大,且需耗費人工為文本打情感標簽,成本較高。