李春生 張 朦
(東北石油大學計算機與信息技術學院 大慶 163318)
隨著教育信息化的發展,在線學習平臺也逐漸走入教育教學的視野[1]。由于在線學習平臺具有跨越時空距離、資源重復利用、內容豐富多樣、學習成本低等特點,受到廣大學習者的喜愛與推崇。但縱使在線學習平臺有著如此多的優勢,其學習資源數據量大、知識結構復雜、內容豐富多樣等信息過載現象,給學習者的學習造成了一定困擾,學習者在繁復多樣的學習資源中選擇適合自己的學習資源變得十分困難,因此學習者迫切地需要個性化學習路徑推薦服務[2]。個性化學習路徑推薦主要以學習者的基本特征、初始能力水平與學習風格等因素決定,主要滿足學習者個性化和精準化的學習需求[3]。
目前,國內外越來越多的學者開始進行學習路徑推薦研究。Ghauth和Abdullah[4]提出了一種基于內容的推薦算法,該算法以優秀學習者評分為依據,從而提高了推薦系統的準確性。另外,Aher 和Lobo[5]等采用了K-means 和關聯規則算法Apriori的組合方法對學習者的歷史學習數據進行分析,并成功地向新生推薦課程,取得了顯著的效果。Zhou[6]等基于聚類和機器學習技術提出了一種新的全路徑推薦模型,很好地提高了學習效果。綜上,混合推薦算法取得了較好的推薦效果,但是其推薦數據過于單一,致使推薦精準度較低,并且忽略了學習具有序列性的特征,無法真正滿足學習者的個性化需求。
針對上述問題,本文構建了一種新型個性化學習路徑推薦模型。模型主要分為兩個部分,首先采集分析學習者的在線學習行為數據,使用K-means算法將學習者聚類,構建相似學習者模型;然后,以相似學習者模型為基礎,向學習者推薦最優學習結果的學習路徑,同時采用Lasso-Lars 算法,分析影響學習效果的各個影響因素的強度序列,進一步優化個性化學習路徑推薦模型。
在線學習平臺中學習者可以按照自己的行為習慣和偏好選擇學習資源進行學習[7]。例如學習者選擇知識的順序、不同的學習活動、訪問某些模塊的頻次等等,這些記錄在系統日志中的學習行為數據反映了學習者學習特征。同時,學習者的心理特征也影響學習者學習效果和成績[8]。因此,本文將從學習者心理特征和在線學習行為兩方面分析學習者特征。
學習者心理特征主要包括學習態度、學習動機和學習類型[9]。學習態度是學習者對學習、學習環境和教學活動所表現出來的心理傾向[10]。學習動機是指學習者內在產生的學習動力,并促使行為朝向一定的學習目標[11]。學習類型分為視覺型、聽覺型、動覺型,主要依據學習者學習感官傾向[12]。學習者在線學習行為數據存儲在學習平臺日志中。通過對這些數據計算分析,獲得相似學習者模型和學習風格特征,以此為基礎構建個性化學習路徑推薦模型。
學習風格是具有學習者個性特征的學習方式和學習傾向的總和[13]。本文主要采用Felder-Silverman學習風格模型[14],即應用非常廣泛的所羅門模型。該模型將學習風格分為4 個維度8 種類型,分別是信息加工(活躍型/沉思型)、感知(感悟型/直覺型)、輸入(視覺型/言語型)、理解(序列型/綜合型)[15]。
Lasso-Lars 算法在2004 年被Efron 等[16]正式提出。Lars算法是一種特征選擇算法,它從訓練數據集中選擇相關性強的特征序列[17]。算法首先選擇與響應變量相關性最大的觀察變量,然后沿著該方向繼續選擇下一個觀察變量,直到特定條件滿足[18]。如果有多個觀察變量與殘差的相關性相同,算法會選擇沿著它們等角度的方向繼續前進,并選擇所需的觀察變量[19]。
Lars算法步驟[20]如下:
1)將回歸系數向量設置為0,然后找到與響應變量yi最相關的一個觀察變量,記作;
2)將沿著此觀察變量的方向最大限度地增大,直到找到另一個與當前殘差r=y-最相關的觀察變量被選中為止,將其記為;
3)將朝著與(,)等角度的方向增大,直到出現第3 個觀察變量符合與當前殘差最相關這一條件;
4)一直沿著與(,,)等角度的方向增大,直到出現第4個觀察變量,以此類推。
Lars算法是殘差不斷減小的過程,具有很高的計算效率[21]。因此,本論文采用Lasso-Lars 方法對學習者的心理特征和在線學習行為進行分析,通過Lars算法迭代計算,得到與學習者學習成績相關性最強的特征序列。
本文將學習者在線學習行為分析引入個性化學習路徑推薦,通過對學習行為數據分析設計相似學習者模型,并以此為基礎構建個性化學習路徑推薦模型。構建該推薦模型主要考慮三個問題:第一,依據學習者在線行為分析,如何構建學習特征相似、知識水平一致的相似學習者模型;第二,經過上述分析,如何選擇最優的相似學習者學習路徑,完成個性化推薦。
針對上述問題,設計相似學習者模型和個性化學習路徑推薦模型共同構成個性化學習路徑推薦模型框架。首先利用K-means 算法聚類獲得特征相似、知識水平一致的相似學習者模型。而另一部分個性化路徑推薦模塊,在相似學習者模型基礎上,使用Lasso-Lars 算法分析出與學習成績具有強關聯關系的幾種學習者在線學習行為,在推薦時優先考慮。
在線學習行為不同表示學習者學習風格和學習水平具有差異性特征,實現個性化學習路徑推薦需以此為依據。因此,構建相似學習者模塊根據以下三步進行:第一,量化學習者的在線學習行為;第二,對學習者學習風格進行分析;第三,構建相似學習者模塊。
3.1.1 量化在線學習行為
學習者在線學習行為數據反映了學習者基本特征、學習偏好和認知水平,這些數據儲存在學習平臺日志中。學習者的基本特征用來標記和區分學習者,包括學習者的編號、姓名、性別、年齡、職位、科目信息。將知識按照復雜程度劃分5 個層級,依次排列為{1,2,3,4,5},設計試卷對學習者進行初始能力測試。
3.1.2 學習風格分析
根據學習者學習行為的差異性,從學習平臺日志中提取學習者在線學習行為數據,通過計算分析得出學習者學習風格,以便向學習者推薦個性化學習路徑。

表1 學習風格分析計算表
3.1.3 相似學習者模型的構建
相似學習者是指特征相似、知識水平一致的學習者群體。利用聚類K-means 算法將學習者分成多個聚類,且每個聚類都包含至少一個相似特征。根據學習者的基本特征,包括編號、性別、職位、科目信息和初始能力測試,將它們用作5 個聚類中心。然后,計算每個學習者與聚類中心的距離,并將其分配給距離最近的聚類中心。這樣,每個聚類中心所包含的學習者就構成了一組聚類。當前學習者與聚類中心距離最近時,將此編號學習者分配給此聚類中心S 組,并從學習集中提取N 組向量。以此類推,在以性別向量為聚類中心的學習者集合中獲得聚類向量S1,在以職位向量為聚類中心的學習者集合中獲得S2,在科目向量為聚類中心的學習者集合中獲得S3,在初始能力向量為聚類中心的學習者集合中獲得S4。按照給定的方法,重新計算每個學習者集群之間的相似度,并將相似度最小的兩個學習者集群合并,直到所有學習者都被分類到集群中。最后,重復以上步驟,將各學習者重新分配到學習者集群中,并重新計算新的學習者集群中心,直到集群中心不再改變。由此,相似學習者模型構建完成。
學習路徑時學習者選擇學習內容和學習活動的有序序列,學習路徑推薦是為了提高學習者的學習成績,獲取最優的學習過程輔助學習者的學習。因此,將相似學習者模型中學習成績最優的學習者學習路徑推薦給同一集群的其他學習者,以此確保學習者獲得最優學習路徑。由于學習者的個體差異較大,為了實現個性化學習路徑推薦,需要進一步優化。主要的方法是采用Lasso-Lars 算法,該算法可以分析與學習成績具有強相關性的幾個關鍵因素。在為學習者推薦學習路徑時,優先考慮這些因素,并根據其關聯關系為學習者提供更加精準的個性化學習路徑。
3.2.1 個性化學習路徑推薦
個性化學習路徑也就是根據學習者特征分析結果,在保證學習內容一致的基礎上,為學習者匹配最符合其個性化發展的學習路徑。本文主要以相似學習者模型為基礎,充分考慮學習者的基本特征、學習風格、初始能力水平,向學習者推薦合適的學習路徑。依據學習者的基本特征和初始能力水平,向學習者推薦相似學習者集群中學習效率最高、學習成績最好且能力水平一致的學習者學習路徑;根據學習者的學習風格,推薦與其個性化特征相符的學習方式和學習活動,以促使學習者在學習活動中投入度最大化,并實現更好的學習效果。與此同時,在線平臺日志中的學習者在線行為數據也將動態監測學習者的學習路徑,以此獲得實時反饋和評價。
3.2.2 基于Lasso-Lars算法的學習路徑優化推薦
為了達到更好的效果,在學習路徑推薦時需要考慮的學習者特征必須全面,但并不是所有的學習者特征都對學習效率和學習成績有明顯的影響。因此,通過文獻分析以及調查研究發現,學習者的學習成績主要與學習者的心理特征和學習行為相關,本文主要采用Lasso-Lars 算法分析找到這些影響因素的差異性,獲得其優先級,從而優化個性化學習路徑推薦模型。
首先,設計問卷調查學習者的學習動機、學習態度和學習類型,獲得學習者心理特征數據。然后,從在線平臺日志中提取學習者在線學習行為,分別為視頻觀看時長、PPT 觀看時長、文本材料訪問時長、初始測試得分、課后習題得分、瀏覽論壇時長、發帖以及回復帖次數、做筆記方式、簽到次數以及測試成績。綜上,共有3 個心理特征和9 個學習行為影響學習成績。
使用Lasso-Lars 算法,以學習者的測試成績為自變量,上述12 個因素為因變量,將每個學習者的數據作為一個記錄。通過應用Lasso-Lars 算法,可以得到每個因素對應的回歸系數的變化趨勢圖,并確定不同因素對學生學習成績的影響大小。根據這些結果,確定影響因素的序列。最后,在推薦學習路徑時基于相似學習者的模型,優先考慮對學習成績影響較大的因素。這樣可以提高學習者的學習效率和學習成績。
根據個性化學習路徑推薦的特點,本文采用的是崗位技能培訓系統為實驗對象,對構建的個性化學習路徑推薦模型進行實驗效果分析。崗位技能培訓系統由六大模塊,分別為學習指導、崗位技能培訓、學習工具、測評管理、教師知識管理、系統管理模塊。如圖1所示。

圖1 崗位技能培訓系統架構圖
在系統日志中隨機選取50 名學習者學習行為數據信息,同時向這50 人發放調查問卷。獲得學習者學習動機、學習態度、學習類型、視頻觀看時長、PPT 觀看時長、文本材料訪問時長、初始測試得分、課后習題得分、瀏覽論壇時長、發帖以及回復帖次數、做筆記方式、簽到次數以及測試成績數據。由于Lasso-Lars 算法只能處理數值型數據,因此對12個影響因素數據進行量化處理。
關于學習者學習動機和學習態度,在調查問卷中設計5 個代表不同分值的選項,分別是“非常不同意”、“不同意”、“不確定”、“同意”和“非常同意”,按照問題利弊分別表示1~5 個分值,最后計算學習者學習動機和學習態度分值。學習類型分別標記視覺型為“1”,聽覺型為“2”,動覺型為“3”。對于學習者在線視頻觀看時長、PPT 觀看時長、文本材料訪問時長、瀏覽論壇時長、發帖以及回復帖次數、簽到次數,則直接使用從日志中獲取數據。對于學習者做筆記方式,在線平臺中有筆記模塊,使用筆記的學習者記為“1”,未使用的學習者記為“0”。對于學習者課后習題得分,取所有得分均值,并保留兩位小數。
學習行為特征包括學習動機分值、學習態度分值、學習類型、視頻觀看時長、PPT 觀看時長、文本材料訪問時長、初始測試得分、課后習題得分、瀏覽論壇時長、發帖以及回復帖次數、做筆記方式、簽到次數,由上述12 個特征構成輸入因素集,以學習者最終測試成績為參照變量。每個學習者學習行為數據作為一個樣本,所有學習者學習行為數據就構成了一個樣本集合。將12 個特征影響因素依次編號,分別是1學習動機分值、2學習態度分值、3學習類型、4 視頻觀看時長、5PPT 觀看時長、6 文本材料訪問時長、7初始測試得分、8做筆記、9課后習題得分、10 瀏覽論壇時長、11 發帖以及回復帖次數、12簽到次數。
Lasso-Lars 算法將每個學習者數據作為一個記錄,應用Lasso-Lars 算法,得到每一個因素所對應的回歸系數組成回歸系數變化走勢圖,并確定出不同的因素對學生學習成績的影響大小,由此確定影響因素序列,如圖2所示。

圖2 學習行為特征分析
由圖2 可以看出,學習者學習成績影響因素強度排序依次是學習動機、課后習題得分、做筆記、初始測試得分、學習態度、瀏覽論壇時長、發帖及回復帖次數、學習類型、文本材料訪問時長、PPT 觀看時長、視頻觀看時長、簽到次數。將者12 個特征按影響系數又可以分為4個層次。
第一個層次是學習者學習動機。好的學習動機可以使學習者獲得更好的學習效率,提高學習動機應該充分了解并滿足學習者學習需要,即滿足學習者個性化發展要求。
第二個層次包括課后習題得分、做筆記和初始測試得分。課后習題的練習可以增強學習者對知識的理解與應用,學習者能夠更好地掌握相關知識,因此這是學習路徑推薦中必不可少的一環。做筆記代表學習者的一種優秀學習習慣,在線學習沒有教師監督,做筆記就是學習者的一種良好的自我監督形式,將學習內容歸納整理后更容易被學習者掌握。初始測試成績反映了學習者的初始能力水平,同等條件下,初始能力水平高的學習者會有更多的時間應用到知識較難的學習中,獲得更好的學習成績。
第三個層次包括學習態度、瀏覽論壇時長、發帖及回復帖次數。學習態度體現了學習者對自身的要求,能否為了實現目標在學習上付出更多的努力。瀏覽論壇時長以及發帖及回復帖次數,都是學習者在遇到問題時的一種求助方式,無論是哪一種方式,適合學習者的就是最好的。
第四個層次包括學習類型、文本材料訪問時長、PPT 觀看時長、視頻觀看時長、簽到次數。學習類型、文本材料訪問時長、PPT 觀看時長以及視頻觀看時長都反映了學習者選擇學習方式時的學習傾向,選擇學習者更傾向的學習方式即可。簽到次數是為了監控學習者是否每天按時登錄系統學習,由于本次實驗對象是成人學習者,自我控制能力較強,因此簽到次數對學習成績影響不大。
綜上,向學習者推薦學習路徑時,在獲取最優學習者學習路徑的前提下,應優先考慮習題模塊、測試模塊和學習工具模塊,以此優化學習路徑,使學習者獲得更高的學習效率和學習成績。
隨著信息技術與教育的逐步融合,使學習平臺的服務越來越趨向于精準化和個性化。本文以學習者在線學習行為分析為基礎,充分考慮學習者的基本特征、心理特征和學習風格的差異性,利用K-means算法劃分相似學習者,并在此基礎上進行學習路徑推薦,同時采用Lasso-Lars 算法對學習路徑推薦進行優化處理,多方面實驗分析,讓學習路徑的生成更加精準化和個性化,幫助學習者提高學習效率進而獲得優秀的學習成績。