中圖分類號:TP391 文獻標志碼:A
0 引言
“線性代數”作為大學數學中的一門重要課程,其傳統教學模式的單一性和教學資源的不均衡性,使得學生在“線性代數”的學習中面臨諸多挑戰。在線教育的興起為“線性代數”課程的教學提供了新的契機。豐富的網絡課程資源,為學生提供了多樣化的學習選擇[1]。但面對海量的學習資源,如何根據學生的學習特點、興趣偏好和需求,進行個性化的推薦,成了一個亟待解決的問題。傳統的網課資源推薦方法雖然在一定程度上解決了學習資源推薦的問題,但仍然存在諸多不足。例如:朱海萍等[2]提出的方法通過分析課程資源的內容特征,與學生已學習的課程內容進行匹配,從而推薦相似或相關的課程資源,但這種方法忽視了學生的學習行為和興趣變化,導致推薦的資源與學生的實際需求存在偏差。何杏宇等[3]提出的方法通過分析大量學生的學習歷史和行為數據,找出相似的學習者群體,然后基于這些群體的學習偏好為學生推薦課程資源,但這種方法依賴于大量的用戶數據,對于新用戶或冷門課程,推薦效果可能不佳。
知識圖譜作為一種新興的技術手段,在知識表示、語義理解以及關系挖掘等方面展現出強大的能力[4]。文章旨在探索基于知識圖譜的“線性代數\"課程網課資源個性化推薦方法,以期提高課程推薦的匹配程度和學生的學習效果。
1構建“線性代數”課程網課資源知識圖譜
構建“線性代數”課程網課資源知識圖譜,須明確網課資源中的知識點與各類實體間的復雜關系,為后續的資源個性化推薦奠定堅實的理論與數據基礎,其構建流程如圖1所示。
圖1線性代數課程網課資源知識圖譜構建流程
如圖1所示,構建流程始于從各大“線性代數”課程網課平臺廣泛收集課程資源,這些資源涵蓋了課程視頻、詳細講義以及教師信息等[5]。通過這一步驟獲得的“線性代數\"課程結構化數據構成了網課資源知識的初步表示。隨后,對收集到的資源進行嚴格的初步整理,剔除重復和無關的內容,確保資源的準確性和完整性[6]
采用知識獲取的形式,從這些數據中提取出線上網課資源的三元組數據。接著,深入分析“線性代數”課程大綱,從中提取出如向量、矩陣等關鍵知識點并進行標注,包括其所屬章節、難易程度等關鍵屬性[7]。根據知識點之間的邏輯關系,構建復雜關聯關系。同時,將課程資源與知識點進行關聯,例如:將某個習題標注為考察某個特定知識點的習題[8]
通過知識抽取與教學資源實體的鏈接,構建“線性代數”課程網課資源知識圖譜的三元組形式。利用(m,q,r) 表示“線性代數”課程網課資源知識圖譜三元組,其網課資源知識圖譜的數學表達式為:
G={(m,q,r)|m,r∈E,q∈R}
其中, E 為網課資源數據集中與“線性代數”課程緊密相關的實體集合; R 為這些實體所構成的關系集合。
這一知識圖譜成功地將“線性代數”課程網課資源與其他實體進行了有效的關聯,從而揭示了實體之間存在的關聯[9],為個性化教學資源推薦提供了強有力支持,使推薦更精準滿足用戶需求。
2用戶偏好與網課資源相似度計算
在“線性代數”網課資源知識圖譜的基礎上,深入計算用戶偏好與網課資源間的相似度,為個性化推薦提供數據支撐。首先,全面搜集用戶在學習平臺的行為數據,涵蓋課程視頻的觀看時長與次數、習題完成的正確率與時間、講義瀏覽的時長及下載情況,記錄學習時間、進度及反饋。這些數據用于深入分析用戶的學習習慣、興趣偏好及認知水平,從而為實現精準網課資源推薦奠定基礎。為了更精確地刻畫用戶特征,采用聚類分析方法對用戶進行分組,它能夠將具有相似特征的用戶歸為一類,從而挖掘出不同用戶群體的共同特征。選取“線性代數”課程網課資源文本中的關鍵詞作為線上用戶興趣偏好的標示。這些關鍵詞通常能夠準確反映課程資源的主題和內容,因此,可以作為用戶興趣偏好的重要依據[1]。為計算用戶偏好與網課資源之間的相似度,采用余弦相似度作為度量標準,通過計算2個向量之間的夾角余弦值來評估它們之間的相似程度,計算公式如下:
其中, S(U,R) 為用戶 U 與網課資源 R 之間的相似度; 為目標用戶 U 學習過的歷史“線性代數”課程網課資源的詞向量;
為線上網課資源 R 的詞向量;
分別為向量 U 和 R 的模長。
根據用戶偏好分析結果和資源相似度計算結果,綜合評估用戶對不同課程資源的偏好程度。相似度越高,說明該“線性代數”課程網課資源與線上用戶的學習偏好越接近。因此,該網課資源越值得被推薦給用戶。
3“線性代數\"課程網課資源個性化推薦
基于用戶偏好與網課資源相似度的計算,能夠評估“線性代數”課程網課資源與線上用戶學習偏好的匹配程度,據此判斷資源是否值得推薦。在此基礎上,制定個性化的推薦策略,考慮用戶的學習需求、學習進度和興趣偏好,為用戶提供符合其個性化需求的推薦列表。
首先,對“線性代數”課程網課資源的文本數據進行預處理,這包括分詞處理和去停用詞處理。分詞處理將文本切割成獨立的詞匯單元,而去停用詞處理則移除對語義貢獻較小的常用詞匯,如“的”“了”等。從預處理后的文本中抽取關鍵詞,作為網課資源的語義特征。隨機使用word2vec模型,將提取的關鍵詞表示為相應的詞向量。word2vec能夠將詞匯映射到一個高維向量空間中,使得語義相似的詞匯在向量空間中的距離較近[12]。此時,“線性代數”課程網課資源可以表示為詞向量的集合,即:
Q={v1,v2,…,vn}
其中, vi 表示第 i 個關鍵詞的詞向量。
根據“線性代數”課程網課資源的知識實體,構建網課資源的知識庫。知識庫包含資源中的關鍵概念、公式、定理等,表達式如下:
KB={(e1,d1),(e2,d2),…,(em,dm)}
其中, ei 為第 i 個知識實體; di 為該實體的描述或定義。將構建的知識圖譜中的知識實體與網課資源識別后的實體進行對齊處理。按照公式(2)計算實體間的相似度,匹配知識實體,形成用戶知識庫。
利用混合推薦算法,結合用戶知識庫和網課資源知識庫,為用戶推薦與認知學習水平相符的“線性代數”課程網課資源,公式如下:
T(u,r)=α?F(u,r)+(1-α)?B(u,r)
其中, T(u,r) 為用戶 u 對資源 r 的推薦得分;F(u,r) 為協同過濾得分; B(u,r) 為基于內容的得分;α 為權重系數。
將推薦結果以用戶友好的方式展示在學習平臺上,提供用戶反饋渠道,收集用戶對推薦結果的滿意度和意見。根據用戶的反饋,不斷優化推薦策略,提高推薦的準確性和用戶滿意度,從而提高學習效果和用戶滿意度,實現“線性代數”課程網課資源的個性化推薦。
4 實驗分析
4.1 研究對象
在此次實驗中,學習者信息數據包括1000名18—45歲的在線學習“線性代數”課程的學習者,其中20—25歲的學習者占比高達 60% 。這些學習者平均已學過2門“線性代數”課程,完成練習數量為100~500 道。此外, 70% 的學習者傾向于中等難度的習題, 60% 的學習者更偏愛直觀的視頻講解風格。“線性代數\"課程資源信息數據包含50門課程資源,其中中級課程占比最高,為 50% 。每門課程平均配備20個時長在 10~30min 視頻講解。同時,課程資源中的知識點均詳細標注,明確了它們之間的前驅和后繼關系,有助于學習者系統地掌握“線性代數”知識體系。
對學習者信息和課程資源數據進行預處理,包括清洗、標準化以及關鍵特征的提取,據此構建特征向量。引入朱海萍等[2]的時空多粒度興趣建模推薦方法和何杏宇等3的圖神經網絡與多主體評價推薦方法,分別設為對照組1和對照組2。同時,將文章提出的方法設為實驗組。在統一的測試環境下,利用現有的樣本數據集,分別運用這3種方法,為學習者提供“線性代數”網課資源的個性化推薦服務。
4.2分析結果
完成推薦流程后,將推薦的“線性代數”課程網課資源與學習者偏好資源進行匹配,以此作為評估推薦方法有效性的核心指標。該匹配結果依據以下公式得出:
其中, K 為推薦的“線性代數”網課資源與學習者偏好資源之間的匹配程度; Kr 為推薦的“線性代數”網課資源集合; K2 為學習者偏好的“線性代數”網課資源集合。 K 值越高,代表推薦資源與學習者需求的匹配度越高,反之,則匹配度越低。基于上述計算,統計了實驗結果,如圖2所示。
圖2推薦網課資源與學習者偏好資源匹配度
從圖中可見,本文提出的基于知識圖譜的個性化推薦方法能確保推薦網課資源與學習者偏好資源的匹配度超過 96% 。相比之下,對照組1和對照組2提出方法的匹配度較低且波動較大。由此可見,本文設計的基于知識圖譜的個性化推薦方法展現出顯著優勢,規范運用該方法進行“線性代數”網課資源推薦,能顯著提升推薦資源與學習者偏好的匹配度,進而為學習者提供更優質的教學服務,全面優化其學習體驗與質量。
為了更深入地探究不同推薦方法的效果,本文以選中的學習者作為測試對象,統一設定了每種類型下“線性代數\"課程網課資源的單個課程時長為 45min 。在此基礎上,統計學習者對推薦網課的平均聽課時長,以此作為衡量學習者對推薦資源喜愛程度的一個重要指標。具體的統計結果如表1所示。
表1平均聽課時長統計結果 單位: min
由表4可知,實驗組在各項網課資源上的平均聽課時長始終高于2個對照組,提升幅度分別達到了24.4% 和 39.4% 。這一結果表明文章提出的方法所推薦的“線性代數”課程網課資源更能吸引學習者的注意力,獲得更高的喜愛程度和參與度。可見,本文提出的基于知識圖譜的個性化推薦方法既能夠滿足“線性代數”課程網課資源的良好匹配,又能夠保證學習者對課程的喜愛程度,具備較好的推薦效果,可以投入實際課程教學中進行廣泛應用。
5結語
本研究聚焦于“線性代數”課程網課資源的個性化推薦,提出了一種基于知識圖譜的推薦方法,旨在解決傳統推薦方法中存在的精準度不足、忽視學習者個性化需求等問題。在研究過程中,深入探討了知識圖譜的構建與應用,通過挖掘“線性代數”課程網課資源之間的關聯關系,為個性化推薦提供了豐富的信息基礎。同時,結合了用戶偏好與網課資源的相似度計算,實現了對學習者需求的精準把握,從而提高了推薦的準確性和有效性。展望未來,將繼續深化對知識圖譜技術的研究與應用,進一步優化個性化推薦算法,提高推薦的精準度和用戶滿意度,為學習者提供更加優質、個性化的學習資源和服務。
參考文獻
[1]李春英,武毓琦,湯志康,等.融合知識圖譜的學習者個性化學習資源推薦[J].小型微型計算機系統,2024(2) :285-292.
[2]朱海萍,王子瑜,趙成成,等.基于時空多粒度興趣建模的學習資源推薦方法[J].計算機研究與發展,2024(62) :1-18.
[3]何杏宇,周易歆,羅東旭,等.基于圖神經網絡和多主體評價的教學資源推薦[J].計算機工程,2024(7) :13-22.
[4]劉瑩,楊淑萍,張治國.基于Spark平臺的并行化譜聚類算法的在線學習資源推薦[J].濟南大學學報(自然科學版),2024(4):456-461.
[5]劉瑩,楊淑萍,張治國.Storm分布式計算框架下基于知識圖譜的快速學習資源推薦[J].南京郵電大學學報(自然科學版),2024(3):93-99.
[6]周洋濤,褚華,朱非非,等.基于深度學習的個性化學習資源推薦綜述[J].計算機科學,2024(10):17-32.
[7]居程程,祝義.采用局部子圖嵌入的MOOCs知識概念推薦模型[J].計算機科學與探索,2024(1):189-204.
[8]仇煥青,陳曙光,龔芝,等.基于鯨魚優化算法改進長短期記憶神經網絡的資源推薦[J].濟南大學學報(自然科學版),2023(3):309-315.
[9]文謐,張洋洋.非均勻個性化網絡資源的深度并行推薦仿真[J].計算機仿真,2024(2):512-516.
[10]孫浩,周力青.基于IMD與Canopy的非均勻資源推薦算法[J].計算機仿真,2023(10):477-481.
(編輯 王永超)
Abstract: Traditional resource recommendation methods neglect the personalized needs of learners and the deep features of course resources,resulting in low recommendation accuracyand low satisfaction.Therefore,the article proposes a personalized recommendation method for online“Linear Algebra”course resources based on knowledge graph.By constructing a knowledge graph to mine resource asociations and combining user preferences with resource similaritycalculation,itaccurately grasps learners’needs.The experiment shows thatthearticle methodrecommends online course resources with a matching degree of over 96% with learner preference resources,and the average listening time of therecommended online course resources isalways higher thanthat of traditional methods, significantly improving the recommendation effect and learner satisfaction
Key words:knowledge graph;“Linear Algebra”; course;online course;resource;personalization; recommendation