王澤毅 吳靜 呂志 王璞
(武漢工程大學計算機科學與工程學院 湖北省武漢市 430205)
近年來,隨著科技的快速發展,眾多新型的學習方式逐漸出現在大眾視野中。從最初的傳統課堂授課,視頻授課,到現在的直播授課,新型學習方式在學習中占據著越來越重要的地位,同時也是未來學習授課的大勢所向。當今的主流學習方式仍是以傳統課堂為主,以網絡學習為輔的授課方式,但是不可否認新型學習方式在學習過程中發揮著越來越重要的作用。
當前的網絡課程學習平臺主要分為兩類[2],一類是以中國大學MOOC為代表的,較為“官方的”,由高校名師進行授課的平臺;另一類是以嗶哩嗶哩網站為代表的,較為“大眾的”,由網友自制課程進行授課的平臺。無論是“官方的”平臺,還是“大眾的”平臺,都存在授課老師風格不同,水平參差不齊的問題。那么,如何在眾多的學習視頻中尋找到適合自己的視頻?為了解決上述部分提到的問題,本文提出了基于個性化推薦的視頻學習網站的設計與實現。
系統大致可以分為三個部分,包括數據信息層、數據處理層和界面交互層,如圖1所示。數據信息層就是用戶在注冊時收集用戶的個人信息與需求,數據處理層包括對收集到的用戶和所選擇的資料進行分類與處理,以便進行個性化推薦,界面交互層就是呈現在用戶面前,能夠使用的功能[3]。
在用戶初次登錄并創建自己的賬號后,系統會在數據庫中為用戶創建對應的數據信息。當用戶在系統中進行操作時,系統會通過用戶的Web瀏覽日志進行數據挖掘。根據挖掘到的數據進行用戶喜好分析[4],并將數據存儲到對應用戶的數據庫中。在處理層對用戶數據和資源數據進行處理后,根據個性化推薦算法計算出最匹配的資源并推薦給用戶。
個性化推薦的本質就是對用戶的瀏覽數據進行篩選、提取,然后加以統計分析。個性化分析需要對每個信息設定標簽信息,并以此為依據進行分類與相似度計算[5]。從預先對每個信息添加的自定義標簽中尋找具有類似標簽和特征的信息,并推薦給用戶。對于網絡學習這種更加開放性的學習方式而言,學生能夠進行的選擇只會更多。如何尋找到適合自己風格的學習視頻,則顯得十分重要,本網站中選擇的個性化推薦算法為協同過濾算法。
隨著技術的發展,從早期基于鄰域的協同算法開始,到Korean提出矩陣因子分解協同過濾,再到現在最新的基于神經網絡的協同過濾,協同過濾算法經過了發展變得逐步完善。協同過濾算法根據選擇對象的不同可以分為兩類,基于用戶的協同過濾和基于產品的協同過濾[6]。
基于用戶的協同過濾算法通過比較用戶之間的偏好來為用戶推薦用戶可能感興趣的產品。首先,以矩陣行代表用戶,以矩陣列代表學習視頻,構造用戶評分矩陣[7]。

圖1:系統總體設計

其中,Rij表示用戶i對視頻j的評分。
隨后,根據皮爾遜相關系數法計算相似用戶,計算得到的結果的絕對值越大,則說明相關性越強。

式中,all表示用戶i和用戶j評分過的視頻的交集,Rki和Rkj分別表示用戶i和用戶j對第k個視頻的評分,分別表示用戶i和用戶j對所有視頻評分的平均值。在計算出結果后,得到與目標用戶最相似的用戶,從而將該用戶的感興趣視頻推薦給目標用戶。
基于產品的協同過濾算法則是通過比較產品之間的相似度為用戶推薦可能感興趣的產品。首先,對每個視頻添加多個不同的視頻標簽信息。在用戶產生瀏覽行為后,根據Web日志的統計,可以統計出每一位用戶的訪問記錄。通過用戶最近幾天的訪問記錄,提取出每位用戶瀏覽過的課程中的標簽信息,若用戶的瀏覽記錄有多個視頻,那么需要提取出所有的瀏覽視頻的標簽,并通過公式進行計算:

圖2:個性化推薦

其中,sum為提取的所有標簽數,ti為第i個標簽出現的次數,ai為第i個標簽出現的頻率。在計算出所有出現標簽的頻率后,根據頻率大小,舍棄頻率出現低的標簽,只保留前五個標簽。
隨后將這五個標簽通過相似度計算公式與所有的視頻標簽計算相似度,然后尋找出相似度最高的的學習視頻,并將這些視頻放入推薦區域。設定視頻的相似度計算公式如下:

其中,S表示用戶篩選出的標簽個數,Si表示視頻i的標簽個數。從該計算公式可以得出用戶瀏覽記錄與其他視頻的相似度,若p值越高,說明該視頻與用戶觀看的視頻之間的相似度越高。在計算所有視頻的相似度之后,選取相似度最高的幾個視頻放置到推薦區,結果如圖2所示。
網站平臺的前端頁面主要通過HTML+CSS+JavaScript語言搭建了一個網絡學習平臺,并根據需求和難度分成了幾個不同的版塊。同時,在頁面的最底端放入對應科目的學習資料,以便于獲取。
平臺的后端數據由MySQL數據庫進行存儲,將用戶的信息存入數據庫中,通過PHP將頁面與后端數據庫連接起來。數據庫中存儲了所有的數據信息,通過這些數據進行分析來進行推理與學習,以便進行個性化推薦。
將基于用戶的協同過濾算法和基于產品的協同過濾算法均用于系統后,發現推薦結果顯示較為不錯。當用戶選擇觀看了高等數學視頻后,個性化推薦區推薦了其他用戶評價較好的高等數學視頻以及預測用戶可能感興趣的視頻。
為了解實際使用效果,設計在線問卷來收集用戶的滿意程度。經統計,總計542人填寫了在線問卷,其中有74%的用戶認為滿足了自己的需求,選擇“十分滿意”;有22%的用戶認為基本滿足了自己的需求,選擇“滿意”;有4%的用戶認為對自己的用處不大,選擇了“一般”,沒有人感到“不滿意”。
本文描述了一個基于個性化推薦的網絡學習平臺。相較于其他的網絡學習平臺,該網站通過個性化推薦技術解決了網絡視頻繁多而導致難以選擇的問題,為學生推薦可能感興趣的學習視頻,節省了學生的精力和時間。其中,重點介紹了使用到的個性化推薦算法,算法分別根據用戶之間的喜好和視頻的之間差異,為不同的用戶推薦不同的視頻,且獲得了較好的推薦效果。