明巧英
(西安翻譯學院 工程技術學院, 西安 710105)
信息化浪潮的推動,使得微課變的炙手可熱,在這種形勢下一批優秀的微課資源網站涌了出來。學習者在“規模巨大”的網絡微課資源中學習的確方便了很多,然而這種“規模巨大”的信息所成就的學習者充實感的背后,卻使其置身于“信息迷霧”。學習者很難快速地從眾多的視頻中找到自己想要的內容,甚至關于同一知識點的微視頻就有多個,學習者無法確定哪個是最優的,這種境況給學習者帶來了一定的麻煩。 雖然搜索引擎技術使這種境況有所好轉,但用戶自己組詞表達需求時,往往會因各種原因很難找到滿足需要的資源,再就是結果頁面中的資源并不一定都與用戶的需求相吻合,因為提供檢索服務的搜索引擎并不關心用戶。不論用戶的興趣愛好如何,使用習慣怎樣, 只要輸入的是相同的檢索關鍵詞,就會返回相同的資源列表。因此,用戶不再滿意這樣的信息獲取方式,用戶希望系統能夠知其所想所需,當用戶在繁多的信息中舉棋不定時,系統能夠像知己一樣提供所需,這樣不但節約了學習者尋找所需資源的時間,而且對于學習者來說具有一定的針對性,能更好的提高其學習效率。這就用到了能夠克服傳統資源檢索缺陷的個性化推薦技術。目前,電子商務領域已成功應用了個性化推薦技術。本研究在微課系統的微視頻資源推薦中引入了個性化推薦技術,以使學習者能有更好的學習效率。
早在2008年,美國新墨西哥州圣胡安學院的戴維·彭羅斯(David Penrose)教授就提出了微課程的概念[1]。微課程是信息化環境下,教育資源的創新,它是為滿足學習者的需求,由教育者針對某一主題或知識點,精心設計的以視頻為主要載體,包含課件、習題、測評等多環節的網絡教學共享資源的集合,其課程教學目標明確,教學方式形象,可使學習者在短時間內汲取知識。微課程因其短小精悍、開放性、網頁化、情景化、動態生成課程資源、交互性強的應用環境等風靡全球。
微課系統是以針對性強的微視頻為主題,主要給學習者提供學習資源的系統[2]。
所謂個性化學習是指以建構主義理論為基礎,以學習者的興趣和需求為中心,在整個學習過程中強調學習者的主體地位,并根據學習者的個體差異及發展潛能采取靈活多樣的教學方式。
系統依據用戶的需求、個體特征等,主動向其推送需要的或可能感興趣的信息,我們就可以說這個系統具有個性化推薦技術。個性化推薦還可以為目標用戶推薦與其相似用戶群的偏好信息資源[3],即共享用戶間的經驗。它的工作原理是:先收集用戶信息,然后依據用戶信息建立相應的興趣模型,再在信息資源庫中尋找與其匹配的資源進行推薦。按個性化推薦實現的算法和方式的不同,把個性化推薦分為:基于內容的推薦、基于關聯規則的推薦和混合型推薦。本研究分析比較了各推薦算法及方式,最后采用協同過濾推薦。
協同過濾推薦技術在電子商務中的應用已經取得了很大的成功,正因為如此,越來越多的教育專家學者,希望把它引入學習系統,以達到因材施教,提高教學效果的目的?,F實生活中與個性化協同過濾推薦技術有異曲同工的現象常常存在,比如人們在選擇商品時,有時會因其種類繁多而很難做出選擇,這時就會尋求指點,咨詢日常與自己情況或喜好相似的人,進而做出決定。
如圖1所示。

圖1 基于用戶的協同過濾算法的主要步驟
是基于用戶的協同過濾算法的主要步驟,先根據用戶的行為日志數據計算其相似度,相似度的計算結果是用來確定與目標用戶具有相似興趣或需求的其他用戶的,就是鄰居用戶。然后以鄰居用戶對視頻的興趣來估算目標用戶對沒有看過的視頻的興趣度,最后找出興趣度(鄰居評價)最高的前幾個視頻將其推薦給目標用戶[4]。
協同過濾推薦技術會涉及計算項目相似性及用戶相似性,關于相似性的計算方法較多,常用的相似性衡量標準有:基于相關的相似性度量、基于歐幾里德距離的相似性度量、基于標準的余弦相似性度量、基于修正的余弦相似性度量等。經分析比較,本研究選用基于修正的余弦相似性度量方法。
不同的用戶對項目有不同的評分標準,所以在計算相似性時會有較大的誤差。減去用戶對項目的平均評分來改進算法是基于修正的余弦相似性的計算方法,計算公式如公式(1),其目的是減少用戶不同的評分標準帶來的問題。
公式(1)中,Rx,m表示用戶x對項目m的評價評分,同理Ry,m表示用戶y對項目m的評價評分;RX代表用戶x對所有項目評分的平均值,同理RY代表用戶y對所有項目評分的平均值。
協同過濾推薦是這樣進行假設推理的:若一些用戶對一些項目的評分相似,可推出他們對其它項目的評分也應是相似的;如若大部分用戶對一些項目的評分相似,可推出當前用戶對這些項目的評分也相似。如式(1)。
(1)
協同過濾推薦系統用統計技術搜尋目標用戶的最近鄰,再依據最近鄰對項目的評分來預測目標用戶對項目的評分,進而產生相應的推薦列表。所以獲取用戶信息、表示用戶信息、形成鄰居、產生推薦是協同過濾推薦中必不可少的流程。
2.2.1 獲取及表示用戶信息
與用戶有關的數據主要有:用戶注冊信息、用戶的學習數據(學習內容、學習測試等)及用戶的行為日志。該研究把用戶對視頻資源的評分作為主要的用戶行為數據,用戶對視頻資源的評分被分為顯式評分和隱式評分。顯式評分是指用戶直接給視頻資源打的分。隱式評分指的是記錄用戶行為(觀看時長、頻率等)的數據[5],把其加權轉化成用戶對資源的評分。顯式評分比較直觀,能準確的反映出用戶對視頻資源的喜愛程度,但由于要專門進行評分操作,所以會帶來一些不便給用戶;隱式評分是經過分析用戶的相關信息而間接得到的,不會給用戶帶來額外的操作,但在某些情況下,相關的數據是不能準確反映出用戶的喜好的,這必會使評分的準確性降低。
獲取的數據被協同過濾技術用用戶-資源評分矩陣來表示[6]。如表1所示。

表1 用戶—資源評分矩陣
第x行第m列的元素Rxm代表第x個用戶對第m個資源的評分。
2.2.2 形成鄰居
尋找目標用戶的鄰居是協同過濾技術最核心的步驟。與目標用戶x具有相近或相同興趣的用戶群就是目標用戶的鄰居。目標用戶x與其他用戶y之間的相似性計算是:先篩選得到用戶x與用戶y都評分的資源的集合Resx,y=Resx∩Resy,然后利用相似性度量方法—修正的余弦相似性度量法計算倆用戶之間的相似性。
微課系統的總體架構,如圖2所示。

圖2 微課系統總體架構圖
微課系統中個性化視頻的推薦是整個系統的核心。在系統的總體設計方面,把其分為兩大部分:基礎數據管理和推薦管理。其中用戶的所有信息和微課的所有資源、信息為最終的推薦提供相關的數據支持,供推薦模塊把預測的用戶最滿意的微課視頻推薦給用戶,所以它們是作為整個推薦系統的基礎數據而存在的。
用戶信息庫主要是對用戶的注冊信息(顯式信息)進行維護的,即用戶類型、年級、與用戶所在年級相關的科目等,這些信息形成了用戶最初的興趣需求模型;用戶行為日志數據是指用戶的搜索行為、觀看行為、瀏覽行為、評分行為、下載行為等,即對用戶學習時所產生的一系列行為進行分析處理;用戶學習數據主要記錄了用戶的學習進度、測試結果、知識認知水平等。根據這些用戶信息,得到用戶的興趣(特征)集合[7],再根據用戶的興趣尋找相似用戶。
微課資源信息庫不但存儲著微課系統中的微視頻,而且還管理微視頻資源的增加、刪除、改查等;用戶評分庫存儲著用戶對視頻資源的打分,用戶評分為后續的推薦提供相關的數據支撐。
微課系統中的推薦管理模塊是整個系統的核心重地,向用戶推薦的資源在此進行加工后才能形成,正是因為有了它,用戶和視頻資源才緊密的聯系在一起。在推薦模塊中,以協同過濾推薦技術為核心,進行相似用戶尋找、視頻過濾等工作。
從微課系統的總體架構分析設計中不難得知:微課系統中需要存儲大量的數據,如:用戶信息數據、用戶行為日志數據、用戶學習數據、微視頻數據等。所以本研究采用Hadoop分布式文件系統(HDFS)進行數據存儲[8]。
HDFS對硬件要求較低,在一般的服務器集群上就能運行,其通過“一次寫入、多次讀取”機制,快速的處理海量的數據,并且能使用戶的歷史訪問記錄長久的存儲,為用戶行為分析提供堅實的數據支撐。如圖3所示。
為微課系統數據存儲的HDFS結構。命名節點、DataNode、客戶端之間是用TCP/IP協議進行通信的??蛻舳藞绦袑懭氩僮髅顣r,先把這些數據緩存在本機上的臨時文件夾中,臨時文件夾中的數據塊一達到設定的值,客戶端便通知命名節點,命名節點就會響應客戶端的數據請求,在文件系統層次中插入文件名,并在DataNode中找到存放該數據的塊,同時將該DataNode及對應的數據塊信息告訴客戶端,客戶端便在指定的數據節點寫入本地臨時文件夾中的數據塊。

圖3 微課系統的HDFS結構圖
是微課系統的功能模塊關系圖,如圖4所示。

圖4 微課推薦系統功能模塊設計
本微課系統主要是為了滿足用戶的個性化需求,所以必需具備以下幾個功能。
①用戶注冊功能:新用戶可在系統上進行注冊,注冊后便于獲取用戶的屬性特征。
②用戶登錄功能:方便注冊的用戶登錄系統。
③數據收集功能:收集用戶的基本屬性信息、行為信息、偏好信息、微課視頻信息等。
④數據處理功能:將收集來的數據進行處理,并濾除無用信息,形成數據模型。
⑤推薦功能:根據前期的數據處理分析,向用戶推薦其感興趣的視頻資源。
⑥頁面展示功能:系統內容和推薦結果的瀏覽、視頻的觀看等,都會用到此功能。
展示的是微課視頻個性化推薦的主要流程,如圖5所示。
經分析,本系統把用戶分成三類進行個性化推薦[9]。對于在系統中看過視頻但沒有登錄的用戶,系統向其推薦的視頻是與其觀看過的視頻屬性特征相似的;對于登錄的新用戶,系統會根據用戶屬性特征進行微課視頻的推薦;對于登錄的老用戶,他不但提供了用戶屬性特征,而且觀看了一些視頻,并且對部分視頻進行了評價等,這樣就可以根據用戶的顯式信息及隱式信息分析計算形成用戶的興趣集(鄰居),再結合視頻資源的評價結果及新資源的情況給用戶進行推薦。這樣的推薦系統滿足了推薦的多樣性和準確度。

圖5 微課推薦系統的流程設計
在現代化教育環境下,如何把個性化學習更好的融進微課教學中,需要教育界的工作者努力地研究探索?;诖?,本研究致力于用戶個性需求的微課視頻資源推薦研究?;趥€性化視頻推薦的微課教學系統分析與設計充分考慮了個性化學習及微課的特點,選擇了合適的相似度算法和推薦技術,完成了個性化微課系統的分析設計,希望推薦技術能夠解決教育教學中師生遇到的實際問題,并為他們的教、學帶來真正的便利。時間在變,事情在變,但教育者努力研究探索的精神不變,所以我堅信在不久的將來,個性化推薦技術必為教育信息化建設貢獻更大的力量。