李斌 孫經緯


摘要:隨著我國教育信息化進程的不斷推進,學習者獲取學習資源的方式逐漸從主動檢索轉變為學習系統自動推薦。智能化的學習內容推薦行為極大地提高了用戶獲取個性化資源的效率,但是內容推薦在教育領域中的應用仍存在著許多方面的不足。該研究分析了推薦系統在教育領域中的應用現狀,介紹了主流的推薦算法及其實現原理,并采用混合推薦模式和不同的推薦策略,設計出個性化學習資源精準推薦系統的系統模型,以期助力學習者的個性化學習。
關鍵詞:精準推薦;個性化學習資源;推薦算法;教育大數據
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)02-0057-02
1 學習資源推薦系統的現狀
1.1 教育領域中缺少高質量的資源推薦應用
以“淘寶”“今日頭條”等商業應用為代表的個性化內容推薦軟件已經廣為人知,但是內容推薦在教育領域中的發展與應用則顯得相對緩慢。一方面,教育應用軟件的設計人員對學習者獲取學習資源方式的認識不足,許多學習平臺的學習資源獲取仍然依靠學習者自主檢索和教學者分發學習材料,教育大數據所帶來的技術優勢沒有得到很好地發揮;另一方面,盈利機構為了搶占市場,往往通過活動推廣等營銷手段吸引用戶。但是,這類內容推薦平臺因為推薦功能不成熟、系統設計不合理而逐漸被使用者放棄。
1.2 學習資源出現“內孤島化”現象
教育大數據時代,“信息孤島”在一定程度上得到緩解,但是這種現象并沒有得到完全的消除。學習資源的“內孤島化”現象隨著資源數量的劇增,反而呈現出加劇的狀況。有學者認為,“內孤島化”的實質是信息資源(尤其是邏輯上的)碎片化,化解信息資源的“內孤島化”的問題在于信息資源的再整合[1]。目前國內的學習資源推薦系統,往往過于注重學習資源的網絡化,而忽略了邏輯上相關的學習資源的聯系建設。大量的學習資源零散地分布在系統平臺里面,導致了在學習系統在進行個性化資源推薦的過程中,存在內在聯系的學習內容無法形成合力,學習者獲取的資源往往是零散的、碎片化的。
1.3 單一的推薦策略和推薦算法可能使用戶深陷“信息繭房”
基于用戶偏好的推送行為,往往更關注用戶偏好的內容而非用戶實際所需要的內容。凱斯·桑斯坦在《信息烏托邦:眾人如何生產知識》中提出“信息繭房”的概念,指的是“信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的通訊領域,久而久之,會將自身桎梏于像蠶繭一般的‘繭房里”[2]。以內容推薦算法為代表的推送方法,雖然可以實現用戶偏好內容的推薦,但是無法確保用戶獲取到的內容是否對其個性化學習具有積極的作用。同時,推薦系統在采用單一推薦策略的情況下,一旦缺乏了教學者的監管,學習者只關注于自身偏好的學習內容,用戶的學習路線越走越偏,這樣“不精準”的推薦行為對學習者有害而無益。
2 推薦算法實現原理及比較
目前,在內容推薦平臺應用模型比較成熟的推薦算法有基于內容推薦算法、基于用戶的協同過濾算法和基于關聯規則的推薦算法。三種推薦算法在內容推薦系統中的實現原理各有不同,我們應該根據情況來進行選擇和使用。
基于內容推薦算法,是指推薦系統根據學習者的瀏覽記錄和資源使用記錄等用戶行為數據,計算出學習者的資源使用偏好,并優先向學習者推薦符合其資源偏好特征的學習內容。
基于用戶的協同過濾推薦算法,是指推薦系統把興趣偏好相類似的用戶劃分到同一群體里面,當某一學習者屬于該群體中的成員時,推薦系統會向該學習者推薦群體中其他用戶偏好的并且該學習者沒有使用過的學習資源。
基于關聯規則推薦算法,該算法來源于美國沃爾瑪超市的“啤酒和尿布”案例,意指表面上沒有關聯的兩種物品,在背后存在著隱藏的相關性。在學習資源推薦系統里面,不同的用戶頻繁地使用了兩種看似無相關的學習內容,那么這兩種學習資源之間具有潛在的關聯規則,推薦系統根據一定的關聯規則將頻繁集項(或頻繁同時出現在使用列表中)的學習資源推薦給學習者。
在實際應用當中,單一的推薦算法往往無法實現學習內容的全面的、精準的推送,所以無論是商業領域還是教育領域,往往采用多種推薦算法結合的混合推送。精準在于算法,看似表現“非凡”的算法實際還不夠“聰明”,目前完善的辦法是多種算法組合,關聯更大數據[3]。不同的推薦算法之間存在差異,本文中介紹的三種推薦算法的比較,如下表1所示:
3 個性化學習資源精準推送系統設計
個性化學習資源精準推薦的實現,離不開多種推薦算法的合力,同時也離不開學習者操作行為數據的支撐。在軟件工程領域,程序常常被認為是數據結構和算法的有機結合。同樣地,一個精準的學習資源推薦系統,對學習者產生的操作為行數據的處理和應用,以及對推薦算法的選擇至關重要。
本研究以微信小程序平臺為依托,在充分發揮微信平臺“用戶群體龐大”“用戶活躍度高”等優勢的同時,通過采用混合推薦的方法和不同推薦策略的結合,設計出基于數據驅動的個性化學習資源精準推送系統模型,詳細的推薦系統模型如圖1所示:
從系統架構的角度來看,該系統可以分為表現層、業務邏輯層和數據訪問層。在表現層中,主要負責的是向用戶呈現推薦學習資源推薦系統(微信小程序)的交互界面,如提供用戶授權登錄、用戶數據的輸入、學習資源的使用等界面;而業務邏輯層主要處理數據訪問層和表現層之間的邏輯,它包括了學習行為數據的采集、學習行為分析以及學習資源的推薦;數據訪問層主要負責存儲數據,它包括了用戶的基本數據存儲、學習資源存儲以及學習行為記錄存儲等方面。
從推薦算法的角度來看,該系統采用基于內容的推薦、基于用戶的協同過濾推薦和基于關聯規則推薦三種推薦算法混合推薦。一方面,多種推薦算法的組合使用既能解決用戶協同過濾算法的“冷啟動”問題,同時還能有效地減少學習者在使用學習資源的過程中對偏好資源的依賴。推薦系統向用戶推薦的資源不僅僅有學習者偏好的,同時也有學習者“不是十分偏好的,有助于學習者進步的”學習資源,從而避免學習者深陷“信息繭房”之中;另一方面,不同推薦算法有各自的優勢和劣勢,通過多種推薦算法進行恰當的整合,既可以使得學習資源推薦方式的靈活多樣,同時也確保了用戶能夠得到更加全面的學習內容。兼顧了學習者對學習資源的“用戶偏好”和“切實需求”兩大方面,極大地提升了資源推薦系統的精準性。
從推薦策略的角度來看,該系統包括了推薦系統自動推薦、教師引導推薦和學習者個體定制三種推薦策略。其中學習者個體定制策略的個性化學習程度最高,推薦系統自動推薦的個性化學習程度較高,教師引導推薦的個性化學習程度中等[4]。教師根據不同學習者自身的學習情況,向學習者推薦相關的學習資源,有利于發揮教師的監督作用和引導作用;推薦系統根據學習者對學習資源的使用情況,包括學習者對資源的類型偏好、學習者對章節知識點的掌握情況,為學習者提供“用戶偏好”的和“確切需要”的學習內容;在學習者個體定制策略方面,推薦系統提供了不同的標簽,用戶可以對自己感興趣的標簽進行訂閱操作,推薦系統會根據學習者的訂閱情況向其推薦訂閱標簽相關聯的學習內容。
個性化學習資源精準推薦系統的功能實現,需要推薦算法、推薦策略、用戶特征數據庫和學習資源數據庫等組成要素的有機結合。學習者通過使用推薦系統,在授權登錄和用戶注冊的過程中生產了最原始的用戶特征數據,隨著用戶數量的增加和用戶使用推薦系統時長的累積,用戶特征數據庫變得越來越完善。推薦系統既可以根據學習者對資源的“收藏”“頻繁使用”等行為數據向學習者推薦“偏好資源”,也可以根據相類似的學習者群體通過用戶協同過濾的方法為學習者提供學習資源,還可以根據學習者的錯題情況及時地向學習者推薦補救性學習資源。在推薦方式多樣化、推薦內容精準化的系統中,教師充當引導者和學習資源的建設者的角色,以學習者為中心的個性化學習得到強有力的支持,有效地促進了學習者的個性化學習。
4 結束語
本研究分析了學習資源系統的應用現狀,總結了內容推薦系統應用于教育領域中存在的不足,并系統介紹了三種主流的推薦算法以及它們的優勢和劣勢。通過采用混合推薦的方法,結合不同的推薦策略,設計出基于數據驅動的個性化學習資源精準推薦系統。通過實現學習資源的“個性化”“精準化”推薦,促進學習者的個性化學習。
參考文獻:
[1] 趙慧,劉君.以用戶為中心的信息構建與網絡治理——信息構建理論視野下的政府網站信息資源“去孤島化”研究[J].公共管理學報,2013(1):128-134.
[2] 梁鋒.信息繭房[J].新聞前哨,2013(1):87.
[3] 張揮,鄒宇松.信息推送教育應用探析[J].中國教育信息化,2019(10):94-96.
[4] 孫眾.駱力明,等.數字教材中個性化學習資源的推送策略與技術實現[J].電化教育研究,2014,35(9):64-70.
【通聯編輯:光文玲】