宋明惠 陳俊華 朱晨笛 仝鎧溦



摘? 要:大類分流時專業的選擇決定了學生的就業方向,然而大多數學生并不能獨立地選擇合適的專業,所以“智能專業推薦”是十分必要的。該文通過闡述和分析協同過濾算法的特點和不足,提出了一種改進的協同過濾算法用于專業推薦中,解決了冷啟動的問題,,提高了系統的可靠性。
關鍵詞:專業推薦? 大類分流? 協同過濾算法
中圖分類號:TP301.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1672-3791(2019)03(b)-0216-02
近年來,“大類招生、分流培養”模式被越來越多的高校所采用,在這種新的培養模式下,專業分流是其中一個重要的環節,選擇一個適合自己的專業對高校學生來說是一件十分重要的事情,用戶在進行專業選擇前會收集各方面資料,其中已經經歷過分流的用戶的建議和體會是未分流的用戶最想了解的,并且會將與自己的成績興趣等相近的用戶的專業作為重要的參考。該文使用協同過濾算法將與當前用戶相似度最高的用戶選擇的專業作為推薦專業。
1? 推薦算法
目前推薦算法廣泛應用于電子商務、社會網絡、數字化圖書館、視頻/音樂點播等領域,比較成熟的推薦算法主要有關聯規則、基于內容的推薦、協同過濾和混合推薦[1]。這4種算法各有優缺點,其主要優缺點如表1所示。
根據表1所示的各類推薦算法的優缺點,該文選擇協同過濾算法作為專業推薦的推薦算法。
2? 用戶相似度
用戶相似度即描述用戶之間是相似程度的度量,傳統的相似度有皮爾遜相關系數法、向量余弦法、調整的向量余弦法、約束的皮爾遜相關系數法、斯皮爾曼相關系數法等,在不同的應用領域中,選取不同的相似度計算方法。在電子商務中,用戶的相似度可以通過幾個用戶對同一件商品的打分情況(這里的分值可能表示真實的購買,也可以是用戶對商品不同行為的量化指標。例如,瀏覽商品的次數,向朋友推薦商品、收藏、分享、或評論等。這些行為都可以表示用戶對商品的態度和偏好程度)來計算用戶之間的相似度。
3? 協同過濾算法
協同過濾的基本思想是:找到與當前用戶Ccur相似(比如興趣相似)的其他用戶Cjs,計算對象s對于用戶的效益值u(Cjs,s),利用效益值對所有s進行排序或者加權等操作,找到最適合Ccur的對象s*[2]。其基本思想非常易于理解,在日常生活中,我們往往會利用好朋友的推薦來進行一些選擇,在普遍的推薦系統中是基于其相似用戶對某一內容的評價向目標用戶進行推薦,而在該系統中,只需找到最相似的用戶即可(見表2)。
根據上述內容可知,協同過濾算法需要基礎用戶作為參考才能進行協同推薦,基礎用戶對該算法而言不可或缺。獲得基礎數據,解決冷啟動問題是進行推薦的基礎。
4? 智能專業推薦的實現
根據霍蘭德人職匹配理論,人格一共被分為6種不同的類型,每一種類型的人格都有著不一樣的特點[3]。基于職業興趣測試的理論,查閱相關資料提取出15個區分度明顯的關鍵詞,依據15個關鍵詞設計了40道具有專業區分度的題目,形成調查問卷。向大類分流后的學生進行問卷調查,收集得到203份問卷結果。
將問卷結果的關鍵詞進行分值的統計,把計算機創新實驗班、計算機科學與技術、物聯網、網絡工程、數字媒體技術5個專業作為5個基礎用戶C,計算每個關鍵詞分值所占百分比,做為用戶C的屬性對象Si,形成向量集合S。當前用戶Ccur答題結束后,系統統計每個關鍵詞分值所占百分比,作為當前用戶Ccur的屬性對象S`i,形成向量集合S`。
通過公式(1)計算當前用戶Ccur和5個基礎用戶C的余弦相似度similarity,將similarity最小的用戶C作為推薦專業,經過測試得推薦結果精確度為67.3%。
通過公式(2)計算當前用戶Ccur和5個基礎用戶C的皮爾森相關系數r,將r最小的用戶C作為推薦專業,經過測試得推薦結果精確度為70.2%。
因此將公式(2)作為該系統的推薦計算方法。
5? 結語
該文通過對協同過濾算法的研究,將協同過濾算法應用到筆者學校的大類分流系統的智能專業推薦功能中,在大類分流階段為用戶提供了專業借鑒,得到了用戶的一致好評。并且隨著基礎用戶數據的增加,推薦的精確度不斷提高。
參考文獻
[1] 冷亞軍,陸青,梁昌勇.協同過濾推薦技術綜述[J].模式識別與人工智能,2014,27(8):720-734.
[2] 許海玲,吳瀟,李曉東,等.互聯網推薦系統比較研究[J].軟件學報,2009,20(2):350-362.
[3] 雷長青.淺談大學生職業規劃設計中霍蘭德人職匹配測試法的運用[J].現代經濟信息,2018(14):445.
①基金項目:北京林業大學大學生創新創業項目—— 基于協同過濾的大類專業分流實時動態系統研建(項目編號:S201810022089)。