[摘要] 協同過濾推薦是電子商務推薦系統中應用最成功的技術,很大程度上決定了推薦系統的推薦質量。文章主要介紹了目前應用較廣的幾種協同過濾推薦技術,并對這幾種推薦技術的存在的問題進行了分析。
[關鍵詞] 電子商務 推薦系統 協同過濾
一、引言
隨著互聯網的廣泛普及,電子商務對傳統的商務交易產生了革命性的變化,產生從以商品為中心到以用戶為中心的商業模式的轉變。新的商業環境在為企業提供新的商機的同時,也對企業提出了新的挑戰。圍繞用戶進行服務,為用戶提供所需要的商品,所以對每個用戶提供個性化的服務成為必要。電子商務推薦系統成為解決問題的重要途徑。而協同過濾推薦是目前研究最多、應用最廣的電子商務推薦技術。
二、電子商務推薦系統
電子商務推薦系統定義為:利用電子商務網站向用戶提供商品信息和建議,幫助用戶決定應該購買什么產品,模擬銷售人員幫助客戶完成購買過程。它是一個基于用戶網上購物的以商品為推薦對象的個性化推薦系統,為用戶推薦符合興趣愛好的商品。分析用戶的消費偏向,向每個用戶具有針對性地推薦的產品,幫助用戶從龐大的商品目錄中挑選真正適合自己需要的商品。電子商務推薦系統在幫助了用戶的同時也提高了用戶對商務活動的滿意度,換來對電子商務站點的進一步支持。
三、協同過濾推薦技術
1.基于用戶的協同過濾,基于用戶的協同過濾推薦技術是推薦系統中應用最為廣泛的方法之一,它是基于鄰居用戶的興趣愛好預測目標用戶的興趣偏好。算法先使用統計技術尋找與目標用戶有相同喜好的鄰居,然后根據目標用戶的鄰居的偏好產生向目標用戶的推薦。它能夠通過用戶間的相互協助、根據用戶對項目的評價的相似性對用戶進行分類,其次,在基于用戶的系統過濾系統中,所有用戶都能從鄰居用戶的反饋評價中得益,當然,基于用戶的協同過濾系統容易挖掘出目標用戶潛在的新興趣。
2.基于項目的協同過濾,基于項目的協同過濾通過先計算已評價項目和待預測項目的相似度,以相似度作為權重,加權各已評價項目的評價分,得到預測項目的預測值,基于項目的協同過濾推薦根據用戶對相似項目的評分預測該用戶對目標項目的評分,它基于這樣一個假設:如果大部分用戶對一些項目的評分比較相似,則當前用戶對這些項目的評分也比較相似。
3.基于混合推薦的協同過濾,綜合考慮了用戶和項目這兩個屬性。一種是先根據項目來預測,然后用基于用戶的協同過慮產生推薦;另外一種是先根據用戶來預測,然后用基于項目的協同過慮產生推薦;還是一種就是分別根據基于用戶和基于項目的協同過慮來加權平均產生推薦。
4.基于聚類的協同過濾,聚類技術是根據用戶的興趣類似性來進行聚類,聚類產生之后,根據聚類中其他用戶對項目的評價預測目標用戶對該項目的評價。有學者提出通過對服務器日志進行事務聚類和關聯規則超圖分割聚類獲取用戶的共同瀏覽特征,然后掃描所有的數據集合產生個性化的推薦。也有學者提出對項目進行聚類,然后在對應的聚類中搜索目標用戶的最近鄰居,由于每個聚類中的用戶數量并不是隨著項目數量的減少而線性減少,所以這種方法在用戶對多個聚類中的商品均有評分的情況下效果并不理想。
5.基于關聯規則的協同過濾,關聯規則技術在零售業得到了很大的發展。關聯規則挖掘可以發現不同商品在銷售過程中的相關性。系統根據生成的關聯規則模型和用戶當前的購買行為向用戶產生推薦。關聯規則模型的生成可以離線進行,因此可以保證系統的實時性要求。
四、待解決的問題
1矩陣稀疏性。電子商務網站通常擁有大量商品,而每個用戶購買或作評價的只是其中很小的一部分通常不到1%,例如亞馬遜網站系統,數據的稀疏會導致算法準確率降低。在一般的協同過濾系統中,如果兩個用戶沒有對相同的商品進行打分,即使這兩個用戶的興趣愛好都相同,系統也無法得出他們之間的相似度,算法甚至找不到任何商品可作推薦。
2.冷啟動問題。冷啟動問題有新商品問題和新用戶問題兩類。新商品問題是指一個新商品剛加入的時候,沒有人或很少人評價,則這個商品很難被推薦出去,這就需要推薦系統引入一些新機制來激勵用戶多作評價。新用戶問題是指推薦系統中對用戶的分類是依據目標用戶與其他用戶的比較,這種比較主要基于不斷累積的用戶評價。如果一個新用戶從未對系統中的項目進行評價,則系統無法獲知他的興趣點,也就無法對他進行推薦。
3.可擴展性。隨著用戶和項目數量急劇增加,在整個用戶空間上搜索目標用戶的最近鄰居比較耗時,難以滿足推薦系統的實時性要求。主要由于基于用戶或項目的協同過濾算法需要掃描整個數據庫來計算相似度,因此隨著數據庫中記錄的增加,其計算復雜度呈指數級別增長,導致推薦系統性能急劇下降。一種可能的方法就是用聚類分兩階段來解決問題。離線階段對用戶或項目進行分類,在線階段就可以直接到規模小很多的聚類中心找到最近鄰居并產生推薦。
4.隱私保持問題。協同過濾中隱私保持問題近年來也引起了越來越多學者的研究興趣。數據挖掘中隱私保持是近年來學術界的一個研究熱點,已在很多協同過濾中取得了成果。有基于加密的技術和隨機擾亂技術解決方案。也有用對等網絡結構的協同過濾推薦隱私保持問題的技術方案。
五、總結
電子商務推薦系統,一方面有助于電子商務網站內容和結構自適應性的實現,另一方面在幫助用戶快速定位感興趣的商品的同時也為企業實現了增值。而協同過濾與其他推薦方法比較有許多不可替代的優化,本文對協同過濾推薦技術進行了介紹,并對存在的問題進行了概述。目前,國內的電子商務網站在這方面的實踐處在快速發展的階段,因此還需要繼續研究出更智能、更優化的協同過濾推薦技術。
參考文獻:
[1]姜有輝高琳琦:電子商場中的個性化推薦研究與應用[J].商場現化,2006,33
[2]余力劉魯:電子商務個性化推薦研究[J].計算機集成制造系統,2004,10