摘要:個性化推薦系統是電子商務個性化服務的核心技術,它是根據網絡消費者的歷史購買記錄或當前瀏覽行為捕獲其潛在偏好,進而為其推薦符合其當前偏好的商品。個性化推薦可以有效的過濾大量無關商品,降低消費者的選擇成本,提高商品交易效率。本文立足于個性化推薦系統,分類總結了近年來提出的個性化推薦系統的核心思想,討論了有代表性的研究成果,深入分析了個性化推薦系統亟待解決的基本問題,并總結展望了當今的發展方向。
關鍵詞:電子商務 個性化推薦 預測偏好
近年來,隨著網絡經濟的發展,越來越多的企業開始重視網絡營銷的重要性,隨之而來的是電子商務網站及產品信息成指數增長。商品信息量的急劇增加在拓展了消費者選擇空間的同時也增加了其選擇滿意商品的成本。為了解決信息過載問題,國內外學者提出各種信息過濾技術。推薦系統作為一種典型的信息過濾技術收到各類電子商務企業的青睞。Tapestry System是最早服務于郵件過濾的推薦系統,隨后,各種各樣的推薦系統應運而生,如GroupLens、Video、Ringo等。
所謂的個性化推薦系統是指依據網絡消費者的瀏覽行為和歷史購買記錄提取網絡消費者的潛在偏好,在此基礎上為其推薦滿足其當前偏好的商品。目前,根據提取消費者偏好的方法還劃分,個性化推薦系統可分為基于協同過濾的推薦系統、基于關聯規則的推薦系統和基于內容的推薦系統。其中,協同過濾推薦算法是推薦系統中應用最為廣泛的一種技術,它是利用群組中其他用戶對商品的偏好預測當前用戶對其它商品的偏好,并選擇滿足當前用戶偏好的N個商品推薦給用戶。它又分為基于用戶的協同過濾推薦系統和基于項目的協同過濾推薦系統兩種,基于用戶的協同過濾推薦系統是依據鄰居用戶對項目的評分對當前用戶的未評分項目進行預測,而基于項目的協同過濾推薦系統是依據項目的相似性評估網絡消費者的偏好。這兩種方法都是依據用戶對項目的歷史評分,由于用戶對項目的評分存在較大的隨意性,而且在大規模電子商務環境下經用戶評分的項目非常稀少,因此基于協同過濾的方法存在很大的缺陷。主要體現在以下幾個方面:①數據稀疏問題,在大規模電子商務環境下,經同時被多個用戶評分的項目非常稀少,從而導致鄰居用戶的計算不夠精確,推薦精度低;②可擴展性和實時性差,隨著用戶數量的增加,算法執行時間成線性增長;③冷啟動問題,對于已經存在于電子商務系統中的項目,系統能夠較好的得到推薦,而對于新進項目或很少被用戶評分項目卻很難被及時推薦給用戶,這就導致推薦的商品過于陳舊。
對于數據稀疏性問題,最常用的方法是給缺省值賦予固定值或平均值,增加用戶共同評分的項目數,但是這種方法忽略了用戶對項目偏好的差異性特征,因此很少使用。于是,研究者又提出基于奇異值分解法和主成分分析法的推薦系統,通過降低項目空間維度提高評分密度,但是在維度較高情況下極易導致數據的丟失,使得找到的最近鄰居用戶不夠精確。為了防止有效數據的丟失,基于項目評分預測的協同過濾算法應運而生,該方法是通過計算項目間相似性評估用戶對未評分項目的值,在一定程度上解決了數據稀疏性問題,然而在計算相似性時仍使用傳統的度量方法,在數據量極端稀疏情況下,對同一項目具有共同評分的用戶又是極為稀少,因此評估的評分值仍不夠精確。對于可擴展性和冷啟動問題,做常用的方法就是將多種推薦模型有機結合,建立混合的推薦系統,但是在構建時面臨較大的復雜性。
為了解決基于協同過濾的推薦系統存在的上述缺陷,研究者又提出將數據挖掘技術引入到電子商務個性化推薦系統中,從而出現了基于關聯規則的推薦系統。基于規則的技術中的規則可以由用戶自己來定或利用基于關聯規則的挖掘技術定,通過已生成的規則向用戶實現推薦服務。一個規則本質上是一個If-Then語句,規則可以利用用戶靜態屬性或用戶動態信息來建立。其優點是簡單、快捷。但是利用規則來推薦信息與規則的質量和數量密切相關,其缺點是隨著規則的數量增多,系統將變得越來越難以管理。典型基于規則的系統有IBM的WebSphere、BroadVi2sion。
無論是基于協同過濾的推薦系統還是基于關聯規則的推薦系統,都僅僅適用于非結構化的商品推薦,以用戶對商品的整體偏好為依據構建偏好模型,進而搭建推薦系統,而對于結構化的商品來說卻不合適。對此,研究者提出了基于內容的推薦系統。基于內容過濾的技術是通過比較推薦資源與用戶描述文件來推薦資源,通過與用戶定義的資源描述文件進行對比,并且對其相似詞的資源進行搜索,得到用戶可能感興趣并且沒有看過的內容進行推薦。這大大增加了推薦的范圍,也增加了用戶可以精確定位自己所需要的內容的可能性。典型的系統有Personal WebWatcher、WebMate、WebACE等。
個性化推薦在電子商務營銷領域發揮著巨大的作用,服務于人們的工作、學習、生活。雖然國內外學者提出了諸多個性化推薦系統,但均有其各自的優缺點,如何更好的結合各自的優勢或者探索更好的推薦系統,仍是個性化推薦領域研究的核心課題。
本文受桂林電子科技大學自然科學研究基金(UF08026Y)資助。