蔣文娟 蘇佳 陸娜 李富蕓



摘要:個性化推薦系統可以幫助電子商務網站為用戶提供快速有效的商品搜索服務,滿足用戶的需求,提高用戶的購物效率。服裝是電子商務平臺的重要類目,但是由于用戶對服裝的偏好因素多,且用戶對服裝商品同時有趨同性和求異性,對服裝個性化推薦的研究有很有必要。基于協同過濾算法,對用戶收藏夾的信息進行了分析,計算出相似度最高的用戶,并將該用戶的收藏夾信息中目標用戶還未關注到的信息推薦給目標用戶,實現了一個簡單電子商務網站的個性化推薦系統。
關鍵詞:協同過濾;個性化推薦;推薦算法;相似度;電子商務
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2019)35-0194-03
1 概述
隨著互聯網的高速發展和物流產業的日益成熟,電子商務已經成為互聯網的重要應用之一,我國電子商務行業的市場規模也發生了翻天覆地的變化。電子商務對二十一世紀人類的生活起到的作用和帶來的改變是不可預估的,網絡已是人們重要的購物途徑。據國家統計局數據顯示,2018年全國電子商務交易額達31.63萬億元,同比增長8.5%。其中,商品、服務類電子商務交易額30.61萬億元,增長14.5%。2018年全國網上零售額達9.01萬億元,如圖1所示,其中實物商品網上零售額為7.02萬億元。從品類來看,服裝鞋帽針紡織品、日用品、家用電器及音響器材占前三,分別占實物商品網絡零售額的25.2%、14.4%和10.6%。[1]
服裝作為日常消費品,消費者的需求比較大,消費者頻次高,密度大。2018年“雙十一”全天成交額達到2315億元,其中服裝服飾占比達到了20.3%。隨著商品種類和數量的呈現指數級的增長,對于消費者來說,從眾多商品中搜索到心儀的商品并非易事。服裝是一種個性化需求特點比較強的商品,普通的搜索引擎并不適用于消費者快速有效地選擇到自己心儀的服裝,個性化推薦系統可以幫助解決以上的問題。
2 個性化推薦系統
個性化推薦系統是通過分析消費者的歷史消費數據以及商品信息,預測消費者的喜好,然后在電子商務網站上為消費者展示其可能感興趣的商品。個性化推薦系統可以幫助銷售服裝的商家及網站迅速而有效地為消費者推薦感興趣的服裝,滿足消費者的需求,提高消費者的購物效率,提升消費者的購物體驗。個性化推薦系統在B2C(Business-to-Customer)電子商務領域的應用,有著良好的發展與應用前景。當前,幾乎所有大型B2C電商系統,如亞馬遜、京東、當當等,都在不同程度上有推薦系統的應用。國內的京東網站在瀏覽商品時會彈出“猜你喜歡”“為你推薦”等關鍵詞;當當網站上為用戶進行私人定制的“專屬商城”,“當當為您推薦”等推薦功能;網易云的音樂個性化調頻推薦,微博、知乎和百度貼吧論壇的內容推薦都是典型的個性化推薦技術的應用。
服裝個性化推薦系統在原理上與其他商品的推薦系統類似,但因為服裝本身不易建立用戶模型,服裝推薦通同時具有趨同心理和求異心理等原因,服裝推薦系統本身有其特殊性。
2.1研究現狀
1987年Malonedeng等研究者最早提出了推薦系統(Recom-mender System)的概念,它是通過評分來進行推薦的,且只在電子商務領域有運用。直到20世紀90年代,Resnick和Varian等[2]研究者在推薦系統的基礎上提出個性化推薦系統的新概念。1998年亞馬遜(Amazon.com)上線了基于物品的協同過濾算法,將推薦系統推向服務千萬級用戶和處理百萬級商品的規模,并能產生質量良好的推薦。2005年Adomavicius等人將推薦系統分為3個主要類別,并提出了未來可能的主要研究方向。2007年第一屆ACM推薦系統大會在美國舉行。2016年,YouTube發表論文[3],將深度神經網絡應用推薦系統中,實現了從大規模可選的推薦內容中找到最有可能的推薦結果。
與國外相比,國內的個性化推薦技術和互聯網發展比較晚,但經過學習國外的技術并結合自己的研發后,發展非常迅速,已經取得了一定的成功。
2.2組成和分類
個性化推薦系統主要由三部分組成:一是收集數據并分析以獲取用戶偏好;二是選擇推薦算法;三是實現推薦。其中推薦算法是整個系統的關鍵。
目前,系統推薦算法主要分為三類[4]:
2.2.1協同過濾推薦
協同過濾算法是最早應用到推薦系統中的,也是目前最常用的推薦算法之一。協同過濾推薦首先基于用戶一評分矩陣來分析目標用戶的興趣愛好,然后檢索與目標用戶有類似興趣愛好的用戶群體,根據類似用戶群體的商品評價信息,將評分高的商品推薦給目標用戶。協同過濾推薦對多媒體內容能夠達到較好的推薦效果,也可以發現用戶新的偏好信息;但是協同過濾推薦對于新的產品和多興趣用戶存在評價系數和冷啟動等問題。
2.2.2基于內容的推薦
基于內容的推薦是協同過濾推薦的延續與發展。該算法首先通過用戶的評價、分享、收藏夾等歷史行為信息來建立用戶偏好模型,還要通過分析和提取推薦商品中的內容信息建立推薦商品模型;再計算推薦商品模型和用戶偏好模型的相似度,最后將相似度最大的商品推薦給用戶。基于內容的推薦簡單且高效,可以很好地解決冷啟動問題;但是該算法只能推薦用戶已有興趣類似的商品,另外對于如音頻視頻等多媒體內容的特征不好提取因此也難以達到滿意的推薦效果。
2.2.3混合推薦
每種算法都有其優點和缺點。混合推薦是綜合利用幾種推薦算法的優點,可以產生由于獨立推薦算法的推薦效果。采用最多的混合方法是基于內容和協同過濾的推薦。
3 基于協同過濾的服裝個性化推薦
3.1協同過濾算法
協同過濾算法不需要預先獲得用戶或物品的特征數據,僅依賴于用戶的歷史行為數據對用戶進行建模,從而為用戶進行推薦。協同過濾以健壯性與優異的速度,在互聯網領域得到了廣泛應用。協同過濾推薦算法正迅速成為信息過濾與信息系統中的流行技術。與傳統的推薦方法不同,協同過濾是用來分析用戶興趣的方法。通過綜合這些用戶對某一信息的評估,從而形成了一個系統來預測用戶對該信息的偏好程度。[5]
協同過濾算法分為以用戶為基礎(User-based)的協同過濾和以商品為基礎(Item-based)的協同過濾兩種算法[6],通過比較,本設計采用基于用戶的協同過濾。
3.2基于用戶的協同過濾算法
基于用戶協同過濾的推薦算法包括三個步驟,如圖2所示:
3.2.1收集數據
此數據指的是用戶的歷史行為數據,如用戶的關注、購買歷史、收藏行為,或給某個商品的評分等,這些都可以作為數據供推薦算法使用。本文是將用戶的收藏行為作為數據來收集的。
3.2.2找到相似用戶
計算用戶間的相似度的方法有如下幾種:
本文用公式(2)余弦相似度來計算用戶間的相似度[7],其中N(u)為用戶u喜歡的物品集合,N(v)為用戶v喜歡的物品集合。可以根據用戶的收藏夾的內容來獲得N(u)和N(v)。
3.2.3進行推薦
本文使用用戶的收藏夾來計算用戶相似度。如下圖3所示,對于用戶A只能計算得到一個相似用戶C,然后將用戶C收藏的服裝D推薦給用戶A。可用圖4說明基于用戶的協同過濾推薦原理。
圖5給出的是系統具體實現中對用戶vape1和其他用戶的相似度的計算結果。根據此結果,可看出用戶vape1和vape2、vape3的相似度較高,因此會給用戶vape1推薦用戶vape2和用戶vape3的收藏夾中的物品。
4 總結
本文通過運用協同過濾算法對服裝個性化推薦系統進行了研究,僅通過采集用戶的收藏夾內容,根據收藏夾內容進行用戶相似度的比較,尋找相似用戶,為用戶在購買服裝前提供個性推薦,從而提高用戶網購服裝的效率以及更好的購物體驗。本系統僅以收藏夾內容作為基礎數據,考慮并不全面,在后續的系統完善中,可以考慮將消費者購物數據以及其他相關信息納入系統基礎數據,從而使推薦更為精準、有效。
參考文獻:
[1]商務部電子商務和信息化司.中國電子商務報告2018[R].北京:中國商務出版社,2018.
[2]Resnick P,Iacovou N,Suchak M,et al.GroupLens: an open ar-chitecture for collaborativefiltering of netnews[C]. USA: Pro-ceedings of the 1994 ACM Conference on Computer Support-ed Cooperative Work,1994:175-186.
[3]Cremonesi P,Tripodi A,Turrin R.Cross-DomainRecommend-er Systems.[C] IEEE, International Conference on Data Mining-Workshops, 2012:496-503.
[4]劉建國,周濤,汪秉宏.個性化推薦系統的研究進展[J].自然科學進展,2009,19(1):1-15.
[5]鄧愛林,朱揚勇,施伯樂.基于項目評分預測的協同過濾推薦算法[J].軟件學報,2003(9):1621-1628.
[6]趙亮,胡乃靜,張守志.個性化推薦算法設計[J].計算機研究與發展,2002(8):986-991.
[7]單毓馥,李丙洋.電子商務推薦系統中服裝推薦問題研究[J].毛紡科技,2016,44(5):66-69.
[8]王寧,何震.改進協同過濾算法在服裝個性化推薦的研究[J].湖南工程學院學報,2019,29(1):34-36.
[9]胡覺亮,王正方.基于用戶偏好的個性化服裝推薦模式研究[J].浙江理工大學學報,2018,40(2):136-143.
【通聯編輯:代影】
收稿日期:2019-11-12
基金項目:海南省自然科學基金項目(617119);國家自然科學基金項目(61562023);海南省自然科學基金(617124);海南省高等學校科學研究項目(Hnky2017-17)
作者簡介:蔣文娟(1975-),女,甘肅人,副教授,碩士,主要研究方向為計算機應用、圖像處理;蘇佳,學士;陸娜,副教授,碩士;李富蕓,副教授,碩士。