安政磊++姚文斌



摘要:伴隨隨著互聯網技術的發展,020餐飲領域發展迅速,然而平臺同質化嚴重,個性化推薦已經成為提升用戶體驗和提高運營水平的一種主要方式。而傳統的協同過濾方法在數據稀疏的情況下,用戶推薦準確率不高。本文研究基于020餐飲行業背景,研究用戶的行為對購買意向的影響,綜合考慮購買行為、評價行,為等多種用戶行為,判斷用戶的興趣點,從而確定用戶的購買意向,提出一種基于多種用戶行為的購買意向模型。基于此提出基于購買意向的推薦方法。最后通過與傳統基于用戶的協同過濾算法進行比較,確定了本文推薦方法的有效性。
關鍵詞:行為分析;個性化推薦;協同過濾;推薦模型
中圖分類號:TP391.3
文獻標識碼:A
DOI:10.3969/j.issn.1003-6970.2015.12.019
本文著錄格式:安政磊,姚文斌.一種基于用戶購買意向的個性化推薦模型[J].軟件,2015,36(12):80-82
0 引言
近兩年來,隨著瓦聯網的發展,020餐飲領域已經成為一種重要的商務模式。在豐要大城市中迅速的擴展開來。與此同時,其中的推薦系統卻沒有跟隨發展,多數平臺還停留在用戶豐動獲取商品信息的時代。這些平臺同質化嚴重,全都標榜以用戶為中心,然而由于原始的建站思路,并沒有完全應用好快速發展的計算機技術,導致發展上的瓶頸。
各種推薦系統層出不窮,推薦機制復雜多變。協同過濾算法已經被廣泛的應用到各個推薦系統,但隨著用戶數量的增加和站點內容結構的日益復雜,協同過濾技術的一些缺點逐漸暴露出來,首要問題就是稀疏性,隨著用戶和項目的數量的增長,用戶相似性矩陣也會急劇擴大。在維度巨大的相似矩陣并且用戶參與度不是很頻繁的情況下,推薦的可信度隨之降低。
目前多數協同算法研究和應用都集中在傳統的電子商務,對于基于餐飲行業的協同過濾算法的推薦研究較少。協同過濾算法的研究目標豐要是商品。本文針對餐飲行業的特點,研究的豐要原子單位是餐廳,考慮不同用戶行為對用戶的購買意向的影響,基于用戶的購買意向設計推薦算法,提高推薦準確率。
1 用戶行為的研究分析
1.1 購買行為分析
相交于傳統電子商務的購買數據,020餐飲行業的購買行為確實不少,但是對于準確的分析用戶購買意向和購買行為之間的關系這項復雜的工作來說,在數量上還是有一定差距。而用戶的購買行為是用戶對某商品研究的結果,因此,用戶必然在前期進行過一系列與該商品相關的用戶瀏覽行為,可見用戶的購買行為還和用戶的瀏覽行為緊密相關。為此需要建立基于PV興趣統計出的用戶購買行為模型,基于用戶的興趣發現用戶的購買意向。分析步驟如下:
Stepl:根據日志文件中瀏覽記錄的定義找到所有餐廳訪問的記錄,過濾沒有餐廳的瀏覽記錄。同時,從數據庫獲取用戶的購買記錄。這兩種記錄作為本次分析的依據。
Step2:針對以上數據,統計每個餐廳的訪問次數和購買次數。兩種數據對用戶的購買意向的影響的程度顯然不同,為了融合兩種數據,為購買數據進行加權分析,餐廳的購買數據加倍,將數據整合在一起。
Step3:根據商品的被訪問時間和餐廳商品數量,來確定用戶對某商品的購買意向。公式如1-1所示。
ti表示用戶瀏覽餐廳時間,Ci表示餐廳的商品數量。而現在多數平臺還有其他查看商品的具體信息的彈出框頁面以及能夠查看單獨商品評價和評分信息等。但是這些信息不具有代表性,所以行為分析時也對這些行為進行忽略。
1.2 評價行為分析
評價行為是用戶購買意向的直接反饋,不僅是對本次購物感受的表達,還能夠據此對用戶未來的購買意向作出判斷??梢酝ㄟ^對用戶評價的情感分析,獲取用戶的購買意向。
Stepl:建立基本語料庫,選取常見情感表達詞語,根據知網的基礎語料分析庫,將這些情感表達詞語分別按照褒義詞和貶義詞的分別放到positive和negative兩個集合中。
Step2:短語或句子分詞。對于020餐飲行業來說,這個領域內的表達情感的詞語是有限的,且本文只針對用戶的感情詞匯進行處理。這樣對評價樣本進行分詞,達到能夠滿足區分用戶情感趨向的程度。采用字符匹配算法來進行分詞。
Step3:詞語分類。為了構造用戶評論的短語模型,需要對分詞進行詞性分析,明確評價信息中的名詞、形容詞等詞性區別。
Step4:構造評價內容的短語模型。
Step5:計算短語的情感值。采用統計學方法,計算一個短語模型在positive和negative集合中的文本出現次數,分別結尾GNumber和BNumber。情感值計算公式1-2所示。
Step6:根據用戶評價內容分詞,采用單詞匹配分析算法,按照公式1-3計算整個評價內容的購買意向值。
2 基于購買意向的推薦模型
2.1 購買意向模型
對用戶行為進行分析,根據上節所述的用戶購買意向和用戶的購買行為以及用戶購買意向和評價行為的關系計算用戶的總體購買意向值。需要分別計算每個用戶對每個餐廳的購買意向值并求意向值之和,意向值之和定義為T。
T-upi+S
(1-4)
將購買意向值T作為計算用戶相似度的指標。
2.2 基于購買意向的推薦模型
基于用戶購買意向模型中用戶購買意向的變化,構建基于購買意向的推薦模型。
(1)循環更新待推薦用戶的購買意向值。
循環所有餐廳,通過購買行為計算當前用戶u對第i個餐廳的購買意向度定義為Tupi(u,i),通過用戶評論計算出當前用戶u對第i個餐廳的購買意向值Ts(u,i),計算用戶對該餐廳的購買意向總和,記為T(u),更新當前用戶u對該餐廳的購買意向值。
(2)選擇該用戶u的購買意向最強的10個餐廳作為用戶u的向量。作為和其他用戶進行比較相似度的來源。采用余弦相似度進行用戶相似度的比較,選擇m個相似用戶,根據普通協同過濾算法,根據待選集合中用戶對餐廳的購買意向,得到中間推薦結果L1。
(3)對于選擇出來的10個餐廳,從高到低分別附上10到1之間的權重,根據數據庫內定的餐廳類別進行如下分析:1)統計每個類別的餐廳個數;2)將每個類別餐廳的個數和每個類別中權值最大的餐廳的權值相乘得到各個類別的一個值;3)在該類別中選擇2k個同類餐廳作為中間推薦結果L:
(4)將中間推薦結果L1和L2求交運算,當最終結果不到k個時,從L2剩余結果中在隨機補選兒個,得到k個最終推薦結果
3 實驗對比分析
3.1 實驗對比標準
本文的豐要目的是為了完成用戶的推薦工作。針對推薦工作,有常用的兩個評價于段,分別是召回率(3-1)和準確率(3-2)。
其中Tn代表數據集合中用戶u喜歡的物品的集合,Rn代表向用戶推薦的物品集合。
3.2 實驗分析
根據以上模型和算法步驟,根據用戶日志文件和后臺數據庫提供數據,設置取相似用戶數量取值范圍為[50,100],實驗結果如圖l所示。
實驗結果表明,基于用戶協同過濾算法和購買意向模型差距不是十分大,在開始時兩者兒乎準確率同等大小。并且隨著召回率的增加,兩者的準確率都在降低。區別是基于用戶的協同過濾算法在開始時下降明顯,而后者下降不是很明顯,出現這樣情況的原因可能是,基于購買意向模型的推薦算法綜合考慮了用戶的購買行為、瀏覽行為、評價行為對用戶的購買意向的影響,從而能夠比基于用戶的協同過濾算法在推薦任務上完成地稍微好一點。
4 結論
協同過濾技術已經被廣泛應用,但有很多還停留在最簡單的基于用戶的協同過濾,隨著用戶行為種類和數量的不斷增多,這些隱藏的行為比顯示的行為提供更多有關用戶購買意向的信息,然而很多現有的用戶網絡行為卻被推薦系統忽視。針對以上問題,本文從用戶行為角度出發,并且抓住常見的隱式行為,分析用戶行為和用戶購買意向的關系,進而根據用戶行為建立用戶行為和用戶購買意向的整合模型,根據這個模型設計出一套用戶推薦算法,經實驗證實,該方法雖不能極大提高推薦效果,但確實在某些情況下提高了召回率和準確率,為了更好地優化推薦效果,還應該繼續研究基于用戶行為的購買意向的優化計算方法。