李加軍
(廣州華商學院,數據科學學院,廣東,廣州 511300)
隨著互聯網技術的不斷成熟和推廣,互聯網已經進入了人們生活、工作、學習、消費等多個領域,其中電子商務是互聯網技術的一個重要應用成果。為了滿足用戶對信息的需求,每天有大量的電子商務呈現在用戶面前,盡管電子商務信息很多,但用戶真正感興趣的電子商務信息很少,如何及時、準確有效地獲取用戶感興趣的電子商務信息十分重要[1]。當前獲取用戶感興趣信息有2種途徑:一種是信息檢索系統,主要通過百度等搜索引擎,由于用戶對信息需求具有多元化和個性化特點,搜索引擎系統無法滿足用戶個性化服務信息要求[2];另一種就是智能推薦系統,該系統可以根據用戶的興趣、特征、瀏覽記錄推薦給用戶其愛好的商品,可以對用戶個性化信息進行過濾服務,是當前電子商務實際應用一個重要的研究方向[3-4]。
由于很多企業發現了電子商務智能推薦可以提高產品銷量,提高企業的經濟利益,因此國內外企業、學者和專家對電子商務智能推薦問題進行了深入、廣泛的研究,出現了許多有效的電子商務智能推薦方法[5-7]。其中一些發達國家對電子商務智能推薦問題研究時間比較長,技術比較成熟,如亞馬遜電子商務網站開發的電子商務智能推薦方法。盡管國內的電子商務智能推薦研究開展的時間稍晚,但發展速度很快,如阿里巴巴旗下淘寶網開發的電子商務智能推薦方法等。但在實際應用過程中,當前電子商務智能推薦方法還存在一些不足,如數據稀疏問題、冷啟動問題等,使得電子商務智能推薦結果不穩定,有時電子商務智能推薦誤差比較大,推薦結果難以滿足用戶真正需求[8-10]。
為了解決當前電子商務推薦系統存在的缺陷,提出一種基于協同過濾的電子商務智能推薦方法。首先收集電子商務相關信息,建立用戶評分矩陣,然后根據用戶間的相性度進行電子商務智能推薦,最后通過具體電子商務推薦對比測試,驗證本文方法的有效性和優越性。
隨著互聯網技術的不斷發展,當前已經進入了一個電子商務信息過載時代,這無論對于消費用戶或者生產者而言,都面臨巨大的挑戰。對于電子商務來說,信息就是商品,而用戶就是消費者,電子商務推薦系統對商品和消費者之間的聯系進行挖掘,給用戶推薦真正需要的商品,是解決信息過載問題的重要工具。電子商務智能推薦系統的總體結構如圖1所示。

圖1 電子商務智能推薦方法的工作原理
對圖1的電子商務智能推薦系統的總體結構進行分析可以發現,其主要包含用戶群體、獲取用戶偏好、用戶偏好信息庫、協同過濾推薦、推薦用戶偏好信息等。它們主要功能如下。
(1)用戶群體:主要對用戶的點擊、搜索、瀏覽、購買等行為進行分析,將用戶劃分為不同的群體。
(2)獲取用戶偏好模塊:主要根據用戶群體中的信息,對每類用戶的偏好或者感興趣的物品進行分析和評價,產生用戶偏好信息。
(3)用戶偏好信息庫:主要負責以用戶偏好信息格式進行轉換,并且保存在用戶偏好信息庫中,構建用戶偏好信息數據庫。
(4)推薦用戶偏好信息模塊:主要用于獲取推薦對象的相關偏好信息,如可能感興趣的物品。
(5)協同過濾推薦模塊:其為電子商務智能推薦最為重要的關鍵模塊,可以根據協同過濾推薦算法分析用戶和電子商務商品間的映射關系,計算相似度,根據相似度產生電子商務推薦結果。
協同過濾算法是當前電子商務推薦最為流行的算法,其工作原理為:首先分析電子商務用戶的歷史行為數據,根據分析結果建立用戶偏好模型,計算相似度,然后根據相似度獲得目標用戶的近鄰用戶,最后根據近鄰用戶的偏好實現目標用戶的電子商品推薦。
1.3.1 建立用戶-商品評分矩陣
設電子商務推薦系統中的用戶集合為U={U1,U2,U3,…,Us},s表示用戶數量,商品集合為I={I1,I2,I3,…,It},t表示商品數量,通常情況下,每一個用戶對每一種商品的偏好是已知,這樣可以建立用戶-商品評分矩陣,具體如表1所示,表中Ra,j表示Ua對Ik的評分,即用戶對商品的偏好程度。
1.3.2 計算用戶之間的相似度
相似度可以采用商品相似度或者用戶相似度,本文根據用戶-商品評分矩陣計算用戶之間的相似度。表1中,每一行可以看作是一個用戶對所有商品的評價向量,當前用戶相似度計算方法有余弦相似度和Pearson相關系數兩種,本文選擇余弦相似度計算用戶之間的相似度,具體過程如下。

表1 用戶-商品評分矩陣
(1)Ra,k和Rb,k分別為Ua和Ub對商品Ik的評分值,Ra和Rb表示評分向量,那么余弦相似度計算式為
(1)
Sim(Ua,Ub)值越大,表示Ua和Ub間的偏好程度越高。

(2)
1.3.3 電子商務智能推薦結果
對于目標用戶Um,根據相似度對近鄰用戶進行搜索,選擇與目標用戶偏好相近的k個近鄰用戶,建立目標用戶的最近鄰集合S(Um)。根據最近鄰集合得到目標用戶對商品Ij的評分,根據評分給目標用戶推薦多個商品,目標用戶對商品Ij的評分具體計算公式如下
(3)
基于協同過濾的電子商務智能推薦流程見圖2。從圖2可以發現:首先收集電子商務用戶相關信息,并對信息進行預處理,然后計算電子商務用戶對項目的評分,構建電子商務用戶評分矩陣,最后采用余弦夾角算法根據用戶評分矩陣計算用戶之間的相性度,基于用戶相似度進行電子商務智能推薦。

圖2 基于協同過濾的電子商務智能推薦流程
為了測試基于協同過濾的電子商務智能推薦效果,選擇以某電子商務購物平臺的訂單數據集作為實驗對象,該數據集包括1 000個用戶,在不同時間的2 000條訂單數據,商品種類為1 400種,用戶評分值集合為(1,2,3,4,5),采用Java編程語言實現協同過濾推薦算法。為了使本文電子商務智能推薦方法的實驗結果更具說服力,選擇文獻[9]和文獻[10]的電子商務智能推薦方法進行對比測試。選擇電子商務智能推薦精度、召回率,以及商品新穎度、商品流行度作為實驗結果的評價指標。
設N表示推薦的商品數,M表示用戶喜歡的商品數,電子商務智能推薦精度、召回率的計算式如:
(4)
(5)
N=Ntr+Nfr,M=Ntr+Nfn
(6)
式中,Ntr表示推薦的商品,同時用戶很喜歡;Nfr表示推薦的商品,但是用戶不喜歡;Ntr表示用戶很喜歡,但是沒有推薦;Nfn表示用戶不喜歡,也沒推薦。
計算3種方法的電子商務推薦精度、召回率,具體如圖3和圖4所示。對圖3、圖4的電子商務推薦精度、召回率進行分析可以發現,本文方法的電子商務推薦精度、召回率遠高于對比方法,提高了電子商務推薦準確性,降低了電子商務推薦錯誤率,獲得了理想的電子商務推薦結果,可以滿足用戶的個性化需求。

圖3 不同方法的電子商務推薦推薦精對比

圖4 不同電子商務推薦方法的召回率對比
對于一個電子商務智能推薦系統而言,其應該可以對商品的新穎度和流行度進行分析,從而為用戶推薦一些新穎度和流行度較高的商品,以對商品銷售起著促進效果,實驗結果如圖5、圖6所示。對圖5和圖6的新穎度和流行度進行分析可以發現,隨著用戶對商品的評分次數不斷增加,商品的新穎度和流行度就逐漸增加,相對于對比方法,本文方法的新穎度和流行度分析結果更加科學、合理,在為用戶提供個性化推薦列表的同時,能夠對商品進行更加精準的推薦,具有明顯的優越性。

圖5 不同電子商務推薦方法的商品新穎度對比

圖6 不同電子商務推薦方法的商品流行度對比
電子商務是當前研究的熱點,其中電子商務智能推薦系統是電子商務實際應用中的一項關鍵技術,為了提高電子商務智能推薦的準確性,解決當前電子商務智能推薦過程存在的一些難題,提出基于協同過濾的電子商務智能推薦方法,并在相同情況下與其他電子商務智能推薦方法在相同環境下進行了對比測試,結果表明,本文方法是一種精度高的電子商務智能推薦技術,能夠幫助用戶找到自己需要的商品,具有十分廣泛的應用前景。