劉旭東,葛俊杰,葉長國
(1.煙臺職業學院信息工程系,山東煙臺 264670;2.泰山學院信息科學技術學院,山東泰安 271021)
一種混合推薦系統的設計與應用
劉旭東1,葛俊杰1,葉長國2
(1.煙臺職業學院信息工程系,山東煙臺 264670;2.泰山學院信息科學技術學院,山東泰安 271021)
針對B2C網上購物的實際背景和要求,設計了一個運用多種技術相結合的個性化推薦系統模型,這種推薦模型既能有效解決單獨關聯規則推薦不適合同類產品推薦問題,又能有效解決協同過濾算法不適合異類產品推薦問題;既能有效處理電子商務中產品種類和類別層次繁多的產品推薦問題,又能加快推薦速度,在電子商務系統中具有良好的推薦效果和應用價值.
個性化推薦系統;協同過濾;關聯規則;電子商務
隨著電子商務的興起與發展,人們的商務理念也發生改變,經銷商和客戶之間通過互聯網進行交易,節省了大量的費用和時間.目前電子商務在線購物的成功很大程度上取決于用戶與計算機的交互[1],取決于用戶的購物經驗.而利用網頁推薦技術可以有效地幫助企業分析從網上獲取的大量數據,發現隱藏在其后的規律性,提取出有效的信息,進而指導企業調整營銷策略,給客戶提供動態的個性化的高效率服務.目前,網頁推薦技術已經被廣泛地應用在國內外的各大電子商務網站之中,如Am azon、EBay、CDNOW、MovieFinder以及Joyo、BOL等,都不同程度地應用了各種形式的推薦系統[2].推薦系統是建立在客戶以前的在線購物行為和個人興趣資料基礎上的,是一種用來個性化網站的有效方法,其本質就是個性化推薦方法的設計.電子商務購物網站中推薦方法的選擇與設計需要考慮以下兩方面的因素:第一,推薦算法的運行速度問題,尤其對在線推薦這一點非常重要;第二,推薦結果既要考慮到不同類/子類商品的推薦,又要考慮同類商品的推薦問題.
針對上面兩個要求,結合B 2C網上購物的實際背景,本文設計了一種能切實提高電子商務網站產品實際購買量的推薦系統模型,克服了目前各種推薦系統所應用算法的不足,在電子商務系統中取得了良好的推薦效果.
本文提出的電子商務推薦系統架構如圖1所示,該推薦系統是一個B/W/S(瀏覽器/W eb服務器/數據庫服務器)三層結構,W eb服務器包括WWW服務器和應用服務器.它包括以下4個部分:
(1)前端用戶
系統前端是基于瀏覽器的用戶端,用戶可在家或辦公室等任何時候通過輸入用戶名和密碼后便可登錄企業的電子商務網站,瀏覽網頁,或是購買商品,所有信息都可經WWW服務器收集并保存在后臺數據庫服務器中.

圖1 電子商務推薦系統架構
(2)WWW服務器
WWW服務器的作用主要有兩個,一是負責收集前端用戶的個人信息資料,并存儲于數據庫服務器中,同時也負責把應用服務器端產生的推薦結果生成動態網頁呈現給用戶.
(3)數據庫服務器
數據庫服務器主要包括用戶交易數據庫和用戶資料數據庫,其中交易數據庫存儲用戶每次的購買詳細記錄;用戶資料數據庫存儲了用戶的個人資料,如姓名、年齡、職業等,還有通過網絡數據挖掘方法等獲得的用戶興趣信息等.在實際中,還可根據推薦方法或推薦系統的需要,增加其它數據庫,如用戶評價數據庫等.
(4)應用服務器
應用服務器是電子商務推薦系統最核心的部分,其中最重要的功能模塊就是購物個性化推薦模塊.前端與WWW服務器相連,后端與數據庫服務器相連,其作用是提取數據庫服務器中的用戶資料庫和交易數據庫中的數據,經數據預處理后,為用戶做出個性化推薦,包括商品子類層次上的關聯規則推薦和子類所屬產品范圍內的協同過濾推薦,前一部分工作可以離線進行,后一部分工作要求在線適時進行,總體可以為用戶作出適時的個性化推薦.
相對其它的推薦方法,該組合推薦方法有以下幾個優點:①關聯規則在商品子類層次進行,提高了關聯規則的發現速度,也加快了商品子類的推薦速度,使推薦算法對于在線推薦變得更為可能;②協同過濾在一個子類范圍內進行,候選推薦項目的內容屬性上相對更為集中,更適合協同過濾推薦的應用場合,使協同過濾推薦更為準確;③由于只在一個子類或部分子類所屬范圍內進行,加快了協同過濾推薦的速度,使協同過濾在線適時推薦變得更為可能.
本系統主要運用兩類推薦算法相結合:基于關聯規則的推薦算法和協同過濾推薦算法.
2.1 基于關聯規則的推薦算法
關聯規則是數據挖掘中的一種主要挖掘技術,它是從大量的數據中挖掘出有價值描述數據項之間相互聯系的有關知識,其挖掘算法的基本問題是:給定一個交易數據庫D,產生支持度和可信度分別不小于用戶給定的最小支持度(m in_sup)和最小可信度(m in_conf)的強關聯規則.該問題可以分解為兩個子問題:(1)求出D中滿足最小支持度的所有頻繁項集;(2)利用產生的頻繁項集,生成滿足最小可信度的強關聯規則.
基于關聯規則的推薦算法可以分為離線的關聯規則推薦模型建立階段和在線的關聯規則推薦模型應用階段[3].離線階段使用各種關聯規則挖掘算法建立關聯規則推薦模型,這一步比較費時,但可以離線周期進行;在線階段根據建立的關聯規則推薦模型和用戶的購買行為向用戶提供實時的推薦服務,使用關聯規則推薦算法產生top-N推薦的算法步驟如下:
(1)使用關聯規則挖掘算法(本文采用典型的Ap riori算法[4])對交易事務數據庫D′(將用戶購買商品組成的事務交易數據庫D經數據預處理,轉化為商品所屬子類層次上的事務數據庫D′)進行關聯規則挖掘,得到滿足最小支持度閾值m in_sup和最小可信度閾值m in_conf的所有關聯規則,記為關聯規則集合R;
(2)搜索關聯規則集合R,找出該用戶u支持的所有關聯規則集合Ru,產生候選推薦集Su;
(3)從候選推薦集Su中刪除用戶u已經購買過的商品子類,并選擇可信度最高的前N個項(記為Si,i=1,2,…,N)作為推薦結果返回給當前用戶u.
2.2 協同過濾推薦算法
協同過濾作為目前最成功的推薦算法被廣泛地應用,其目標是根據具有相似偏好的用戶的觀點向目標用戶推薦新的商品[5].它首先找出和目標用戶最相似的用戶即最近鄰居,然后根據最近鄰居對項目的評分預測目標用戶對項目的評分,產生相應的推薦列表.
主要分為三個步驟:矩陣表示、鄰居形成和產生推薦.
(1)矩陣表示
用戶評分數據可以用一個m*n階矩陣A(m,n)表示,m行代表m個用戶,n列代表n個項目,第a行第j列的元素Raj代表用戶a對項目j的評分.
(2)鄰居形成
用戶相似性數據可以用一個m*m階矩陣w(m,m)表示.首先得到用戶a和用戶i評分過的所有項目,然后計算出用戶a和用戶i之間的相似性,度量用戶間相似性的方法有許多種,主要包括如下三種方法:余弦相似性、相關相似性以及修正的余弦相似性.這里采用修正的余弦相似性來進行度量,記為

其中,Ia,i表示用戶a和i共同評分過的項目集合,Ia和Ii分別表示用戶a和用戶i評分過的項目集合,ra,c和ri,c分別表示用戶a和用戶i對項目c的評分,分別表示用戶a和用戶i對項目的評分.根據相似性計算的結果,直接找出與用戶相似性最高的前N個用戶作為最近鄰居.
(3)產生推薦
“最近鄰居”集產生后,可計算用戶對任意項的興趣度和Top-N推薦集.設用戶a和相應的已選項集Ia,對任意項j(j Ia)的興趣度按下式計算:

在經關聯規則推薦得到的前N個用戶最感興趣的商品子類后,就可以在這N個商品子類所屬的產品范圍內利用協同過濾給出具體的產品推薦,具體做法有兩種:
(1)在所有推薦子類所屬的產品范圍內采用協同過濾方法進行推薦,也就是在Si(i=1,2,…,N)范圍內一次性采用協同過濾方法進行推薦.(2)在每個子類所屬的產品范圍內用協同過濾推薦.
假設對每個子類Si(i=1,2,…,N),得到Q個產品推薦,記得到的推薦集合為Ii=﹛Ii1,Ii2,…, IiQ﹜,同時記每個產品的預測分分別為P(Ii1),P(Ii2),…,P(IiQ).
再根據下列策略得到最后推薦:
(1)子類平均推薦:對所有P(Ii,j)(i=1,2,…,N;j=1,2,…,Q)從高到低排列,選擇其中最高的作為推薦.
(2)子類加權推薦:由于用戶對經關聯規則得到推薦子類具有不同的偏好,所以對每個P(Ii,j)(i= 1,2,…,N;j=1,2,…,Q)加權用戶子類Si的偏好程度.假設用戶對子類Si偏好權重為w(Si)(權重可以是經關聯規則推薦時計算所得到的可信度,也可通過用戶在子類Si上的歷史購買情況來刻劃),計算Fij=w(Si)P(Ii,j),并依據Fij(i=1,2,…,N;j=1,2,…,Q)的高低選擇最高的前N個商品作為推薦.
近幾年來,隨著電子商務的蓬勃發展,商家競爭日趨激烈,為了盡可能將網站的瀏覽者轉變為商品的購買者,同時提高電子商務系統的交叉銷售能力,對顧客提供個性化的服務成為必然需要,電子商務推薦系統應運而生.同時,關聯規則作為數據挖掘的主要方法之一,也引起了人們越來越多的關注.文中在對關聯規則和協同過濾進行研究的基礎上,提出和設計了一種基于產品子類層次上的關聯規則和子產品范圍內的協同過濾推薦組合模型,該模型大大提高了系統的運行效率和質量,在實際應用中取得了較好的推薦效果.
[1]余力.電子商務個性化推薦若干問題研究[D].北京:北京航空航天大學,2004.
[2]鄧愛林,朱揚勇,施伯樂.基于項目評分預測的協同過濾推薦算法[J].軟件學報,2003,14(9).
[3]劉曉波.基于關聯規則的電子商務商品推薦系統研究[J].中國市場,2008,17(52).
[4]曹月芹,林楓,陳國浪.基于Ap rio ri分類事務庫關聯規則算法[J].計算機系統應用,2009,18(4).
[5]J.L.Herlocker,J.A.Konstan,L.G.Terveen,etal.Evaluating co llabo rative filtering recomm ender system s[J].ACM Trans.Information System s,2004,22(1).
Design and App lication of Recomm endation System Based on Hybr id Technology
L IU Xu-dong1,GE Jun-jie1,YE Chang-guo2
(1.Departm entof Info rm ation Engineering,YantaiVocationalCo llege,Yantai,264670; 2.Schoo lof Information Science and Technology,Taishan University,Tai’an,271021,China)
A ccording to the background and requestof the B 2C on line shopp ing,one kind of personalized recomm endation system is designed.This k ind of recomm endationm odel,no ton ly so lves the sam e c lass p roduct recomm endation to which association ru le is not suit and different class p roduct recomm endation to w hich co llaborative filtering is not suit,but also imp roves recomm ending speed which is very key for on line recomm endation.Therefore,it greatly achievesgood recomm ending resu ltsand app lication value in E-Comm erce.
personalized recomm endation system s;co llabo rative filtering;association ru le;E-Comm erce
TP311
A
1672-2590(2010)03-0030-04
2010-03-18
山東省教育科學“十一五”規劃課題(2008GG068)
劉旭東(1976-),男,山東龍口人,煙臺職業學院信息工程系講師.