■魏吉勇 張 瑩 南京大學(xué)商學(xué)院
隨著互聯(lián)網(wǎng)和IT技術(shù)的發(fā)展,B2C電子商務(wù)模式取得了長足的進(jìn)步。B2C電子商務(wù)模式指的是企業(yè)(Business)對消費(fèi)者(Consumer)的一種商務(wù)模式,它直接為最終客戶提供商品,免去中間環(huán)節(jié),降低了經(jīng)營成本,可使得最終客戶享受價格優(yōu)惠;也使得企業(yè)可以直接與最終客戶交流,詳細(xì)了解他們的需求,使企業(yè)更有目的生產(chǎn)適銷對路的產(chǎn)品。然而,B2C電子商務(wù)的飛速發(fā)展也給用戶帶來了煩惱,他們不得不從大量的信息中找到所需的商品。雖然B2C公司想到對用戶進(jìn)行信息的推薦,但這些公司把用戶當(dāng)成整體來看,將推薦信息不加區(qū)分的推送給所有用戶,這不能解決用戶個性化需求的問題。
B2C電子商務(wù)目前已處在競爭激烈的時代,不同B2C網(wǎng)站上所提供商品間的差別越來越小,因此,任何一家B2C網(wǎng)站如果能夠根據(jù)用戶的興趣愛好等特點(diǎn)主動推薦給用戶所需的商品或服務(wù),那么該家網(wǎng)站一定可以在激烈的競爭中處于優(yōu)勢地位。因此,電子商務(wù)網(wǎng)站的個性化推薦技術(shù)便產(chǎn)生了,其目的是根據(jù)不同的客戶的特點(diǎn)提供更有針對性地服務(wù),更好的吸引客戶,保留客戶,提高該網(wǎng)站的銷售能力。
推薦技術(shù)是推薦系統(tǒng)性能的優(yōu)劣的關(guān)鍵,好的電子商務(wù)個性化推薦技術(shù)能夠以很高的精度來幫助用戶推薦商品或服務(wù)。傳統(tǒng)的個性化推薦技術(shù)有基于內(nèi)容推薦和基于關(guān)聯(lián)規(guī)則推薦這兩種傳統(tǒng)的推薦技術(shù)。
1.基于內(nèi)容推薦。基于內(nèi)容的推薦是信息過濾技術(shù)的延續(xù)與擴(kuò)展,內(nèi)容指的是可以用來刻畫某個實(shí)體(既可以是一個人,一個地點(diǎn),也可以是一個物體)特點(diǎn)的那些信息,這些信息是與用戶和應(yīng)用(包括地點(diǎn),時間,活動,對某一實(shí)體的偏好)的交互關(guān)系有關(guān)的。以此來看,基于內(nèi)容的推薦技術(shù)需要獲得相關(guān)的外部信息,(例如,電影的特征描述包括它的題材,演員,票房收入等的;用戶的特征描述包括人口信息等)。內(nèi)容過濾成功實(shí)現(xiàn)的一個典型例子是音樂基因組計(jì)劃——音樂分析師根據(jù)大量的特征對每首歌進(jìn)行打分,其所依據(jù)的信息不僅是音樂本身的特征,也有對于聽者偏好的信息。
這種方法的優(yōu)點(diǎn)是:a)不依賴其它用戶的數(shù)據(jù),不存在冷啟動問題和稀疏問題;b)在為興趣愛好比較特殊的用戶推薦時,效果明顯;c)根據(jù)所列出的推薦商品或服務(wù)的內(nèi)容特征,可以解釋推薦的原因。
缺點(diǎn)是:a)對有意義的特征信息的依賴性強(qiáng),要求特征信息有良好的結(jié)構(gòu)性,并且用戶的偏好能夠用特征信息來表達(dá);b)不能顯式地得到其它用戶的情況。
2.基于關(guān)聯(lián)規(guī)則推薦。基于關(guān)聯(lián)規(guī)則的推薦是以關(guān)聯(lián)規(guī)則挖掘理論為基礎(chǔ),關(guān)聯(lián)規(guī)則挖掘是Agrawal(1993)首先提出的,關(guān)聯(lián)規(guī)則直觀的意義就是用戶在購買某些商品的同時有多大程度去購買另外一些商品。比如在對某家超市的實(shí)際分析中發(fā)現(xiàn),購買啤酒的人往往同時會購買尿布。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性,這在零售業(yè)已得到了成功的應(yīng)用。
關(guān)聯(lián)規(guī)則與其他的技術(shù)相比有如下優(yōu)點(diǎn):a)所需數(shù)據(jù)源簡單,只要有準(zhǔn)確的交易記錄即可;b對用戶購買行為具有預(yù)測性,挖掘用戶的潛在興趣;c)對商品特性沒有要求,可以挖掘不同類型的商品。
然而,基于關(guān)聯(lián)規(guī)則方法的推薦只是在大量數(shù)據(jù)分析的基礎(chǔ)上得到的用戶在購買某中產(chǎn)品后有多大程度去購買另外一種產(chǎn)品,卻不能根據(jù)具體某個用戶的特點(diǎn)來推薦給他(她)所需的產(chǎn)品,因此在推薦上還是不能取得很高的準(zhǔn)確率。
如果說以上方法不能很好的滿足當(dāng)今B2C模式推薦系統(tǒng)的要求,那么協(xié)同過濾技術(shù)相比來說是能夠?qū)崿F(xiàn)高準(zhǔn)確性的推薦效果的。基于協(xié)同過濾技術(shù)的推薦系統(tǒng)是從用戶的角度為出發(fā)點(diǎn)來進(jìn)行相應(yīng)推薦的,并且是自動的,即用戶獲得的推薦是系統(tǒng)從用戶購買模式或?yàn)g覽行為等行為信息學(xué)習(xí)到的,不需要用戶努力地搜索適合自己興趣的信息,如填寫一些調(diào)查表格等。
協(xié)同過濾技術(shù)的優(yōu)點(diǎn)是:a)對推薦對象沒有特別的要求,既能處理結(jié)構(gòu)化的對象,如關(guān)系數(shù)據(jù)表。又能處理非結(jié)構(gòu)化的復(fù)雜對象,如音樂、電影、圖書等;b)可以利用其用戶的特征信息,避免了內(nèi)容分析的不完全或不精確;c)可以發(fā)現(xiàn)用戶潛在的但用戶自己尚未發(fā)現(xiàn)的興趣偏好。
協(xié)同過濾技術(shù)主要的兩個研究方向是近鄰方法和潛在因素模型。近鄰方法主要在于計(jì)算產(chǎn)品之間或者用戶之間的聯(lián)系;潛在因素模型根據(jù)產(chǎn)品和用戶的特征來進(jìn)行評級。
1.協(xié)同過濾技術(shù)。協(xié)同過濾推薦是基于鄰居用戶的興趣愛好來預(yù)測目標(biāo)用戶的興趣偏好,其推薦過程大致是首先搜索目標(biāo)用戶的若干最近鄰居,然后根據(jù)最近鄰居對產(chǎn)品的評分預(yù)測目標(biāo)用戶對產(chǎn)品的評分,從而產(chǎn)生推薦列表。本技術(shù)首先計(jì)算目標(biāo)用戶與各個聚類中心之間的相似性,獲得目標(biāo)用戶所屬各個聚類程度的向量,然后搜索類別所屬程度矩陣,確定目標(biāo)用戶的最近鄰居,然后就可以對用戶進(jìn)行推薦。
除基于用戶的協(xié)同過濾技術(shù)以外,還有基于項(xiàng)目的協(xié)同過濾和基于模型的協(xié)同過濾。基于項(xiàng)目的協(xié)同過濾推薦算法是由Sarwar(2001)提出的,該算法有一個基本的假設(shè)就是,能夠引起用戶興趣的產(chǎn)品,必定與其之前評分高的產(chǎn)品相似,通過計(jì)算產(chǎn)品之間的相似性來代替用戶之間的相似性。以項(xiàng)目為基礎(chǔ)的協(xié)同過濾不用考慮用戶間的差別,所以精度比較差。但是卻不需要用戶的歷史資料。對于產(chǎn)品來講,它們之間的相似性要穩(wěn)定很多,因此可以離線完成工作量最大的相似性計(jì)算步驟,從而降低了線上計(jì)算量,提高推薦效率。
基于模型的協(xié)同過濾和基于項(xiàng)目的協(xié)同過濾統(tǒng)稱為基于記憶的協(xié)同過濾技術(shù),基于模型的協(xié)同過濾是先用歷史資料得到一個模型,再用此模型進(jìn)行預(yù)測。以模型為基礎(chǔ)的協(xié)同過濾廣泛使用的方法有貝葉斯網(wǎng)絡(luò)等,基于對一個樣本的分析得到模型。
2.矩陣因子技術(shù)。一些成功的潛在因素模型的實(shí)現(xiàn)是基于矩陣因子分解的。它的基本形式就是根據(jù)評級模式既描述產(chǎn)品又描述用戶,兩者高相關(guān)的話就產(chǎn)生一個推薦。推薦系統(tǒng)根據(jù)不同類型的數(shù)據(jù),將這些數(shù)據(jù)構(gòu)成一個二維矩陣,一個維度代表用戶,另一維度代表產(chǎn)品。
矩陣因子法的一個優(yōu)點(diǎn)是它允許額外信息的并入。當(dāng)明確的信息不能得到時,推薦系統(tǒng)就會運(yùn)用隱含的反饋信息來判斷用戶的偏好,這通過觀察用戶的行為(如購買史,瀏覽史,搜索模式,鼠標(biāo)的移動等)來間接地反映用戶的觀點(diǎn)。
通常一個推薦系統(tǒng)必須要處理冷啟動問題,原因在于用戶提供非常少的評分,緩解這一問題的一個方式就是,并入額外的與用戶有關(guān)的信息源。推薦系統(tǒng)能夠使用不明確的反饋來獲得用戶的偏好。例如,一個零售商可以使用顧客的購買歷史和瀏覽歷史來了解他們的傾向,而不是根據(jù)顧客們提供的評分。
伴隨著不同置信水平的輸入,在許多的排列中,并不是所有的觀察到的評分擁有同樣的權(quán)重和可信度。例如,大范圍的廣告也許會影響用戶對某一物品的評分,這不能很好的反映長期的特點(diǎn)。
通過分析我們知道因子模型越復(fù)雜,就需要更多的參數(shù),根據(jù)Yehuda Koren(2009)的研究運(yùn)用網(wǎng)飛公司(Netflix)的數(shù)據(jù)進(jìn)行的實(shí)驗(yàn)表明,矩陣因子技術(shù)比傳統(tǒng)的近鄰技術(shù)更準(zhǔn)確。
本文在分析B2C電子商務(wù)網(wǎng)站特點(diǎn)的基礎(chǔ)上介紹了協(xié)同過濾技術(shù)在B2C電子商務(wù)銷售網(wǎng)站個性化推薦系統(tǒng)中的應(yīng)用。當(dāng)今時代,B2C電子商務(wù)網(wǎng)站的高速發(fā)展,使得網(wǎng)上銷售的商品無論在種類上還是數(shù)量上都大幅增加,因此為用戶在尋找有價值的產(chǎn)品或服務(wù)提供個性化的推薦就顯得特別重要,這也是解決信息過載問題的有效方法。文章對常用的幾種推薦技術(shù)進(jìn)行了簡單的對比,分析了以往推薦系統(tǒng)所用方法的不足之處,并且發(fā)現(xiàn)協(xié)同過濾是目前應(yīng)用最為廣泛和成功的個性化推薦技術(shù),最后介紹了矩陣因子技術(shù)在向B2C電子商務(wù)模式的推薦系統(tǒng)中發(fā)揮的作用。
[1]Yau,S.S.,&Karim,F..An adaptivem iddleware forcontext-sensitive communicationsfor real-timeapplicationsin ubiquitouscomputingenvironments[J].Real- TimeSystems,2004,26(1),29-61.
[2]Pazzani,M ichaelJ.and DanielBillsus.Content-based recommendation systems[J].Theadaptiveweb.Springer Berlin Heidelberg,2007:325-341.
[3]Andrew I.Schein,Alexandrin Popescul,Lyle H.Ungar,David M.Pennock.Methodsand Metrics forCold-StartRecommendations[C].Proceedings of the 25th annual international ACM SIGIR conference on Research and development in information retrieval,2002:253- 258.
[4]J.J.Sandvig,Bamshad Mobasher,and Robin Burke.Robertnessof Collaborative Recommendation Based On Association Rule M ining[C].Proceedingsofthe2007ACM conferenceon Recommendersystems,ACM New York,USA,2007:105-110.
[5]SarwarZ.Project-based Learning to Facilitate LearnerAutonomy[J].English Language Education in South Asi:From Policy to Pedagogy,2011:195.
[6]YehudaKoren,RobertBellandChrisVolinsky.Matrix Factorization Techniques for Recommender Systems[J].IEEEComputer Society,2009:42-43.