
Dr. S,喜歡研究各種商家策略,精通公司和品牌吸引顧客的各種門道。他非常樂意帶你去揭開生活中的商業(yè)秘密,然后為你提供建議,有時還會發(fā)你些信息bonus。所以,如果你有疑惑,盡管給他發(fā)郵件吧—dr.secret@yicai.com。
亞馬遜中國對個性化推薦系統(tǒng)守口如瓶,哪怕只是相關(guān)數(shù)據(jù)。難怪亞馬遜如此小心,現(xiàn)在,個性化推薦以其在電商網(wǎng)站的廣泛應用而聞名,它們以顧客的興趣作為切入點,產(chǎn)生一個推薦列表,也就是你所熟悉的那些“猜你可能會喜歡”。
亞馬遜是零售網(wǎng)站中使用個性化推薦技術(shù)的先驅(qū),其個性化推薦系統(tǒng)目前屬于網(wǎng)站的核心機密。而據(jù)美國科技博客網(wǎng)站VentureBeat的數(shù)據(jù),Amazon.com有35%的銷售額是來自個性化推薦。當當、京東等電商網(wǎng)的銷售額也有很大部分間接受到個性化推薦的影響。
購物網(wǎng)站的個性化推薦到底是如何成為用戶的知心人的?答案是,用“個性化算法”。它屬于數(shù)據(jù)挖掘的范疇,依據(jù)一定的邏輯與公式,計算出用戶的個人偏好,發(fā)掘出他們無法正確表述,甚至還未成形的需求。這件事最有意義的地方在于能把只能憑直覺判斷的主觀“喜好”徹底量化,達到精準推薦的目的。
聽上去很玄對不對?實際上#8943;#8943;它確實不那么簡單。這次,我們也“死理性派”一次,逐一分析四種被運用得最多的“個性化算法”。電子科技大學互聯(lián)網(wǎng)科學中心主任周濤認為,新用戶更容易受流行的影響,而老用戶的個性化需求會更強。正是由于這一原則,當消費者來到一個陌生的電子商務網(wǎng)站,或者成為網(wǎng)站的注冊用戶時,接受到的推薦多是熱門的、流行的暢銷商品。而只有當消費者留下瀏覽、搜索和購買記錄后,他們才能得到更有針對性的推薦。
關(guān)聯(lián)推薦,漸被淘汰的個性化算法
這種方法最為簡單直白,網(wǎng)站將用戶搜索、瀏覽、購買、已評級的商品視為一個整體,分解出作者、主題、品牌等關(guān)鍵詞,進而搜索與此商品最直接相關(guān)的東西。例如,消費者在網(wǎng)站瀏覽了伍迪·艾倫的《中央西路》,那么網(wǎng)站就會默認用戶喜歡該導演,伍迪·艾倫的其他作品便會出現(xiàn)在推薦書單里。網(wǎng)站分解出的哪個詞出現(xiàn)頻率越高,就證明與之相關(guān)的東西越代表用戶的喜好。看得出,這種方法并不智能。因為它把用戶理解得過于簡單。正是因為這一缺陷,關(guān)聯(lián)推薦完全OUT了。當當數(shù)據(jù)分析師張嘉洪說,這是電子商務網(wǎng)站最早期的推薦方法,現(xiàn)在國內(nèi)只有少數(shù)小規(guī)模購物網(wǎng)站用的還是這種推薦模式。
人以群分,基于用戶的個性化算法
“協(xié)同過濾”是目前商業(yè)應用最廣泛的個性化技術(shù),它整合所有用戶的信息,為個體服務。基于用戶的協(xié)同過濾是第一代協(xié)同過濾技術(shù)。它背后的道理非常簡單:人以群分。如果一群消費者常在網(wǎng)站購買同樣的商品,那么這些人應該有相似的偏好。網(wǎng)站要做的就是找出那些有相似購物或瀏覽記錄的用戶,然后把他們還不曾擁有的東西相互推薦—把甲消費者買過、但乙消費者還沒有購買的東西,推薦給乙消費者,反之亦同。
比起關(guān)聯(lián)推薦,這種方法能幫助顧客發(fā)現(xiàn)新的、有趣的商品。然而,用戶間的相似度如何判斷,需要經(jīng)過復雜的計算才能得出具體數(shù)值。下圖是A、B、C、D四位用戶在CDNOW網(wǎng)站的購買記錄:
看起來很復雜是吧?你只需要記住,這個公式可以算出不同用戶的相似系數(shù)。以此類推,A與C的相似系數(shù)約為0.41,而A與D的也約為0.41,數(shù)值越高,相似度越大,由此可以判斷:A與B的品位最為接近,可以將B已經(jīng)購買、而A尚未購買的商品2推薦給A。事實上,當網(wǎng)站找到了與A相似的多位用戶之后,它會將那些A尚未購買,而其他人已經(jīng)購買的專輯,按照這些專輯被購買的概率,對產(chǎn)品進行排序,最終才把排名靠前的東西推薦給A。
物以類聚,基于商品的個性化算法
對當當/京東等大型零售網(wǎng)站來說,它的用戶數(shù)量遠大于商品數(shù)量,那么基于用戶的個性化算法顯然會帶來計算量過大的問題。豆瓣工程師阿穩(wěn)說,計算用戶之間的相似性需要計算1000萬次左右,而計算商品之間的相似性,10萬次左右就夠了。
基于提高計算效率這一思路,亞馬遜個性化部門的共同創(chuàng)始人Greg Linden設計和開發(fā)了“從商品到商品的協(xié)同過濾”技術(shù)。這也是目前被使用最多的個性化算法。簡單來講,其原理是先判斷哪些商品之間具有潛在相關(guān)性,然后根據(jù)用戶的購買記錄,把那些和購買記錄中關(guān)聯(lián)度高的商品推薦給用戶。
何為潛在相關(guān)性呢?看個經(jīng)典案例—購物籃分析。1990年代,零售商們在美國中西部超市發(fā)現(xiàn)了“啤酒-尿布綜合癥”:年輕男顧客的購物籃中,尿布和啤酒會同時出現(xiàn)。這其中的聯(lián)系是,男顧客被妻子打發(fā)出來買尿布后,都會拎一箱啤酒回去。向買尿布的年輕男子推銷啤酒,成功率會明顯增高。當兩種看似風馬牛不相及的商品被同一用戶同時購買的頻率越高,那么商品的潛在關(guān)聯(lián)就越強。當面對海量的數(shù)據(jù)集和用戶數(shù)量時,從商品到商品的協(xié)同過濾會顯現(xiàn)出優(yōu)勢—實時做出高品質(zhì)推薦。因此,當我們在亞馬遜等網(wǎng)站瀏覽某商品后,即便立刻回到主頁,主頁的推薦也會根據(jù)之前的瀏覽信息立刻做出調(diào)整,反應時間被控制在半秒之內(nèi),甚至更短。
你輸入的關(guān)鍵字也能成為個性化算法
有時候用戶并不清楚他們想要的是什么,他會通過關(guān)鍵字來進行搜索,而網(wǎng)站會根據(jù)這些對商品內(nèi)容描述的詞,推薦更多與你需求類似的東西。如果一件商品的tag,即標簽越多,那么它的屬性也就越豐富,與之相關(guān)聯(lián)的東西也就越多。網(wǎng)站也會根據(jù)這些標簽來計算哪些商品的關(guān)聯(lián)度更高。這種個性化算法在業(yè)內(nèi)被稱為“基于內(nèi)容過濾的算法”。豆瓣負責個性化推薦的工程師王可斌說,目前“豆瓣猜”采用的就是“基于內(nèi)容的算法”和“基于商品的個性化算法”。
不過,如果網(wǎng)站只采取“基于內(nèi)容過濾”的個性化推薦也也會產(chǎn)生問題—獲取的內(nèi)容雖與消費者興趣吻合,但也會讓消費者的購買視野越來越窄。
個性化推薦的風險
而今,所有的個性化推薦都不會只采用一種算法,而是文中各種算法的結(jié)合。不過,愈加智能的個性化推薦仍存在一些風險。豆瓣曾推薦了本《富人不說,卻默默在做的33件事》,有網(wǎng)友說:認為誰窮瘋了么,你愛推薦給誰給誰,別總給我推薦這類書!當然,這段話已經(jīng)被我們“翻譯”得很溫和了。或許,網(wǎng)站應該反思一下如何不讓個性化推薦冒犯到用戶。
此外,網(wǎng)站搜集的信息越多,消費者越會感到隱私受侵犯。如果你的朋友都收到了以下推薦:“你的好友最近購買了一些減肥藥,你要不要也試試?”這多令人尷尬啊!亞馬遜解決這一沖突的方法是,允許消費者修改或刪除記錄。