鄭楊 譚玲?
摘 要:互聯網用戶可以在計算機前輕輕點擊鼠標來完成相對于現實生活中復雜的互動交友活動,個性化好友推薦系統通過基于內容推薦、協同過濾推薦、聚類推薦三種策略來幫助用戶建立網狀復雜的人際關系,最終提高用戶對于本類社交網站的忠誠度。本文將通過詳細分析新浪微博、騰訊QQ和人人網三大社交網站來具體分析個性化好友推薦系統的優缺點。
關鍵詞:個性化推薦;新浪微博;協同過濾
中圖分類號:TP393 文獻標識碼:A 文章編號:1672-8122(2014)06-0117-03
隨著信息技術的發展,人們不再僅僅局限于身邊的社交網絡,而是在互聯網上繼續拓展自己的交友圈。現在的用戶可以在計算機前輕輕點擊鼠標來完成相對于現實生活中復雜的互動交友活動,但是社交網絡在給人帶來方便與快捷的同時也產生了信息冗雜、難以辨別的問題,為此個性化好友推薦系統應運而生。現在個性化推薦系統主要應用于電子商務平臺,如B2B網站(當當網)、B2C網站(淘寶)等等。在電子商務的虛擬環境前提之下,個性化推薦系統就像一個采購助手一樣幫助用戶來選購商品,通過搜集用戶的個人信息,瀏覽記錄,商品交易詳情等來預測用戶的喜好并向其推薦可能感興趣的商品或者服務,從而提高產品的銷售量。同樣的,社交網站通過這種個性化好友推薦系統,幫助用戶建立網狀復雜的人際關系,最終提高用戶對于本類社交網站的忠誠度。
為了清楚地了解我國社交網站的好友推薦功能的使用狀況,我們選擇國內與交友相關的三個著名網站,包括最火平臺新浪微博、聊天軟件騰訊QQ和SNS網站人人網,用以分析各網站的個性化好友推薦功能。
一、社交網站的好友推薦方法簡介
早在1995年,卡耐基·梅隆大學的Robert Armstrong 和 斯坦福大學的Marko Balabanovic等人就在美國人工智能協會上提出了個性化推薦系統,該系統主要是根據用戶的興趣特點和購買行為,向用戶推薦用戶感興趣的信息和商品,它是建立在海量數據挖掘基礎上的一種高級商務智能平臺,以幫助電子商務網站為其顧客購物提供完全個性化的決策支持和信息服務[1]。目前,我國的社交網站在好友推薦方面所使用的主要是檢索和非個性化推薦的技術。一般的社交網站會在注冊或使用過程中要求用戶輸入相關的信息,如生日、所在地、愛好、學校、公司等,通過豐富用戶的網絡標簽來增加用戶被檢索和推薦的方式。從廣義上來說,由于檢索是一種基于用戶自主查找目標好友的方式,那么其實它也可以看作是系統給出的推薦結果。非個性化推薦是依據最近熱門的信息或者用戶來進行推薦,不同的被推薦者都會收到同樣的推薦信息,這種方法并不考慮被推薦者的第一興趣,就像商場促銷時分發的商品推薦目錄一樣。
對于好友推薦,可以從以下三個方面來考察其性能:其一,個性化程度。推薦系統檢索出的結果是否符合當前用戶的興趣愛好和需要。其二,實現難易程度。用戶為得到推薦結果所需要付出的勞動量。其三,可拓展性。主要指隨著用戶信息和興趣的變化,好友推薦能否能及時的獲取相關數據以及新信息的推薦能否高效率的被推薦到用戶面前。
二、社交網站的個性化好友推薦策略
推薦的本質是代替用戶對他沒有看過的資源對象進行評定,從而幫助用戶找到他喜歡的東西[2]。推薦系統通過獲取用戶的信息,將與之類似內容進行關聯,進而把用戶喜歡和需要的東西推送至其面前。
(一)基于信息推薦
也稱為基于內容的推薦,它是對信息過濾技術的延續和發展,必須建立在對用戶個人信息進行總匯并對信息進行有效過濾的基礎之上。根據用戶的特征和目標要求預測并搜索與之匹配程度較高的其他好友,這個過程中一般不需要用戶對內容的評價意見,只通過相關的特征和屬性用機器檢索的形式進行推薦。
1.人脈。人人網將自己定位為中國領先的實名制SNS社交網絡,宣傳語是“因為真實,所以精彩”。在一開始注冊的時候,用戶就被要求填寫出生地、高中、入學時間、畢業院校、公司等個人信息,這就為個性化好友推薦提供了良好的信息來源。值得注意的是,現在的社交網站紛紛將推薦重點轉移到人脈關系上。比如在人人網添加好友選項中有專門的按人脈篩選標簽,選擇已有的一位好友,推薦系統就會自動計算二度人脈中與用戶本身相似度比較高的,從而完成個性推薦的過程。騰訊推出的朋友網更是致力于人脈推薦,不但將一度人脈、二度人脈細分獨立出來,還將每個用戶所貢獻的人脈做排名比較,最大限度的調動用戶的使用興趣,真正的讓用戶由信息瀏覽者變成了信息使用者。除此之外,朋友網還兼顧非個性好友推薦的策略,在網頁的側邊欄還提供各類形式多樣的好友推薦,如“他們是你的高中學弟學妹”、“可能認識的人”,“人脈中有X人是你的本科同級校友”等,當用戶把鼠標移到這些信息之上時,結果不只是顯示單一的推薦列表,更能清晰的看到有幾位共同好友,系統用這種方式向用戶解釋了為什么推薦這些資源,真正體現了個性化推薦系統的人性化。
2.IP。騰訊QQ查找好友選項中有開啟位置信息的選項,只要開啟用戶自己的地理位置信息,推薦系統就可以顯示附近的QQ用戶信息。
(二)協同過濾推薦
協同過濾推薦一般采用最近鄰技術,利用用戶的歷史記錄信息計算用戶之間的距離,然后利用目標用戶的最近鄰用戶對某一內容信息評價的評價來預測目標用戶對特定內容信息的喜好程度,系統從而根據這一喜好程度來對目標用戶進行推薦[3]。
1.LBS。在網民急劇增長的今天,想要為社交網絡用戶找到真正感興趣的好友,最好的辦法就是首先找出與此用戶有相似生活經歷、娛樂活動或者興趣愛好的其他用戶。微博的宣傳語是“隨時隨地分享身邊的新鮮事”,用戶發布微博的同時還可以進行地點定位,當微博用戶點擊相關地點時,就主動的進入了篩選好友的個性化系統。與騰訊網直接的IP好友推薦不同,新浪微博依據用戶IP定位將其他用戶所發的微博總匯起來,用“周邊的人”、“周邊熱圖”、“相關微博”、“周邊熱門”幾個標簽分別歸類,當用戶瀏覽這些信息時,便可以與自己在同一地點、發表相似感想或者相同興趣愛好的網友進行互動。通過協同過濾推薦,用戶不需要填寫調查表格、個人信息,而是通過對社交網站的瀏覽行為,自動的獲得好友推薦。值得一提的是,新浪微博還將電子商務融入進個性化推薦,提供用戶定位地點附近的團購優惠信息,極大提供了便利。
2.標簽。騰訊QQ的好友信息中特別設有標簽一欄,通過這種近乎個人的知識體系,以個人的感性邏輯(個人知識、情感、意志、記憶、素養等等的綜合反映)為線索,以個人所需信息的匯集、梳理和查詢為目的,以個人經驗為基礎來實現個性化好友推薦[4]。用戶通過自己的喜好,用更靈活的表達方式來組織和管理自己的信息,不同于傳統的關鍵字檢索方式,標簽功能讓用戶更個性化的表達自己的興趣愛好,是一種更智能化的分類。騰訊QQ用戶選擇系統自帶的標簽,也可以自己創作,隨時修改并發布,好友推薦系統就會及時的呈現出有相同愛好的同道中人。
(三)聚類推薦
類似于電子商務系統中所運用的關聯規則,把用戶已經購買的商品作為規則的源頭,將推薦對象看作規則目標體。關聯規則挖掘的典型例子是購物籃分析,該過程通過發現顧客放入其購物籃中不同商品之間的聯系,分析顧客的購買習慣[5]。比如買上衣的用戶,一般還會繼續購買裙子或者褲子,網站將這些頻繁被同時購買的商品匯總,從而制定營銷策略。
騰訊QQ推出一系列娛樂應用功能,比如QQ農場、捕魚達人等,讓同一社區進行相同游戲的用戶進行相互推薦。在新浪微博中,微博小秘書會及時通知用戶被關注的情況,以便用戶互粉。微博中更有其他APP應用功能軟件在用戶體驗過之后就會發布微博公開網址,用戶可以通過瀏覽微博發現此信息點擊進入后,擁有相似應用經歷的用戶就會呈現在網頁上,這也是隱性好友推薦的一種方法。
三、國內社交網站個性化好友推薦的優點與存在的問題
通過以上分析,可以發現國內的社交網站將非個性化好友推薦與個性化好友推薦技術相結合,多種推薦策略的混合使用能更好的共同服務于用戶。人人網有時間軸功能、騰訊網有圈子社區、騰訊微博開通微人脈應用,隨著用戶個性偏好與生活經歷的改變,這些好友推薦系統能將隨著時間而改變的資源記錄下來,從而構造出用戶的個性偏好隨時間變化的模型。如今隨著科技的飛速發展,普通用戶想要從信息量繁雜的互聯網世界中搜尋到自己可能感興趣的內容,不但難度提高了很多,成本也是不可小覷的。再者社交網站與一般商業網站的長尾經營策略不同,如果用戶不積極的提高自己的活躍度,那么就極有可能不再受到別人的關注。雖然社交網站采用了三種不同的推薦策略,在實際應用中也取得了喜人的效果,然而這些推薦系統或多或少的都面臨著許多問題。
(一)基于信息推薦系統面臨“游客”問題
基于信息推薦系統運作的前提是用戶注冊本網站并且填寫基本個人信息,然后才能從用戶已建立的人脈關系或者顯示的IP地址中獲得用戶可能會偏好的信息,進而計算用戶之間的相似度。當一個新用戶以游客的身份進入網站時,會因為身份不明確而被拒之門外,這一點與國內一些知名的交友網站運作策略不同,比如世紀佳緣網、百合婚戀網等。非注冊用戶也許只是想打開網站鏈接對相關視頻、音樂、文章一探究竟,但由于注冊的步驟很繁瑣,這種閉門造車的經營方法會導致潛在用戶的流失。新注冊用戶在加入到網站伊始,由于基于信息推薦系統完全依靠用戶自己輸入的信息進行推薦,這種環環相扣的推薦方式如果其中某個鏈條出現空白將直接影響到整個推薦系統的運作,導致用戶不能精準的找到自己的目標好友。而且面對日益增多的用戶,對規模不斷擴大的數據進行整合成為直接制約系統實現的重要因素。雖然基于內容系統推薦由于前期用戶對自我信息的補充減少了建立模型花費的時間,但是用于識別“最相似”算法的計算量隨著使用人數和信息的增加,將會面臨嚴重的擴展性瓶頸問題,該問題會對算法的準確性產生直接影響。
(二)協同過濾推薦系統面臨技術難題
協同過濾推薦系統受到信息獲取技術、專業戶程度過高等因素的制約[6]。一方面在協同過濾推薦系統中,用于標明用戶特征的內容都必須能被計算機自動提取出來并進行統一的歸納,因此該類算法在搜集信息時對有關技術有很高的要求,比如在微博中,用戶僅僅能夠通過標簽和IP定位來搜尋目標好友,如果用戶發表一段語音,系統可以通過過濾其中的關鍵詞來提取信息,那么目標好友的推薦的范圍是不是可以更加開拓呢?同樣的,用戶發表一張圖片,計算機系統對圖片內容進行分類歸納,由此也可以把標記過相似內容的用戶進行相互的推薦。另一方面,在用戶標簽的實際應用中,如果兩個不同的詞匯剛好用相同的特征詞匯表示,那么這就容易造成彼此的混淆。特別是在衍生詞和造字風潮的現代社會,這種情況尤其明顯,例如最近比較熱門的“土豪”一詞,“土豪”原指在鄉里憑借財勢橫行霸道的壞人,后在ACG界引申為無腦消費的人民幣玩家,兩個詞寫法一樣意思卻大相徑庭,這樣的話,系統只推薦相關度最高的好友給用戶,就很難保證推薦的準確性與多樣性。
(三)聚類推薦系統面臨“新”問題的制約
聚類推薦系統受到新用戶問題的制約,該系統最根本的就是要建立用戶與產品的關聯網絡圖,即用戶下載了什么應用軟件、使用的程度如何。新用戶剛剛進入系統時沒有任何選擇或者被選擇的信息,無法被其他用戶發現并建立關聯,所以也沒有辦法啟動聚類推薦系統,只能僵硬的讓非個性化推薦作為敲門磚,讓用戶自行選擇偏好的好友。同時聚類推薦系統還受到時間進度的影響,用戶的長期興趣與短期興趣都被考慮在關聯算法之內,無法區分,從而使得推薦的準備讀大大降低。
除此之外,國內的社交網站一般都需要用戶先明確自己的需求,然后通過用戶與系統的相互交流,表達出用戶的興趣愛好與要求,最后由系統給出推薦結果。整個過程所體現出的最大問題就是推薦的自動化程度低,用戶要比較明確的知道自己的需求并且花費一定的時間來與計算機進行交互,最后才能得到結果。因此對于研究機構來說,要加大研究力度,將工作重心放在自動化推薦技術的研究上。
參考文獻:
[1] 個性化推薦系統在電子商務網站中的應用研究[EB/OL].http:// www.doc88.com/p-148667184110.html.
[2] 陳敏.個性化推薦系統研究[D].南京郵電大學,2012.
[3] 曾春,邢春曉,周立柱.個性化服務技術綜述[J].軟件學報,2002(10).
[4] 田瑩穎.基于社會化標簽系統的個性化推薦[J].圖書情報工作,2010(1).
[5] 陳麗麗.個性化推薦系統在B2C教育網站上的應用[EB/OL]. http://www.doc88.com/p-795222687856.html.
[6] 劉建國.個性化推薦系統的研究進展[J].自然科學進展,2009(1).