張繼東 段小萌


[摘要]隨著現代網絡的發展,登錄移動社交平臺已經成為大多數人每天的日常,和親人朋友在社交平臺上的交流遠遠多于面對面的交談,學習工作上的事情也大多可以用社交軟件完成,在這樣的大前提下,移動社交平臺用戶之間的信任關系必然要成為關注的重點。用戶信任度可以用來詳細檢查用戶之間所有可能的社交網絡關系,本文以新浪微博為例提供了一種計算用戶之間信任的方法,通過對用戶之間的信任進行分析完成相應的推薦和其他服務。
[關鍵詞]移動社交網絡;社交平臺;用戶信任度;推薦系統
1研究背景
CNNIC(中國互聯網絡信息中心)2016年研究報告數據顯示,2016年6月,網民中即時通信用戶規模達到36.42億,相比于2015年底增長1769萬,占網民總體的90.4%;其中使用移動社交app來進行即時通信的用戶有6.03億,相比于2015年底增長4627萬,占手機網民的91.9%。移動社交app成為移動網民上網的主要習慣之一。
最初,社交網絡基于互聯網,許多人將它作為和他們的家人,朋友和同事溝通的工具。后來,由于手機的廣泛使用,更加成熟的移動社交平臺的出現和發展,社交網絡從基于網絡的應用程序擴展到更廣泛的移動社交平臺。隨著移動無線網絡的逐步便捷,我們的生活中慢慢離不開移動網絡,同時將更多的時間用在移動社交上,我們每個人都是移動社交網絡的組成部分。我們通過移動社交網絡來與朋友交談,通訊,在維持正常的社交關系的同時發展新的社交關系。最初的推薦系統多用于確定用戶需要哪方面的產品或服務從而進行個性化的推送,應用于社交網絡中的則是一種特殊類型的推薦系統。
大數據時代,數據在網絡中以高速動態變化,移動社交網絡更是充滿了復雜性和不確定性,我們需要建立有效的方式來控制用戶的行為和選擇交互策略,以使移動社交網絡保持在穩定和可信任的狀態。現在的大趨勢是移動社交平臺的多元化,它不僅僅作為一個單純的社交平臺,更可以是小型瀏覽器,甚至和電子商務相結合作為支付工具存在,除了支付寶以外很多手機網民同時使用微信支付,QQ錢包及百度錢包等在線支付工具。當一個軟件擁有如此繁雜的功能和大量用戶信息的時候,用戶之間的信任和用戶的隱私安全便顯得尤為重要。
2基于移動社交平臺和用戶信任度的相關工作
2.1移動社交網絡的實質
移動社交網絡的本質是以移動終端設備為基礎給用戶提供一個在人群中分享興趣、愛好、狀態和活動等信息的在線平臺,它包括傳統社交網絡、圖片社交、私密社交,基于位置社交以及存在與社交網絡中的商業模式。移動社交網絡是社交網絡的組成部分,社交網絡是通過各種移動終端和固定終端的用戶組成的,隨著智能手機、平板電腦等移動終端設備的更加普及,移動社交網絡的發展速度將大步提升。與固定終端相比,移動終端具有更好的便攜性,可以隨時隨地和朋友共享狀態和心情,移動社交網絡可以更好地滿足人們對社交關系的需求,但這并不代表固定終端社交網絡會因此沒落,兩者依舊是相輔相成的,固定終端具有很多移動終端無法完成的功能。
移動社交網絡的現狀大多是以現實人際關系為基礎進行擴展的社交關系網,20世紀60年代,美國哈佛大學心理學教授米爾格蘭姆(stanley Milgram)通過實驗提出了六度空間理論,他認為世界上任意兩個人之間建立聯系,最多只需要六個人。這是一個小世界現象,任何兩個素不相識的人,通過一定的方式必然存在著某種聯系。這也是我們社交網絡的實質,通過合適的算法和推薦機制,移動社交平臺可以智能的為用戶找到與其志趣相符的人,用戶可能感興趣的商品、話題等。
2.2國內移動社交平臺的現狀和分析
CNNIC將國內移動社交軟件主要分為6大類:即時通信工具、綜合社交應用、圖片,視頻社交應用、社區社交應用、婚戀,交友社區應用和職場社交應用。其中即時通信工具的使用率最大,占手機網民的90.7%。超高的市場占有率也說明了即時通信工具在我們生活中的必要性,而即時通信工具中市場占有率最高的兩個軟件分別是QQ和微信,他們除了即時通訊的功能以外都具有向好友展示狀態、圖片或視頻的平臺,QQ的QQ空間和微信的朋友圈,這都占據了很大一部分流量。在QQ空間和朋友圈中,用戶可以進行點贊評論或者轉發分享等互動,這是一個不能被忽視的平臺。
在綜合類移動社交軟件中,新浪微博占據了很大一片市場。網民使用移動社交軟件的主要目的有與朋友互動、了解熱點新聞、關注感興趣的內容、獲取幫助和分享知識,調查表明73.9%的用戶通過新浪微博關注熱點新聞和話題,因為微博內容編輯的簡單性和網絡傳播的高效性,這樣的數據并不使人意外,很多熱點新聞在媒體報道之前微博上就已經有了詳細的經過,這意味著新浪微博已經成為一個大眾輿論平臺,是人們當下了解時事熱點的主要渠道之一。
大多數社交平臺的切入點都是熟人和商務交流,這樣的社交方式可以稱為強社交,是高強度和高黏性的代表,隨著用戶的積累和移動網絡的普及,移動社交平臺的發展趨勢是要從強社交到大社交的逐步轉換,大社交包括用戶社交的多元化,僅僅通訊已經無法滿足用戶的需求,語音和視頻通話,微視頻交流甚至是直播的方式也越來越多地出現在我們的生活中,這也將慢慢成為一種互動的方式,社交方式的多樣化也會成為移動社交平臺的發展趨勢。
2.3社交網絡中用戶之間的信任
網絡可以定義為一組節點通過各種鏈路互相鏈接,網絡的建成目的之一都是交換,它們具有不同的拓撲結構。社交網絡可以定義為一組用戶通過不同的關系相互聯系,用戶之間可能的關系有相識、熟悉、信賴甚至厭惡等。信任,只是一種關系,然而卻有極大的價值,也可以說它是一種資產。人際信任的經驗是由個人價值觀、態度、心情及情緒、個人魅力交互作用的結果,是一組心理活動的產物。網絡信任一詞在20世紀被提出,對于它有很多不同的定義。魯興虎教授將網絡信任歸納總結后分為以下三種:基于電子商務活動中網站和用戶之間的信賴關系,技術上的“信任體系”和網絡人際交流過程中的信任關系,即為本文研究的移動社交平臺用戶之間的網絡信任。endprint
在本文中,我們將信任定義為用戶能夠依靠他的朋友在社交網絡中的推薦。在研究社交網絡中的信任時,我們面對兩個最重要的問題,一是如何在社交網絡中識別出誰是用戶可以信任的朋友;二是如何計算沒有直接連接的社交網絡用戶之間的信任。本文將主要關注前一個問題——如何衡量用戶和他朋友之間的信任以及如何計算用戶之間的信任關系。
2.4在社交網絡中對用戶的隱私保護
隱私權指自然人的私人信息秘密依法受到保護,不被他人非法侵擾、知悉、收集、利用和公開的一種人格權,而且權利主體對他人在何種程度上可以介入自己的私生活,對自己是否向他人公開隱私以及公開的范圍和程度等具有決定權。
互聯網的便捷使得我們的很多信息在網站和軟件的數據庫里都有存檔,比如搜索和消費信息,大多數我們常用的軟件都包含很多的個人信息。在線社交網絡的普及增加了用戶的可視性配置文件和用戶與其他用戶之間的交互,作為擁有大量用戶和大量用戶信息的在線社交網絡,一定要確保用戶隱私的安全性,用戶需要可以自主的選擇是否在社交網絡內分享個人信息。移動社交網絡中的隱私保護涉及收集個人數據,使用用戶身份連接數據,使用數據,存儲數據,轉發數據和知曉用戶所在位置的權利。
在本文中,我們需要根據用戶和用戶的朋友之間的聯系來計算他們之間的信任度,在計算的過程中涉及很多用戶隱私的方面,在后臺計算的同時,要注意不能泄露用戶的資料,保證用戶的網絡隱私權。
3社交網絡中的通用信任模型
當我們嘗試在一個基于移動網絡的主流SNS(社交網絡服務)平臺上建立一套社交推薦系統時,我們需要關注如何定義具有變化離散值的社交網絡成員,如在移動社交網絡中的兩個用戶是否為可信任的朋友以及他們之間連接價值的權值。這種分析轉化可以基于以下兩點:①目標用戶與其他用戶之間的相似性,可以根據過往的瀏覽記錄,購買記錄甚至地理位置分析計算得到相應數據,②在社交活動中,目標用戶與其他用戶之間的社交活躍度,可以通過用戶之間的聊天次數頻率、共同參與的群聊和在公共平臺(如朋友圈,QQ空間等)上的互動情況分析得來。
如圖1所示,用戶A、用戶B、用戶c等代表的是社交網絡中的一個獨立用戶,而目標用戶則是我們的研究對象。他們之間的連接線抽象的表示用戶在社交網絡中發生的社交行為,如聊天、留言和點贊等,但是在圖l的模型中,每個連線的寬度和所表示的意義都是相同的,在實際交往中,每個關系的社交程度不盡相同,所以我們需要用某種方式表現出用戶之間社交的差異性。如圖2所示。
圖1和圖2在基本模型上區別不大,但是用戶和用戶之間存在著寬度不同的社交連接線。因為在社交網絡中,用戶間社交的次數和程度都不一樣,我們通過對用戶之間的社交進行分析和轉換,用連接線的寬度來近似地表示用戶之間社交的差異性,如用戶D和目標用戶之間的社交強度明顯大于用戶B和目標用戶之間的社交強度。這樣的模型可以適用于大多數的社交網絡,它不僅可以表示擁有直接社交關系的兩個用戶之間的關系,還可以表示用戶之間的間接社交,如用戶A和用戶c并不存在直接的社交行為,但是他們通過用戶B和目標用戶存在著間接的社交關系,所以它可以在實際應用中作為一個社交通用模型使用。
在圖2中用戶之間關聯的權重以連線的寬度抽象表示。Podobnik,V和Lovrek,I提出了一個分析客戶檔案和過去行為進行客戶匹配的機制,同時創建客戶社交網絡以促進組織客戶關系管理,他們所創建的機制就是基于第一種方法,即用戶之間的相似性,模擬創建隱式社交網絡,以相似性來定義用戶之間的連接級別。在本文中我們將著重于第二種方法,并展示出如何利用用戶在社交活動中的行為計算社交網絡中兩個朋友之間的信任級別。
筆者將社交活動定義為在移動社交網絡中兩個直接連接的用戶之間的社交交互行為,例如在同一張照片上有兩個朋友的共同標記。現在我們將P(User x)定義為在某一段時間內與用戶x在相同照片上有標記的朋友的列表,P(User x)中元素是兩個對應的數據(User y,A),A是指用戶x與用戶y標記在相同照片上的次數,也就是此時的互動次數。例如,一個列表P(User x)可以定義為:
P(User x)={(User a,3),(uscr b,5),(uset c,2)}(1)
公式(1)表示用戶x與用戶a共同標記了3張合影,與用戶b共同標記了5張合影,與用戶c共同標記了2張合影。我們定義P(User x,User y)為用戶x和用戶y在社交網絡中的合影標簽,如公式(1)中P(User x,User a)=3,用戶x和用戶a的合影標簽為3。
移動社交平臺除了發布照片以外還支持多種不同類型的社交活動,為了計算社交網絡中兩個直連的用戶之間完成的信任度,必須全面考慮在社交網絡中用戶可以參與的所有社交活動。因此,把用戶x的各種社交活動的描述歸納為一個社交活動集,它是列表的集合,其中每個列表描述不同的社交活動,所有列表都被定義為類似P(User x)的形式。
3.1以微博為例計算用戶信任度
作者以微博為例,詳細說明通過信息的采集再用一系列算法計算出用戶之間的信任級別,最后將用戶之間的新人級別應用到實際社交之中的過程。在數據采集的過程中包括用戶個人行為和用戶朋友的行為數據,這些數據包括在一定時間內:
1)用戶的呢稱和賬號登錄信息
2)用戶的好友列表(此時只考慮互相關注的情況)
3)相互評論微博情況
4)相互回復評論情況
5)相互點贊情況
6)相互@提醒查看情況
7)私信聊天情況
8)相互轉發微博情況
9)所發微博含有同樣合影的情況
10)在同一位置發微博
以上的信息基本概括了在微博里兩個用戶之間所有可能的社交行為,通過對以上信息的分析,我們可以比較全面的計算出兩個用戶之間的社交活躍度。但是以上信息在計算中所占的比重是不一樣的,例如評論要比點贊更重要,對每項互動所占的權重考慮很重要。每個用戶在對微博的使用上都有很大的差異,一些用戶把微博作為一個記錄生活的平臺,樂于發照片和狀態,一些用戶雖然很少發微博但是經常瀏覽評論朋友的微博并通過私信與他們交流,這都是計算社交活躍度中很重要的部分。endprint