何 軍 劉業(yè)政 王錦坤
(1.合肥工業(yè)大學(xué)管理學(xué)院,安徽 合肥 230009;2.安徽大學(xué)商學(xué)院,安徽 合肥 230601)
·應(yīng)用研究·
基于社會選擇和社會影響的社交網(wǎng)絡(luò)社群分類與群推薦策略研究
何 軍1,2劉業(yè)政1王錦坤1
(1.合肥工業(yè)大學(xué)管理學(xué)院,安徽 合肥 230009;2.安徽大學(xué)商學(xué)院,安徽 合肥 230601)
社會選擇和社會影響是在線社交網(wǎng)絡(luò)社群形成的兩個主要因素,如果能有效對網(wǎng)絡(luò)社群中用戶和群體進(jìn)行分類,就可以采取不同的群推薦策略,實(shí)現(xiàn)群體滿意最大化。利用偏好對表示群用戶偏好,利用矩陣分解和貝葉斯個性化排序方法,考查社會選擇和影響對用戶偏好的影響程度,實(shí)現(xiàn)群用戶和群體的分類,進(jìn)而提出2種群推薦策略。最后通過2個數(shù)據(jù)集的實(shí)驗(yàn)驗(yàn)證,表明本文提出的基于用戶和群體分類的群推薦策略是有效的。
社群分類;群推薦;社會選擇;社會影響;推薦策略
個性化推薦技術(shù)已被廣泛應(yīng)用于向消費(fèi)者推薦產(chǎn)品、服務(wù)或活動,然而消費(fèi)者往往并不是單獨(dú)存在的,他們處于各種各樣的群體中。隨著研究者對群體活動的關(guān)注,出現(xiàn)了面向群體活動如電影、聚餐、旅游等的群推薦系統(tǒng)(Group Recommender Systems,GRS)[1-4]。隨著Web2.0應(yīng)用以及其他各種類型的社會媒體的發(fā)展,在線社交網(wǎng)絡(luò)(online social networks,OSN)已經(jīng)成為人們網(wǎng)絡(luò)生活的最主要平臺,而面向在線社交網(wǎng)絡(luò)的群推薦系統(tǒng)正成為推薦領(lǐng)域的熱點(diǎn)研究問題。由于用戶參與社區(qū)的動機(jī)的不同,是自我主動的社會選擇還是基于從眾的社會影響,將導(dǎo)致社區(qū)在組織結(jié)構(gòu)和決策模式方面存在較大差異。社會選擇過程中,人們傾向于和他們相似的人之間形成關(guān)系,是同質(zhì)性在起作用,即人們根據(jù)相似的特征選擇朋友,這是人們自我主動選擇的機(jī)制。同時社會影響機(jī)制的作用下,網(wǎng)絡(luò)中存在的社會聯(lián)系將影響節(jié)點(diǎn)個體的特征。理解這兩種效應(yīng)之間的沖突不僅有利于揭示社交網(wǎng)絡(luò)及用戶行為形成的原因,也有利于發(fā)現(xiàn)在網(wǎng)絡(luò)中實(shí)施某種干預(yù)的效果。例如,當(dāng)社區(qū)中存在著諸如讀書、看電影、奢侈品消費(fèi)等共同興趣時,若觀察到的共同興趣完全是因?yàn)樯鐣绊懶纬傻模涂梢钥紤]瞄準(zhǔn)一個特定人群,如具有一定影響力的子群實(shí)施群推薦,此方案將會對整個社區(qū)產(chǎn)生廣泛的影響;但若共同興趣完全是因?yàn)檫x擇效應(yīng)而產(chǎn)生的,那么上述方案只能對所瞄準(zhǔn)的特定人群起作用,而對其他人群就難以產(chǎn)生效果,因此群推薦方案的設(shè)計(jì)要考慮社區(qū)中絕大多數(shù)人的興趣偏好。由此可知,針對參與社區(qū)不同動機(jī)的用戶和不同動因形成的網(wǎng)絡(luò)社區(qū),群推薦策略存在著很大的差異。
針對群推薦系統(tǒng)的研究遠(yuǎn)少于面向個體的推薦系統(tǒng),而且大部分群推薦系統(tǒng)都應(yīng)用于一個具體的場合,如PolyLens[5]、Travel Decision Forum[6]、INTRIGUE[7]、TV4M[8]等。已經(jīng)成功應(yīng)用的群推薦系統(tǒng)往往需要明確獲取用戶的偏好信息,如一些社交網(wǎng)絡(luò)群推薦系統(tǒng)在社區(qū)中開發(fā)個插件,PolyLens就是通過插件來獲取用戶的評分,這在大規(guī)模網(wǎng)絡(luò)社區(qū)中獲取用戶明確評分的方式是很難做到的;群推薦的一個關(guān)鍵問題是如何將個體偏好集結(jié)成群體的偏好,如MusicFX系統(tǒng)采用無痛苦平均策略進(jìn)行集結(jié)[9];梁昌勇等提出結(jié)合領(lǐng)域?qū)<曳ǖ娜后w用戶推薦算法[10]。
Leskovec等通過對4個大型社交網(wǎng)絡(luò)的分析,證明了社會選擇的存在[11];Lewis等通過收集一群大學(xué)生在Facebook上4年的活動數(shù)據(jù),發(fā)現(xiàn)在電影、音樂方面具有相同興趣愛好的人容易結(jié)成好友[12]。社會影響是人們決策受到與他人社會交往的影響,考慮別人的意見以避免和大多數(shù)人偏差太大[13];Bond等在Facebook上針對美國國會選舉進(jìn)行6 100萬人隨機(jī)試驗(yàn),發(fā)現(xiàn)社會影響能夠明顯改變個體的行為[14];Muchnik等同樣通過大規(guī)模的隨機(jī)試驗(yàn)證明了社會影響能夠改變個體決策[15]。如何明確區(qū)分社會影響和同質(zhì)性各自作用的研究也很多,有實(shí)驗(yàn)、統(tǒng)計(jì)、仿真等。Ma等的研究量化兩種因素,并進(jìn)行了實(shí)證分析[16];肖邦明等對交易型社區(qū)的仿真表明基于同質(zhì)性的傳播在初期有較快的擴(kuò)散速度,而基于社會影響的擴(kuò)散可以達(dá)到更大的范圍[17],總的來說要明確區(qū)分兩種影響因素較為困難。
群推薦與個體推薦的一個不同之處在于,最終的決策可能不是由某一位個體做出來的,而是群成員共同協(xié)商的結(jié)果。因此通過對群體社會選擇和社會影響機(jī)制的研究,將對群體的形成的影響機(jī)制應(yīng)用于群推薦成員協(xié)調(diào)決策中,會取得較好的效果。本文通過偏好對(Pair)隱反饋獲取群個體偏好,然后針對社會選擇和社會影響效應(yīng)程度不同的社交網(wǎng)絡(luò),研究群偏好集結(jié)方法,具體來說首先根據(jù)群體對個體偏好的影響大小實(shí)現(xiàn)對群中用戶和群的分類,最后針對兩類群研究不同的推薦策略,提出群推薦候選方案的產(chǎn)生方法。實(shí)驗(yàn)表明,本文提出的基于社會選擇和影響的社交網(wǎng)絡(luò)社群分類與群推薦策略,優(yōu)于一般的個性化推薦方法。
社交網(wǎng)絡(luò)中,直接獲取用戶的興趣偏好較為困難,文獻(xiàn)[18-19]提出一種隱偏好對的隱式偏好獲取方法,不要求用戶提供明確的偏好信息,而是通過對用戶在社交網(wǎng)絡(luò)中的行為獲取。在面向隱偏好數(shù)據(jù)的貝葉斯個性化排序?qū)W習(xí)模型(Bayesian Personalized Ranking from Implicit Feedback,BPR)推薦模型中,就是將用戶對項(xiàng)目的評分,處理為一個偏好對的集合(i,j),其中i為評分為1的顯式正向反饋項(xiàng)目,j為評分為0的隱式負(fù)反饋項(xiàng)目。假設(shè)某用戶有M個1的評分,N個0的評分,則該用戶共有M×N個偏好對,數(shù)據(jù)集就由三元組(u,i,j)表示,該三元組表示相對于項(xiàng)目j,用戶u更喜歡項(xiàng)目i。本文在BPR偏好對基礎(chǔ)上,將模型拓展到群體的應(yīng)用,設(shè)U為所有用戶集合,I為所有產(chǎn)品集合,G為存在的群組,則所有的反饋數(shù)據(jù)為S?G×U×I。在社交網(wǎng)絡(luò)中,若群g中用戶u曾經(jīng)瀏覽過某個項(xiàng)目i,即(g,u,i)∈S,則表示相比于其它未觀察到的項(xiàng)目,用戶u更偏愛項(xiàng)目i。如在圖1中用戶u1瀏覽過項(xiàng)目i2和i3,沒看過項(xiàng)目i1和i4,則我們可以假設(shè)用戶u喜歡項(xiàng)目i2勝過i1:i2>ui1,i2也勝過i4:i2>ui4,同樣項(xiàng)目i3勝過i1和i4。而對于用戶u1都瀏覽過的項(xiàng)目i2和i3,不能推斷出他們之間的偏好,用“?”表示。

圖1 數(shù)據(jù)Pair預(yù)處理
本文定義訓(xùn)練數(shù)據(jù)為DS∶={(g,u,ia,ib)|∶(g,u,ia)∈S∧(g,u,ib)?S},則(g,u,ia,ib)∈DS表示群g中用戶u喜歡ia勝過ib。(G×U×I)S表示沒有觀察到的負(fù)樣本,由于>u是反對稱的,因此也隱式地考慮了負(fù)樣本。在本文的實(shí)驗(yàn)數(shù)據(jù)集中CiteULike和Last.fm中,如果用戶點(diǎn)評了某些論文或歌曲,則表明用戶對這些Item感興趣,是作為正的樣本數(shù)據(jù),而把用戶沒有點(diǎn)評的作為負(fù)的樣本數(shù)據(jù),用戶可能不感興趣,也可能是用戶感興趣但是沒有看到。這樣訓(xùn)練數(shù)據(jù)由正樣本、不感興趣的負(fù)樣本和缺失值負(fù)樣本構(gòu)成,沒有丟失有價值的負(fù)反饋數(shù)據(jù)。
在線社交網(wǎng)絡(luò)環(huán)境下,用戶之間的交互信息體現(xiàn)了個體成員和群體的偏好興趣,且一個成員往往參加多個社區(qū)的活動,通過獲取分散在整個社交網(wǎng)絡(luò)中的海量、碎片化的信息構(gòu)建個體成員的偏好模型,分析社區(qū)中成員間的交互信息和相互影響修正群偏好模型,對群推薦效果至關(guān)重要。
假設(shè)1:每個用戶都有個體的興趣偏好,而用戶的個體偏好是用戶固有的,一般不容易改變,個體偏好與用戶的社會屬性和社會經(jīng)歷相關(guān),如年齡、性別、教育背景和職業(yè)等因素,設(shè)用戶u個體偏好pu。
假設(shè)2:用戶基于個體興趣偏好或受其他因素影響加入群體,用戶在群體中的社會交互過程,會在一定程度上影響用戶的興趣偏好,也就是用戶在群體中所表現(xiàn)出的興趣偏好不僅與個體固有偏好有關(guān),還受到所在群體的影響,這個影響程度因人而異,對群中每個用戶不一樣,設(shè)u所在群體g的總體偏好為pg。
假設(shè)3:用戶可能會因?yàn)榕d趣的多樣性,加入不同的群體,而在不同群體中用戶表現(xiàn)的行為也不完全一致,受群體的影響程度也不同。比如在某些群體中用戶對群體討論的內(nèi)容較為熟悉,表現(xiàn)出較高的活躍性,也就是主動選擇性較高;而在另外一些群體中用戶對群體討論的內(nèi)容不熟悉,表現(xiàn)就可能不活躍,參與群體是為了獲取這些信息,受社會影響性更高。
根據(jù)以上假設(shè),則最終用戶的偏好表示為:
其中pu是用戶u個體興趣偏好,wuc是用戶在所加入的群c中個體偏好所占比重,pgc是用戶加入的群體c所表現(xiàn)的興趣偏好,wgc為群c所占的比重,也就是群c對用戶興趣偏好形成的影響,wuc+wgc=1,群體的作用越大,則wgc權(quán)重越大。用戶最終興趣偏好既要考慮用戶個體的固有偏好,也要考慮用戶加入的所有群體對用戶的影響。
定義1:選擇型用戶
假設(shè)用戶加入某個群或參與群中社區(qū)活動的動機(jī)更多是基于自身興趣偏好的主動選擇,表達(dá)自身的觀點(diǎn)或主張,而受群其他用戶的影響小,也就是個體選擇大于群體影響。若用戶在參與的所有群體中,在大多數(shù)群體中都表現(xiàn)出這樣的特征,則將這類用戶定義為選擇型用戶。
定義2:影響型用戶
假設(shè)用戶加入某個群或參與社區(qū)活動的動機(jī)更多是受到群體的影響,可能為獲取信息而接受群中其他用戶的推薦,或基于從眾性而與其他用戶保持一致,也就是受群體的影響大于自身的主動選擇。若用戶在參與的所有群體中,在大多數(shù)群體中都表現(xiàn)出這樣的特征,則將這類用戶定義為影響型用戶。
定義3:選擇型群
若在某個群中,群體對大多數(shù)用戶的興趣偏好影響小于用戶個體固有的興趣偏好,也就是選擇性大于影響性,則稱這個群為選擇型群,群的整體偏好將趨向分散的可能性更高。
定義4:影響型群
若某個群中,群體對大多數(shù)用戶的興趣偏好影響大于用戶個體固有的興趣偏好,也就是影響性大于選擇性,則稱這個群為影響型群,群的整體偏好將趨向一致的可能性更高。
社會選擇型的群,此時群中大部分用戶的wuc>wgc,個體的特征主導(dǎo)社區(qū)成員的行為,群偏好集結(jié)時需要著重考慮用戶的個體偏好,尊重用戶主動選擇;而社會影響型的群,此時群中大部分用戶wuc 社會選擇和社會影響表明用戶加入群和參與群活動的動機(jī),如果能識別兩種作用機(jī)制大小,就可以實(shí)現(xiàn)用戶和群的分類。根據(jù)不同類型用戶和群的群偏好集結(jié)方式,就可以采取不同的群推薦策略。 策略1:從用戶的角度進(jìn)行群推薦,當(dāng)針對某個群進(jìn)行推薦時,對于群中的選擇型用戶,個體選擇大于群的影響,推薦時僅考慮個體偏好;對于影響型用戶,群的影響大于個體選擇,用群的偏好代替?zhèn)€體偏好,最后進(jìn)行個體推薦結(jié)果集結(jié),見公式(1)。 群推薦策略1: (1) 策略2:從群的角度進(jìn)行群推薦,針對選擇型的群,需要著重考慮個體用戶的偏好,也就是在群推薦時候,對群中的所有用戶根據(jù)其個體偏好單獨(dú)進(jìn)行推薦;而對于影響型的群,群體的偏好趨向一致,可以直接用群體的偏好代表所有用戶的個體偏好,在群推薦時候?qū)θ褐兴杏脩舻钠霉灿萌旱钠茫詈笮纬蓡我坏耐扑]列表,見公式(2)。 群推薦策略2: (2) 矩陣分解與傳統(tǒng)的算法相比可以帶來更好的推薦結(jié)果,矩陣分解模型(Matrix Factorization,MF)[20]是一種隱語義模型,其基本原理是將表示用戶—項(xiàng)目的評分矩陣R分解成兩個矩陣,用戶因素矩陣P和項(xiàng)目因素矩陣Q,則預(yù)測分?jǐn)?shù)可以表示為: (3) 其中K是隱特征個數(shù),對群的推薦可以看成Z∶G×U×I→R,進(jìn)行TopN推薦時,使得群里面所有用戶的平均滿意度最高。 (4) 本文個體和群體偏好分別用矩陣分解表示為: (5) 其中bi∈B表示項(xiàng)目的偏差程度,流行的項(xiàng)目bi值會較大。 貝葉斯個性化排序?qū)W習(xí)模型BPR根據(jù)評分來優(yōu)化用戶對項(xiàng)目的排序,在對個體用戶的應(yīng)用上取得了較好的效果,本文根據(jù)個體和群體的類型,將其改進(jìn)以適用于群體的情況,實(shí)現(xiàn)矩陣分解模型求解。 3.2.1 模型優(yōu)化準(zhǔn)則 在群推薦策略中,模型可以被看作>g,u,i?I×I在給定(g,u)下是一個排序問題,模型目標(biāo)是則優(yōu)化問題為極大化如下目標(biāo): p(Θ|>g,u)∝p(>g,u|Θ)p(Θ) (6) 其中>g,u是(g,u)的隱偏好排序,模型假設(shè)所有用戶相互獨(dú)立,對于用戶項(xiàng)目對(ia,ib)的排序與其它項(xiàng)目對的順序獨(dú)立。上述似然函數(shù)p(>g,u|Θ)進(jìn)一步改寫為: (7) 其中ψ是指示函數(shù),ψ(x)=1如果x為真,否則ψ(x)=0。ia>g,uib指給定一個(g,u),其對ia的偏好高于ib。 由于排序方案的總體性和反對稱性,上式可以進(jìn)一步簡化為: (8) 定義一個(g,u)對相比項(xiàng)目ib更偏向ia的概率為: (9) (10) 再引入了一個一般性的先驗(yàn)密度函數(shù)p(Θ),它是一個均值為0,方差協(xié)方差矩陣為ΣΘ的正態(tài)分布。 p(Θ)~N(0,ΣΘ) (11) 令ΣΘ=λΘI形式化描述最大后驗(yàn)估計(jì),從而推導(dǎo)用于個性化排序的一般性最優(yōu)化準(zhǔn)則: (12) 其中λΘ是與模型相關(guān)的正則化參數(shù)。 3.2.2 模型學(xué)習(xí)算法 模型優(yōu)化準(zhǔn)則可微分,所以可以利用梯度下降算法求解,當(dāng)給定一組(g,u,ia,ib)樣本,模型參數(shù)為θ,則梯度下降求解算法為: (13) 基于Bootstrap抽樣的隨機(jī)梯度下降(SGD,Stochastic Gradient Descent),對于每個元組(g,u,ia,ib)∈Ds進(jìn)行一次更新。 (14) 模型具體學(xué)習(xí)過程如下: 1)Learn Step:固定WU、WG,然后學(xué)習(xí)參數(shù)G、U、IG、IU、B。給定一組(g,u,ia,ib),則梯度下降求解過程。 (15) Bia=Bia+α·(δ-λ·Bia) Bib=Bib+α·(-δ-λ·Bib) 2)Uptate Step:固定G、U、IG、IU、B,學(xué)習(xí)WG、WU。 (16) 3.2.3 用戶和群分類 根據(jù)學(xué)習(xí)到的參數(shù)WU、WG,對用戶和群進(jìn)行分類。 1)用戶分類 若在某個群c中,個體用戶u的wuc>wgc則在這個群中u為選擇型,若u在其所有參加的群中,絕大多數(shù)情況下都是選擇型,則最終定義用戶u為選擇型用戶,否則為社會影響型用戶。 2)群分類 若在某個群c中,絕大多數(shù)用戶的wuc>wgc,則定義群c為選擇型群,否則為影響型群。 策略1:從用戶的角度進(jìn)行群推薦 對于選擇型用戶u,WUu的權(quán)重為1,WGu中所有的權(quán)重為0;對于影響型用戶,WUu的權(quán)重為0,WGu中所有的權(quán)重為1。確定下來參數(shù)WU、WG后,再重新學(xué)習(xí)參數(shù)G、U、IG、IU、B,以保證群推薦的精度。此時群推薦就是對群中所有的用戶進(jìn)行推薦,匯總個體用戶推薦列表,取總排名在前的項(xiàng)目作為群推薦候選項(xiàng)目。 策略2:從群的角度進(jìn)行群推薦 對于選擇型群c,WUc中所有用戶的權(quán)重為1,WGc的權(quán)重為0;對于影響型群c,WUc中所有用戶的權(quán)重為0,WGc的權(quán)重為1。確定下參數(shù)WU、WG后,重新學(xué)習(xí)參數(shù)G、U、IG、IU、B。此時群推薦,選擇型群是對群中所有的用戶單獨(dú)進(jìn)行推薦,匯總推薦列表,影響型群就是對群整體進(jìn)行推薦,形成單獨(dú)的群推薦列表。 為驗(yàn)證本文提出的用戶和群分類方法,以及群推薦策略,實(shí)驗(yàn)采用2個真實(shí)社交網(wǎng)絡(luò)數(shù)據(jù)集,CiteULike和Last.fm,表1為實(shí)驗(yàn)數(shù)據(jù)集信息。CiteULike(http://www.citeulike.org/)是一個著名的論文書簽網(wǎng)站,研究人員提交或者收藏自己感興趣的論文并且給論文打標(biāo)簽,以便更好地發(fā)現(xiàn)和自己研究領(lǐng)域相關(guān)的優(yōu)秀論文。CiteULike可以邀請朋友加入創(chuàng)建Group,同群組的人一起分享文獻(xiàn)。本文選擇至少有5個用戶的群和至少標(biāo)注過2篇論文的用戶,實(shí)驗(yàn)數(shù)據(jù)集總共包含130 321個(Group-User-Item)三元組,11 168篇論文作為項(xiàng)目,1 310個用戶和584個群。Last.fm(http://www.last.fm/),是一個提供音樂分享服務(wù)的個性化網(wǎng)站,是世界上最大的社交音樂平臺。該站點(diǎn)通過每個用戶的音樂收聽情況提供個性化推薦、聯(lián)系品味相近的用戶、提供定制的電臺廣播及更多其他服務(wù)。在Last.fm中,音樂愛好者也可以創(chuàng)建群組共享音樂。Last.fm實(shí)驗(yàn)數(shù)據(jù)集包含317 907個(Group-User-Item)三元組,3 602個用戶和2 716個群,共點(diǎn)評了1 992個項(xiàng)目。 表1 CiteULike and Last.fm數(shù)據(jù)集 實(shí)驗(yàn)采用平均精度均值MAP(Mean Average Precision)、召回率(Recall)和MRR(Mean Reciprocal Rank)作為衡量指標(biāo)。 MAP平均精度均值是推薦結(jié)果準(zhǔn)確率(Precision)的平均值表示方式,算法推薦出來的相關(guān)項(xiàng)目Rank越高,MAP就可能越高。如果算法推薦的項(xiàng)目沒有命中,則準(zhǔn)確率為0,MAP也會降低,MAP值越高說明預(yù)測準(zhǔn)確率越高。 (17) 召回率評估群推薦系統(tǒng)返回所有相關(guān)項(xiàng)目的能力,該值越高,代表系統(tǒng)性能越好,召回率衡量的是推薦系統(tǒng)的查全率。 (18) 其中N是在測試集的相關(guān)項(xiàng)目的數(shù)量,Nrelated是在測試集中出現(xiàn)的推薦排序列表中的項(xiàng)目數(shù)。 MRR考查推薦項(xiàng)目列表集合的優(yōu)劣,跟第一個正確項(xiàng)目的位置有關(guān),第一個正確項(xiàng)目越靠前,結(jié)果越好。MRR將給予推薦列表中出現(xiàn)在前面的項(xiàng)目較高的值,后面出現(xiàn)的項(xiàng)目MRR值逐漸遞減。 (19) 其中|G|是測試集中群的個數(shù),rank(g)表示在推薦列表中正確項(xiàng)目的排名。 本文實(shí)驗(yàn)通過對WU、WG參數(shù)的學(xué)習(xí),比較用戶個體和群體權(quán)重的大小,若用戶在其所有參加的群中半數(shù)以上表現(xiàn)為選擇型特征則定義為選擇型用戶。表2為用戶分類結(jié)果,2個實(shí)驗(yàn)數(shù)據(jù)集都是選擇型用戶多于影響型用戶,Last.fm中選擇型用戶數(shù)更是遠(yuǎn)遠(yuǎn)多于影響型用戶數(shù),表明在Last.fm中用戶的主動選擇大于社會影響,Last.fm中用戶參加一個音樂小組群,更多的是基于個體對于音樂的興趣。而在CiteULike中,網(wǎng)站主要功能是用來處理文獻(xiàn)引用和文獻(xiàn)分享的需要,用戶加入某個群可能是為了獲取其他人的文獻(xiàn)分享,因此用戶的研究興趣偏好會受到外界其他用戶一定的影響,在CiteULike中影響型用戶雖然也少于選擇型用戶,但差距沒有Last.fm中的大。 表2 用戶分類結(jié)果 用戶分類之后,再對實(shí)驗(yàn)數(shù)據(jù)集的群進(jìn)行分類,實(shí)驗(yàn)數(shù)據(jù)集是選擇型用戶多于影響型用戶,因此以選擇型群的識別進(jìn)行分類,此處先做個一般情況下的劃分,下一節(jié)將做更細(xì)致分類條件分析。實(shí)驗(yàn)將群中的用戶興趣偏好其個體的影響權(quán)重在55%以上的,也就是wuc≥0.55的用戶占到群中用戶數(shù)的半數(shù)以上,定義為選擇型群,低于半數(shù)的為影響型群。表3為群分類結(jié)果,無論是CiteULike還是Last.fm,選擇型群都要多于影響型群,也說明在這兩類社交網(wǎng)絡(luò)中,群的形成主要還是基于同質(zhì)性的主動選擇,用戶根據(jù)其興趣偏好加入某個群。 表3 群分類結(jié)果 圖2 MAP實(shí)驗(yàn)結(jié)果 圖3 Rec@10實(shí)驗(yàn)結(jié)果 圖4 MRR實(shí)驗(yàn)結(jié)果 圖2~4為實(shí)驗(yàn)結(jié)果,從各圖中可以看出,本文提出的方法在各個指標(biāo)上都優(yōu)于其他方法。群推薦GR的指標(biāo)最好,但GR沒有實(shí)現(xiàn)用戶和群分類,依賴的參數(shù)權(quán)重與測試數(shù)據(jù)集有關(guān),可能存在過擬合的情況。UCGR和GCGR推薦效果稍低于GR,都優(yōu)于傳統(tǒng)的方法。UCGR實(shí)現(xiàn)了用戶分類,GCGR實(shí)現(xiàn)了群分類,對于其他針對群營銷的應(yīng)用場合也能有較好參考價值,而不僅僅限于實(shí)驗(yàn)數(shù)據(jù)集。BPR-U和BPR-G的實(shí)驗(yàn)結(jié)果說明,僅考慮個體或者僅考慮群體的這兩種方法都不合適,在對群偏好集結(jié)時,應(yīng)該根據(jù)群體的特征,同時考慮群體和個體的共同作用。群推薦的結(jié)果也驗(yàn)證了本文的用戶和群分類是有效的。 前面在做群分類時,將wuc≥0.55的權(quán)重影響程度作為群分類條件,群的不同分類條件,可能會對群的分類有較大的影響結(jié)果,表4和表5為其他幾種條件下,2個實(shí)驗(yàn)數(shù)據(jù)集群的分類結(jié)果敏感性分析。隨著選擇型群分類條件的提高,實(shí)驗(yàn)數(shù)據(jù)集的選擇型群數(shù)量會降低,Last.fm在≥0.65和≥0.7下分類結(jié)果一樣。圖5為CiteULike敏感性實(shí)驗(yàn)結(jié)果,可以看出,≥0.55的群劃分條件下,CiteULike的群推薦效果最好,在≥0.5~≥0.6條件下,群分類結(jié)果和推薦效果都較為穩(wěn)定,只在≥0.7后推薦效果才有較大的下降。圖6為Last.fm敏感性實(shí)驗(yàn)結(jié)果,在≥0.5的群劃分條件下Last.fm的群推薦效果最好,且其他條件下推薦效果也較為穩(wěn)定。敏感性分析的結(jié)果也同時表明,本文提出的群分類方法在不同分類條件下的推薦結(jié)果較為穩(wěn)定,都優(yōu)于普通的推薦方法。 表4 CiteULike不同條件下群的分類 圖5 CiteULike敏感性實(shí)驗(yàn)結(jié)果 群分類≥0.5≥0.55≥0.6≥0.65≥0.7選擇型群數(shù)目23082256204317151715影響型群數(shù)目38846067310011001 圖6 Last.fm敏感性實(shí)驗(yàn)結(jié)果 隨著社交網(wǎng)絡(luò)的發(fā)展,針對群體的群推薦系統(tǒng)應(yīng)用也越來越廣,本文提出了一種針對社會選擇和社會影響兩種機(jī)制的社群用戶和群分類方法,在分類基礎(chǔ)上,提出2種不同的群推薦策略,CiteULike和Last.fm兩個實(shí)驗(yàn)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,本文提出的群推薦方法優(yōu)于傳統(tǒng)的個性化推薦方法。本文的方法還同時解決了群推薦3個主要問題,首先是在社交網(wǎng)絡(luò)中沒有明確用戶評分的情況下,如何隱含的獲取用戶偏好信息;其次是社交網(wǎng)絡(luò)群偏好聚集策略,問題的復(fù)雜性在于個體偏好的動態(tài)性和多樣性,并且這種偏好要受到所加入群的影響,加入的群越多,影響的程度不同復(fù)雜性越大,本文通過對社交網(wǎng)絡(luò)中用戶和社群的分類,實(shí)現(xiàn)社交網(wǎng)絡(luò)群偏好的聚集;最后是社交網(wǎng)絡(luò)群推薦策略,社交網(wǎng)絡(luò)中群類型的不同,分別采取不同的推薦策略,針對選擇型的用戶和群,需要著重考慮個體用戶的偏好,也就是在群推薦時,對群中的用戶根據(jù)其個體偏好單獨(dú)進(jìn)行推薦,而對于影響型的用戶和群,群體的偏好趨向一致,可以直接用群體的偏好代表所有用戶的個體偏好,在群推薦時對群中所有用戶的偏好共用群的偏好,然后進(jìn)行推薦。 [1]Jameson A,Smyth B.Recommendation to groups[J].The adaptive web,2007:596-627. [2]Boratto L,Carta S.State-of-the-art in group recommendation and new approaches for automatic identification of groups[J].Information retrieval and mining in distributed environments,2011,324:1-20. [3]Masthoff J.Group recommender systems:Combining individual models[J].Recommender systems handbook,2011:677-702. [4]張玉潔,杜雨露,孟祥武.組推薦系統(tǒng)及其應(yīng)用研究[J].計(jì)算機(jī)學(xué)報,2016,39(4):745-764. [5]O’Connor M,Dan C,Konstan J A,et al.PolyLens:a recommender system for groups of users[C]//Conference on European Conference on Computer Supported Cooperative Work.Kluwer Academic Publishers,2001:199-218. [6]Jameson A,Baldes S,Kleinbauer T.Two methods for enhancing mutual awareness in a group recommender system[C]//Proceedings of the working conference on Advanced visual interfaces.ACM,2004:447-449. [7]Ardissono L,Goy A,Petrone G,et al.Tailoring the recommendation of tourist information to heterogeneous user groups[C]//Workshop on Adaptive Hypermedia.Springer,Berlin,Heidelberg,2001:280-295. [8]Yu Z,Zhou X,Hao Y,et al.TV Program Recommendation for Multiple Viewers Based on user Profile Merging.[J].User Modeling and User-Adapted Interaction,2006,16(1):63-82. [9]McCarthy J F,Anagnost T D.MusicFX:an arbiter of group preferences for computer supported collaborative workouts[C]//Proceedings of the 1998 ACM conference on Computer supported cooperative work.ACM,1998:363-372. [10]梁昌勇,冷亞軍,王勇勝,等.電子商務(wù)推薦系統(tǒng)中群體用戶推薦問題研究[J].中國管理科學(xué),2013,21(3):153-158. [11]Leskovec J,Backstrom L,Kumar R,et al.Microscopic evolution of social networks[C]//Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining.ACM,2008:462-470. [12]Lewis K,Gonzalez M,Kaufman J.Social selection and peer influence in an online social network[J].Proceedings of the National Academy of Sciences,2012,109(1):68-72. [13]Denrell J.SOCIOLOGY:Indirect social influence[J].Science,2008,321(5885):47-48. [14]Bond R M,Fariss C J,Jones J J,et al.A 61-million-person experiment in social influence and political mobilization[J].Nature,2012,489(7415):295-298. [15]Muchnik L,Aral S,Taylor S J.Social influence bias:A randomized experiment[J].Science,2013,341(6146):647-651. [16]Ma L,Krishnan R,Montgomery A L.Latent homophily or social influence? An empirical analysis of purchase within a social network[J].Management Science,2014,61(2):454-473. [17]肖邦明,黃敏學(xué).交易型社區(qū)的病毒式營銷策略:基于社會影響、同質(zhì)性和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的ABMS仿真研究[J].營銷科學(xué)學(xué)報,2015,11(1):22-38. [18]Rendle S,Schmidt-Thieme L.Pairwise interaction tensor factorization for personalized tag recommendation[C]//Proceedings of the third ACM international conference on Web search and data mining.ACM,2010:81-90. [19]Rendle S,Freudenthaler C,Gantner Z,et al.BPR:Bayesian personalized ranking from implicit feedback[C]//Proceedings of the twenty-fifth conference on uncertainty in artificial intelligence.AUAI Press,2009:452-461. [20]Yehuda Koren,Robert Bell,Chris Volinsky.Matrix Factorization Techniques for Recommender Systems[J].Computer,2009,42(8):30-37. [21]Hu Y,Koren Y,Volinsky C.Collaborative filtering for implicit feedback datasets[C]//Data Mining,2008.ICDM’08.Eighth IEEE International Conference on.Ieee,2008:263-272. [22]何軍,劉業(yè)政.同質(zhì)性和社會影響對混合型社交網(wǎng)絡(luò)形成的仿真分析[J].現(xiàn)代情報,2017,37(4):87-94. CommunityClassificationandGroupRecommendationStrategyofOnlineSocialNetworksBasedonSocialSelectionandSocialInfluence He Jun1,2Liu Yezheng1Wang Jinkun1 (1.School of Management,Hefei University of Technology,Hefei 230009,Chian;2.School of Business,Anhui University,Hefei 230601,China) Social selection and social influence are the two main factors in the formation of online social network community.If classification of users and groups in network community effectively,it can take different strategies for group recommendation,so can realize the community satisfaction maximization.The paper used pairwise to express user preference preference,used matrix factorization and Bayesian personalized ranking method to judge social selection and influence on user preferences.And it realized the classification of users and groups,Then proposed 2 group recommendation strategies.Finally,the experimental results of 2 datasets showed that the proposed group recommendation strategy based on classification of users and groups is effective. community classification;group recommendation;social selection;social influence;recommendation strategy 10.3969/j.issn.1008-0821.2018.01.013 TP181;TP391 A 1008-0821(2018)01-0092-08 2017-08-29 國家自然科學(xué)基金項(xiàng)目“基于模體挖掘面向在線社交網(wǎng)絡(luò)中虛擬社區(qū)的群推薦系統(tǒng)研究”(項(xiàng)目編號71371062);安徽省教育廳人文社會科學(xué)重點(diǎn)項(xiàng)目“在線社交網(wǎng)絡(luò)社區(qū)形成機(jī)制對企業(yè)社會化營銷策略的影響研究”(項(xiàng)目編號SK2015A234)。 何軍(1978-),男,講師,博士研究生,研究方向:社會網(wǎng)絡(luò)分析、信息處理、決策分析。劉業(yè)政(1965-),男,教授,博士生導(dǎo)師,研究方向:智能決策理論與方法、電子商務(wù)。王錦坤(1990-),男,博士研究生,研究方向:個性化推薦、數(shù)據(jù)挖掘。 (實(shí)習(xí)編輯:陳 媛)2.3 群推薦策略


3 群推薦實(shí)現(xiàn)方法
3.1 基于矩陣分解的模型表示

3.2 基于貝葉斯個性化排序的模型實(shí)現(xiàn)







3.3 群推薦策略實(shí)現(xiàn)
4 群分類和群推薦實(shí)驗(yàn)
4.1 實(shí)驗(yàn)數(shù)據(jù)集

4.2 評價方法


4.3 用戶和群分類結(jié)果


4.4 群推薦結(jié)果




4.5 敏感性分析




5 結(jié)束語