999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學術虛擬社區核心用戶興趣遷移模型構建研究

2021-02-04 07:50:27楊瑞仙黃書瑞王彰奇
現代情報 2021年2期
關鍵詞:頁面用戶

楊瑞仙 黃書瑞 王彰奇

摘?要:[目的/意義]針對目前學術虛擬社區存在對核心用戶興趣變化關注不足的問題,本文基于艾賓浩斯遺忘曲線構建用戶興趣遷移模型,以準確描述核心用戶的興趣遷移,提升對核心用戶個性化推薦結果的準確率。[方法/過程]以“小木蟲論壇”為研究對象,構建用戶影響力評估指標和問答網絡,分別利用熵權法和PageRank算法識別核心用戶。在此基礎上,基于艾賓浩斯遺忘曲線構建核心用戶興趣遷移模型,并對此模型的適用性進行驗證。[結果/結論]本文所構建的核心用戶興趣遷移模型能更好地反映核心用戶的興趣遷移。

關鍵詞:學術虛擬社區;用戶興趣遷移模型;小木蟲;熵權法;PageRank算法;核心用戶識別;艾賓浩斯遺忘曲線;協同過濾算法

DOI:10.3969/j.issn.1008-0821.2021.02.002

〔中圖分類號〕G203?〔文獻標識碼〕A?〔文章編號〕1008-0821(2021)02-0010-09

Abstract:[Objective/Meaning]Aiming at the current academic virtual community's insufficient attention to changes in core user interest,this paper builds a user interest transfer model based on the Ebbinghaus forgetting curve to accurately describe the core user's interest transfer and improve the accuracy of personalized recommendations for core users.[Method/Process]The paper took the“emuch BBS”as the research object,constructed user influence evaluation indicators and question-and-answer network,and then respectively used entropy method and PageRank algorithm to identify core users.On this basis,the core user interest transfer model was constructed based on the Ebbinghaus Forgetting Curve,and the applicability of this model was verified.[Results/Conclusions]The core user interest transfer model constructed in this paper could better reflect the core user's interest transfer.

Key words:academic virtual community;user interest migration model;emuch BBS;entropy weight method;PageRank algorithm;core user identification;ebbinghaus forgetting curve;collaborative filtering algorithm

隨著互聯網的發展,網絡空間發展理念逐漸由面向數據轉變為面向用戶。如今,隨著社交媒體的出現,經管之家(原人大經濟論壇)、科學網博客、小木蟲學術科研互動平臺(以下簡稱“小木蟲論壇”)等學術虛擬社區逐漸成為科研人員涉足的非正式科研交流新場所。在學術虛擬社區中,用戶可以通過發文、點贊、回復以及轉發等形式發布與科研相關的知識,社區內的用戶可在短時間內完成知識交流的過程,其時效性和交互性逐漸受到科研人員的青睞[1]。隨著用戶逐漸成為學術虛擬社區的核心,學術虛擬社區能夠吸引多少用戶成為該社區是否成功的一項重要衡量指標。然而,信息的爆炸式增長使得用戶在海量數據中獲取其感興趣內容的需求難以滿足,進而導致用戶對社區的關注度缺失[2]。在此背景下,學者們開始關注從海量數據中挖掘具有潛在價值的信息和知識的研究,并提出了用戶個性化服務的概念。用戶個性化服務是以用戶為本,通過各種渠道收集、整理和分類用戶的歷史行為數據,了解用戶的興趣,向用戶推薦相關信息,以滿足用戶的信息需求。對用戶興趣的研究是精準化推薦的重要基礎,用戶興趣模型的好壞直接影響著相關分析和服務的準確度。

學術虛擬社區中的核心用戶指在人際傳播中為他人提供信息,同時也對他人施加影響的“活躍分子”[3],他們既是信息傳播過程中的主要擴散者,也是權威起源者,由此形成了社交網絡中的信息級聯傳播,這在社交網絡的知識傳播交流過程中發揮著至關重要的作用。由于學術虛擬社區信息資源的極大豐富和核心用戶在知識交流過程中的關鍵地位,識別學術虛擬社區中的核心用戶,并根據他們的歷史行為信息了解他們的興趣偏好,以實現對核心用戶的個性化推薦,對社區的建設和發展而言顯得尤為重要。

協同過濾推薦算法可以根據用戶歷史行為數據挖掘用戶的興趣偏好,預測用戶可能感興趣的內容并向其推薦,實現對用戶的個性化推薦,并在電子商務中得到了廣泛應用[4]。本文通過協同過濾算法計算核心用戶興趣遷移模型推薦結果的準確率,進而評估模型性能。

在學術虛擬社區中,“小木蟲論壇”擁有良好的交流氛圍及豐富的學術資源,已成為最具影響力的學術虛擬社區之一。為此,本文主要以“小木蟲論壇”為研究對象,通過構建用戶影響力評估指標體系和問答網絡識別學術虛擬社區中的核心用戶;利用用戶的發帖相關信息構建核心用戶興趣遷移模型;通過協同過濾算法驗證該模型的合理性,為社區的建設和發展提供參考建議。

1?相關研究

相關學者通過文獻調研發現,有關核心用戶興趣的研究是個性化信息服務的重要基礎,深入分析核心用戶興趣是精準化信息投放的有力保障。Koren Y和Liu J等[5-6]認為用戶的興趣偏好可能隨時間變化,一些學者提出部分存儲模型描述用戶興趣隨時間變化的現象[7-8]。如于洪濤等[9]基于遺忘曲線提出了用戶興趣模型,認為用戶所關注信息距離當前時間越遠越容易被遺忘,用戶關注某領域的信息越多,對該領域的興趣度越高;董晨露等[10]根據用戶評論將遺忘曲線引入傳統過濾算法中,利用遺忘曲線描述用戶興趣遷移;王占等[11]綜合用戶信任度、用戶相似度以及用戶興趣遷移,為目標用戶推薦項目。相關研究表明,目前有關用戶興趣隨時間變化的研究大多從用戶在以往某個時刻與當前時間的時間間隔角度計算用戶在不同主題方向的興趣度變化,有關用戶在相鄰時間窗興趣變化的研究尚顯不足,這不利于準確把握用戶興趣隨時間的變化。此外,針對核心用戶興趣遷移的研究較為匱乏。

已有研究表明[12-14],用戶原創主題帖內容豐富,能夠在很大程度上體現用戶的興趣方向,對用戶發帖信息進行研究具有重要意義。由此,本文首先獲取“小木蟲論壇”的相關數據項,利用熵權法計算用戶的影響力,構建用戶問答網絡,利用PageRank算法計算用戶在社交網絡中的重要性,進而識別核心用戶;同時基于艾賓浩斯遺忘曲線建立核心用戶興趣遷移模型。此研究為提高學術虛擬社區用戶粘性,促進學術虛擬社區的建設和發展具有一定參考意義。

2?研究方法

本文主要采用熵權法計算用戶影響力,在此基礎上構建用戶問答網絡,利用PageRank算法計算用戶在問答網絡中的重要性,進而識別核心用戶。在此基礎上,采用艾賓浩斯遺忘曲線計算不同時刻用戶在各主題方向的興趣度,構建核心用戶興趣遷移模型,并通過實驗驗證此模型的性能。

2.1?核心用戶識別方法

2.1.1?熵權法

熵權法是一種以信息熵為權重標準,計算各指標權重的方法。熵是表征系統無序程度的一個度量,香農最早將其引入信息論中。根據信息論的基本原理,信息是系統有序程度的一個度量,因此稱熵的度量值為信息熵[15]。信息熵可用于度量隨機指標的不確定程度,以解決信息量度量的問題。某一指標的信息熵越小,該指標提供的信息量越大,在綜合評價中的作用越大,權重越高[16]。因而,可利用熵權法確定各指標的權重,以減少主觀因素對指標權重的影響,進而使評價結果更為客觀。

本文利用熵權法確定各指標權重的過程如下:

1)原始數據標準化。對原始數據的標準化處理公式見式(1):

式(1)中,xij表示原始數據第i個評價對象的第j個評價指標;yij表示標準化后第i個評價對象在第j個指標的值。

2)計算指標j的熵值,見式(2):

3)計算指標j的權重。ej值越小,表明指標效用價值越高,在評價指標體系中所起的作用越大,權重也就越高。指標j的權重見式(3):

4)各指標加權計算綜合得分。利用加權和公式計算樣本的得分或評價值,見式(4):

2.1.2?PageRank算法

PageRank算法是一種由搜索引擎根據網頁間的超鏈接計算網頁重要性的技術。近年來大量研究都致力于利用改進的PageRank算法挖掘社交網絡中的核心用戶[17]。本文利用PageRank算法網頁排名的這一特性體現問答網絡中節點的相關性和重要性。

PageRank算法通過網絡的超鏈接關系確定一個頁面的等級,把從A頁面到B頁面的鏈接解釋為A頁面給B頁面投票,根據投票來源和投票目標的等級確定新的等級。簡單地說,一個高等級頁面可以提升其他低等級頁面的等級。PageRank算法如下,假設有一個由A、B、C和D這4個頁面組成的小團體,如果所有頁面均鏈向A,那么A的PageRank值(以下簡稱PR值)就是B、C、D的PR值之和,即PR(A)=PR(B)+PR(C)+PR(D)。假設B也有到C的鏈接,且D也有鏈接到包括A的3個頁面,由于一個頁面不能投票2次,所以B給每個頁面投半票。同理,D的投票只有1/3算到了A的PR值上,此時A的PR值為PR(A)=PR(B)2+PR(C)1+PR(D)3,即根據鏈出頁面的總數評估一個頁面的PR值,即如果L(X)表示從X鏈出頁面的數量,那么PR(A)=PR(B)L(B)+PR(C)L(C)+PR(D)L(D)。

為保證鏈出頁面的公平,本文規定阻尼系數(Damping Factoe)q為常規值0.85,其表示用戶在任意時刻達到某頁面后繼續向后瀏覽的概率。1-q表示用戶停止點擊,隨機跳轉到新頁面的概率。Google通過數學系統給每個頁面一個初始PR值,其計算過程如式(5)所示。

式(5)中,p1,p2,…,pN指被研究頁面,網絡中存在由頁面pj指向pi的鏈接,L(pj)是pj鏈出頁面的數量,N是所有頁面的數量,q為阻尼系數。

所有頁面的PR值是特殊矩陣中的特征向量,這個特征向量可表示為:

式(6)中,φ(pi,pj)=1L(pj),如果pj不鏈向pi,且對每個j都成立,那么φ(pi,pj)=0,且∑Ni=1φ(pi,pj)=1。

因此,一個頁面的PR值由其他頁面的PR值計算所得,如果每個頁面有一個隨機的PR值(非0),那么經過不斷地重復計算,這些頁面的PR值會逐漸趨向于正常和穩定。

2.2?遺忘曲線

在分析用戶興趣的背景下,遺忘曲線是指用戶興趣偏好程度隨時間逐漸衰減過程的數學函數[18]。德國心理學家Hermann E[19]通過對人類大腦接觸新事物時的遺忘規律進行系統實驗和深入分析,提出了反映人類中長期記憶的艾賓浩斯遺忘曲線,并對記憶時效隨時間的變化特征加以描述。艾賓浩斯遺忘曲線可以反映人們的興趣偏好或記憶隨時間增長慢慢減弱的變化[20],有學者采用負指數曲線對其進行擬合,其量化函數如式(7)所示。

式(7)中,p0為初始記憶量,k為遺忘速率,用以反映遺忘曲線衰減速度的差異[21]。

2.3?協同過濾算法

協同過濾推薦算法是根據其他用戶的觀點對目標用戶推薦其感興趣話題的算法,它基于這樣一個假設[22]:如果用戶對一些項目的評分較為相似,則他們對其他項目的評分也較為相似。協同過濾推薦算法使用統計技術搜索目標用戶的若干最近鄰居,然后根據最近鄰居對項目的評分預測目標用戶對項目的評分,并產生對應的推薦列表。為找到目標用戶的最近鄰居,首先度量用戶間的相似性,然后選擇相似性最高的若干用戶作為目標用戶的最近鄰居。目標用戶最近鄰居查詢的準確性直接關系到整個推薦系統的推薦質量。

在推薦系統中,用戶對所有產品評價的數據庫中包含s個用戶的集合U={U1,U2,…,Us}和t個產品的集合I={I1,I2,…,It}。用戶評分數據集表示為一個s×t階的矩陣,如表1所示。本文主要研究不同時刻用戶在各主題方向的興趣度,故將用戶發帖的主題方向視為產品評價中的產品,將某一時刻用戶在不同主題方向的興趣度視為用戶評分,在此基礎上展開研究。

用戶—發帖主題方向興趣度矩陣中共有s行代表s個用戶,t列代表t個發帖主題方向。假設某一用戶Ua對發帖主題Ij(其中Ua∈U,Ij∈I)的興趣度為Ra,j,這個興趣度體現了用戶Ua對主題方向Ij的興趣和偏好程度。

2.3.1?相似性度量方法

相似性計算可以是在用戶間的相似性計算,也可以是產品間的計算[23]。本節中以用戶間的相似性研究為例,即基于用戶的協同過濾算法。余弦相似性可通過向量間的余弦夾角計算度量,其計算過程如式(8)所示。

式(8)中,Ra,k表示用戶Ua對主題方向Ik的興趣度,Sim(Ua,Ub)表示用戶間的相似性,它的取值范圍在[0,1]區間中,Sim(Ua,Ub)的值越大,表示用戶Ua和Ub間的相似性越大。

2.3.2?最近鄰(KNN)協同過濾算法

KNN協同過濾推薦算法是采用k個最相似的近鄰用戶預測興趣度的一種算法。通常推薦系統對某一用戶Ua主要有兩個任務:

1)在用戶發帖主題集中,選擇某一用戶a未曾發過的主題方向Ij,Ij不屬于Ra,j。

2)在用戶未發過的主題帖中,預測用戶興趣度最大的N個主題方向(N≥1),選擇推薦給用戶。

通過計算用戶間的相似性,基于用戶的協同過濾算法為未知的Ij尋找k個近鄰,即與Ua最相似的k個用戶,定義為:S(Ua)且S(Ua)=k,以預測用戶在某個主題方向的興趣度,該算法的實現過程如式(9)所示。

式(9)中,a、b分別表示用戶Ua、Ub對其他主題方向興趣度的均值,Rb,j表示用戶Ub對主題方向Ib的預測興趣度。

3?核心用戶興趣遷移模型構建

3.1?核心用戶識別

在識別核心用戶前,本文首先根據用戶在學術虛擬社區中的行為信息,從用戶積極性和權威性兩個維度構建用戶影響力評估指標,然后采用熵權法計算用戶在學術虛擬社區中的影響力,并在此基礎上構建用戶間的問答網絡,利用PageRank算法計算用戶在社交網絡中的重要性,識別社區中的核心用戶。

3.1.1?用戶影響力評估指標構建

本文在進行學術虛擬社區用戶影響力計算前,首先構造學術虛擬社區用戶影響力的評估指標,用戶影響力包括用戶積極性和權威性兩個一級指標,其中用戶積極性包括用戶應助數、散花數、發帖數、沙發數4個二級指標,用戶權威性包括聽眾人數、紅花數、貴賓值、金幣數4個二級指標,如表2所示。

3.1.2?問答網絡的構建

在大多數識別核心用戶的文獻中,社交網絡分析法具有較為明顯的優勢[24]。為了在學術虛擬社區中綜合性地識別核心用戶,本文借鑒郭博等的研究思路[25],結合“小木蟲論壇”的數據特征,利用學術虛擬社區中用戶間的問答互動行為信息,構建了一個基于用戶間問答關系的問答網絡結構。根據已建立的學術虛擬社區網絡結構,本文首先計算問答網絡中每位用戶的影響力,在此基礎上結合用戶問答網絡結構利用PageRank算法計算社交網絡中每位用戶的重要性,以挖掘學術虛擬社區中的核心用戶。該研究過程及其框架如圖1所示:

3.1.3?用戶PageRank綜合值計算

PageRank算法是數據挖掘領域較常見的一種算法,該算法利用每一頁面的權威值評估網頁在網站中的重要性。頁面的權威值被定義為指向該頁面的其他頁面平均分配給該頁面的權威值之和,通過迭代計算可以得到該網頁最終等級劃分[26]。假設用戶在問答網絡中均與其他用戶具有相應的交互關系,本文將PageRank算法的思想用于計算社交網絡中每位用戶在社交網絡中的重要性。

學術虛擬社區中的問答網絡為加權有向網絡,由于問答網絡需要考慮邊的權重,因此在計算時需要在每個頂點形成權威值的不對等傳遞,以真實地反映每位用戶的影響力。將兩個頂點之間的邊權重表示為式(10):

式(10)中,p(i)為利用熵權法根據用戶的積極性和權威性計算的用戶影響力,Nij為用戶i與用戶j在問答關系中出現的頻次。本文根據傳統的PageRank算法式(7)將每個頂點i在問答網絡中的綜合值QR(i)可以表示為式(11):

式(11)中,α為阻尼系數,在大多數情況下α取值為0.85[27]。本文將控制迭代結束的參數e設定為10-7。

3.2?興趣遷移模型構建

用戶興趣偏好隨時間的衰減過程與艾賓浩斯遺忘率的相關概念類似[18],當用戶剛接觸某類別內容時,可認為此刻用戶對該主題方向的興趣度最高,然而隨著時間的推移,若在一定時間內沒有持續的刺激,用戶在該主題方向的興趣度將會持續衰減,直至用戶的整體興趣度保持在有效記錄時間窗外的長期興趣度水平。在用戶興趣偏好變化理論的基礎上,本文通過定義遺忘曲線、時間窗與衰減率將時間因子與用戶興趣建立聯系。參照式(7)用戶興趣衰減階段,本文將以上過程用數學公式進行描述,則用戶興趣度的量化函數如式(12)所示。

式(12)中,Wtn-1為處理本條記錄前一刻用戶的興趣度,θ是衰減因子,t0是有效記錄的起始時間。

同時,在用戶興趣衰減的過程中,若在對應興趣類別下有新數據加入,即用戶在有效記錄時段多次發布此主題方向的內容,根據式(12),用戶興趣度的變化情況如圖2所示。圖2中t1、t2、t3分別表示用戶3次發帖的主題方向內容以及用戶興趣加入的時刻,整個興趣度變化呈現為分段函數,每一階段均為1次新函數的衰減過程。以(t1,t2)和(t2,t3)的兩個衰減過程為例,兩衰減過程的主要區別是本階段的起始位置p1和p2,每次加入新條目后的增量h1和h2,以及衰減率θ,根據這些指標即可計算任意時刻用戶的興趣度。

圖2?用戶興趣的變化趨勢圖

由圖2可知,在給定時間窗內,第n個衰減過程的起始位置pn是由上一衰減過程的剩余量rn-1與本次激勵下興趣度的增長量hn疊加而成,其起始位置的計算方法如式(13)所示。

對于每次激勵下用戶的興趣度增長量hn,因用戶在重復發表某一主題方向的內容時,每次提升的興趣度并不等量,隨著重復次數的增加,用戶在此方向的興趣度總量不斷增大,且這一增加過程逐漸趨于平緩,并最終收斂于某最大值。由此可知,在一定時間內,用戶所發布的特定主題方向的帖子記錄越多,每次興趣度的增量越少,可使用負指數函數對該過程進行描述,則每次激勵下用戶興趣的增量如式(14)所示。

由式(7)、(12)~(14)可得用戶在任意衰減過程中的興趣度初始值,如式(15)所示。

用戶興趣度能體現出用戶對該主題方向的興趣程度,但從用戶發帖標簽中提取的用戶興趣則需要考慮時效性。在實際分析過程中,研究人員通常以自分析時刻起,相鄰一段時間(如30天)的行為記錄作為用戶興趣偏好的分析目標。p0為用戶興趣增量的初始值,衰減率θ設定為時間窗長度的倒數。

4?實證研究

4.1?數據來源

本文以“小木蟲論壇”為研究對象,首先利用Python程序分別獲取“小木蟲論壇”中“有機交流”“第一性原理”“微米和納米”“金融投資”4個版塊所有用戶的url;然后訪問獲取用戶的url,提取出用戶id、性別、生日、專業、分組等用戶背景信息,用戶應助數、散花數、發帖數、沙發數等用戶積極性信息,用戶聽眾人數、紅花數、貴賓值、金幣數等用戶權威性信息,以及用戶發帖內容、發帖標簽等用戶發帖信息,并將所獲取的數據項存入Postgres數據庫中。其中,用戶發帖內容可用于表征用戶的興趣方向,用戶發帖標簽可用于概括用戶發帖信息的內涵,且根據“小木蟲論壇”社區的版塊導航結構,可將發帖標簽映射到16個主題方向上,用戶發帖標簽在各主題方向的映射結構(部分)如表3所示。為反映用戶的發帖信息特征,本文利用SQL腳本對所獲取的數據項進行刪除殘缺項等清洗和整理操作,并將739名用戶在2015年1月1日—2020年1月1日的11 119條發帖信息作為本研究的數據集。

4.2?核心用戶識別

本文采用熵權法分別計算各級指標的權重,分別得到用戶活躍性各指標對應的權重w和信息熵e如表4所示,用戶權威性各指標對應的權重w和信息熵e如表5所示,用戶影響力各指標對應的權重w和信息熵e如表6所示。

由表4可知,在用戶活躍性指標中,用戶沙發數對用戶活躍性影響最大,權重為0.32,其次為應助數,權重為0.26,由此首先評論用戶發帖的用戶和主動幫助他人解決問題的用戶對用戶活躍性的影響最大,因此,社區管理者可通過激勵用戶成為帖子的首位評論者、鼓勵用戶積極幫助解答他人的求助問題等方式提升學術虛擬社區用戶的積極性。由表5可知,用戶的貴賓值對用戶權威性影響最大,權重值為0.38,其次為聽眾人數和紅花數,權重值均為0.22。由表6可知,相比于用戶活躍性,用戶權威性對用戶影響力的影響最大,權重為0.55,因此用戶若想提升自身在學術虛擬社區中的影響力,應該著重提升自身的權威性。

根據表4、表5和表6的計算結果,計算用戶的影響力。本文參照式(11)計算用戶在問答網絡中的綜合值QR,進而識別學術虛擬社區中的核心用戶。借鑒袁潤等[27]將用戶影響力前25%的用戶作為高互動影響力群體的結論,本文根據用戶的QR值對739名用戶進行倒序排序,將排名前25%的185名用戶作為學術虛擬社區內的核心用戶,其影響力綜合值排名如表7所示。

其中這185名核心用戶在5年內共計發文5 103條,平均每人每年發文5.5條。這一結果表明學術虛擬社區核心用戶的人均發文量較少,然而社區內的核心用戶作為社區的中堅力量,在鼓勵其他用戶積極參與社區活動中發揮著至關重要的作用,因此對核心用戶興趣偏好的研究就顯得尤為重要。

4.3?核心用戶興趣遷移

根據3.2節基于艾賓浩斯遺忘曲線的用戶興趣建模結果,本文在計算用戶在不同時刻各主題方向的興趣度時,將用戶興趣增量的初始值p0設置為0.8,時間窗口設置為180天,則用戶的衰減因子θ為1/180。因篇幅限制,本文從185名核心用戶中隨機挑選1名社區編號為“712283”的用戶,對其在不同時間節點的7條發帖信息興趣度進行展示,如表8所示。

由表8可知,用戶在某主題方向的初始興趣度值均為0.8,用戶在2015年3月26日首次發表“論壇事務區”相關主題帖,與在2019年8月22日第2次發表“論壇事務區”相關主題帖的時間間隔1 610天,興趣度由0.8衰減為0.6551,而用戶首次發表“版塊孵化區”相關主題帖的時間為2016年3月23日,與第2次在2016年5月28日發表“版塊孵化區”相關主題帖的時間間隔66天,興趣度由0.8上升為1.2094,這一結果符合艾賓浩斯遺忘曲線的假設情況。

4.4?個性化推薦實現

1)數據集

本文以185名核心用戶的5 103條發帖信息作為實驗數據集,整個實驗需要將實驗數據集劃分為訓練集和測試集。本文引入變量x,表示訓練集在整個數據集的占比,如x=0.8表示隨機地將數據集中的80%作為訓練集,20%作為測試集。在本文的所有實驗中,均采用x=0.8作為實驗基礎。

2)評價指標

評價指標反映一種推薦算法在運行過程中的效果,準確率反映系統推薦的主題帖內容中有多少是用戶真正想要的,這是評價推薦系統優劣性的一個重要指標。推薦結果的準確率計算公式如式(16)所示。

式(16)中,Precision指推薦結果的準確率,R(u)是根據用戶在訓練集中的行為為用戶推薦的列表,而T(u)是用戶在測試集上的行為列表。

3)實驗結果

在基于用戶的協同過濾的推薦算法中,本文使用被推薦用戶的最近鄰進行推薦,在實驗中,本文使用該算法將最近鄰數k從2取到20,間隔為2進行測試,利用Precision指標分析算法的運行效果,運行結果如圖3所示。

由圖3可知,當k=2時,推薦結果的準確率最高,達到了96.4%。隨著k值的增加,推薦結果的準確率逐漸降低,當k≥14時,推薦結果的準確率逐漸趨于平緩,并穩定在93.7%上下,高于Lan等學者所提出模型的推薦結果準確率[5]。故本文所構建的核心用戶興趣遷移模型能夠更好地預估核心用戶的興趣變化,為核心用戶推薦其可能感興趣的主題帖,提升學術虛擬社區的用戶粘度。

5?結?語

本文以“小木蟲論壇”為研究對象,獲取學術虛擬社區中的用戶信息數據項,構建學術虛擬社區用戶影響力的評估指標體系,利用熵權法計算各級指標的權重,計算用戶的影響力,在此基礎上構建問答網絡,利用PageRank算法計算用戶在社交網絡中的重要性,識別核心用戶。在此基礎上,本文基于艾賓浩斯遺忘曲線計算核心用戶在不同時刻各主題方向的興趣度,構建核心用戶興趣遷移模型,利用協同過濾算法驗證此模型的合理性。結果顯示,此模型能夠更好地評估用戶的興趣變化,推薦結果的準確率高達93.7%,有助于社區更好地根據核心用戶的歷史行為信息提供精準的個性化推薦服務,對于社區的建設和發展具有重要意義。

參考文獻

[1]Dietrich S.Internet:New Scientific Research Establishments[EB/OL].http://www.newso.org/ITNews/Trade/Internet-new-scientific-research-establishments/29eafd05-7352-451a-89bb-3d7c98495f6c,2020-08-19.

[2]Simon H A.Designing Organizations for an Information-rich World[J].Martin Greenberger Computers Communication & the Public Interest the Johns,1971,70:37-72.

[3]劉媛媛,張璇.新媒介時代微博意見領袖研究[J].新聞界,2016,(20):63-68.

[4]榮輝桂,火生旭,胡春華,等.基于用戶相似度的協同過濾推薦算法[J].通信學報,2014,(2):16-24.

[5]Koren Y.Collaborative Filtering with Temporal Dynamics[J].Communications of the ACM,2010,53(4):89.

[6]Liu J,Deng G.Link Prediction in a User-object Network Based on Time-weighted Resource Allocation[J].Physica A:Statistical Mechanics and its Applications,2009,388(17):3643-3650.

[7]Michalski R S,Maloof M A.Incremental Learning with Partial Instance Memory[J].Artificial Intelligence:An International Journal,2004,154(1/2):95-126.

[8]Maloof M A,Michalski R S.A Method for Partial-memory Incremental Learning and Its Application to Computer Intrusion Detection[M].1995:392-397.

[9]于洪濤,崔瑞飛,董芹芹.基于遺忘曲線的微博用戶興趣模型[J].計算機工程與設計,2014,(10):3367-3372,3379.

[10]董晨露,柯新生.基于用戶興趣變化和評論的協同過濾算法研究[J].計算機科學,2018,45(3):213-217,246.

[11]王占,林巖.基于信任與用戶興趣變化的協同過濾方法研究[J].情報學報,2017,36(2):197-205.

[12]扈維,張堯學,周悅芝.基于社會化標注的用戶興趣挖掘[J].清華大學學報:自然科學版,2014,54(4):502-507.

[13]何炎祥,劉續樂,陳強,等.社交網絡用戶興趣挖掘研究[J].小型微型計算機系統,2014,35(11):2385-2389.

[14]Joachims T,Freitag D,Mitchell T.WebWatcher:A Tour Guide for the World Wide Web[M].Pollack M E.1997:770-775.

[15]王道平,王煦.基于AHP/熵值法的鋼鐵企業綠色供應商選擇指標權重研究[J].軟科學,2010,24(8):117-122.

[16]程啟月.評測指標權重確定的結構熵權法[J].系統工程理論與實踐,2010,30(7):1225-1228.

[17]毛國君,謝松燕,胡殿軍.PageRank模型的改進及微博用戶影響力挖掘算法[J].計算機應用與軟件,2017,34(5):28-32,37.

[18]朱凱歌.面向個性化服務的用戶興趣挖掘方法研究與實現[D].北京:北京交通大學,2018.

[19]Ebbinghaus Hermann.Memory:A Contribution to Experimental Psychology[J].Annals of Neurosciences,2013,20(4).

[20]J.Bobadilla,F.Ortega,A.Hernando,et al.Recommender systems survey.2013,46:109-132.

[21]曾東紅,汪濤,嚴水發,等.一種基于指數遺忘函數的協同過濾算法[J].科技廣場,2013,(7):10-15.

[22]Breese J S,Heckerman D,Kadie C.Empirical Analysis of Predictive Algorithms for Collaborative Filtering[C]//UAI'98,San Francisco,CA,USA,1998:43-52.

[23]黃創光,印鑒,汪靜,等.不確定近鄰的協同過濾推薦算法[J].計算機學報,2010,33(8):1369-1377.

[24]Yoganarasimhan H.Impact of Social Network Structure on Content Propagation:A Study Using YouTube Data[J].Quantitative Marketing & Economics,2012,10(1):111-150.

[25]郭博,許昊迪,雷水旺.知乎平臺用戶影響力分析與關鍵意見領袖挖掘[J].圖書情報工作,2018,62(20):122-132.

[26]Xing W,Ghorbani A A.Weighted Page-Rank Algorithm[C]//Proceeding of the Second Annual Conference on Communication Networks and Services Research,2004.

[27]袁潤,王琦.學術博客用戶畫像模型構建與實證——以科學網博客為例[J].圖書情報工作,2019,63(22):13-20.

(責任編輯:陳?媛)

猜你喜歡
頁面用戶
微信群聊總是找不到,打開這個開關就好了
大狗熊在睡覺
刷新生活的頁面
保健醫苑(2022年1期)2022-08-30 08:39:14
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
同一Word文檔 縱橫頁面并存
主站蜘蛛池模板: 欧美不卡视频在线| 国产精品亚洲片在线va| 精品少妇人妻无码久久| 性视频久久| 色一情一乱一伦一区二区三区小说| 久久婷婷五月综合色一区二区| 亚洲—日韩aV在线| 日本免费一区视频| 国产成人凹凸视频在线| 成人久久精品一区二区三区| 亚洲精品天堂在线观看| 国产精品19p| 免费看a级毛片| 一本大道香蕉高清久久| 国产欧美视频在线| 成人夜夜嗨| 色有码无码视频| 五月天天天色| 五月天香蕉视频国产亚| 在线观看无码av五月花| 午夜不卡视频| 国产91全国探花系列在线播放| 亚洲第一天堂无码专区| 亚洲精品无码高潮喷水A| 制服丝袜在线视频香蕉| 国产熟女一级毛片| 国内黄色精品| a网站在线观看| 动漫精品啪啪一区二区三区| 欧美综合区自拍亚洲综合天堂| 人妻无码一区二区视频| 亚洲无线观看| 国产成人91精品免费网址在线| 超薄丝袜足j国产在线视频| 播五月综合| 久久精品免费看一| 亚洲 日韩 激情 无码 中出| 久久久久国产一区二区| 亚洲欧美另类专区| 草逼视频国产| 中文国产成人久久精品小说| 国产丝袜91| 久久精品91麻豆| 国产尤物在线播放| 老司机精品99在线播放| 成人在线欧美| 久热中文字幕在线观看| 高清无码不卡视频| 毛片视频网址| 麻豆国产在线不卡一区二区| 亚洲国产成熟视频在线多多| 亚洲国产成人超福利久久精品| 亚洲中文字幕在线一区播放| 中文无码精品A∨在线观看不卡 | 九九热视频在线免费观看| 国产区网址| 欧美一级高清免费a| 久久a毛片| 婷婷伊人久久| 九色国产在线| 韩国v欧美v亚洲v日本v| 久久久久亚洲av成人网人人软件| 无码中文字幕精品推荐| 538国产视频| 国产在线观看精品| 国产一级在线观看www色 | 亚洲中文字幕国产av| 99久久国产自偷自偷免费一区| 美女被躁出白浆视频播放| 91视频国产高清| 91毛片网| 国内精品91| 国产精品无码一区二区桃花视频| 在线观看无码av免费不卡网站| 成人午夜福利视频| 色悠久久综合| 欧美精品成人一区二区在线观看| 国产精品亚洲va在线观看 | 久久96热在精品国产高清| 日韩第八页| 免费观看男人免费桶女人视频| 日韩AV无码一区|