毛宜鈺,劉建勛,胡 蓉,唐明董,石 敏
湖南科技大學 知識處理與網絡化制造湖南省普通高校重點實驗室,湖南 湘潭 411201
采用Sigmoid函數的Web服務協同過濾推薦算法*
毛宜鈺+,劉建勛,胡 蓉,唐明董,石 敏
湖南科技大學 知識處理與網絡化制造湖南省普通高校重點實驗室,湖南 湘潭 411201
協同過濾;Sigmoid函數;數據稀疏性;推薦系統;用戶興趣
近年來隨著服務計算及其相關技術的發展,互聯網上涌現出大量功能相同但服務質量(quality of service,QoS)各異的Web服務,人們在滿足功能需求的同時對服務的非功能性需求愈發重視,使得個性化服務推薦技術成為服務計算領域的一個研究熱點。
協同過濾推薦是目前個性化推薦系統中應用最廣泛、最成功的技術,它通常分為兩類[1]:基于記憶的協同過濾(memory-based)和基于模型(model-based)的協同過濾。基于記憶的協同過濾通過近鄰算法對整個用戶-項目評分數據集進行計算,求出用戶或項目的相似鄰居來進行推薦。基于模型的協同過濾通過對歷史評分記錄進行學習來建立一個復雜的評分模型,然后基于該模型預測目標用戶對未評分項目的評分值產生推薦。
由于傳統協同過濾方法完全依賴評分產生推薦,而在用戶和項目數量巨大的實際應用中,用戶往往只對一小部分項目進行評價。這使得可用于度量相似度的評分數據極端稀疏,用戶之間常常因為沒有共同評分項目而無法進行比較[2]。另外,不同于普通項目,服務質量易隨各種客觀因素發生變化,用戶評分也會隨之改變,且用戶的評分尺度各異,評分結果可信度難以保證。因此在服務推薦領域,傳統的基于評分的協同過濾算法推薦質量并不高。
本文針對上述問題展開研究,提出了一種采用Sigmoid函數的Web服務協同過濾推薦算法。本文算法通過分析用戶對服務的歷史調用記錄,利用TFIDF(term frequency-inverse document frequency)算法的思想計算用戶對服務內容的興趣度;然后引入Sigmoid函數對調用次數進行標準化處理,得到用戶對服務功能的興趣度;最后計算用戶興趣相似度,結合傳統協同過濾算法預測用戶興趣,從而進行推薦。經實驗證明,本文算法能有效緩解數據稀疏性問題,提高協同過濾方法在服務推薦領域的推薦質量。
本文的創新點和主要貢獻有:
(1)利用調用次數預測用戶興趣,彌補了傳統方法中由評分數據稀疏造成的不良影響,且調用次數易于獲得,抗干擾能力強,比評分數據更可信。
(2)發現了Sigmoid函數與用戶興趣變化之間的關系,充分利用該函數特點反映出用戶對服務的感興趣程度隨調用次數的變化情況。
(3)結合內容興趣度與功能興趣度來計算用戶興趣相似度,既考慮了用戶興趣隨調用次數的變化情況,又考慮了調用同一個服務的不同用戶之間的特殊性。
本文組織結構如下:第2章闡述背景與相關工作;第3章詳細介紹基于Sigmoid函數的協同過濾推薦方法;第4章通過實驗驗證本文算法在改善推薦質量方面的有效性;最后對全文進行總結。
為了幫助用戶從眾多功能相同而服務質量不同的服務中選擇符合用戶非功能需求的服務,不少學者將協同過濾方法運用到服務推薦過程。Shao等人[3]基于協同過濾思想提出了一種根據用戶經驗進行相似性挖掘和預測的方法,根據用戶歷史調用過的服務的QoS值預測用戶未使用過的服務的QoS值。Zheng等人[4]則在其基礎上,將基于用戶的協同過濾與基于項目的協同過濾相結合,提出了WSRec推薦系統來計算QoS的預測值。Rong等人[5]從協同過濾中受到啟發,結合用戶興趣相似度和關聯規則對Web服務評分進行預測。Chen等人[6]通過建立高效的區域模型來分析QoS特征,并基于該模型采用改進的基于記憶的協同過濾來實現高效率的服務推薦,提高了推薦速度。Li等人[7]同Zheng等人一樣,結合兩種協同過濾算法,并將用戶對服務的歷史調用次數引入相似度計算過程,提高了QoS預測值的準確度。Hu等人[8]根據用戶調用服務的時間和地點來為目標用戶選擇最近鄰居,提出一種上下文感知的協同過濾方法進行服務推薦。Zhao等人[9]則在協同過濾的基礎上,提出一種新的相似度計算方法,同時考慮兩個用戶共同調用的服務以及分別調用的服務數目,使得到的相似用戶更加準確。Deng等人[10]認為現有服務推薦方法大多只關注于單個服務的屬性,卻忽略了用戶與服務之間的關系,因此根據用戶對服務的評分建立信任網絡,基于該網絡計算可信度來進行預測,提高了協同過濾算法的推薦質量。王海艷等人[11]基于Beta信任模型建立用戶間信任關系,提出一種基于可信聯盟的服務推薦方法。該方法引入服務的推薦屬性特征,根據改進的相似度計算方法與服務推薦行為的信任度構建出鄰居用戶的可信聯盟,根據該可信聯盟來進行推薦。
現存的服務推薦算法,絕大多數都是基于服務的QoS值來進行推薦,而實際情況中服務的QoS易隨網絡狀況等客觀因素發生變化,針對不同用戶的QoS差別很大,可信度難以保證。觀察發現,人類的興趣與其行為有很大關聯,如用戶對項目評分、評論、頻繁使用等行為,都表明了用戶的興趣。實際上,用戶對不同服務的調用次數相差很大,可以認為,被用戶調用次數越多說明該服務越受用戶關注。調用次數客觀上反映了用戶對服務的感興趣程度,具有很大的利用價值,且相對于評分而言,調用次數不需要用戶刻意反饋,易于收集,因此本文將調用次數引入協同過濾方法來進行推薦。
在實際生活中,由于用戶和服務數目眾多,人們往往不會對每個使用過的服務進行評價,評分矩陣成為一個高維稀疏矩陣。這就使得用戶之間共同評分項目數量很少,甚至完全沒有共同評分,給相似度計算過程帶來了極大的挑戰。學者們經過研究發現,用戶在使用網絡時的點擊、瀏覽、評論、評分等行為能從某種程度上反映用戶興趣[12-13],為分析用戶興趣提供了更多有利資源。因此本文利用這一結論,將調用次數引入協同過濾推薦過程,根據TF-IDF算法的思想計算用戶對服務內容的興趣度,然后用Sigmoid函數對調用次數進行標準化處理,得到用戶對服務功能的興趣度,并結合兩種興趣度計算用戶興趣相似度,提出了基于Sigmoid函數的協同過濾算法。該算法分為4個步驟:興趣度計算,用戶的興趣相似度計算,興趣度預測值計算和推薦。
3.1 興趣度計算
3.1.1 內容興趣度計算
調用次數在一定程度上反映了用戶對不同服務的感興趣程度,用戶ui對服務oj的興趣度隨ui對oj的調用次數的增加呈正比增加,同時也隨著oj被其他用戶的調用頻率呈反比下降。因此,利用TF-IDF算法[14]的思想,根據調用次數來計算用戶對服務內容的興趣度。
在信息檢索領域,TF-IDF是一種評估一字詞對于一個文件集中的一份文件的重要程度的統計方法,從理論上講,它也可以用來評估K維空間中一個對象在某一特定維度的重要性。本文將推薦系統中每個用戶看成一個文檔,被用戶調用的服務為文檔中的單詞,用戶對服務的調用次數即文檔中單詞出現的次數,由此來計算用戶對服務內容的興趣度。
定義1(內容興趣度)用戶對服務的內容興趣度表示用戶對服務內容的感興趣程度。假設在推薦系統中,存在一個包含n個用戶的集合U={u1,u2,…,un}和一個包含m個服務的集合O={o1,o2,…,om}。用戶ui對服務oj的調用次數為Ri,j,服務oj對用戶ui的“重要性”由詞頻TFi,j來計算:


其中,n是推薦系統中總的用戶個數。因此,用戶ui對服務oj的內容興趣度由以下公式定義:

用戶ui對O={o1,o2,…,om}中所有服務的內容興趣度值組成用戶ui的內容興趣度向量,即Ci=(Ci,1,Ci,2,…,Ci,m)。
3.1.2 功能興趣度計算
用戶對不同服務的調用次數相差很大。一方面,調用次數可以無限增加沒有上限;另一方面,對于調用次數為0的服務,用戶也并不是完全沒有興趣,只是尚無使用經驗。為了通過調用次數更合理地反映用戶興趣,防止調用次數特別多的服務將用戶對其他服務的興趣淹沒,以及為用戶未調用的服務賦一個初始值,本文引入Sigmoid函數對調用次數進行標準化,得到用戶對服務功能的興趣度。
Sigmoid函數是一個在生物學中常見的S形函數,它由以下公式定義:

該函數連續、光滑、嚴格單調,其值在區間(0,1)之間,且關于點(0,0.5)中心對稱,是一個良好的閥值函數。在區間(-∞,0]上呈先慢后快的非線性增長;反之,在區間[0,+∞)上呈先快后慢的增長趨勢。
定義2(功能興趣度)在服務推薦系統中,用戶對服務的功能興趣度表示用戶對服務所提供的功能的感興趣程度。用戶ui對服務oj的功能興趣度Fi,j由以下公式得到:

Fig.1 User's function interestingness function and Sigmoid function圖1 用戶功能興趣度函數與Sigmoid函數
由式(5)可知,用戶ui對O={o1,o2,…,om}中所有服務的功能興趣度值組成用戶ui的功能興趣度向量,即Fi={Fi,1,Fi,2,…,Fi,m}。
3.2 用戶的興趣相似度計算
相似度計算是協同過濾推薦算法中的一個重要步驟,常用方法有夾角余弦法和Pearson相關系數法[15-16]。本文選用余弦相似度分別計算用戶間的內容興趣相似度和功能興趣相似度,再結合二者來計算用戶的興趣相似度,具體公式如下:

其中,Sab表示用戶ua和ub之間的興趣相似度;‖Ca‖為向量的模;a為設定的可調節的基于內容興趣相似度和功能興趣相似度的參數。不失一般性,本文將參數a設為0.5,即認為兩者重要性相同,但根據應用或數據集的不同特征,該參數可以進行不同的設置。
3.3 興趣度預測值計算
在計算出用戶之間的興趣相似度后,選擇與目標用戶相似度最大的前K個用戶組成目標用戶ua的最近鄰居集Na,然后通過以下公式得出目標用戶ua對目標項目oq的興趣度:

3.4 推薦
得到目標用戶對未調用過的服務的興趣度預測值后,就可以選擇出預測值最高的前N項服務推薦給用戶,即目前推薦系統中運用最為廣泛的top-N推薦。
算法1基于Sigmoid函數的Web服務協同過濾推薦算法
輸入:用戶-項目調用矩陣R(n,m),目標用戶ua,最近鄰居個數K,推薦集Irec項目數N。
輸出:目標用戶ua的top-N推薦集Irec。
步驟1根據式(3)求出矩陣R(n,m)中每個用戶對服務的內容興趣度,得到一組用戶內容興趣度向量C1,C2,…,Cn。
步驟2根據式(5)和用戶調用矩陣R(n,m),得到一組用戶功能興趣度向量P1,P2,…,Pn。
步驟3根據式(6)計算用戶的興趣相似度矩陣sim(ui,uj)n×n。
步驟4由sim(ui,uj)n×n,得到與目標用戶ua相似度最大的前K個用戶,組成ua的最近鄰居集Na。
步驟5根據式(7)計算目標用戶ua對他未調用過的服務的興趣度pred(ua,oq)。
步驟6將步驟5中得到的一組興趣度按由高到低的順序排列。
步驟7將興趣度最大的前N個服務組成目標用戶的推薦集Irec。
4.1 數據準備
本文算法基于用戶對服務的調用次數,因此必須建立用戶調用次數數據集。本實驗通過數據采集程序對1 000個隨機抽取的樣本用戶在4周內的行為進行采集。樣本用戶每次開機時,都會形成一個對應的日志文件,數據采集程序以2 s一次的頻率掃描樣本用戶計算機的當前焦點窗口,若焦點窗口發生變化,則會在日志中追加一條記錄。一個典型的樣本行為日志如圖2所示。

Fig.2 Log of use beharior圖2 用戶行為日志
本文利用Matlab對以txt文件形式存儲的日志文件進行數據預處理,最后得到812個用戶對860個應用程序在4周內共31 206條的使用次數記錄,以此作為實驗數據集。將數據集平均分為5份,每次實驗選擇其中1份作為測試數據集,其余4份作為訓練數據集。
4.2 準確性分析
4.2.1 度量標準
本文采用平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean square error,RMSE)作為推薦質量的度量標準,通過計算預測的興趣度與實際中用戶對服務的興趣度(即標準化后的調用次數)之間的偏差來度量預測的準確性,MAE和RMSE越小,意味著推薦質量越高。假設預測的興趣度集合表示為(p1,p2,…,pn),對應的實際興趣度集合表示為(q1,q2,…,qn),則:

此外,本文還采用準確率(Precision)來比較基于“調用次數”和基于“評分”的協同過濾算法的推薦質量,它表示正確推薦數目占整個top-N推薦集的比例。如果top-N推薦集中某個服務oq出現在目標用戶測試集中的訪問記錄里,則表示生成了一個正確推薦。具體計算如下:

其中,Hits表示算法產生的正確推薦數目;N表示算法生成的推薦總數。
4.2.2 準確性結果及分析
為了驗證Sigmoid函數對于預測用戶興趣度的有效性,采用傳統標準化方法:

對用戶調用次數標準化,然后在此基礎上使用協同過濾方法來與本文方法相比較,分別計算兩種方法的RMSE和MAE。式(11)中ISi,j為用戶ui對服務oj的興趣度,ni,j是用戶ui對服務oj的調用次數,maxni和minni
分別為用戶ui所調用的所有服務中調用次數的最大值和最小值。鄰居個數從5增加到40,間隔為5,基于5個不同訓練集得到的實驗結果如圖3和圖4所示。
圖3和圖4反映了本文算法的RMSE和MAE結果隨最近鄰居數目改變的變化情況。從圖中的結果可以看出,在任意訓練集中,本文算法都具有更小的RMSE和MAE。且隨著最近鄰居數目的增加,基于Sigmoid函數的協同過濾推薦算法的RMSE和MAE值變化很小,說明本文算法具有較高的穩定性。因此在沒有用戶評分或用戶評分數據極端稀疏的環境下,本文算法不但緩解了數據稀疏性問題,也具有較高的推薦質量。
為了進一步驗證本文算法在推薦質量方面的優勢,將本文算法與傳統的基于用戶的協同過濾算法(user-based collaborative filtering,UBCF)以及基于項目的協同過濾算法(item-based collaborative filtering,IBCF)進行比較,實驗結果如圖5所示。可以看出,本文算法明顯優于另外兩種基于“評分”的協同過濾算法。
4.3 效率分析

Fig.3 Comparison onRMSEusing 5 different training sets圖3 5個不同訓練集的RMSE值
為了考察基于Sigmoid函數的協同過濾推薦算法在不同用戶數量、不同服務數量下的運行效率,通過實驗記錄了本文算法與傳統標準化方法在用戶和服務數目由200增加至800時產生推薦所需的運行時間,并將其繪制成圖6。
從圖6中可以看出,兩種算法的計算效率都隨著用戶和服務數目的增加而降低,但傳統標準化方法的速度降低更快。因此當系統中用戶和服務數量過多時,本文算法計算效率更高。

Fig.4 Comparison onMAEusing 5 different training sets圖4 5個不同訓練集的MAE值

Fig.5 Recommendation precision using different CF methods圖5 不同協同過濾算法對準確率的影響

Fig.6 Comparison of different methods on time to generate recommendations圖6 不同方法產生推薦所需運行時間
推薦系統能幫助用戶從海量信息中獲取到自己真正需要的資源,給人們的生活帶來便利的同時也提高了網站收益,因此受到各界的廣泛關注,國內外眾多學者為提高推薦準確度而進行了大量研究,提出了許多不同的方法。本文針對傳統協同過濾算法在用戶評分數目很少的服務推薦領域推薦質量不高的問題,提出了一種根據用戶對服務的調用次數將Sigmoid函數與傳統協同過濾相結合的推薦算法。本文算法通過分析用戶對服務的歷史調用記錄,利用TF-IDF算法的思想計算用戶對服務的內容興趣度;然后引入Sigmoid函數來描述用戶對服務的功能興趣隨調用次數非線性變化的情況,基于兩種興趣度計算用戶興趣相似度;并結合傳統協同過濾方法預測用戶興趣產生最終推薦。實驗結果表明,本文算法能有效緩解數據稀疏性問題,提高了推薦質量。下一步工作將會考慮調用次數數據依然稀疏的情況,結合基于語義內容的推薦,進一步解決稀疏問題,并提高推薦精度。
[1]Breese J S,Heckerman D,Kadie C.Empirical analysis of predictive algorithms for collaborative filtering[C]//Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence,Madison,USA,Jul 24-26,1998.San Francisco:Morgan Kaufmann Publishers Inc,1998:43-52.
[2]Papagelis M,Plexousakis D,Kutsuras T.Alleviating the sparsity problem of collaborative filtering using trust inferences[C]//LNCS 3477:Proceedings of the 3rd International Conference on Trust Management,Paris,France,May 23-26,2005.Berlin,Heidelberg:Springer,2005:224-239.
[3]Shao Lingshuang,Zhang Jing,Wei Yong,et al.Personalized QoS prediction for Web services via collaborative filtering [C]//Proceedings of the 2007 IEEE International Conference on Web Services,Salt Lake City,USA,Jul 9-13,2007. Piscataway,USA:IEEE,2007:439-446.
[4]Zheng Zibin,Ma Hao,Lyu M R,et al.QoS-aware Web service recommendation by collaborative filtering[J].IEEE Transactions on Services Computing,2010,4(2):140-152.
[5]Rong Wenge,Liu Kecheng,Liang Lin.Personalized Web service ranking via user group combining association rule [C]//Proceedings of the 2009 IEEE International Conference on Web Services,Los Angeles,USA,Jul 6-10,2009. Piscataway,USA:IEEE,2009:445-452.
[6]Chen Xi,Liu Xudong,Huang Zicheng,et al.Regionknn:a scalable hybrid collaborative filtering algorithm for personalized Web service recommendation[C]//Proceedings of the 2010 IEEE International Conference on Web Services,Miami, USA,Jul 5-10,2010.Piscataway,USA:IEEE,2010:9-16.
[7]Li Yali,Pan Shanliang,Huang Xi.A kind of Web service recommendation method based on hybrid collaborative filterng [J].Journal of Computational Information Systems,2012, 8(20):8357-8364.
[8]Hu Rong,Dou Wanchun,Liu Jianxun.A context-aware collaborative filtering approach for service recommendation [C]//Proceedings of the 2012 International Conference on Cloud and Service Computing,Shanghai,China,Nov 22-24,2012.Piscataway,USA:IEEE,2012:148-155.
[9]Zhao Shuai,Zhang Yang,Cheng Bo,et al.A feedbackcorrected collaborative filtering for personalized real-world service recommendation[J].International Journal of Computers Communications&Control,2014,9(3):356-369.
[10]Deng Shuiguang,Huang Longtao,Wu Jian,et al.Trustbased personalized service recommendation:a network perspective[J].Journal of Computer Science and Technology, 2014,29(1):69-80.
[11]Wang Haiyan,Yang Wenbin,Wang Suichang,et al.A service recommendation method based on trustworthy community[J].Chinese Journal of Computers,2014,37(2):301-311.
[12]Li Yong,Meng Xiaofeng,Liu Ji,et al.Study of the longrange evolution of online human-interest based on small data [J].Journal of Computer Research and Development,2015, 52(4):779-788.
[13]Liu Jian,Sun Peng,Ni Hong.Estimation of user interest degree based on neural network[J].Computer Engineering, 2011,37(7):187-189.
[14]Chan N N,Gaaloul W,Tata S.A recommender system based on historical usage data for Web service discovery[J]. Service Oriented Computing and Applications,2012,6(1): 51-63.
[15]Su Xiaoyuan,Khoshgoftaar T M.A survey of collaborative filtering techniques[J].Advances in Artificial Intelligence, 2009,2009:4.
[16]Hofmann T.Latent semantic models for collaborative filtering[J].ACM Transactions on Informatiotems,2004,22(1): 89-115.
附中文參考文獻:
[11]王海艷,楊文彬,王隨昌,等.基于可信聯盟的服務推薦方法[J].計算機學報,2014,37(2):301-311.
[12]李勇,孟小峰,劉繼,等.基于小數據的在線用戶興趣長程演化研究[J].計算機研究與發展,2015,52(4):779-788.
[13]劉建,孫鵬,倪宏.基于神經網絡的用戶興趣度估計[J].計算機工程,2011,37(7):187-189.

MAO Yiyu was born in 1992.She is an M.S.candidate at Hunan University of Science and Technology.Her research interests include service computing and cloud computing,etc.
毛宜鈺(1992—),女,湖南邵陽人,湖南科技大學碩士研究生,主要研究領域為服務計算,云計算等。

LIU Jianxun was born in 1970.He received the Ph.D.degree in computer science from Shanghai Jiao Tong University in 2003.Now he is a professor and Ph.D.supervisor at Hunan University of Science and Technology,and the member of CCF.His research interests include workflow and service computing,etc.
劉建勛(1970—),男,湖南衡陽人,2003年于上海交通大學計算機系獲得博士學位,現為湖南科技大學教授、博士生導師,CCF會員,主要研究領域為工作流,服務計算等。

HU Rong was born in 1977.She received the Ph.D.degree in computer aplications from Nanjing University in 2014.Now she is a lecturer at Hunan University of Science and Technology,and the member of CCF.Her research interests include service computing and data mining,etc.
胡蓉(1977—),女,湖南湘潭人,2014年于南京大學計算機應用專業獲得博士學位,現為湖南科技大學講師,CCF會員,主要研究領域為服務計算,數據挖掘等。

TANG Mingdong was born in 1978.He received the Ph.D.degree from Institute of Computing Technology,Chinese Academy of Sciences in 2010.Now he is an associate professor and M.S.supervisor at Hunan University of Science and Technology,and the member of CCF.His research interests include service computing and cloud computing,etc.
唐明董(1978—),男,湖南永州人,2010年于中國科學院計算技術研究所獲得博士學位,現為湖南科技大學計算機學院副教授、碩士生導師,CCF會員,主要研究領域為服務計算,云計算等。

SHI Min was born in 1991.He is an M.S.candidate at Hunan University of Science and Technology.His research interests include information retrieval and service computing,etc.
石敏(1991—),男,湖北大冶人,湖南科技大學碩士研究生,主要研究領域為信息檢索,服務計算等。
Sigmoid Function-Based Web Service Collaborative Filtering Recommendation Algorithm*
MAO Yiyu+,LIU Jianxun,HU Rong,TANG Mingdong,SHI Min
Key Lab of Knowledge Processing and Networked Manufacturing,Hunan University of Science and Technology, Xiangtan,Hunan 411201,China
+Corresponding author:E-mail:maoyiyu151@gmail.com
Collaborative filtering techniques have been widely used in various recommender systems.However,they are likely to suffer from the data sparsity problem which often results in inaccurate recommendation results.In view of this problem,this paper proposes a collaborative filtering recommendation algorithm based on Sigmoid function,by analyzing users'invocation records of services.Firstly,the relationship between a user and the invocation number of service is analyzed to acquire the user's interest in contents of service by using TF-IDF algorithm.Then,a Sigmoid function is used to calculate the user's interest in function of service according to the invocation number.Finally,personalized service recommendation is performed by combining the user's contents interestingness with the function interestingness.The experimental results show that this algorithm can effectively alleviate the data sparsity problem and thus achieve better prediction accuracy.
collaborative filtering;Sigmoid function;data sparsity;recommender system;users'interest
10.3778/j.issn.1673-9418.1511072
A
TP301
*The National Natural Science Foundation of China under Grant Nos.61572186,61572187(國家自然科學基金);the Scientific Research Fund of Education Department of Hunan Province under Grant No.15K043(湖南省教育廳科研基金);the Project of State Key Laboratory for Novel Software Technology at Nanjing University under Grant No.KFKT2015B04(南京大學計算機軟件新技術國家重點實驗室資助項目).
Received 2015-11,Accepted 2016-03.
CNKI網絡優先出版:2016-03-07,http://www.cnki.net/kcms/detail/11.5602.TP.20160307.1710.008.html
MAO Yiyu,LIU Jianxun,HU Rong,et al.Sigmoid function-based Web service collaborative filtering recommendation algorithm.Journal of Frontiers of Computer Science and Technology,2017,11(2):314-322.
摘 要:協同過濾推薦技術被廣泛用于各個推薦系統,但它仍然存在著用戶評分數據稀疏性問題,可能導致推薦結果不準確。針對該問題,提出了一種采用Sigmoid函數的協同過濾推薦算法。首先,分析用戶興趣與其調用服務的次數之間的關系,利用TF-IDF算法計算用戶對服務內容的興趣度;其次,定義一個Sigmoid函數,根據服務調用次數計算用戶對服務功能的興趣度;最后,基于內容興趣度和功能興趣度計算用戶興趣相似度完成協同過濾算法,實現個性化的服務推薦。實驗證明,該方法能有效緩解數據稀疏性問題,提高了推薦質量。