999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進的雙極Slope One算法的農業信息推薦模型研究

2014-04-29 00:00:00張啟宇宋瑤陳英義封文杰
安徽農業科學 2014年29期

摘要 為了在海量信息中為用戶提供有價值的信息,個性化在線推薦系統是農業信息化綜合服務平臺的重要組成部分。Slope One算法因簡單高效被許多在線推薦系統使用。對Slope One算法進行研究,并結合農業信息化綜合服務平臺的特點,提出了農業信息推薦模型。該模型按資源類別把用戶評分矩陣劃分為評分子矩陣,在此基礎上采用杰卡德統一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One算法和Item user average算法相結合的方式對未訪問資源進行評分預測,有效降低計算量,并提高了評分預測精度,既適合稠密數據集,又適合稀疏數據集。

關鍵詞 杰卡德統一算子距離相似度算法;雙極Slope one算法;Item user average算法;農業信息;個性化推薦

中圖分類號S126文獻標識碼A文章編號0517-6611(2014)29-10394-03

基金項目山東省自主創新專項(2012CX90204)。

作者簡介張啟宇(1977- ),男,山東榮成人,講師,碩士,從事計算機科學與技術研究。*通訊作者,從事農業信息化研究。

農業信息化綜合服務平臺利用現代信息網絡技術,為農村、農民、中小型企業及更多用戶提供海量的農業相關信息,農業新聞、科技動態、市場信息等等為用戶提供便捷的信息通道。但面對眾多信息,如何給用戶準確提供所需信息是要解決的一個重要問題。個性化在線推薦系統是眾多網站的選擇。協同過濾技術是應用最為廣泛的個性化推薦技術,是推薦系統的一個重要組成部分。協同過濾通過參考與活動用戶具有相似興趣和需求的其他用戶的選擇來決定如何為該用戶進行信息過濾[1]。Slope One算法是基于評分的協同過濾算法[2],被許多在線推薦系統使用,如Hitflip DVD推薦系統、inDiscover MP3推薦系統、Value Investing News股票新聞網站、AllTheBests購物推薦引擎等[3]。

Slope One算法族[2]包括Slope One算法、加權Slope One算法和雙極Slope One算法,是基于項目的評分預測算法,采用線性模型進行評分預測,簡單易實現、高效、準確度高、支持在線查詢和動態更新。Slope One算法族主要有3個方面的缺陷[4-5]:沒有考慮用戶之間的相似性;沒有考慮項目之間的相似性;在數據稀疏的情況下,推薦效果不如傳統協同過濾算法好。為了解決上述問題,一些學者提出了改良辦法。如王小亮把K均值聚類算法和加權Slope One算法相結合[6],李文剛把基于用戶協同過濾算法和加權Slope One算法相結合[7],孫麗梅等提出了一種動態K近鄰和Slope One相結合的算法[3],這3種方法都是對用戶尋找鄰居用戶群,再利用近鄰用戶的評分數據生成項目之間的平均偏差,進行評分預測。楊晶提出了基于用戶興趣模型的 Slope one算法,利用用戶興趣模型計算目標的相似用戶群,以縮小預測目標項目評分時的數據搜索范圍,提出改進的基于用戶相似度的項目評分平均差值公式,提高相似用戶在評分平均差值計算中的貢獻[8]。王毅等提出一種基于項目語義相似度的改進Slope One算法,但WordNet語義相似度只適合英文[9]。宋晗為Slope One算法引入了一種相似度權重[10]。林德軍提出了基于用戶興趣局部相似性的Slope One算法、基于Kmeans項目聚類的Slope One算法以及基于奇異值分解的Slope One算法[4]。董麗等對5種協作過濾算法Userbased(近鄰數為20)、Itembased、Item average、Item user average和Slope One進行測試,結果Item user average算法無論在稠密還是稀疏數據集上都有良好的表現[5]。

為建設農業信息化綜合服務平臺,推進農村社會服務信息化,筆者按資源類別把用戶評分矩陣劃分為評分子矩陣,采用杰卡德統一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One 算法和Item user average算法相結合的方式建立個性化農業信息推薦模型,能夠有效解決Slope One算法族3個主要缺陷。

1Slope One算法族

1.1Slope One算法Lemire等于2005年提出的Slope One算法族[2]是對項目評分進行預測的算法,該算法不會計算用戶或項目之間的相似度。依據Slope One算法,對如表1所示的用戶評分表中用戶B項目2進行評分預測。預測結果為:2+(1.5-1)/1=2.5。即Slope One算法的原理是基于線性回歸進行預測,預測器采用f(x)=x+b的形式,b為常數,表示用戶對兩個項目評分的平均偏差。

1.2加權Slope One算法在推薦系統中,用戶的評分項目數一般大于2,為了均衡每個項目對目標項目的影響,產生了加權Slope One算法。如通過用戶A對項目J和K的評分預測用戶A對項目L的評分,其中2 000用戶對項目J和L評分、20用戶對項目K和L評分、用戶A對項目L的評分采用用戶A對項目J的評分比項目K的評分進行預測更好一些。因此Daniel Lemire等提出加權Slope One預測評分公式:

1.3雙極Slope One算法雙極Slope One算法考慮用戶對項目的喜好,將用戶u的評分分為兩組:S1(u)={i∈S(u)|ui>}(喜歡)和S2(u)={i∈S(u)|ui<}(不喜歡)。對項目i和j,評分集合T分為兩組:S1ji={u∈T|i,j∈S1(u)}(喜歡)和S2ji={u∈T|i,j∈S2(u)}(不喜歡)。用戶喜歡和不喜歡的項目評分分別計算喜歡偏差dev1ji和不喜歡偏差dev2ji,再加權平均進行預測:

2改進的雙極Slope One協同過濾算法

改進的雙極Slope One協同過濾算法主要有4個步驟:評分表示、鄰居形成、評分預測和推薦生成。其流程圖如圖1所示。

2.1評分表示用戶評分數據可以用1個m×n階矩陣R表示,其中m行代表m個用戶,n列代表n個項目,第i行第j列的元素Rij代表用戶i對項目j的評分。評分方式一般有2種:①用0和1來表示用戶的偏好(喜歡/不喜歡)、購買狀態(已購買/未購買)或訪問狀態(訪問/未訪問);②用數字分級表示用戶對項目的喜好值,如MovieLens中用戶對電影的評分以從 0~5的整數來表示用戶的喜好,0表示沒有評分,數值越大表示用戶偏愛程度越大[11]。

第1種評分方式比較簡單,不能表現出用戶的興趣。而讓用戶對資源進行顯式評分,不一定能夠得到真實的評分,因此在農業信息化綜合服務平中,用戶對資源的評價采用隱式方式。該研究中,借鑒網絡上流行的點贊和分享的功能進行用戶對資源的打分。在每一個資源的頁面,參照點贊的形式,設置喜歡和不喜歡的點擊功能,參照分享的形式,設置分享到百度貼吧、QQ空間、豆瓣網、新浪微博、騰訊微博、網易微博和人人網等7個目前國內比較常用的信息平臺。通過對用戶行為的監測,來統計用戶對資源的評分。具體的評分規則為:①若用戶只訪問資源,+1;②若用戶點喜歡,訪問+1,喜歡+1,每分享一個+1;③若用戶點不喜歡,訪問-1,不喜歡-1,每分享一個-1;④若用戶直接分享,訪問+1,每分享一個+1;⑤沒有訪問的資源,評分為1。

2.2鄰居形成度量用戶之間相似性的方法[12-13]有余弦相似性、相關相似性、修正余弦相似性、修正相關相似性等。孫慧峰提出了杰卡德統一算子距離相似度算法(Jaccard Uniform Operator Distance Similarity Measurement,簡記為JacUOD)進行相似度計算,并與上述4種方法進行對比驗證,表明JacUOD效果最好[13]。采用JacUOD對兩個用戶u、v進行相似度計算公式為:

計算用戶相似度的目的是求出近鄰用戶集,通過近鄰用戶集對未訪問項目進行評分預測,提高預測精度。在農業信息化綜合服務平臺中包含很多類別的頁面(項目),若是把全部項目用于計算用戶相似度,得到的近鄰用戶集不一定準確。因為用戶一般有多種興趣愛好,不同的用戶之間在一種興趣上相似而在另外一種興趣上可能相異,若共同計算相似度,必然導致計算結果不準確。利用項目類別把用戶評分矩陣劃分為m個子矩陣(m為類別個數),對每一個子矩陣利用公式(2)進行相似度的計算,這樣得到的近鄰用戶集更準確。

為了獲取近鄰用戶集,設定一個閾值c。滿足simt(u,v)≥c的用戶v加入到用戶u的近鄰用戶集中。

2.3評分預測用戶之間是否有共同評分項將評分預測方法分為2種。當用戶之間有共同評分項時,可利用改進的雙極Slope One算法預測評分,重點利用JacUOD進行相似度計算,求鄰近用戶集,利用雙極Slope One算法計算獲得用戶評分;當用戶之間沒有共同評分項時,利用Item user average算法求資源用戶平均值,獲得預測評分,流程圖如圖2所示。

雙極Slope One算法要求用戶之間有共同評分項才能進行預測。若預測用戶u對項目i的評分,而項目i對應的類別評分子矩陣計算的近鄰用戶集中沒有用戶和用戶u有共同評分項,那么無法進行評分預測。此時需要尋找其他的方法進行預測。因此選擇Item user average算法在雙極Slope One算法不能預測評分情況下進行預測評分。

Item user average算法[5]即資源用戶平均值算法,預測用戶ui對資源tj的評分時,綜合考慮所有用戶對資源tj的評分均值rj(t),用戶ui對所有資源的評分均值ri(u),以及所有用戶對所有資源的評分均值,即:

對用戶未訪問過即評分為1的項目進行評分預測,采用改進的雙極Slope One算法預測其評分;若改進的雙極Slope One算法不能預測,采用Item user average算法預測其評分。

2.4推薦生成對用戶的每一個未訪問項目進行評分預測,取預測分值最高的N項作為用戶的推薦項。

3結語

該研究根據農業信息化綜合服務平臺的特點,按資源類別把用戶評分矩陣劃分為評分子矩陣,在此基礎上采用杰卡德統一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One算法和Item user average算法相結合的方式對未訪問資源進行評分預測。該方法可降低計算量,并提高評分預測精度,既適合稠密數據集,又適合稀疏數據集。

參考文獻

[1] 孫小華.協同過濾系統的稀疏性與冷啟動問題研究[D].杭州:浙江大學,2005.

[2] LEMIRE D,MACLACHLAN A.Slope One predictors for online ratingbased collaborative ffiltering[C]//Proceedings of SIAM Data Mining Conference.Newport Beach,California,2005:471-475.

[3] 孫麗梅,李晶皎,孫煥良.基于動態k近鄰的Slope One協同過濾推薦算法[J].清華大學學報:自然科學版,2011,5(9):857-864.

[4] 林德軍.基于Slope One改進算法推薦模型的設計與實現[D].北京:北京郵電大學,2012.

[5] 董麗,邢春曉,王克宏.基于不同數據集的協作過濾算法評測[J].清華大學學報:自然科學版,2009,49(4):590-594.

[6] 王小亮.基于協同過濾的個性化推薦算法 的優化和應用[D].杭州:浙江工商大學,2010.

[7] 李文剛.奢侈品電子商務推薦的協同過濾算法研究與應用[D].上海:復旦大學,2012.

[8] 楊晶.用戶興趣模型及實時個性化推薦算法研究[D].南京:南京郵電大學,2013.

[9] 王毅,樓恒越.一種改進的Slope One協同過濾算法[J].計算機科學,2011,38(S1):192-194.

[10] 宋晗.基于加權偏差表的Slope One改進算法研究[D].昆明:云南大學,2013.

[11] 楊芳,潘一飛,李杰,等.一種改進的協同過濾推薦算法[J].河北工業大學學報,2010,39(3):82-87.

[12] 王輝,高利軍,王聽忠.個性化服務中基于用戶聚類的協同過濾推薦[J].計算機應用,2007,27(5):1225-1227.

主站蜘蛛池模板: 欧美成人国产| 国产国模一区二区三区四区| 久久国产精品娇妻素人| 色老头综合网| 免费播放毛片| 亚洲欧州色色免费AV| 久久网综合| 国产精品无码一区二区桃花视频| 国产你懂得| 女人18一级毛片免费观看| 免费国产高清视频| 国产h视频免费观看| 99视频在线精品免费观看6| 亚洲精品福利视频| 无码丝袜人妻| 欧美成人影院亚洲综合图| 欧美日韩成人| 一级成人a做片免费| 亚洲综合色在线| 精品国产成人高清在线| 99视频精品在线观看| 在线视频亚洲色图| 欧美高清三区| 国产伦精品一区二区三区视频优播 | 日韩高清成人| 国产欧美亚洲精品第3页在线| 中文字幕 欧美日韩| 67194在线午夜亚洲 | 亚洲欧洲天堂色AV| 日韩毛片在线视频| 无码丝袜人妻| 日本精品一在线观看视频| 欧美久久网| 久久国产精品影院| 欧美成一级| 人妻丰满熟妇啪啪| 999国产精品| 在线亚洲精品自拍| 亚洲日韩精品无码专区97| 午夜国产精品视频黄| 国产精品yjizz视频网一二区| 亚洲人成人无码www| 欧美激情第一区| 亚洲美女一级毛片| 国产精品成人免费视频99| 8090成人午夜精品| 2021精品国产自在现线看| 日韩在线欧美在线| 她的性爱视频| 香港一级毛片免费看| 精品人妻系列无码专区久久| 国产精品区网红主播在线观看| 99热免费在线| 久久性妇女精品免费| 黄色网页在线播放| 日韩小视频在线观看| 蜜芽一区二区国产精品| 国产主播喷水| 精品无码日韩国产不卡av | 国产91视频免费观看| 久久女人网| 日韩欧美网址| 全免费a级毛片免费看不卡| 亚洲欧美在线综合一区二区三区| 夜夜操国产| 四虎永久免费网站| 国产精品无码在线看| 97超级碰碰碰碰精品| 扒开粉嫩的小缝隙喷白浆视频| 日韩精品毛片人妻AV不卡| 在线高清亚洲精品二区| 国产精品成人啪精品视频| 中国一级毛片免费观看| 中文字幕在线视频免费| 极品国产在线| 精品欧美一区二区三区在线| 国产jizz| 欧美高清日韩| 亚洲A∨无码精品午夜在线观看| 日本黄网在线观看| 欧美一区二区精品久久久| 成人国产一区二区三区|