999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進的雙極Slope One算法的農業信息推薦模型研究

2014-04-29 00:00:00張啟宇宋瑤陳英義封文杰
安徽農業科學 2014年29期

摘要 為了在海量信息中為用戶提供有價值的信息,個性化在線推薦系統是農業信息化綜合服務平臺的重要組成部分。Slope One算法因簡單高效被許多在線推薦系統使用。對Slope One算法進行研究,并結合農業信息化綜合服務平臺的特點,提出了農業信息推薦模型。該模型按資源類別把用戶評分矩陣劃分為評分子矩陣,在此基礎上采用杰卡德統一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One算法和Item user average算法相結合的方式對未訪問資源進行評分預測,有效降低計算量,并提高了評分預測精度,既適合稠密數據集,又適合稀疏數據集。

關鍵詞 杰卡德統一算子距離相似度算法;雙極Slope one算法;Item user average算法;農業信息;個性化推薦

中圖分類號S126文獻標識碼A文章編號0517-6611(2014)29-10394-03

基金項目山東省自主創新專項(2012CX90204)。

作者簡介張啟宇(1977- ),男,山東榮成人,講師,碩士,從事計算機科學與技術研究。*通訊作者,從事農業信息化研究。

農業信息化綜合服務平臺利用現代信息網絡技術,為農村、農民、中小型企業及更多用戶提供海量的農業相關信息,農業新聞、科技動態、市場信息等等為用戶提供便捷的信息通道。但面對眾多信息,如何給用戶準確提供所需信息是要解決的一個重要問題。個性化在線推薦系統是眾多網站的選擇。協同過濾技術是應用最為廣泛的個性化推薦技術,是推薦系統的一個重要組成部分。協同過濾通過參考與活動用戶具有相似興趣和需求的其他用戶的選擇來決定如何為該用戶進行信息過濾[1]。Slope One算法是基于評分的協同過濾算法[2],被許多在線推薦系統使用,如Hitflip DVD推薦系統、inDiscover MP3推薦系統、Value Investing News股票新聞網站、AllTheBests購物推薦引擎等[3]。

Slope One算法族[2]包括Slope One算法、加權Slope One算法和雙極Slope One算法,是基于項目的評分預測算法,采用線性模型進行評分預測,簡單易實現、高效、準確度高、支持在線查詢和動態更新。Slope One算法族主要有3個方面的缺陷[4-5]:沒有考慮用戶之間的相似性;沒有考慮項目之間的相似性;在數據稀疏的情況下,推薦效果不如傳統協同過濾算法好。為了解決上述問題,一些學者提出了改良辦法。如王小亮把K均值聚類算法和加權Slope One算法相結合[6],李文剛把基于用戶協同過濾算法和加權Slope One算法相結合[7],孫麗梅等提出了一種動態K近鄰和Slope One相結合的算法[3],這3種方法都是對用戶尋找鄰居用戶群,再利用近鄰用戶的評分數據生成項目之間的平均偏差,進行評分預測。楊晶提出了基于用戶興趣模型的 Slope one算法,利用用戶興趣模型計算目標的相似用戶群,以縮小預測目標項目評分時的數據搜索范圍,提出改進的基于用戶相似度的項目評分平均差值公式,提高相似用戶在評分平均差值計算中的貢獻[8]。王毅等提出一種基于項目語義相似度的改進Slope One算法,但WordNet語義相似度只適合英文[9]。宋晗為Slope One算法引入了一種相似度權重[10]。林德軍提出了基于用戶興趣局部相似性的Slope One算法、基于Kmeans項目聚類的Slope One算法以及基于奇異值分解的Slope One算法[4]。董麗等對5種協作過濾算法Userbased(近鄰數為20)、Itembased、Item average、Item user average和Slope One進行測試,結果Item user average算法無論在稠密還是稀疏數據集上都有良好的表現[5]。

為建設農業信息化綜合服務平臺,推進農村社會服務信息化,筆者按資源類別把用戶評分矩陣劃分為評分子矩陣,采用杰卡德統一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One 算法和Item user average算法相結合的方式建立個性化農業信息推薦模型,能夠有效解決Slope One算法族3個主要缺陷。

1Slope One算法族

1.1Slope One算法Lemire等于2005年提出的Slope One算法族[2]是對項目評分進行預測的算法,該算法不會計算用戶或項目之間的相似度。依據Slope One算法,對如表1所示的用戶評分表中用戶B項目2進行評分預測。預測結果為:2+(1.5-1)/1=2.5。即Slope One算法的原理是基于線性回歸進行預測,預測器采用f(x)=x+b的形式,b為常數,表示用戶對兩個項目評分的平均偏差。

1.2加權Slope One算法在推薦系統中,用戶的評分項目數一般大于2,為了均衡每個項目對目標項目的影響,產生了加權Slope One算法。如通過用戶A對項目J和K的評分預測用戶A對項目L的評分,其中2 000用戶對項目J和L評分、20用戶對項目K和L評分、用戶A對項目L的評分采用用戶A對項目J的評分比項目K的評分進行預測更好一些。因此Daniel Lemire等提出加權Slope One預測評分公式:

1.3雙極Slope One算法雙極Slope One算法考慮用戶對項目的喜好,將用戶u的評分分為兩組:S1(u)={i∈S(u)|ui>}(喜歡)和S2(u)={i∈S(u)|ui<}(不喜歡)。對項目i和j,評分集合T分為兩組:S1ji={u∈T|i,j∈S1(u)}(喜歡)和S2ji={u∈T|i,j∈S2(u)}(不喜歡)。用戶喜歡和不喜歡的項目評分分別計算喜歡偏差dev1ji和不喜歡偏差dev2ji,再加權平均進行預測:

2改進的雙極Slope One協同過濾算法

改進的雙極Slope One協同過濾算法主要有4個步驟:評分表示、鄰居形成、評分預測和推薦生成。其流程圖如圖1所示。

2.1評分表示用戶評分數據可以用1個m×n階矩陣R表示,其中m行代表m個用戶,n列代表n個項目,第i行第j列的元素Rij代表用戶i對項目j的評分。評分方式一般有2種:①用0和1來表示用戶的偏好(喜歡/不喜歡)、購買狀態(已購買/未購買)或訪問狀態(訪問/未訪問);②用數字分級表示用戶對項目的喜好值,如MovieLens中用戶對電影的評分以從 0~5的整數來表示用戶的喜好,0表示沒有評分,數值越大表示用戶偏愛程度越大[11]。

第1種評分方式比較簡單,不能表現出用戶的興趣。而讓用戶對資源進行顯式評分,不一定能夠得到真實的評分,因此在農業信息化綜合服務平中,用戶對資源的評價采用隱式方式。該研究中,借鑒網絡上流行的點贊和分享的功能進行用戶對資源的打分。在每一個資源的頁面,參照點贊的形式,設置喜歡和不喜歡的點擊功能,參照分享的形式,設置分享到百度貼吧、QQ空間、豆瓣網、新浪微博、騰訊微博、網易微博和人人網等7個目前國內比較常用的信息平臺。通過對用戶行為的監測,來統計用戶對資源的評分。具體的評分規則為:①若用戶只訪問資源,+1;②若用戶點喜歡,訪問+1,喜歡+1,每分享一個+1;③若用戶點不喜歡,訪問-1,不喜歡-1,每分享一個-1;④若用戶直接分享,訪問+1,每分享一個+1;⑤沒有訪問的資源,評分為1。

2.2鄰居形成度量用戶之間相似性的方法[12-13]有余弦相似性、相關相似性、修正余弦相似性、修正相關相似性等。孫慧峰提出了杰卡德統一算子距離相似度算法(Jaccard Uniform Operator Distance Similarity Measurement,簡記為JacUOD)進行相似度計算,并與上述4種方法進行對比驗證,表明JacUOD效果最好[13]。采用JacUOD對兩個用戶u、v進行相似度計算公式為:

計算用戶相似度的目的是求出近鄰用戶集,通過近鄰用戶集對未訪問項目進行評分預測,提高預測精度。在農業信息化綜合服務平臺中包含很多類別的頁面(項目),若是把全部項目用于計算用戶相似度,得到的近鄰用戶集不一定準確。因為用戶一般有多種興趣愛好,不同的用戶之間在一種興趣上相似而在另外一種興趣上可能相異,若共同計算相似度,必然導致計算結果不準確。利用項目類別把用戶評分矩陣劃分為m個子矩陣(m為類別個數),對每一個子矩陣利用公式(2)進行相似度的計算,這樣得到的近鄰用戶集更準確。

為了獲取近鄰用戶集,設定一個閾值c。滿足simt(u,v)≥c的用戶v加入到用戶u的近鄰用戶集中。

2.3評分預測用戶之間是否有共同評分項將評分預測方法分為2種。當用戶之間有共同評分項時,可利用改進的雙極Slope One算法預測評分,重點利用JacUOD進行相似度計算,求鄰近用戶集,利用雙極Slope One算法計算獲得用戶評分;當用戶之間沒有共同評分項時,利用Item user average算法求資源用戶平均值,獲得預測評分,流程圖如圖2所示。

雙極Slope One算法要求用戶之間有共同評分項才能進行預測。若預測用戶u對項目i的評分,而項目i對應的類別評分子矩陣計算的近鄰用戶集中沒有用戶和用戶u有共同評分項,那么無法進行評分預測。此時需要尋找其他的方法進行預測。因此選擇Item user average算法在雙極Slope One算法不能預測評分情況下進行預測評分。

Item user average算法[5]即資源用戶平均值算法,預測用戶ui對資源tj的評分時,綜合考慮所有用戶對資源tj的評分均值rj(t),用戶ui對所有資源的評分均值ri(u),以及所有用戶對所有資源的評分均值,即:

對用戶未訪問過即評分為1的項目進行評分預測,采用改進的雙極Slope One算法預測其評分;若改進的雙極Slope One算法不能預測,采用Item user average算法預測其評分。

2.4推薦生成對用戶的每一個未訪問項目進行評分預測,取預測分值最高的N項作為用戶的推薦項。

3結語

該研究根據農業信息化綜合服務平臺的特點,按資源類別把用戶評分矩陣劃分為評分子矩陣,在此基礎上采用杰卡德統一算子距離相似度算法建立用戶類別近鄰用戶,采用改進的雙極Slope One算法和Item user average算法相結合的方式對未訪問資源進行評分預測。該方法可降低計算量,并提高評分預測精度,既適合稠密數據集,又適合稀疏數據集。

參考文獻

[1] 孫小華.協同過濾系統的稀疏性與冷啟動問題研究[D].杭州:浙江大學,2005.

[2] LEMIRE D,MACLACHLAN A.Slope One predictors for online ratingbased collaborative ffiltering[C]//Proceedings of SIAM Data Mining Conference.Newport Beach,California,2005:471-475.

[3] 孫麗梅,李晶皎,孫煥良.基于動態k近鄰的Slope One協同過濾推薦算法[J].清華大學學報:自然科學版,2011,5(9):857-864.

[4] 林德軍.基于Slope One改進算法推薦模型的設計與實現[D].北京:北京郵電大學,2012.

[5] 董麗,邢春曉,王克宏.基于不同數據集的協作過濾算法評測[J].清華大學學報:自然科學版,2009,49(4):590-594.

[6] 王小亮.基于協同過濾的個性化推薦算法 的優化和應用[D].杭州:浙江工商大學,2010.

[7] 李文剛.奢侈品電子商務推薦的協同過濾算法研究與應用[D].上海:復旦大學,2012.

[8] 楊晶.用戶興趣模型及實時個性化推薦算法研究[D].南京:南京郵電大學,2013.

[9] 王毅,樓恒越.一種改進的Slope One協同過濾算法[J].計算機科學,2011,38(S1):192-194.

[10] 宋晗.基于加權偏差表的Slope One改進算法研究[D].昆明:云南大學,2013.

[11] 楊芳,潘一飛,李杰,等.一種改進的協同過濾推薦算法[J].河北工業大學學報,2010,39(3):82-87.

[12] 王輝,高利軍,王聽忠.個性化服務中基于用戶聚類的協同過濾推薦[J].計算機應用,2007,27(5):1225-1227.

主站蜘蛛池模板: 日韩色图区| 国产精品一老牛影视频| 黄片一区二区三区| 国产香蕉97碰碰视频VA碰碰看| 亚洲乱亚洲乱妇24p| 香蕉色综合| 亚洲天堂视频在线免费观看| 一级看片免费视频| 国产精品香蕉在线| 99视频在线免费| 日韩毛片在线视频| 国产成+人+综合+亚洲欧美| 久久国产V一级毛多内射| 婷五月综合| 91麻豆精品视频| 亚洲区一区| 国产成+人+综合+亚洲欧美| 老色鬼久久亚洲AV综合| 夜夜爽免费视频| AV不卡无码免费一区二区三区| 国产成人亚洲精品无码电影| 51国产偷自视频区视频手机观看| 54pao国产成人免费视频| 精品国产黑色丝袜高跟鞋| 91探花在线观看国产最新| 中文字幕欧美成人免费| 中文字幕第1页在线播| 嫩草在线视频| 亚洲成人免费看| 无码内射中文字幕岛国片| lhav亚洲精品| 国产精品嫩草影院av| 欧美激情综合一区二区| 亚洲高清无码精品| 久久一日本道色综合久久| 欧美另类精品一区二区三区| 日韩黄色大片免费看| 日韩精品一区二区三区大桥未久 | 久久亚洲精少妇毛片午夜无码| jizz在线观看| 91网站国产| 黄色网站不卡无码| 国产精品国产三级国产专业不| 成人国产小视频| 国产网站免费观看| 欧美一道本| 九九免费观看全部免费视频| 在线播放91| 丁香综合在线| 国产在线精品香蕉麻豆| 99国产精品一区二区| 五月婷婷综合网| 欧美成人看片一区二区三区| 国产精品污视频| 在线免费a视频| 波多野结衣一区二区三区AV| 久一在线视频| 三级国产在线观看| 999在线免费视频| 精品丝袜美腿国产一区| 伊人福利视频| 色综合久久无码网| 亚洲男人的天堂久久香蕉| 亚洲美女一级毛片| 亚洲天堂网视频| 久久综合激情网| 精品国产网| 日韩黄色在线| 91国语视频| 99青青青精品视频在线| 欧美在线中文字幕| 欧美亚洲激情| 欧美成人午夜视频免看| 精久久久久无码区中文字幕| 久久综合丝袜长腿丝袜| 亚洲国产成人精品青青草原| 99久久精品久久久久久婷婷| 精品无码国产一区二区三区AV| 毛片免费在线视频| 国产嫩草在线观看| 欧美不卡视频在线| AV天堂资源福利在线观看|