王培培
(河北大學管理學院 河北保定 071002)
基于協同過濾算法的農業信息服務個性化推薦研究
王培培
(河北大學管理學院 河北保定 071002)
為解決農業信息服務中農戶查找所需信息困難,信息服務平臺實用性信息缺乏等問題,文章提出了農業信息個性化推薦的必要性,并且以農業信息服務系統中的地域分塊推薦為例引入個性化推薦算法中的協同過濾推薦算法,以期能夠在農業信息服務系統中實現個性化推薦,解決農業信息服務中存在的問題。
農業信息服務 個性化推薦 協同過濾算法
我國的農業信息服務基礎設施建設已經取得很大進展,農業科技成果也不少,但真正用于生產,產生實際農業經濟效益的科技成果應用卻不多,特別是在信息利用方面還存在不少制約著農業收益的問題。比如農民實際應用信息不多,信息供給不能滿足當地農民實際生產需求等。主要原因就是面對海量的農業信息供給,用戶找不到針對自己種植作物的相關方面信息,而且農業生產有明顯的地域性,季節性特征,這就使得農業信息服務的水平有待提高。個性化推薦是主動型信息推送服務,能夠根據用戶需求推薦用戶感興趣的相關信息,使得農業信息服務這一環節做的更加到位,從而加強用戶信息利用的效用,增加農業收益[1]。
1.服務對象復雜
農業信息服務的受眾文化水平參差不齊,一般農民的知識水平都比較低,個性化農業信息推送技術不要求農業從業人員具備專業的背景知識和檢索技能,易于被用戶接受,使得廣大農民朋友足不出戶就能享受到優質的農業信息服務。
2.信息傳播渠道單一
個性化推薦是實行信息推送的主動信息服務,可以有效緩解文化素質較低的農民用戶獲取信息方式單一的問題,這也要求推送服務要構建出傳播方式靈活的多種傳播渠道。
3.針對性不足
農業生產門類眾多,地域性,季節性特征明顯,一般的農業信息服務系統的針對性較差,滿足個性化程度不高,這就要求我們加強農業信息的個性化推薦服務應用[2]。
1.地域分塊推薦
依據農業地域性特點,中國種植業區可劃分為:(1)東北大豆、玉米、甜菜區;(2)北部高原小雜糧、甜菜區;(3)黃淮海棉、油、煙、果區等10個一級區[3]。各個種植區由于作物結構不同,對信息的需求類型也將有所不同,如圖所示,農業信息服務個性化推薦可以依據用戶所在位置確定用戶屬于哪個種植區,從而推斷用戶對哪幾種作物的種植信息比較感興趣,從而縮小備選推薦信息的范圍,提高針對性,在此基礎上,再根據同一種植區域內的用戶興趣大致相似特點,在備選推薦信息基礎上進一步縮小推薦信息范圍,把推薦信息限定在用戶感興趣的信息范圍內,這一過程可以通過協同過濾推薦算法實現。
2.協同過濾推薦算法
協同過濾推薦與傳統的基于內容過濾的推薦不同,它是在用戶群中尋找目標用戶的最近鄰居,然后根據最近鄰居對某一信息的評價或瀏覽記錄,來預測目標用戶對某一信息的喜好程度,從而為目標用戶推薦信息[4]。協同過濾算法分為基于用戶的協同過濾、基于項目的協同過濾、基于模型的協同過濾。
在農業信息按地域分塊推送的情況下,事先系統就已經把用戶分成了很多興趣不同的模型, 所以只要在模型的基礎上進一步縮小推薦信息的范圍, 把推薦給用戶的信息準確地限定在用戶感興趣的信息范圍內就可以了, 所以本文在這里主要介紹的是基于用戶的協同過濾推薦算法。基于用戶的協同過濾推薦算法是通過比較目標用戶的一系列行為選擇和其他用戶之間的相似性,來識別出一組相互具有相似興趣偏好的用戶——最近鄰居,一旦系統識別出目標用戶的最近鄰居,就將最近鄰居感興趣的信息推薦給當前目標用戶,在信息服務推薦系統中應用的基本思想就是:使用與新用戶a相似的用戶a”對一個對象s的評價來預測s對新用戶a的效用,進而判斷是否推薦s給a。主要有三個步驟:
一是建立用戶-項目評分矩陣,將用戶對項目的評分表示成m*n的矩陣r,m代表用戶數量,n代表項目數量,rij代表第i個用戶對第j個項目的評分值。
二是尋找目標用戶的最近鄰集合,每個用戶u都有一個最近鄰集合,通過計算目標用戶與其他用戶之間的相似度來尋找最近鄰,常見的相似度計算方法有余弦相似性、pearson相關系數等。用戶之間的相似值計算出來后,就根據用戶間的相似值得出目標用戶的最近鄰集合,確定最近鄰居的方法有兩種:一種被稱作“閾值”策略,即把與目標用戶的相似值大于閾值的用戶當作最近鄰居集合;另一種被稱作“Top-N”策略,即將最近鄰居與目標用戶之間的相似值按從大到小排序,最近鄰集合為排在前N位的最相似用戶。
三是產生推薦,使用公式計算目標用戶對某項目的興趣度預測值,選取N個最高的預測值項目推送給用戶。
通過基于協同過濾算法的個性化推薦,可以把農戶所需要的信息及時推送給農戶,滿足用戶對信息的需求。
基于用戶的協同過濾也有局限性,計算用戶相似度時,是把目標用戶的歷史行為記錄與其他每一個用戶的記錄進行比較得出的,若一個網站有上百萬個用戶,且用戶數量逐漸增多,每計算一個目標用戶都將涉及到上百萬次比較,所以擴展性難將成為非常嚴重的問題。基于項目的協同過濾推薦算法和基于模型的協同過濾推薦算法也會存在數據稀疏性,冷啟動等問題。因此,如何克服協同過濾算法中存在的各種問題也是協同過濾推薦算法研究的一個重要課題。
本文只是在農業信息服務系統中的地域分塊方法基礎上對協同過濾推薦算法的一個小型案例分析,協同過濾算法雖然有一些缺點,但也有一定的優勢,例如簡單易于理解,能為用戶推薦新的感興趣的信息等,我們也可以把它與其它算法結合起來,取長補短,更好的應用到農業信息服務個性化推薦中,以加強所提供信息的針對性,使得信息能夠被更有效的利用。
[1]喬波,聶笑一.基于本體的農業信息服務個性化推送研究[J].安徽農業科學,2013,41(27).
[2]張新香.情境感知和興趣適應的農業信息推薦模型[J].計算機應用研究,2015,33.
[3]陳誠,廖桂平,史曉慧.農業農村信息服務個性化推送技術[N].中國農學通報, 2011,27(29):151-156.
[4]徐穩.湖南農業信息區域推送關鍵技術研究[D].湖南農業大學,2013,6.
王培培(1992),女,漢族,河北廊坊人,河北大學情報學碩士研究生,研究方向:信息服務,大數據。