裘進 李秋霞 章珺彧


摘要:電子商務發展迅速,其作為信息時代的重要產物,給我們的生活帶來了諸多便利,但是隨著“信息過載”問題的出現,我們很難從電子商務平臺上找到讓自己滿意的商品,商品推薦應運而生。隨著技術的發展,其他電商平臺的推薦技術已趨于成熟,但是,對于農產品的推薦技術和系統卻很少。所以,本文提出改進的基于物品的協同過濾算法,以推薦精準、快速為目標。
關鍵詞:協同過濾;個性化推薦;農產品電商
1 1綜述
電子商務發展迅速,淘寶、京東和亞馬遜等的出現使人們的消費方式發生了翻天覆地的變化。自2015年至今,多項扶持農業的國家政策的出臺和上百億電商進農村專項資金的下撥,農村電商像雨后春筍般蓬勃發展。
我國農產品電商已經經過20幾年的發展,初步形成了電子商務網站、期貨交易,以及涉農大宗商品交易、網上商城等多種農產品電商形式。2015年,電子商務總交易額1364700億,其中,農產品交易額48.7萬億元,占總量的36%;農產品電商成交額超2000000億[1]。農產品如此巨大的交易額表明農產品地位的舉足輕重。越來越多的企業和個人,開始投資和參與到農產品電子商務中來,農產品冷鏈的發展進一步促進了農產品電商的發展。
但是,農村電商的發展還受到了很多問題的限制,其中很重要的一點就是:消費者很難找到符合自己要求的農產品。消費者必須要花費大量的時間和精力在搜索和尋找喜愛的農產品,這在很大程度上影響到消費者的購物體驗。而農產品個性化推薦技術,一方面,個性化推薦能夠在為消費者推薦商品的同時,為消費者節省了時間;另一方面,農產品個性化推薦能降低商家的成本,最大程度為農民謀福利。
推薦方法主要有五種:協同過濾、基于圖論的推薦算法、基于內容的推薦、混合推薦算法以及其它[2]。基于商品的推薦算法建立在在協同過濾算法上,它不依靠用戶對于商品的評分,而是根據用戶瀏覽的商品推薦與之類似的商品。但是不論運用哪一種推薦算法一定會包含以下四個模塊:信息采集、用戶模型建模、個性化推薦、用戶模型更新。
2 2協同過濾推薦算法
基于用戶的協同過濾算法的推薦過程可以分為三個步驟,第一步,獲取消費者購買過的商品、評分等數據;第二步,獲取相似用戶;第三步,推薦。計算相似用戶是算法核心,相似用戶的選擇對推薦的準確性至關重要,目前計算用戶相似度的方法有皮爾遜相關系數、杰卡德相似和余弦相似度和等。
對每個相似用戶v(v∈N) ,用相似用戶v對商品i的評分R_vi,和相似用戶v與目標用戶u之間的相似度Sim(u,v),加權得到目標用戶u對目標商品i的預測評分P_ui。
基于物品的協同過濾算法通過分析消費者商品的瀏覽歷史,將現有商品與之前的商品計算相似度,然后進行排序,將相似度排在前面的商品推薦給消費者。圖2是基于內容的推薦算法的示意圖。基于內容的系統過濾算法存在一個嚴重的弊病:數據的稀疏性,這導致了推薦效果的準確度不夠。
對相似商品集合中每個商品j (j∈N),用目標用戶u對相似商品j的評分值R_ui,和相似商品j與目標商品i之間的相似度Sim(i,j),加權得到目標用戶u對目標商品P_ui。
3改進協同過濾算法的具體流程
本文為了解決協同過濾算法代碼數據稀疏的問題,提出一種改進的基于2物品的協同過濾算法。原有算法的相似公式為:
我們將原有的余弦相似度公式加入時間、用戶評分,得到新的相似計算公式:
下面文章將詳細介紹改進算法的流程。
第一步,按時間倒序獲取用戶購買農產品的列表。首先,提取用戶訂單,包括農產品id,用戶id,用戶評分和訂單時間,并按時間倒序排列農產品列表。再獲得用戶購物車數據,包括農產品id,用戶id,加入購物車時間。最后把兩個數據表合二為一。
第二步,得到農產品矩陣和農產品-用戶表。該矩陣的每個值S[i][j]代表了同時喜歡物品i和物品j的用戶數:
其中N(i)是喜愛農產品i的用戶數量,而N(j)是喜愛農產品j的用戶。然后,需要提取農產品-用戶表,
第三步,獲取時間表。去重農產品id和用戶id,得到農產品-用戶-時間表。
第四步,建立農產品評分表。遍歷第一步得到的表格,去除評分為零的數據,計算每一個農產品的平均評分。
計算得到的每個農產品的平均評分即成為影響因子。
第五步,建立農產品-農產品相似度矩陣G。從以上步驟建立的表中提取有用信息,從而使用改進的相似度計算公式計算農產品-農產品相似度矩陣G。每個用戶都有屬于自己農產品相似度矩陣。
第六步,歸一化農產品相似度矩陣。歸一化公式為:
其中,W_ij^'是歸一化后的值,maxW_ij代表最大值,W_ij是歸一化前的相似度。歸一化不僅可以提高推薦系統的準確性,還能提高農產品的覆蓋率。
第七步,獲得當前用戶對農產品j的興趣度。
其中Q_uxi代表U(x)的農產品j興趣度,W_ij表示農產品j對農產品i的相似度R_uxi是當前用戶U(x)對農產品i的興趣,N(ux)表示當前用戶喜歡的農產品集合,Sim(j,k)是和農產品j比較相近的k個農產品的集合。
第八步,獲得當前用戶的興趣度排序列表。
第九步,生成最終的農產品推薦表。
4實驗與結果
文章采用的是由Minnesota大學的Grouplens研究小組創建的數據集進行實研。
我們使用召回率、準確率以及平均絕對誤差來衡量推薦算法。召回率表示推薦算法是否全面;準確率表示推薦是否正確。召回率和準確率公式如(9)和(10)所示。
我們將改進的算法與傳統基于項目的協同過濾算法進行對比。
本文提出的改進算法較之于傳統算法的MAE數值有所減小,也就是說推薦準確度更高。
表2顯示本文改進的算法比傳統算法的召回率和準確率都要高。
5結束語
本文主要介紹了農產品推薦的必然性和基于內容的協同過濾算法的主要思想;本文還介紹了目基于內容的協同過濾算法存在的一些問題;本文致力于解決原有算法存在的矩陣稀疏性、新用戶和推薦實時性等問題,最后將其應用與農產品推薦中。在農產品電商中可以運用本文提出的改進的基于內容的協同過濾技術將農產品推薦給對此農產品感興趣的消費者手中。
文章雖然對算法進行了一定改進,但是依然存在一些問題。算法對于分析文本數據還可以,但是對于提取農產品多媒體數據內容的特征具有一定的困難,在為農產品電商用戶發現新的產品資源能力有限。
參考文獻:
[1]全巧梅.農產品電商中精準推薦算法應用研究[J].科技廣場,2016(9):39-42.
[2]葉錫君,龔玥.基于項目別的協同過濾推薦算法多樣性研究[J].計算機工程,2015(10):42-46,52.
作者簡介;裘進(1974—)男,漢族,浙江杭州人,本科,中級,研究方向:農業經濟信息管理;李秋霞(1990—)女,漢族,江西南昌人,碩士,中級,研究方向:計算機技術應用及產品管理;章珺彧(1991—)女,漢族,浙江長興人,本科,研究方向:農業電子商務。