趙志超
(河北中信聯信息技術有限公司河北 石家莊 050091)
蔬菜銷售電子商務平臺的推薦系統研究
趙志超
(河北中信聯信息技術有限公司河北 石家莊 050091)
應用中的區域蔬菜電子商務系統大多具備網上購銷的主要功能,但在提高銷售量和消費者應用體驗方面有重要作用的推薦系統則建設不多,或不夠完善。從用戶管理和交易行為特點數據中提取用戶特征和購銷行為模型,生成k—均值聚類簇和簇中心,計算新用戶相應信息與聚類簇中的最近鄰居集數據的最大相似度,生成銷售推薦信息,可構建出適合區域蔬菜電子商務網站用戶規模和應用的推薦系統。
蔬菜銷售電子商務聚類簇協同過濾算法推薦系統
區域性蔬菜產銷電子商務系統可實現定域內蔬菜產業重點縣的專業合作社與超市、消費者的直接對接,為蔬菜合作社、蔬菜生產企業(單位)、農資供應單位、物流配送企業、超市和蔬菜消費者提供信息發布、瀏覽和交易等功能。用戶通過蔬菜和農資產品展示、信息發布、撮合洽談及物流配送等功能,實現供需雙方“鍵對鍵”的網上交易,包括蔬菜、農資的網上銷售、電子支付、物流配送管理以及客戶關系管理等功能[1,2]。
這些建設中的蔬菜電子商務系統雖然具備了網上購銷的主要功能,但仍有借鑒學習大規模電子商務網站先進營銷技術和豐富完善自有特點功能的發展空間。蔬菜和農產品銷售時間因素很重要,利用信息技術提高交易效率是解決此類問題的有效手段。
結合農產品銷售和消費者的活動特點,綜合用戶信息和購銷行為數據,經過聚類分析和協同過濾等算法,為網上銷售對時令節氣依賴很強的蔬菜和農產品創新設計推薦系統,有助于縮短銷售供需周期,提高銷售量,降低購銷成本,優化銷售體驗。
區域性蔬菜產銷電子商務系統通的基本系統功能結構如
圖1所示,主要由系統管理、合作社管理、會員管理、后臺運營管理、推薦系統、第三方支付管理、交易管理和商品管理等多個功能相對集中,數據相互共享的子系統組成[3]。
推薦系統在傳統農產品銷售的電子商務網站上應用較少,但對時令節氣依賴很強的蔬菜和農產品上網銷售來說,個性化推薦系統能大大提高網站銷售額,有效縮短供需銷售周期,優化銷售體驗,值得投資建設。
協同過濾算法推薦系統的基本思想是興趣和需求相近的消費者可能對同樣的商品感興趣,并可能產生相同的采購行為。因此,推薦系統的運行離不開積累用戶的歷史交易數據。為了結合行業和地域特點,并有效地管理和應用用戶數據,蔬菜電子商務網站以會員機制運作。蔬菜合作社、蔬菜生產企業、農資供應企業、蔬菜加工企業、蔬菜銷售企業(超市、批發市場)、普通消費者或其他組織和個人等,經網上注冊和審核后,均可成為交易級會員。
可供蔬菜電子商務交易推薦系統利用的用戶信息和行為數據主要有以下3類。
①用戶檔案:用戶會員的基本信息,如會員級別和會員分類;注冊的基本信息,如組織的名稱、法人、單位屬性、經營范圍、注冊資金和地域、經營規模和財務狀況等,個人的姓名、性別、年齡、職業、地域、收入及教育背景等資料;
②用戶交易記錄:用戶在電子商務網站上購買商品的信息,會員積分信息等;
③用戶行為特征:用戶對商品的評分信息、瀏覽行為、需求信息和反饋信息等。
這些數據只有部分是用戶會員登錄注冊提供的,大部分是用戶在網上瀏覽、交易過程中,依靠電子商務網站收集整理的。
目前許多協同過濾推薦算法使用用戶對商品的評分數據作為推薦基礎,用戶評分數據分為顯式評分和隱式評分2類。蔬菜電子商務系統采用顯式評分和隱式評分相結合的方式,對于只能通過顯式記錄才能獲得有效的記分或便于顯式記分的記錄項采用顯式評分,其他則應用隱式評分,以便提高用戶購買體驗。
協同過濾推薦系統通過對系統可以捕獲的操作進行分析以獲取隱式評分,這些操作稱為隱含興趣指示操作。隱含興趣指示操作主要有:
①標記網頁操作:包括將網頁添加到收藏夾、從收藏夾刪除網頁、將網頁另存為本地文件、打印網頁、以及將網頁以電子郵件方式發送給好友等;
②編輯網頁操作:包括剪切、復制和粘貼等編輯操作,還包括在新窗口中打開鏈接,在網頁中搜索文本和下拉滾動條等操作;
③重復行為:如果用戶在某個網頁上重復某些操作行為,可能暗示用戶對該網頁有更多興趣。如某網頁的打開時間比較長,反復上下左右拉動滾動條,重復訪問某一網頁等行為。
為了避免用戶數據庫體積龐大影響算法效率,系統設計首先對歷史數據進行k—均值聚類,預先分成k個不同的簇,而且每個簇的中心采用簇中所含記錄的均值計算而成,通過機器學習算法聚成用戶興趣特征類簇,然后再用類中心與新用戶的行為數據進行相似分析,快速歸類后,再與類中的元素進行最大相似分析,做出推薦建議。
有了用戶行為數據,就可以進行推薦分析。為此,可以建立下面的數學模型。
設有具有n個用戶的p個商務行為的觀測樣本數據xi= (xi1,xi2,…,xip)T,i=1,2,…,n

這樣,每個行為可視為p元空間的一個點,n個行為序列組成p元空間的n個行為向量。任意2個向量xi,xj的歐氏距離定義為

圖1 蔬菜銷售電子商務平臺總體結構設計

根據觀測樣本數據空間的規模,選擇適當的D=dij將所有用戶聚類分成k個興趣特征用戶數目不等的,互不相交的類簇集N={N 1,N 2…Nk},其中心可表示為yi=(yi1,yi2,…,yip) T,i=1,2,…,k,k 通過上面的相似性度量方法可以得到目標用戶的最近鄰居(聚類集),衡量用戶u與最鄰近用戶行為簇Nu中所有用戶行為向量之間的相似性程度,常用向量的相關系數和夾角余弦來描述。任意兩向量xi,xj的夾角余弦cos(xi,xj)為: cos(xi,xj)的絕對值越接近于1,說明向量xi和xj之間的夾角越小,相互關聯性越大。 用戶u對某商品項i的預測評分Pu,i可以通過用戶u從最近鄰居行為數據簇集合Nu={U 1,U 2,…,Us}中鄰居對該項的評分獲到: 式中,cos(u,uh)表示用戶u與其最近鄰居簇中用戶uh之間的相似性,uhi表示用戶uh對項目i的評分。和分別表示用戶u和用戶uh對行為項的平均記分。 上述方法可以預測用戶對所有未評分項的評分,然后選擇預測評分最高的前若干個項作為推薦結果反饋給當前用戶u。當使用交易數據作為算法輸入時,則可以采用如下2種方式產生top—N推薦: ①最頻項推薦:掃描當前用戶每一個最近鄰居的購買記錄,對其購買的商品進行計數,選擇出現頻率最高且當前用戶沒有購買過的前N件商品作為推薦結果; ②關聯推薦:將當前用戶最近鄰居的交易數據作為一個虛擬的交易數據庫,進行關聯重合挖掘。如果在關聯用戶重合部的商品已出現在當前用戶的購買商品集合中,就向當前用戶推薦在預測關聯部分中用戶尚未購買的商品[5]。 根據上述思想設計的電子商務推薦系統由3個主要部分構成,如下圖2所示。 圖2 推薦系統主體結構示意圖 ①用戶行為記錄:收集和記錄用戶行為和反饋數據; ②推薦引擎:分析用戶行為數據,按照模型生成推薦結果并展示在用戶界面上; ③頁面展現:展示推薦結果,收集用戶對推薦結果的反饋。 用戶行為記錄系統是推薦系統的基礎,首先需要實時更新用戶的行為數據,同時還需要能夠對大數據量的快速存儲和處理。沒有大量翔實的數據記錄,推薦引擎的工作成果就會大打折扣。推薦引擎的設計與推薦算法策略,則決定著整個系統的效率。推薦系統的人機交互界面設計有非常重要的作用,好的交互界面設計不僅能良好地展現推薦商品的信息,更能夠收集到更多,更準確的用戶反饋,對提高推薦引擎的推薦的準確性和系統的性能改善都有重要作用[6]。 因為銷售行為是持續的過程,推薦系統必然也是一個持續收集用戶行為,更新用戶興趣模型,調整用戶推薦算法和策略的閉環信息交互系統,尤其是評價推薦轉化成銷售的效果更重要。消費者的行為不是一成不變的,推薦系統能夠隨之調整推薦模型和策略,提高推薦準確有效率,是需要持續深入研究的課題,但隨著用戶行為數據積累的不斷增多和方法的改進,系統的推薦結果將會越來越準確越有效。 雖然討論的是區域蔬菜電子商務平臺上推薦系統的設計應用,由于互聯網的覆蓋特性,可以方便地擴展到全國乃至更廣的區域,但是,系統的組織,流程和數據管理,乃至推薦算法將需要根據用戶群和地域特性進行相應的調整。 [1]鄧愛林.電子商務推薦系統關鍵技術研究[D].上海:復旦大 學,2003. [2]青海.電子商務推薦系統核心技術研究[D].北京:工業大學,2009. [3]PETER H.機器學習實戰[M].李銳,李鵬,譯.北京:人民郵電出版社,2013. [4]范金城,等.數據分析[M].北京:科學出版社,2002. [5]MARMAN ISH,BABENKO D.智能web算法[M].阿穩,陳鋼,譯.北京:電子工業出版社,2011. [6]秦壽康,等.綜合評價原理與應用[M].北京:電子工業出版社, 2003. Research on Recomm endation System Based on Vegetable Sales E-comm erce Platform ZHAO Zhi-chao The local vegetable E-commerce systemsmostly have themain function of Internetmarketing,but the construction of recommendation systemswhich plays the important rolesin the aspectsof improvementof salesand consumer application experiencesare notmany or inadequate.This paper extracts the user characteristics and buying/selling behaviormodel from the usermanagement and trading behavior characteristic data to build the k-means cluster and cluster center,and calculates themaximum sim ilarity of the nearest neighbor setdata in the relevant information ofnew usersand clustersto generate the salesrecommendation information,in order to build the recommendation systemswhich are suitable for localvegetable E-commercewebsite user scale and application. vegetablessales;E-commerce;cluster;collaborative filtering algorithm;recommendation system TP393 A 1008-1739(2014)13-62-4 定稿日期:2014-06-125 推薦產生


6 推薦系統主體結構設計

7 結束語
(HebeiUniW in Information Technology Co.,Ltd.,Shijiazhuang Hebei050091,China)