麻亞妮
(陜西藝術職業學院 影視系, 西安 710054)
在信息智能時代中,互聯網技術不斷發展,微博、新聞、電子商務、社區、音頻、視頻信息及智能搜索等信息開始出現大爆炸,各種內容豐富了互聯網平臺。在此背景下,傳統商務也面臨著一定的挑戰。用戶能夠獲得的信息在不斷增加,以此使傳統商務在商品宣傳及營銷推薦方面需要做更多努力,個性化推薦系統的開發也因此備受關注。智能推薦模型的提出較晚,在互聯網時代早期,即便是成型的推薦系統也較為直接且簡單。當時推薦算法只是傳統統計分析及市場調研?;谑袌鲆幠<翱蛻羧后w不斷增加的背景下,此種方法已經無法滿足需求。個性化智能推薦系統目前主要的研究方向就是基于知識、協同過濾及推薦內容等,重視對用戶內在特點的深入挖掘。另外,機器學習算法在此領域也備受重視。基于此,本文就基于智能推薦及機器學習,對商務評分平臺進行設計與實現。
本文所研究的系統主要目的就是實現推薦算法在智能模型評分系統中的使用,推薦系統中評分數據較常見,評分數據具有自身收集基本數據類的特點,不同的是數據集類型只是掌握物品和用戶之間的對應聯系,用戶不評價物品。評分屬于評分系統的主要操作,所以得到的全部評分均值類型都屬于數據集類型。為了能夠保證Count操作的復雜程度為0-1之間,那么就要單獨維護評分數據,以此有效記錄評分數量。另外,推薦系統中的正反饋類型能夠作為用戶隱式反饋算法內容,用戶對物品評分,此數據屬于推薦算法優先數據,從而使用戶充分展現物品取向性[1]。
本文所設計的評分系統主要包括用戶交互層、數據存儲層、推薦引擎層。其中的用戶交互層能夠收集用戶在網上購物時候的購買、收藏及瀏覽等信息,以此能夠為用戶推薦滿足自身需求的物品。其中推薦引擎層的主要目的就是以電子商務系統場景,選擇合適推薦算法,對推薦結果進行計算,并且在數據存儲層中進行存儲。數據存儲層的主要目的就是實現大量用戶及商品信息的結構存儲。其中各個層之間使用分層架構,其能夠有效保證系統具備低耦合、高內聚的優勢,不僅能夠有效保證系統穩定性,還能夠使系統伸縮性有所提高,使系統能夠根據需求及場合隨時實現調整[2]。圖1為基于智能推薦模型的評分系統設計框架。
評分系統需要大量數據計算,其中的數據主要包括電子商務平臺中的商品及用戶數據,還包括利用系統日志提出的用戶行為和用戶在對網頁的瀏覽行為。對于用戶及商品數據能夠相互共享的網站數據會被不斷的更新,利用系統提取日志有效解析用戶商品的評價,從而使模塊的需求能夠轉變成為評分的指標。系統收集模塊能夠實現多數據轉化及收集方式的設計,并且以推薦引擎實現數據需求的收集。不同推薦引擎需要不同數據,那么數據收集方式也能夠滿足不同推薦引擎的需求,以此還可以設計公共接口,之后以不同引擎對數據收集方式進行有效實現[3]。

圖1 基于智能推薦模型的評分系統設計框架
推薦引擎組是一種推薦算法組合,通過多種推薦算法能夠在組模塊中集成,并且利用不同推薦引擎相互結合,從而使其能夠變成推薦結果?;蛘吣軌蛟诰W站發展過程中的各個階段使用不同推薦引擎。推薦引擎包括離線計算及在線計算的模塊,離線計算數據也在數據庫中存儲。利用多引擎組合,不使用單引擎組合,并且還要對以下問題進行全面的考慮:其一,利用各個推薦引擎的優點在項目后期實現全新推薦算法的添加,而且還要以實際需求調整推薦引擎;其二,通過用戶反饋能夠使用戶對不同推薦引擎選擇,以此得到結果。部分用戶喜歡全新的商品,但是部分用戶喜歡自己之前所喜歡的商品,這些都是利用不同策略所構成的[4]。圖2為推薦引擎的結構。

圖2 推薦引擎的結構
以不同推薦引擎只能夠得到大概的結果,還要對其進行深入的處理,從而為用戶進行提供。本文所設計的評分系統主要目的就是根據用戶的評分,深入挖掘用戶的喜好,以此為用戶提供高質量的服務,從而使用戶體驗得到進一步的提高。在對物品進行過濾的過程中,其主要過濾內容為:
其一,用戶已經使用或者用戶不喜歡的物品,要對此部分進行規律;
其二,以推薦模型推薦物品還會出現古怪的物品組合,此物品一般不會進入到物品推薦中;
其三,被網站定義為不合格或者不適合推薦的物品[5]。
此模塊能夠有效視線數據的交互,并且其并不是頁面或者終端的模塊,其中具備公共接口,從而方便其他網站模塊能夠對其進行調用。此模塊還能夠有效收集用戶的直接反饋及在線行為,而且能夠對推薦結果進行有效處理。所以,推薦結果屬于評分和ID,用戶交互模塊能夠通過數據庫找到推薦商品的具體信息,而且還能夠反饋給用戶,用戶交互模塊的設計詳見圖3[6]。

圖3 用戶交互模塊的設計
推薦功能模塊主要包括用戶、產品、訂單、交易、售后的管理。
其中用戶管理中的前臺包括用戶登錄、資料維護、注冊及忘記密碼等功能,后臺主要包括會員管理、注冊審核等。
產品管理的前臺主要包括產品信息發布、信息展現及產品檢索,后臺主要包括添加產品信息、積分及折扣等。
訂單管理中的前臺主要包括產品選購、購買、支付、退換貨、評價等。后臺主要包括訂單確認、發貨及信息更新等。
交易管理中的前臺主要包括對于訂單交易選擇商品查詢、積分獎勵和交易支付等。后臺主要包括收款管理及統計報表等管理。
推薦展示指的是通過用戶瀏覽頁面生成日志記錄及用戶購買信息中實現用戶興趣愛好屬性的充分挖掘,利用推薦算法為每位用戶都能夠將自己所感興趣的產品進行展現。
在用戶進入到電子商務推薦系統中,系統為用戶的個性化制定熱銷商品的推薦欄,其主要是基于用戶協同過濾推薦算法,以相似商品銷售為用戶推薦熱銷商品。另外,系統還能夠根據用戶的需求提供用戶可能會購買的商品。此欄目的主要目的就是根據物品協同過濾推薦算法,以此為用戶推薦可能會感興趣的商品[7]。
商務智能推薦系統架構基于以上分析,此服務器模塊的主要目的就是實現推薦算法的交互,服務器能夠實現數據集文件的讀取,并且還能夠將映射文件、數據及及生成模型序列化實現第二次的使用。圖4為推薦系統服務器的功能設計結構。
在實現數據及推薦算法優化的過程中,為了能夠實現已經創建推薦算法系統框架能力的測試及展現,在此模擬商務平臺中,可以實現四種推薦算法的測試。本節依次實現這些算法的優化,其中的每個算法配置參數數量都不同,基于遞歸下降生成模型要求具有隨機性,并且在多次試驗基礎上,使模型質量得到進一步的提高[8]。

圖4 推薦系統服務器的功能設計結構
樸素貝葉斯算法的配置參數主要是物品屬性選擇方面,由于底層推薦系統框架使用二進制屬性,所以其中的每個屬性只具有存在或者不存在兩個狀態,全面考慮最終數據集這些信息,并且還要充分考慮特征值是否能夠屬于貝葉斯算法可選輸入。之后使用交叉驗證方法實現精準度的測試,使訓練數據集中部分子集的拆分,將其作為測試數據,之后實現內部相互驗證,實現模型參數方法的對比和選擇。
此推薦算法的重點為接近物品數量k選擇的時候,如果k值較小,那么就會使評分預測只是參考部分臨近物品,降低了預測結果的代表性。如果k值較大,那么就會延長訓練及預測的時間。全面考慮測試數據集的情況,若將k值限定在30-60之間,則交叉驗證結果在40-50之間,全面考慮精準性及綜合時間。
此算法要求具有較多的配置參數,首先要假設用戶-物品關聯屬性數量,此方面還是矩陣分解算法核心,根據不同屬性數量實現較差驗證[9],能夠得到不同屬性數量中的RMSE誤差。
本文在實驗過程中要創建Hadoop分布式集群,使用三臺PC機,其中的配置為雙核處理器,使用4GB內存。創建Hadoop分布式集群實驗環境的過程中,要實現master節點的免密碼配置,此方面是實驗環境創建過程中尤為重要的部分。SSH屬于非對稱加密算法,Hadoop集群中的各節點在實現數據訪問的過程中,被訪問的節點就會實現可靠性的驗證。在創建實驗環境之后,要在Master節點中實現Hadoop的啟動,利用jsp命令對Hadoop集群中的每個節點進程是否能夠正常啟動進行查看。為了能夠對Hadoop分布式集群執行效率進行有效的評估,可以使用加速比作為評價的標準,定律評估是基于固定規模數據中,分布式集群運行性能會在節點數量不斷增加的過程中而變化,基于此標準情況中,在數據規模大小一定的時候,加速比和節點數屬于線性的關系[10]。實驗的結果,如圖5所示。
通過圖5可以看出來,本文所設計的系統算法推薦質量較好,此數據加速比都和集群節點具有線性關系,以此表示,數據集越大,那么加速比集群的節點數線性關系就會越好。那么,本文所設計的Hadoop推薦算法在實現海拉近數據處理的過程中,具有一定的效率。

圖5 實驗的結果
本文使用Hadoop實現基礎數據的處理,之后使用機器學習思想編寫完整的推薦系統框架、智能商務系統。通過系統的性能和測試結果表示,此系統能夠有效滿足實際使用需求,此系統能夠將推薦系統從理論兼容到實踐中實現初始目標。測試平臺能夠實現公司投入實際使用情況的展現,基于擴展性及通用性,不同功能能夠在模塊中明確,以此滿足系統未來的使用需求。