謝暢

摘 要:本文結(jié)合河北省中小企業(yè)公共服務(wù)平臺網(wǎng)絡(luò)項目設(shè)計建設(shè)理念,分析了“服務(wù)交易推薦系統(tǒng)”的業(yè)務(wù)需求、功能需求和實現(xiàn)方式,以期這種建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的高級智能平臺,能夠幫助服務(wù)平臺網(wǎng)站為企業(yè)用戶選擇服務(wù)提供完全個性化的決策支持和服務(wù)導(dǎo)航。
關(guān)鍵詞:平臺網(wǎng)絡(luò);推薦;數(shù)據(jù)
1 需求分析
建立服務(wù)交易推薦系統(tǒng),模擬專家?guī)椭脩暨x擇服務(wù),企業(yè)用戶瀏覽了某項服務(wù),系統(tǒng)不僅向用戶提供符合一定條件的服務(wù),系統(tǒng)經(jīng)過用戶行為分析,推測用戶還需要其他哪些服務(wù),并向用戶推薦,為用戶選擇服務(wù)提供智能導(dǎo)航。
效果分析供運營人員和管理人員使用的功能模塊,通過該模塊,可以以多種圖表視圖查看推薦功能為系統(tǒng)帶來的詳細流量貢獻,進而為網(wǎng)站優(yōu)化提供參考。
2 系統(tǒng)功能
系統(tǒng)對用戶行為數(shù)據(jù)進行監(jiān)控,根據(jù)個性化的需求精準推送相關(guān)的消息。通過系統(tǒng)可以為用戶提供服務(wù)。通過分析用戶的歷史行為給用戶的興趣建模,從而主動給用戶推薦能夠滿足他們興趣和需求的信息。通過發(fā)掘用戶的行為,找到用戶的個性化需求,從而將服務(wù)準確地推薦給需要它的用戶,幫助用戶發(fā)現(xiàn)那些他們感興趣但很難發(fā)現(xiàn)的服務(wù)。
2.1 用戶行為采集
通過該功能,系統(tǒng)將不間斷監(jiān)控目標網(wǎng)站的用戶訪問行為,并將監(jiān)控到的行為發(fā)送給消息服務(wù)器。從消息服務(wù)器異步接收行為數(shù)據(jù),按需轉(zhuǎn)發(fā)給關(guān)系型數(shù)據(jù)庫、傳統(tǒng)文件系統(tǒng)、分布式文件系統(tǒng)等數(shù)據(jù)載體,供后續(xù)模塊使用。
2.2 獲取服務(wù)需求
系統(tǒng)基于采集到的用戶行為(包括瀏覽、申請等)數(shù)據(jù),分析挖掘用戶對服務(wù)產(chǎn)品的需求偏好,供相關(guān)模塊使用。
2.3 核心推薦
基于采集到的用戶行為數(shù)據(jù),利用數(shù)據(jù)挖掘、機器學(xué)習(xí)等技術(shù),分析挖掘全量用戶行為中隱含的行為模式,產(chǎn)出熱賣榜、看了又看、買了又買、猜你喜歡等推薦結(jié)果數(shù)據(jù)集,供后續(xù)模塊使用。
2.4 服務(wù)匹配
基于核心推薦子系統(tǒng)計算出來的各類交易推薦結(jié)果數(shù)據(jù),以熱門榜、看了又看、買了又買、猜你喜歡等具體頁面展現(xiàn)形式,在合適的網(wǎng)頁、合適的位置,向網(wǎng)站用戶推薦服務(wù),以促成服務(wù)之間的交易。
3 開發(fā)構(gòu)架設(shè)計
開發(fā)構(gòu)架如圖1所示,包括各環(huán)節(jié)的關(guān)鍵模塊及數(shù)據(jù)處理流程。
4 功能描述
4.1 用戶行為采集子系統(tǒng)
該系統(tǒng)包括以下幾個核心模塊:
用戶行為監(jiān)管:通過該功能,系統(tǒng)將不間斷監(jiān)控目標網(wǎng)站的用戶訪問行為。監(jiān)控內(nèi)容主要包括用戶的基本信息、用戶狀態(tài)、用戶行為等。并將監(jiān)控到的行為數(shù)據(jù)以異步方式發(fā)給消息服務(wù)器。
用戶行為采集:從消息服務(wù)器異步接收行為數(shù)據(jù),按需轉(zhuǎn)發(fā)給關(guān)系型數(shù)據(jù)庫、分布式文件系統(tǒng)、Hive等數(shù)據(jù)載體,供后續(xù)模塊使用。
4.2 業(yè)務(wù)數(shù)據(jù)交換子系統(tǒng)
推進引擎的計算過程涉及大量業(yè)務(wù)對象相關(guān)基礎(chǔ)數(shù)據(jù),業(yè)務(wù)數(shù)據(jù)交換子系統(tǒng)負責(zé)周期性的將目標網(wǎng)站的業(yè)務(wù)相關(guān)基礎(chǔ)數(shù)據(jù)同步到推薦系統(tǒng)大數(shù)據(jù)集群中,供推薦引擎模塊使用。
4.3 核心推薦引擎
核心推薦引擎是服務(wù)交易推薦系統(tǒng)的“心臟”,綜合運用Mapeduce、Hive、Mahout等分布式計算、分布式數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、機器學(xué)習(xí)等大數(shù)據(jù)相關(guān)技術(shù),以用戶行為數(shù)據(jù)為基礎(chǔ),挖掘計算得出各類主題的推薦頁面片段所需數(shù)據(jù),包括熱門榜單、看了又看、買了又買、猜你喜歡等。核心推薦引擎的產(chǎn)出數(shù)據(jù)將導(dǎo)入分布式數(shù)據(jù)庫HBase中,供推薦展示子系統(tǒng)使用。
4.4 推薦展示子系統(tǒng)
推薦展示子系統(tǒng)從HBsae讀取核心推薦引擎計算出的推薦數(shù)據(jù),生成各類推薦主題的頁面片段供網(wǎng)站動態(tài)加載調(diào)用。
推薦片段主要分以下三大類:
①熱門榜單:基于全量用戶行為統(tǒng)計得出各類熱門榜,包括熱讀、熱賣等;
②看了又看、買了又買:基于全量用戶行為挖掘出的交易模式,向用戶推薦看或買了當(dāng)前服務(wù)之后最后可能感興趣的相關(guān)服務(wù)產(chǎn)品;
③猜你喜歡:基于協(xié)同過濾等算法挖掘得出用戶興趣偏好,向用戶推薦可能感興趣的服務(wù)產(chǎn)品。
4.5 推薦效果分析子系統(tǒng)
推薦效果分析子系統(tǒng)針對各類推薦目標業(yè)務(wù)對象,從時間、地點、分類、算法、推薦片段等維度,對比分析訪問量和購買量指標,向管理員以各種圖文展示推薦系統(tǒng)為服務(wù)平臺帶來的真實貢獻。