黃章樹 李寶玉 陳翠萍



[摘要]云計算技術的發展與成熟為跨平臺數據資源的共享帶來了福音,其強大的計算能力、高存儲、低成本特征使得資源的共享變得更加切合實際需求。本文圍繞電商企業客戶信息管理中存在的問題,闡述基于云計算服務模式的客戶知識共享資源庫平臺的構建思路,從平臺的服務模式、資源管理和三層架構模型三方面論述平臺的實現過程,詳細介紹了平臺的主要應用服務內容。最后通過基于該平臺的RFM模型應用論證了基于客戶知識共享資源庫進行精準大數據挖掘的可行性。
[關鍵詞]知識共享;資源庫;云計算;客戶管理
[中圖分類號]G250.73
[文獻標識碼]A
[文章編號]1008-0821(2015)04-0069-06
互聯網高速發展的今天,數據已經成為提升企業綜合競爭力,贏得市場的關鍵性資源。“大數據摩爾定律”揭示了數據量正以超乎想象的速度在增長,隨著客戶數據的幾何倍數增長,電商企業面臨的挑戰也日益加劇。大數據的4V特征(Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值))的每一方面都對企業數據處理工作造成巨大的挑戰。特別是Web2.0時代的到來,客戶在互聯網絡上的表現越來越活躍,社交網絡、大眾媒體、口碑式電商等平臺的信息與日俱增,不同媒介平臺信息的強異構性、分布存儲性、高冗余性及海量性是一般電商企業所無法駕馭的。面對企業內外部的海量數據,企業如何利用海量數據挖掘出有價值的客戶信息以及通過洞察分析海量數據,幫助企業做出更快更明智的客戶管理策略成為當今研究的焦點。
構建基于云計算服務模式的客戶知識共享資源庫平臺是解決上述問題的一個可行方案。借助云計算平臺強大的分布數據存儲、高效的計算能力及虛擬化特點,CKSRL旨在實現跨平臺異構數據環境下電商企業客戶信息的自動過濾、清洗、安全管理和推送服務。平臺以用戶為導向,以最大化實現用戶的個性化需求為目標,通過數據挖掘技術輔以適合的規則匹配算法實現對用戶需求資源的提取、過濾、評價和推薦功能。
1 研究綜述
對云計算(Cloud Computing)的定義學術界并沒有形成統一的意見,由谷歌首席執行官埃里克·施密特在2006年的搜索引擎大會提出的云計算概念被認為是其最正統的誕生記,自那以后云計算受到國內外廣大學者的追捧,從用戶角度最通俗的理解為:云計算是一種新型的商業模式,它像水電煤氣一樣,只要你需要,給付一定的費用即可得到。目前云計算被廣泛應用于金融、醫療、IT等領域,Coogle的App Engine開啟公司的云計算之旅;亞馬遜的云計算服務(Amazon Web Services,AWS)在IaaS領域中獨領風騷,成為全球范圍內實際意義上的公有云計算主導者;在國內阿里巴巴集團于2009年成立“阿里云”子公司專注于云計算領域的開發研究;騰訊也在2010年加緊腳步進軍云計算領域,目前已有較成熟的云服務器、云存儲產品。
在云計算數據管理方面上的應用研究,國內外已有一些研究成果:國外學者Goscinski和Brock(2010)提出基于云計算的Web服務資源框架(RVWS),研究如何通過網頁接口進行動態資源的發布、搜索、選擇、使用現有云,并實踐證明了其框架的可行性及高效性。Teregowda等(2010)討論了在當前索引文件瘋狂增長及用戶個性化需求日益增加的環境下CiteSeerx所面臨的挑戰,提出基于云計算的高虛擬存儲系統以實現CiteSeerx的可持續經營。J.Octavio(2010)等在其書中指出在云計算環境中消費者、中間商和服務提供商三者交互影響,其將每一參與者視為一個Agent提出了一種云環境下基于多Agent的服務資源組合優化框架。Gutierrez(2011)提出面向服務的移動云計算體系架構,采用開放網關和APIs維持底層豐富的網絡資源用以實現網絡服務(NaaS)。國內學者張鼐(2010)以圖書館信息資源共享問題為例探討了基于內容構建和服務構建的圖書館信息資源共享模式。劉向等(2014)提出采用中介器/封裝器設計模式,以GLAV方式實現中心節點問的數據分布存儲和信息交互,構建基于云計算環境信息資源集成共享五層架構模型。綜上所述,對云計算的體系及構架的研究已有一些成果,但在電商領域的客戶知識共享管理的應用方面還有待進一步的研究。
2 電商企業客戶信息資源管理存在的問題
電商企業的客戶信息資源管理往往局限于內部數據的挖掘,然而內部信息往往只是客戶信息的冰山一角,并不能反映客戶的真正需求。特別是在互聯網背景下,一方面,客戶網上社交行為產生了大量的用戶偏好數據、實時產品需求信息,這些信息往往對準確判斷客戶需求至關重要。另一方面,隨著電商平臺的發展,客戶的選擇更加自由,客戶跨平臺的交易使得單平臺的數據挖掘變得不可靠,例如客戶實際已經在B電商平臺購買了最近在A平臺搜索過的產品,但是由于信息的不對稱,A平臺根據最近搜索推薦機制仍繼續向客戶推薦該產品,如此不僅影響平臺的廣告效果而且也造成了客戶主觀厭倦甚至是被視為廣告騷擾。此外,中小電商企業由于資金、成本、人才等的限制,在海量數據中提取、處理和利用數據的成本往往超過了數據本身價值。因此迫切需要一種基于按需付費、低成本、高可靠性與擴展性的客戶知識交易模式為企業提供有價值的客戶信息。鑒于此,本文提出基于云計算的客戶知識共享資源庫平臺的構建方案,并闡述平臺的主要應用服務內容。
3 基于云計算的CKSRL構建
3.1平臺構建的意義
CKSRL平臺體現的是以用戶服務為中心,采用需求拉動形式的服務模式,為電商企業提供按需付費的客戶知識管理服務,平臺借助云計算技術以解決跨平臺資源異構性、分布存儲問題。平臺的建設具有較強的現實意義。
(1)CKSRL中的客戶知識是基于數據共享的多平臺數據整合與交互,因而從共享資源云中抽取的數據能夠提供客戶360度全方位信息,其客戶知識準確度更高,知識覆蓋范圍更廣。endprint
(2)CKSRL助力電商營銷,各互聯網運營商平臺通過公共數據云建立客戶知識模式后,能夠借助其電商用平臺特點為中小型電商企業提供精準化、個性化營銷服務。
(3)基于“云計算”的服務模式讓中小型電商企業的大數據客戶挖掘價值成為可能。按需付費的客戶資源獲取,使得中小電商企業能夠以較低的成本進行有效的客戶關系管理。
綜上,CKSRL的建設具有較強的現實意義,以下將從CKSRL的服務模式、跨平臺信息資源管理方法、平臺構架及其主要功能論述CKSRL的構建方案。
3.2服務模式
要實現客戶資源的共享,首先必須建立相應的信息服務共享機制,如圖1所示,由資源管理仲裁委員會負責資源的統籌問題:制定相應的標準、服務機制、資源管理策略等并尋求合適的云計算運營商,由云計算運營商根據服務協議內容進行共享資源云的構建,解決跨平臺數據源的資源云架構、資源數據安全、資源分配、使用管理問題。電商平臺、社交網站等互聯網運營商平臺既是共享資源云的資源供應商,也是資源云的受益商,它們首先基于信息提供協議向云計算運營商提供其平臺資源接口,接著根據資源云的信息使用協議,取得公共資源云的授權資源,構建各自的CKSRL應用服務平臺為其平臺上的電商企業提供客戶知識管理服務以及廣告營銷服務。由此可見,平臺的實現將涉及眾多的利益相關方如提供與使用資源的平臺運營商、維護共享云的云計算運營商、平臺最終用戶——電商企業,它們之間彼此相互關聯相互依賴,但又存在資源競爭關系,因此仲裁委員會需要解決如何基于合作博弈最大化各平臺的利益。
3.3跨平臺信息資源管理
跨平臺信息資源管理是構建CKSRL平臺的重點難點之一,為了能夠實現不同信息源之間的共享與交換,首先需要解決各平臺底層資源的異構性和復雜性問題,以實現分散資源的整合。這部分工作主要包括跨平臺信息資源的描述、資源發現與匹配、資源的動態管理等。目前比較常用的資源描述方法有HTML(超文本鏈接標記語言)、XML(或擴展標記語言)、RDF(資源描述框架)和本體語言。HTML廣泛用于Internet上的信息描述,但由于其擴展性較弱且其表達性較差無法適應云計算的資源描述需求,因此在云計算領域中后3種語言較為常見,這3種語言在HTML語言的基礎上進行衍生與擴展,其較好地描述了異構信息資源的內外部特征;資源發現與匹配通過數據挖掘方法實現跨平臺的資源調用與資源整合,當前的主流方式有基于分布式環境下的信息資源發現機制和基于語義規則的匹配,張迎新等(2010)提出一種基于服務屬性和功能描述的混合服務匹配方法,以服務本體為基準采用LSA算法進行相似性匹配并實證了此方法的效率優化性。在資源動態管理方面,客戶信息總是處在不斷的變化當中,為了達到最大化的客戶知識協同管理,必須解決信息資源在不同資源平臺的動態復制與遷移問題。而不同平臺的信息結構、負荷能力往往不同,因此需要建立一套具有高擴展、強時效、適應資源狀態不斷變化的高效動態管理機制以實現對信息資源進行合理的分配與協調。
3.4CKSRL平臺架構
基于云計算的CKSRL平臺是從用戶的角度出發,以需求推動系統的運行,因此選擇一種合適的架構模式至關重要。目前比較常見的模式有:基于層次的架構、基于代理Agent的架構以及基于P2P點對點的架構,關于這3種模式的研究,徐達宇等(2012)在其論文中進行了詳細的探討與說明,并建立了云環境下多源信息資源管理系統框架。基于層次的架構模型與HTTP請求類似,它將請求的資源逐層提交給上層服務器后,服務器處理完畢后再逐層下發給請求層,其相關理論及技術的發展較為成熟,因此本文采取此種模式進行研究。
假如在數據整合之前,所有數據中關于客戶隱私的細節都可以被有效隱藏。那么通過整合分布在各個平臺的數據“云”構建一個龐大的“共享資源云”,由資源管理仲裁委員會授權的云計算運營商進行“共享資源云”的基礎建設及資源管理。各互聯網平臺基于對資源云的資源貢獻度及資源付費規則獲取相應的授權資源,實現以客戶知識發現為核心的CKSRL平臺構建,然后通過CKSRL平臺為電商企業提供按需付費的客戶知識服務,同時也能為各平臺的產品推廣提供有力支持,最終提高各平臺的廣告營銷效益。CKSRL平臺架構分為3層,分別為云數據層、云計算層、云表現層,平臺結構如圖2所示。
云數據層是構建CKSRL平臺的基礎,主要實現將不同平臺上的數據資源進行整合,建立共享資源云,實現跨平臺數據的整合、抽取、清洗以及客戶隱私信息的有效屏蔽。其主要包括物理層和數據云兩部分,物理層面向的是數據傳輸媒體,主要由各電商平臺、社交平臺、搜索引擎等互聯網平臺的服務器設備、數據庫存儲設備、網絡設備構成以及云計算運營商的資源整合管理設備組成;數據云層通過采用虛擬化技術實現共享資源云的構建,為跨平臺的數據共享協同工作打下基礎;該云層的技術關鍵點在于虛擬化技術和數據庫訪問中間件技術的應用,為節約軟硬件的投入成本需要采用服務器虛擬化以及技術最大化服務器的利用率,為系統提供相互隔離的應用執行環境以實現各子系統的安全性,此外采用服務器虛擬化技術進行動態資源調配也可提升系統運行的穩定性;數據庫訪問中間件技術解決的是不同互聯網運營商間數據接口的不一致問題,不同運營商所使用的數據庫不一樣,有的使用ORACLE,也有的使用SYBASE,使用該中間件可隱藏網絡部件的異構性,實現服務器透明性、網絡透明性以及語言透明性。通過以上兩種關鍵技術最終實現物理層和數據云層的交互。
云計算層是平臺架構的核心層,該層負責對共享資源云進行有效管理,主要包含3個方面,(1)用戶管理:保證用戶數據的安全性,對用戶權限的合法性進行控制;(2)資源服務管理:對入池資源進行審核,根據資源調配機制進行資源分配、資源訪問、申請管理、任務分配、資源使用計費、共享云監測和能耗管理等工作;(3)平臺安全服務:保證平臺數據的安全存儲、合法使用,確保平臺運行的穩定性以及服務器間信息傳遞及網絡信息的安全性。云計算層采用Apache開源云計算框架——Hadoop,其底層的分布式文件系統(HDFS)具有高容錯性和高吞吐量,能夠實現低成本的海量數據存儲。上層的MapReduce實現任務的分散與結果的匯總,為提高計算效率提供了技術支持。至此,云計算運營商完成共享資源云的搭建工作,與此同時各平臺根據各自CKSRL建設需求引入數據分析中間件實現進行數據分析挖掘管理工作以實現用戶的需求。endprint
云表現層位于三層結構的最頂層也即CKSRL的具體應用層,其基本應用服務含有客戶基礎知識庫管理、動態需求庫管理、決策支持分析、廣告推送營銷服務、可視化分析報告等應用,在此基礎上也可根據用戶的具體需求進行改進與完善,從而滿足客戶個性化的資源獲取需求。本層由用戶接口、服務內容、訪問模式、客戶管理等功能組成。其中用戶接口層描述終端的資源請求方式如電腦終端、手持終端等;服務內容即用戶的服務請求內容;訪問模式主要有B/S模式、C/S模式;用戶管理主要實現前端用戶的訪問權限控制以及對用戶的合法性進行審核。
3.5CKSRL平臺的應用服務
共享資源云通過虛擬化技術集中了海量信息資源的虛擬映射,各互聯網運營商基于“共享云”借助大數據分析與挖掘工具實現CKSRL平臺應用服務,提供客戶360°全視圖知識管理、動態需求分析、客戶關系管理、精準廣告服務。
3.5.1客戶360°全方位基礎信息的收集
通過已有客戶數據的積累,結合公共數據資源云進行客戶知識的完善及客戶群體的分析,構建包含客戶人口統計學特征、人口地理學特征、購買時機特征、消費特征及群體特征的客戶360°全方位信息知識庫。其中人口統計學特征包括:性別、年齡、學歷、行業、職業等;地理特征包含:購買渠道、購買地點等;購買時機特征包括兩方面內容,一是公共時機如雙11、雙12、國慶、春節及各種節假日等全民性活動;二是個人時機特征如結婚、入學、紀念日等;消費特征描述客戶的消費、服務偏好、產品購買生命周期等信息;群體特征給出客戶的個性特征、生活偏好等。
3.5.2客戶動態需求分析
在線廣告營銷成功的關鍵在于“在正確的時間,正確的地點,向正確的消費者,使用正確的營銷策略,銷售正確的產品”,因此獲取客戶的實時動態需求至關重要,CKSRL平臺使用日增量方式更新動態需求庫的客戶實時需求。通過抓取待分析客戶的社交數據、電商平臺瀏覽記錄及搜索引擎的數據,結合客戶基礎知識庫中的客戶信息即可建立客戶購買意向預測模型,實現客戶動態需求分析。
3.5.3客戶關系管理
結合用戶本身積累的企業內部客戶信息,平臺可為企業提供全方位的客戶關系管理咨詢服務工作,包括:利用平臺現有資源采用相似度模型挖掘潛在客戶,對已有客戶進行交易分析、生存分析、客戶流失預警、行為預測分析,提供客戶保持及挽留策略,量化客戶關系管理成本績效。
3.5.4精準廣告推送
在線廣告投放的典型任務包括搜索廣告、上下文廣告、顯示廣告及行為定位,平臺建立一整套與在線廣告投放、計價、效果評估等相關的算法模型庫,如精準廣告推送的關鍵詞匹配、排序算法、受眾人群匹配算法等;基于CTR(Click Through Rate)點擊率的廣告投放成本預測模型,結合客戶基礎知識庫及動態需求庫建立用于客戶定位的協同過濾模型等。通過這些算法庫模型實現精準廣告營銷、廣告成本測算及效果計量。
4 基于CKSRL平臺的RFM模型應用
RFM(recency,frequency,monetary)模型是CRM中的重要模型,它被廣泛用于衡量客戶價值和估算客戶創利能力。通過R(客戶最近一次交易離現在的時間間隔)、F(客戶購買頻率)、M(客戶的消費額)3個指標來衡量客戶的價值。傳統的RFM是建立在自有數據庫基礎之上的,但對于多數電商企業來說,采用單一平臺進行的RFM客戶知識挖掘并不能保證數據挖掘的準確性。此外,隨著電子商務的不斷發展,每一商品都有其易獲取的替代品,且同一商品在電商平臺上都存在多個店鋪同時在售,因此要掌握客戶對某一產品的購買頻率和最近一次購買時間點比較困難。若企業通過CKSRL平臺,則可以采用按需付費的低成本方式取得比自主分析更精確的客戶數據,具體流程如下:
步驟1:提交企業分析請求,企業根據自有數據庫向平臺提供所需要分析的客戶名、主導產品等相關信息,平臺分析人員對客戶請求進行需求確認。
步驟2:獲取客戶基礎信息,平臺分析人員根據客戶名匹配模式從客戶基礎知識資源庫中找到對應的客戶,同時輸出綜合各平臺分析后的客戶360°基礎知識,如客戶的商品定位、偏好電商平臺、網購活躍度、偏好社交平臺、社交活躍度等,將用戶標上行為標簽。
步驟3:數據抽取,通過步驟2得到待分析客戶的基礎信息后,結合產品特征從共享資源云中匹配客戶及產品記錄,取得客戶相關產品及替代品的交易數據并對這些數據進行清洗,與此同時云計算運營商進行資源調度、分配與計費工作。
步驟4:數據挖掘,取得相關數據后就可以按分析主題進行數據挖掘,伴隨著數據挖掘技術的不斷成熟,如何有效選擇合適的數據挖掘算法成為數據挖掘的重點。在客戶價值分析方面,可以采用基于RFM模型和協同過濾的客戶細分及價值分析法,根據上一步驟取得的客戶產品及替代品的交易記錄使用RFM算法即可得到客戶對某一同質產品的最近一次消費的時間、購買頻率、消費水平。最后,采用協同過濾算法進行客戶群體的細分,將具有相似特點的客戶聚為一類,為企業針對不同客戶群體進行客戶關系管理提供決策支持。
步驟5:交付與驗收,分析員以可視化的表達形式向商家提供分析報告。商家得到相關分析報告后,可通過基于客戶價值、客戶購買頻率、最近購買時間、客戶產品定位、偏好平臺聚類得到的客戶群體細分特征制定個性化的營銷方案。
通過以上步驟實現了對客戶價值和客戶創利能力精準化的全面估算。此外,通過對客戶的購買頻率分析,企業也可精確把握客戶購買時機從而進行精準化營銷。
5 結語
互聯網時代,傳統企業建立在信息不對稱和特殊渠道上的銷售優勢將被徹底顛覆,而基于信息交換與共享的資源整合及優勢互補的客戶知識共享將成為勢不可當的趨勢。本文通過分析電商企業跨平臺客戶知識管理中存在的問題,提出了一個基于云計算的客戶知識共享資源庫平臺的構建方案,用三層架構模式——云數據層、云計算層、云表現層搭建了平臺的主要架構,闡述了CKSRL平臺的主要功能。建立了CKSRL平臺的運營服務機制,探討了跨平臺信息資源管理的方法。希望通過CKSRL的建設與應用能在一定程度上解決電商企業客戶信息的孤島問題,有助于收集全面的客戶信息,以便深入地進行客戶信息的分析與挖掘,為企業的精準營銷提供幫助。
(本文責任編輯:馬卓)endprint