林雯



【摘 要】文章闡述了DM和CRM技術(shù),分析了數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則Apriori算法,從數(shù)據(jù)倉庫設(shè)計(jì)、ETL設(shè)計(jì)和多維數(shù)據(jù)模型設(shè)計(jì)等多方面對電子商務(wù)企業(yè)CRM系統(tǒng)進(jìn)行數(shù)據(jù)倉庫設(shè)計(jì),進(jìn)而對基于DM技術(shù)的電子商務(wù)CRM系統(tǒng)進(jìn)行了總體設(shè)計(jì)和數(shù)據(jù)表設(shè)計(jì),該系統(tǒng)能有效地提升企業(yè)的盈利能力和市場競爭力。
【關(guān)鍵詞】DM;電子商務(wù);CRM系統(tǒng)
【中圖分類號】TP393.09;F724.6【文獻(xiàn)標(biāo)識碼】A【文章編號】1674-0688(2016)08-0026-03
0 引言
隨著網(wǎng)絡(luò)信息時(shí)代的高速發(fā)展,電子商務(wù)市場迅速成長和壯大,給企業(yè)帶來前所未有的挑戰(zhàn)。電子商務(wù)企業(yè)之間的競爭日益激烈,競爭早已由“以產(chǎn)品為中心”轉(zhuǎn)向“以客戶為中心”,客戶資源已經(jīng)成為企業(yè)之間競爭的最重要的資源之一。電子商務(wù)企業(yè)如何為客戶帶來優(yōu)質(zhì)的產(chǎn)品和優(yōu)質(zhì)的服務(wù)?如何為客戶制定個(gè)性化的服務(wù)?已經(jīng)成為影響企業(yè)發(fā)展和壯大的重要因素。但是,隨著企業(yè)規(guī)模的不斷擴(kuò)大,電子商務(wù)企業(yè)面臨客戶業(yè)務(wù)量大、客戶數(shù)據(jù)復(fù)雜多樣等特點(diǎn),電子商務(wù)企業(yè)既要保留當(dāng)前的數(shù)據(jù)信息,也要保留歷史性的數(shù)據(jù)信息,同時(shí)也要對這些數(shù)據(jù)進(jìn)行有效的管理,更為重要的是要對客戶數(shù)據(jù)進(jìn)行剖析,從大量的客戶數(shù)據(jù)中挖掘出有效的、有價(jià)值的數(shù)據(jù)信息。
1 數(shù)據(jù)挖掘和CRM
數(shù)據(jù)挖掘(Data Mining)就是從海量的、繁雜的、有噪聲的、不完全的、模糊的數(shù)據(jù)庫或數(shù)據(jù)倉庫中,發(fā)現(xiàn)并提取隱藏在其中的、不為人們事先知道但又具有一定價(jià)值的信息和知識的發(fā)現(xiàn)過程。
CRM(Customer Relationship Management)為電子商務(wù)企業(yè)提供整理、收集、分析客戶信息的系統(tǒng),為現(xiàn)代化電子商務(wù)企業(yè)提供全新的商業(yè)管理戰(zhàn)略,其目的在于幫助企業(yè)充分合理地利用客戶資源信息,開拓新的業(yè)務(wù)市場和渠道,優(yōu)化企業(yè)的盈利能力和提升客戶滿意度,促進(jìn)電子商務(wù)企業(yè)在激烈的市場競爭中立足和發(fā)展。
客戶關(guān)系管理(Customer Relationship Management,CRM)的產(chǎn)生不僅為企業(yè)提供了一個(gè)收集、分析、利用客戶信息的系統(tǒng),更為現(xiàn)代企業(yè)提供了一種全新的商業(yè)管理戰(zhàn)略,幫助企業(yè)充分利用其客戶關(guān)系資源,擴(kuò)展新的市場和業(yè)務(wù)渠道,提高客戶的滿意度和企業(yè)的贏利能力,使其在空前激烈的競爭中更好地立足和發(fā)展。電子商務(wù)企業(yè)CRM作為一個(gè)完整的系統(tǒng),主要能實(shí)現(xiàn)數(shù)據(jù)倉庫、客戶互動(dòng)管理、運(yùn)營管理、策略決策、后端系統(tǒng)整合和分析層次CRM等功能。
2 關(guān)聯(lián)規(guī)則算法研究
常用的數(shù)據(jù)挖掘算法主要有關(guān)聯(lián)規(guī)則、分類、聚類等,本系統(tǒng)采用DM技術(shù)中的改進(jìn)的關(guān)聯(lián)規(guī)則(Association Rules)經(jīng)典挖掘算法-頻集算法(Apriori算法),Apriori算法是從數(shù)據(jù)倉庫或數(shù)據(jù)集市中挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián),其算法是Support和Conf idence分別滿足用戶給定閥值的規(guī)則,即
Support(X?圯Y)=P(X∪Y)
Conf idence(X?圯Y)=P(Y/X)
Apriori算法基本思想是找出事務(wù)數(shù)據(jù)庫中所有大于或等于用戶指定最小支持度的頻繁項(xiàng)集,由頻繁項(xiàng)集生成滿足用戶指定的最小信任度閥值的關(guān)聯(lián)規(guī)則。Apriori算法采用了逐層搜索的迭代的方法,算法簡單明了,沒有復(fù)雜的理論推導(dǎo),也易于實(shí)現(xiàn),但是也存在對數(shù)據(jù)倉庫掃描次數(shù)頻繁和產(chǎn)生大量的中間項(xiàng)集等問題。
網(wǎng)絡(luò)通信技術(shù)飛速發(fā)展、市場變化莫測、企業(yè)之間的協(xié)同合作,電子商務(wù)企業(yè)面臨客戶數(shù)據(jù)量大、數(shù)據(jù)繁雜多樣等問題。電子商務(wù)企業(yè)客戶的銷售數(shù)據(jù)表明,電子商務(wù)企業(yè)客戶銷售數(shù)據(jù)主要面臨時(shí)間和空間2個(gè)維度,不同時(shí)間維度和不同空間維度的客戶銷售數(shù)據(jù)具有不用的意義和價(jià)值。
本文針對電子商務(wù)企業(yè)的特點(diǎn)和實(shí)際情況,為了使電子商務(wù)企業(yè)快速、準(zhǔn)確、高效地分析客戶數(shù)據(jù)和獲得有價(jià)值的信息,進(jìn)而提升電子商務(wù)企業(yè)的決策和管理能力,采用一種加權(quán)、分段的Apriori算法,該算法既減少了I/O代價(jià),又加快了挖掘處理速度,提高了執(zhí)行效率。其主要思想如下。
加權(quán):重新定義Support和Conf idence,將客戶數(shù)據(jù)的權(quán)重考慮在內(nèi)。
Support(A?圯B)=■
Conf idence(A?圯B)=■
分段:將從電子商務(wù)企業(yè)數(shù)據(jù)倉庫中所提取的客戶數(shù)據(jù)信息分為若干適合內(nèi)存處理的子數(shù)據(jù)庫,然后利用Apriori算法對子數(shù)據(jù)進(jìn)行分析處理,接著歸并子數(shù)據(jù)庫所挖掘出的結(jié)果,再次掃描數(shù)據(jù)庫,最終篩選出有價(jià)值的關(guān)聯(lián)規(guī)則。
3 電子商務(wù)企業(yè)CRM系統(tǒng)數(shù)據(jù)倉庫設(shè)計(jì)
電子商務(wù)企業(yè)CRM系統(tǒng)數(shù)據(jù)倉庫的建設(shè),是以企業(yè)客戶數(shù)據(jù)業(yè)務(wù)量大為基礎(chǔ),將客戶數(shù)據(jù)信進(jìn)行時(shí)整理、歸納和重組,及時(shí)提供給企業(yè)決策層。電子商務(wù)企業(yè)數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)主要包括數(shù)據(jù)源、數(shù)據(jù)存儲和管理、OLAP(Online Analysis Process)和前端工具等。
3.1 數(shù)據(jù)倉庫系統(tǒng)分析和設(shè)計(jì)過程
數(shù)據(jù)倉庫中的數(shù)據(jù)具有面向主體的、集成的、不可更新的、隨時(shí)變化的特征,一個(gè)完整的電子商務(wù)企業(yè)數(shù)據(jù)倉庫應(yīng)包括數(shù)據(jù)查詢、數(shù)據(jù)管理、忠誠客戶識別、客戶購買行為、客戶流失警示、客戶數(shù)據(jù)信息共享等基本功能。在電子商務(wù)企業(yè)應(yīng)用的領(lǐng)域中,數(shù)據(jù)倉庫最重要的是具有網(wǎng)絡(luò)化、實(shí)時(shí)性和可擴(kuò)展性等特點(diǎn),本文針對三層B/S結(jié)構(gòu)和兩層C/S結(jié)構(gòu)的不足,采用一種滿足網(wǎng)絡(luò)化、實(shí)時(shí)性強(qiáng)和易于維護(hù)的跨平臺的五層B/S模式,該模式基于Windows環(huán)境下具有利用JAVA、JBuilder 2013和數(shù)據(jù)連接池技術(shù),構(gòu)建客戶層、表示邏輯層、商業(yè)邏輯層、數(shù)據(jù)連接管理層和數(shù)據(jù)庫層的五層B/S模式。
結(jié)合電子商務(wù)企業(yè)CRM系統(tǒng)的特點(diǎn),設(shè)計(jì)數(shù)據(jù)倉庫的步驟如下:選取待建模的事務(wù)處理—選取事務(wù)處理的粒度—選取事實(shí)表的維度—選取實(shí)事表的度量。
3.2 數(shù)據(jù)倉庫ETL設(shè)計(jì)和多維數(shù)據(jù)模型設(shè)計(jì)
電子商務(wù)企業(yè)CRM系統(tǒng)中,后臺數(shù)據(jù)庫采用Microsoft SQL Server 2012,Microsoft DTS(Data Transmission System)設(shè)計(jì)器具有編程效率高、擴(kuò)展性好、易用等特點(diǎn),因此采用DTS設(shè)計(jì)器來實(shí)現(xiàn)數(shù)據(jù)倉庫ETL過程。以客戶銷售分析為例,從Customer(客戶)表抽取數(shù)據(jù)的SQL語句描述如下:
SELECT
CustomerID,CustomerName,City,Province,County,PostalCode,Phone,F(xiàn)ax,EmployeeNu-
mber,YearlyIncome,CrateDate,AccountCard,CustomerAsset From Customer
執(zhí)行DTS,完成數(shù)據(jù)的加載工作。同時(shí),DTS還有一定的調(diào)度功能。
Microsoft SQL Server 2012提供MDX(Multi-dimensional Express)支持多維數(shù)據(jù)集操作,Microsoft SQL Server Analysis Services提供DSO(Decision Support Object)用于編寫程序訪問多個(gè)維度,在多維數(shù)據(jù)分析模塊中,利用ADO/MD對象模型和PivotTable Semite構(gòu)造MDX查詢語句進(jìn)行多維數(shù)據(jù)查詢分析,Cellset對象存儲多維查詢分析結(jié)果,供電子商務(wù)企業(yè)查看數(shù)據(jù)。
利用Server對象的MDStores集合上調(diào)用Add-
New方法創(chuàng)建分析服務(wù)數(shù)據(jù)庫,語法為DSOServe.MDStores. AddNew數(shù)據(jù)庫名。
在DataBase.MDStores集合上可創(chuàng)建多維數(shù)據(jù)集,如:創(chuàng)建一個(gè)多維數(shù)據(jù)集合名:Set DSOCube=DSODb.
MDStores.AddNew=;設(shè)置多維數(shù)據(jù)集的數(shù)據(jù)源:DSOCube.DataSources.AddNew DSODb.DataSou-
rces(數(shù)據(jù)源名).Name。
利用SQL Server 2012的Analysis Services組件建立電子商務(wù)企業(yè)銷售決策支持的OLAP數(shù)據(jù)庫,例如利用MDX查詢南寧某地銷售處的銷售情況:Select[Measures].[Sales] ON COLUMNS [Time].[Monday] ON ROWS FROM Sales Cube WHERE [Region].[Guangxi].[NanNing].AND [Product].[Bag].[Q320]。
4 基于DM技術(shù)的電子商務(wù)CRM系統(tǒng)的設(shè)計(jì)
4.1 系統(tǒng)總體設(shè)計(jì)
基于DM技術(shù)的CRM系統(tǒng)設(shè)計(jì)結(jié)合電子商務(wù)企業(yè)的特點(diǎn),能夠?qū)崿F(xiàn)企業(yè)對市場、銷售、客戶、支持和服務(wù)的全面管理,有效地解決企業(yè)分布在不同地理位置和不同網(wǎng)絡(luò)環(huán)境下的網(wǎng)絡(luò)化管理。電子商務(wù)企業(yè)CRM系統(tǒng)主要功能模塊如圖1所示。
電子商務(wù)企業(yè)CRM系統(tǒng)主要實(shí)現(xiàn)的目標(biāo):分析客戶信息、分析客戶計(jì)劃、分析客戶購買行為、分析客戶投訴滿意度、分析客戶反饋滿意度、分析產(chǎn)品銷售情況和產(chǎn)品查詢統(tǒng)計(jì)。
4.2 系統(tǒng)主要數(shù)據(jù)表的設(shè)計(jì)
電子商務(wù)企業(yè)CRM系統(tǒng)數(shù)據(jù)表主要包括區(qū)域表(Client_QYXX)、客戶級別表(Client_KHJB)、客戶信息表(KHXX)、客戶滿意程表(Client_KHMYD)、客戶銷售表(Client_KHXS)和客戶反饋信息表(Client_KHFK)等。以區(qū)域表(Client_QYXX)為例,其結(jié)構(gòu)見表1。
5 結(jié)語
本文詳細(xì)分析和研究了數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則頻集算法(Apriori算法),同時(shí)從數(shù)據(jù)倉庫系統(tǒng)分析、數(shù)據(jù)倉庫設(shè)計(jì)過程、數(shù)據(jù)倉庫ETL設(shè)計(jì)和多維數(shù)據(jù)模型設(shè)計(jì)等方面對電子商務(wù)企業(yè)CRM系統(tǒng)進(jìn)行數(shù)據(jù)倉庫設(shè)計(jì),并對基于DM技術(shù)的電子商務(wù)CRM系統(tǒng)進(jìn)行了總體設(shè)計(jì)和數(shù)據(jù)表設(shè)計(jì)?;贒M技術(shù)的電子商務(wù)CRM系統(tǒng)能夠從海量的客戶信息數(shù)據(jù)中提取或發(fā)現(xiàn)有價(jià)值的商業(yè)信息或規(guī)則,為企業(yè)決策層提供正確、合理的決策支持,進(jìn)而提升企業(yè)的盈利能力和市場競爭力。
參 考 文 獻(xiàn)
[1]梁保恩.基于DM技術(shù)的電子商務(wù)CRM系統(tǒng)的研究[J].輕工科技,2016(5).
[2]王崢.面向電子商務(wù)的CRM系統(tǒng)分析與設(shè)計(jì)[D].北京:北京郵電大學(xué),2012.
[3]肖婧.電子商務(wù)環(huán)境下咨詢企業(yè)的CRM系統(tǒng)應(yīng)用研究[D].成都:西南交通大學(xué),2015.
[責(zé)任編輯:鐘聲賢]