鄭 華
ZHENGHua
(廣西工商職業技術學院,南寧 530003)
中國的銀行業在發展的過程中,已逐步積累了大量的客戶數據和經營數據,利用這些數據,發掘有價值的信息,已經成為銀行業普遍關心的問題,而解決問題的關鍵就是建立銀行企業級的數據倉庫,在數據倉庫的基礎上,施行客戶關系管理,以滿足銀行客戶分析需要和管理決策需要,原有的客戶關系系統作為一種管理系統難以做到這一點,而商業智能系統則可以很好的解決這個問題,它使我們能夠將數據轉變為有效的信息和知識。
如今,在金融行業大變革之后,一系列的新問題讓我們不得不關注。例如,如何才能分析上市公司的財務情況,并規避財務風險?如何才能讓銀行、信托機構更好地分析、評價客戶的信用程度和還款能力?如何大規模地分析用戶的消費行為?這時商業智能應運而生。商業智能可以為企業或機構提供大規模數據聯機處理、數據挖掘、數據分析,以及報表展現等服務,通過對大量的特定數據進行分析、整理,從而形成量化的決策信息,以供企業決策者采用。
商業智能這一術語1989年由Gartner Group的Howard Dresner首次提出,它描述了一系列的概念和方法,通過應用基于事實的支持系統來輔助商業決策的制定。商業智能系統從企業運作的日常數據中開發出結論性的、基于事實的和具有可實施性的信息,使企業能夠更快更容易的做出更好的商業決策,使企業管理者和決策者以一種更清晰的角度看待業務數據,提高企業運轉效率、增加利潤并建立良好的客戶關系,以最短的時間發現商業機會捕捉商業機遇。
商業智能的技術體系主要有數據倉庫(DW)、聯機分析處理(OLAP)以及數據挖掘(DM)三部分組成。
數據倉庫(Data Warehouse)是支持管理決策過程的、面向主題的、集成的、動態的、連續的數據集合。可以從容量龐大的業務處理型數據庫中抽取數據,清理、轉換為新的存儲格式。
聯機分析處理(OLAP)技術則幫助分析人員、管理人員從多種角度把從原始數據中轉化出來、能夠真正為用戶所理解的、并真實反映數據維特性的信息,進行快速、一致、交互地訪問,從而獲得對數據的更深入了解的一類軟件技術。
數據挖掘(Data Mining )技術以數據倉庫和聯機分析處理(OLAP)為平臺,借助企業擁有的大量數據,通過清洗、轉換、裝載等數據處理方法,發現大量資料間的關聯與趨勢,探尋一種獨特的、通過其他方法發現不了的業務規律和模式。
數據倉庫的建設,是以現有企業業務系統和大量業務數據的積累為基礎。數據倉庫不是靜態的概念,只有把信息及時交給需要這些信息的使用者,供它們做出改善其業務經營的決策,信息才能發揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時提供給相應的管理決策人員,是數據倉庫的根本任務。因此,從產業界的角度看,數據倉庫建設是一個工程,是一個過程。
整個數據倉庫系統是一個包含四個層次的體系結構,具體如圖1所示。

圖1 體系結構
數據源:是數據倉庫系統的基礎,通常包括企業內部信息和外部信息。內部信息包括存放于關系型數據庫(R D B MS)中的各種業務處理數據和各類文檔數據,外部信息包括各類市場信息、競爭對手信息和各種手工收集的信息等等。
數據的存儲與管理:是整個數據倉庫系統的核心。數據倉庫的真正關鍵是數據的存儲和管理。針對現有各業務系統的數據,進行抽取、清理,并有效集成,按照主題進行組織。
OLAP(Online Analysis Process)服務器:對分析需要的數據進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發現趨勢。
前端工具:主要包括各種報表工具、查詢工具、數據分析工具、數據挖掘工具以及各種基于數據倉庫或數據集市的應用開發工具。其中數據分析工具主要針對O L A P服務器,報表工具、數據挖掘工具主要針對數據倉庫。
在銀行各業務系統的基礎上建立兩層數據倉庫(DB-DW)體系結構,利用數據挖掘等商業智能技術可以實現客戶細分、客戶保持、客戶最大價值等分析。這樣,銀行的管理者就可以對客戶的動向進行預測,從而調整產品策略,制定正確的決策。但按照發展的需求,DB-DW兩層結構不能涵蓋銀行所有的數據處理要求,使用效果不能令人滿意。
沒有支持戰術決策的數據結構基礎,難以實現實時分析和挖掘應用。
企業數據集成接口復雜,難以滿足企業OLTP系統的需要。
難以承受大量的分析查詢。
在銀行網絡化、智能化應用領域,最重要的就是系統功能的擴展,隨著生產方向的調整,系統也應該隨之進行相應的升級擴展。因此,兩層體系結構的應用不適合應用于網絡智能化銀行各業務的實際生產過程。
針對傳統三層B/S結構和兩層C/S的不足,本系統提出一種采用Windows環境下,可以滿足網絡化集成的系統開發、系統維護和跨平臺等方面特殊要求的五層B/S模式開發。如圖2所示:

圖2 五層B/S模式
該模式采用JBuilder9.0和數據連接池技術,將傳統三層B/S結構的第二層(服務器端)劃分為表示邏輯層、商業邏輯層和數據連接管理層。這樣,CRM系統的服務請求及響應實現過程為 :客戶端的瀏覽器通過超文本鏈接標記語言(H y p er Text Markup Language,HTML)向應用服務器發出請求;服務器端商業邏輯層中的Servlet對請求進行分派,調用EJB(enterprise Javabeans),Java Beans組件進行商業邏輯處理,涉及到數據庫操作時,從數據連接管理層中的連接池中取出一個數據連接,使用Java數據庫連接(Java Data Base Comectility,JDBC)技術訪問數據庫取得所需數據后,將數據連接放回連接池,以釋放所占用的資源。最后,Servlet調用表示邏輯層的結果處理J S P頁面對獲得的數據進行格式化,形成最終H T ML頁面并發往客戶端,以完成對該次服務請求的響應。服務器端運用S QL Server 2000數據庫,完成相關業務的后臺處理。
設計的第一步是通過將對業務需求的理解與對可用數據的理解組合起來而確定建模的業務處理內容,如圖3所示。業務處理過程并不是指業務部門或者職能,如果建立的維度模型是同部門捆綁在一起的,就無法避免出現具有不同標記與術語的數據拷貝的可能性。多重數據流向單獨的數據模型,會使用戶在應付不一致性的問題方面顯得很脆弱。

圖3 銀行業務關系
目前銀行賬務管理都采用以賬戶為核算的單位,同一客戶在不同的網點擁有賬戶;同一客戶在同一網點擁有不同產品的賬戶;甚或同一客戶在同一網點、相同的產品目錄中擁有不同的賬戶。客戶同銀行打交道會選擇不同的賬戶,因此在分析系統中賬戶信息應當設置成為一個維表。同一客戶擁有多個賬戶,并且客戶的大部分信息在一定的時間段中保持不便,設計客戶信息維表來統帥客戶的賬戶信息,通過客戶號可以歸約得出客戶在該分行的存款、貸款等信息。
客戶交易可以選擇卡、存折等不同的載體;可以選擇通過網點柜臺、ATM, POS、網上銀行、電話銀行等不同的渠道;目前銀行所提供的全國聯網實時交易系統,客戶可以在全國不同的地區進行存取款、消費等交易。這些不同顯示出客戶不同的交易行為、習慣,也反映出客戶對金融服務的不同需求。設計維表時,交易載體、交易渠道、交易地點應當首要考慮。
將客戶信息作為一個維表設計,主要依據客戶的信息在某一個時期內保持不變,而將交易信息作為事實表。客戶信息維表包含客戶的所有屬性,如出生年月、性別、學歷等等。如圖4所示。

圖4 信用卡業務多維數據模型


將多種銀行業務系統數據操作型環境數據移入數據倉庫必須作出許多決策,其中首要的一個關鍵技術問題是決定從操作型環境中選取哪些數據移入Oracle數據倉庫。我們須全面考慮具體需求,對一組操作型系統進行分析并決定哪些擁有對決策支持過程有用的數據。一旦選定了源數據,我們就要著手考慮如何將它們移入racle數據倉庫中。
利用Oracle企業管理器(OEM)部件中的S L*Loader(SQL*裝載器)可以將平面文件中的數據移入racle數據倉庫中。SQL*Loader的輸入通常是一個在racle或非racle的操作型環境下產生的ASCII文本平面文件。當向racle轉載數據時,由一個控制文件控制SQL*Loader如何將輸入文本映射至racle數據庫表的一列或多列中。
激活SQL*Loader有兩種方法,一是用一系列命令行參數控制會話行為:
Sqi1dr80 userid=/control=regional bad=regbad.datdiscard=regdsc.dat
第二種是用一個命令行參數的最小集,并同時在控制文件中說明會話的參數,兩種方法實質上是一致的:

使用以上操作方式有兩個關鍵性要點:
1)源數據庫的表的屬主不必與目標數據庫的表的屬主相同,數據可從一個用戶的表轉移到另一個用戶的表中。
2)當導入表時,如果這些表事先不存在,可在它們的數據被導入之前利用在導出文件中的代碼產生。
3)導出/導入有三種操作方法:
(1)交互式對話:使導出/導入進入一種對話狀態,操作者可詢問一些問題并接受回答。
(2)命令行一參數:激活在命令行中帶有參數及其值的導出得入。
(3)參數文件:激活導出得入并為關鍵字parfile提供一個值,該值是一個文件名,在這個指定的文件中存放著導出/導入操作需讀取的關鍵字和它們的值。
導出命令為:

根據銀行企業分析型CRM數據倉庫的應用需求,深入研究了數據倉庫的組織與結構設計,并結合企業的實際情況,對數據模型進行了設計。為下一步CRM系統的實施奠定了堅實的基礎。
[1]李啟炎.企業商業智能教程[M].上海:同濟大學出版社,2007,10-23.
[2]朱德利.SQL Server 2005數據挖掘與商業智能完全解決方案[M].北京:電子工業出版社,2007,46-56
[3]郭寧,鄭小玲.管理信息系統[M].北京:人民郵電出版社,2006,100-110.
[4]吳志軍.客戶關系管理中的數據挖掘[J].商場現代化,2005,(20):15-30.
[5]曼蒂,桑斯維特,等.數據倉庫工具箱:面向SQL Server 2005和Microsofr商業智能工具集[M].北京:清華大學出版社,2007,57-59.
[6]楊路明,等.客戶關系管理理論與實務[M].北京:電子工業出版社,2004,89-95.
[7]張云濤,龔玲.解析BIRT-Eclipse商業智能和報表工具[M].北京:電子工業出版社,2007,215-220.
[8]朱順泉.數據挖掘技術在商業領域中的應用[J].中國管理信息化,2006,(1):8-9.
[9]李東.決策支持系統與知識管理系統[M].北京:中國人民大學出版社,2005,120-130.
[10]陳文偉.數據倉庫與數據挖掘技術[M].北京:清華大學出版社,2006,69-78.
[11]Tang,z.h.,MaccLennan,等.數據挖掘原理與應用:SQL Server2005數據庫[M].北京:清華大學出版社,2007,215-2.