摘要:本文在數據倉庫與數據挖掘基礎理論基礎之上,將其運用于我國中小商業銀行。以某銀行的業務情況為基礎數據,設計構建了個人及企業銀行數據倉庫的體系結構,并對其進行數據粒度的劃分。在此基礎上,對所構建的數據倉庫進行多維數據分析,并通過實施數據挖掘操作,實現知識發現的功能。結果顯示,通過應用數據倉庫和數據挖掘技術,可以為其獲得巨大的信息收益。
關鍵詞:數據倉庫;數據挖掘;OLAP多維數據分析;商業銀行
近年來,由于我國商業銀行業務量的增加,業務數據也隨之大幅度增加。但由于缺乏有效的方法和手段以對數據背后所隱藏的規律和知識進行挖掘,導致銀行工作人員無法利用這些數據對銀行相關業務所包含的規律和未來發展趨勢進行分析。上述現象在信息系統較不發達的中小商業銀行體現則更為明顯。數據倉庫和數據挖掘技術作為信息化的有效工具,其在國外的金融領域已經得到廣泛應用。以北美十大銀行之一的蒙特利爾銀行為例,通過運用數據倉庫以及數據挖掘技術,對其產品線進行重新組織,并基于數據挖掘所獲得的經驗和知識,進行更具針對性的市場營銷,總共為其節約了2280萬美元。而這一技術尚未被我國中小商業銀行所掌握。
一、數據倉庫與數據挖掘相關理論概述
(一)數據倉庫
數據倉庫是“面向主題的、集成的、穩定的、隨時間變化的數據集合,用于支持管理決策過程”。在這個定義中,W.H.Inmon明確給出了數據倉庫的四個重要特點,即“面向主題”、“集成”、 “穩定”、“隨時間變化”[1]。
數據倉庫的數據組織方式主要包括有三種,分別是虛擬存儲方式、基于關系表的存儲方式和多維數據庫存儲方式等[3]。其中,多維數據庫存儲方式是直接面向數據挖掘分析操作所需的數據組織形式,它對DW中的海量數據從客戶感興趣的角度進行層次化處理、抽象概括,并設置維索引及相應的元數據管理文件,以對應于數據倉庫中的數據[4]。與虛擬存儲方式、基于關系表的存儲方式中組織關系都比較復雜相比,更適用于組織、存儲數據倉庫中的海量數據[5]。
(二)基于數據倉庫數據的OLAP
1.聯機分析處理(OLAP)的概念和特征
2.OLAP多維分析操作
多維分析是指對數據倉庫中的數據進行切片、切塊、鉆取和旋轉等分析操作[9],用戶能從多角度對數據進行深入剖析,進而了解其中的規律。
(1)切片。切片是指通過在某個或某些維上選取某一特定的屬性成員,而在其他維上則選取一定區間的屬性成員,對所獲得的數據進行分析。以某銀行部分業務數據所形成的數據立方為例進行說明:從該立方中選取2012年4月這一個時間段內所有理財產品的銷售情況進行分析,此即為切片。
(2)切塊。切塊是在立方體中的三個維上取一定區間的屬性成員或全部屬性成員。切塊可以看成是在切片的基礎上,進一步確定各個屬性成員的區間得到的片段體,也即由多個切片疊合起來。
(3)鉆取。鉆取包括上鉆和下鉆兩種操作。從高級數據到明細級數據視圖稱為下鉆;從明細級數據到高級數據視圖稱為上鉆。
(4)旋轉。旋轉指改變一個報告或頁面顯示的維方向,通過旋轉操作可以最終用戶從不同視角來觀察數據。
(三)數據挖掘技術
數據挖掘是根據企業所設定的業務目標和存在的問題,對大量的業務數據進行探索,揭示隱藏其中的規律并模型化,以指導并應用于實際經營實踐。通過對業務數據的挖掘,從中發現企業運作的本質規律,優化企業本身的運作[10],或進行有效的客戶關系管理。
常用于銀行業的數據挖掘方法主要包括:
(1)預測型方法:分類(Classification) /決策樹算法(Decision Tree)、回歸分析(Regression)、時間序列分析(Time Series)。
(2)描述型(Descriptive)方法:關聯分析(Association Analysis)、序列關聯分析(Sequential Analysis)、聚類分析(Clustering)。
將上述方法應用于銀行業領域,其可實現的功能主要包括:大客戶特征的識別、客戶群體細分、客戶流失的預測與控制、業務預測、理財產品銷量預測、客戶欺騙的早期識別等方面。
二、中小商業銀行數據倉庫的設計
(一)個人銀行數據倉庫構建
1.個人銀行數據倉庫的體系結構
(二)企業銀行數據倉庫構建
1.企業銀行數據倉庫的體系結構
四、結論
數據倉庫和數據挖掘在我國中小商業銀行中的應用尚處于探討階段。本文在對數據倉庫與數據挖掘相關理論進行分析的基礎之上,認為將其運用于我國中小商業銀行具有可行性。以某銀行的業務情況為例,對個人及企業銀行數據倉庫的組織構建進行設計,實施多維數據分析,進行數據挖掘操作及分析,認為通過應用數據倉庫和數據挖掘技術,可以獲得巨大的信息收益。■
(責任編輯:張恩娟)
參考文獻:
[1]Bendell J. Data Modeling and Database Design for Data Warehouses: The Data Warehousing Institute, 1996.
[2]袁虹,何厚存.聯機分析及數據倉庫的建模技術[J].計算機應用研究,1999(12):61-63.
[3]史金紅,吳永明.影響數據倉庫成功的關鍵因素[J].電子工程師.2000(1):9-13.
[4]韋洛霞.數據倉庫與OLAP[J].東莞理工學院學報,2000 (2):19-24.
[5]蔣翊凌.基于數據倉庫的銀行業務數據挖掘研究[D].上海:華東師范大學,2006.
[6]孫其輝.基于數據倉庫的集裝箱支線運輸DSS研究[D].遼寧:大連海事大學,2008.
[7]趙璐.數據挖掘技術及其在電信系統應用的研究[D].吉林:長春理工大學,2009.
[8]徐奇,楊光敏,歐陽學兵,靳志宏.基于數據倉庫的口岸跨境運輸決策支持與系統實現[J].交通信息與安全,2011 (3):110-115.
[9]靳志宏,徐奇,蘭輝.集裝箱多式聯運的多維數據分析與數據挖掘[J].集美大學學報.2011(4).
[10] Zhihong Jin, Qi Xu. The Realization of Decision Support System for Cross-border Transportation Based on the Multi-dimensional Database. Journal of Software,2012(5).