范建華 張肖
摘要:本文的研究的主要目的是將數據挖掘技術作為一種信息保護手段引入到信息安全體系之中,從全新的視角來找到一種信息保護方法。數據挖掘在當代信息爆炸時代可以說是一種的信息價值增值手段,但是同時它也是一種必要的信息保護方法。信息的泄露或者對所存在的有價值信息視而不見被競爭者利用就會是造成一定的損失甚至是災難性的后果。特別是對于銀行業,其信息具有真實性、實時性等特點,對于信息安全有特別高的要求,因此不能無視隱性風險隱患的存在,應該積極開發和利用數據挖掘技術來進一步完善信息安全風險防控體系。
關鍵詞:信息安全數據挖掘流程
1.引言
從上世紀90年代中后期,我國各大商業銀行都進入了數據化大集中的時代,數據集中是銀行界對技術支持系統的一個改造,同時也是對傳統銀行業的整體管理理念的徹底再造。銀行業經歷了金融電子化時代,幾乎各項業務都實現了數字化。多數的數據我們無法處理,因此可以說它是垃圾信息,但是并不能肯定它是沒有價值的信息。那么許多有用的信息就被我們忽視或者丟棄在那些我們所認為的垃圾數據之中,這就給信息保護埋下了安全隱患。要保護大型數據和信息就有必要將數據挖掘作為信息安全策略的一個方面來進一步維護信息安全。
2.銀行業需要重視和保護的信息內容
銀行業信息可以認為是在銀行的一系列業務發展過程中產生、應用和搜集的各類信息,這些信息是銀行業經營和發展的基礎。在銀行業發展過程中信息安全情況決定其生存和發展的命脈,因此信息保護就成為各類銀行發展中所必須重視的一項內容更。銀行業信息可以劃分為兩大類:
2.1顯性信息
顯性數據主要包括由各類存儲媒介保存的數據,包括軟盤、硬盤、紙質等保存的文件,這部分資料可以占道銀行信息的20%。這類是數據是業務發展所產生和存儲的數據,包括賬戶的開立信息、個人儲蓄記錄、對公存款記錄、貸款資料、貸款合同、還款記錄等等。這些信息是可以隨時調閱和查找使用的信息。
2.2隱性信息
隱性數據是相對于顯性數據而言的,它沒有具體的存儲介質,比較抽象的但是實在存在的數據。這一類數據主要是柜員、客戶經理、中層領導在日常工作中所掌握的隱性的沒有量化的信息,這部分資料根據二八原則可占到銀行信息的80%。柜員在儲蓄柜臺辦理日常的業務過程中會直接接觸到客戶,柜員能夠掌握經常辦理業務的客戶對不同產品的青睞和喜好,這也是一類重要的信息。
3.海量數據所造成的信息安全隱患
金融數據大集中之后,數據量增幅很大,以人民銀行2009年對銀行業務量統計作數據參考:
存儲和保護所有數據,因此會有所刪減和側重。數據和信息的概念是不同的,數據是無規則、全描述性的、無具體指向的;而信息是有內容的可為做出經營決策提供參考的資源。銀行業擁有的數據資源非常龐大,但是并不都是有用的信息,因此在處理和保存過程中就不會也不可能特別的保護所有的數據,大量的數據就會造成信息安全保護障礙。
3.1數據銷毀不完全造成信息泄露
由于銀行業的業務量非常大,同時每個工作日結束都會產生大量的垃圾文件及影印資料,在處理這些資料時就會有不同的處理方式,但多數是不會集中銷毀。紙質資料是銀行業務中必然會使用和產生的資料,在這些丟棄的廢品中包含著大量的信息,有客戶的存款賬號以及存款金額、廢棄客戶資料、銀行廢棄報表資料等等。這些資料多數并不是錯誤的信息,相反這些是一些真實性相當高的信息,因此廢棄資料的銷毀和處理就有必要加以重視。事實上,通過對許多商業銀行的調查與統計許多商業銀行并沒有制定具體處理措施規章制度,也沒有指派專人負責處理,而是較隨意的丟棄。從這些丟棄的資料中我們不難找到客戶的存款資料,對公賬戶的基本信息,甚至是銀行內部的經營狀況等等。此類信息是銀行非常機密的信息,泄露的損失會非常的嚴重。
3.2錯誤判斷數據價值造成的信息安全威脅
在競爭如此激烈的銀行業,當沒有發展和改革是就相當于在退步,在失去競爭力。隨著經濟全球化和信息技術的發展,金融數據正在以空前的速度產生和累積。因此,迫切需要找到一種有效的方法從海量的金融數據中提取有用的信息以在銀行制定戰略性計劃和投資時給予支持。由于銀行業接觸到的信息量相當大,因此會讓領導人員對已有的數據視而不見。然而這些數據會提供很有用的決策支持,在擁有數據而不去利用就會造成利益的損失。由于貸款系統并不可能融入如此復雜的數據量,這些信息就容易被忽略,這樣就容易造成錯誤判斷,最終流失一個良好客戶,也有可能會增加高風險客戶。
3.3隱性信息價值帶來的安全隱患
由于權限等級劃分帶來了權利和責任的高度集中,在多數銀行都以授權與代辦關系存在。往往代辦員只是在辦理業務過程中的操作者,而多數的信息是掌握在授權者手中。這些授權者一般屬于銀行的中層管理者,他們掌握的信息包括:大額存款戶資料、貸款戶的資信狀況、營業網點的經營狀況等等。這些都是整個營業網點經營命脈。根據二八原則的劃分,20%的信息是組織運營中的存檔信息,而大量的80%的信息是各個經營者所掌握的隱形的信息。這80%的信息安全就只能依靠職業道德規范和職業行為規范等制度對中層領導的約束來保證,存在著嚴重的安全隱患。
3.4金融欺詐
隨著經濟的發展,在金融領域的欺詐行為已經越來越多,形式也多種多樣,有貸款、存款、銀行卡等等。例如在銀行業務發展過程中會考核信用卡的發卡量,為達到發卡規模就會盲目的發卡、放松發卡條件等等,大量的信用卡申請信息就會造成信息核實的時間和人力困難。調查表明[2]金融機構每年的欺詐損失占其年收入的6%,相當于美國每年的GDP損失數千億美元。英國欺詐損失總額每年也達到了140億英鎊。欺詐行為會給銀行帶來巨大的經濟損失,同時也會造成信譽和形象上的重大負面影響。欺詐行為也是多種多樣的,主要類型有以下三種:一是由于業務量大而忽略銀行柜員對信息的訪問控制和跟蹤,銀行內部職員會利用系統漏洞,非法進入銀行交易系統,直接獲取不正當利益,或者為以后的作案做準備;二是由于信用卡等信用貸款量大,無法具體核實貸款人資信狀況的真實性,造成以虛假的承諾和虛假的保證來騙取貸款額度;三是隱瞞重要的資信信息,避重就輕,造成銀行的錯誤判斷。銀行可以通過建立自己的數據庫,來跟蹤核實此類信息,在大量的處理業務數據中對數據進行挖掘分析并找出相應的規則、規律、論斷,再結合人工分析,達到有效檢測金融欺詐的效果。
4.數據挖掘技術在銀行業信息保護中的應用
數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數據挖掘,在人工智能領域,習慣上又稱為數據庫中的知識發現(KDD),也有人把數據挖掘視為數據庫中知識發現過程的一個基本步驟。
金融機構收集到的金融數據通常相對完整、可靠并具有高質量,方便了系統化的數據分析和數據挖掘。同樣數據挖掘也可以作為銀行信息保護的一種方法為銀行發展做出貢獻。為保護銀行信息安全,數據挖掘通常包含以下四個部分的應用分析情況。
4.1應用數據挖掘技術管理銀行報表
銀行報表是每天都會產生的報表,管理者會通過報表的數據來進行日常業務決策。根據調查顯示,銀行報表基本是由銀行主管會計打印、輸出、整理報送銀行主管人員。在報送過程中就產生了多個信息安全的風險點:首先紙質打印就會有錯誤和多余打印的廢棄資料;其次會計主管必然會掌握和了解各類數據;再次是整理好的數據資料的管理也十分必要。銀行報表上的數據是銀行需要保密的經營數據,它關系到一家銀行的生存和發展,只有決策層和領導層有權限和有必要掌握和了解。因此要從根本上杜絕信息安全隱患就必須從報表的形式和報表訪問權限上來加以控制。據分析階段對銀行業務中產生的龐大數據進行分類、識別、篩選和初步分析。從大量數據中挖掘出適合銀行業務人員使用的信息模式和知識,從而產生出報表,以指導銀行營銷和競爭。
4.2數據挖掘提升客戶關系管理
銀行根據多個方面的數據內容建立客戶資料數據庫,來維護客戶,全方位的描述和統計該客戶的資金流量、信用度等。建立該客戶的信息由有商業銀行實施客戶關系管理(CRM)的目標是充分掌握客戶的需求,找出能盈利的客戶。數據挖掘技術在商業銀行CRM中具有廣泛用途,它首先有助于銀行客戶資源的開發,有助于集成客戶的各種信息,有助于銀行進行市場細分、開發新產品、拓展新市場。從數據挖掘技術在CRM系統中的具體應用來看,可以分為以下五個階段。第一階段:建立客戶信息數據庫。數據庫是數據挖掘的基礎,這一階段主要是進行數據清理,消除現有業務系統中數據不一致的現象,通過關聯將有聯系相互作用的數據建立索引,將其整合到信息庫,建立以客戶為中心的數據倉庫基礎環境。第二階段:記錄、更新客戶交易信息。這一階段主要是把客戶與銀行的所有歷史交易數據加載到客戶信息庫。第三階段:建立評估模型。為客戶的每一個賬號建立利潤評測模型,以便了解客戶對銀行的利潤貢獻度,同時掌握模型的利潤貢獻。第四階段:維護和優化客戶關系。銀行可以通過掌握客戶在生活、職業等方面的變化及外部環境的變化,抓住推銷新產品和服務的時機。這需要將賬號每次發生的交易明細數據,加載到數據倉庫,核對客戶行為的變化。第五階段:風險評估和管理。銀行風險管理的對象主要是與資產和負債有關的風險,因此與資產負債有關文章都各自占一張表,并把所有論題表放入統一數據庫中。
4.3建立員工工作日志,量化隱性信息
從上述的銀行信息分類可以看出銀行的80%的信息是隱性信息,是由一線員工掌握的。在銀行內部網站中可以創立一個員工工作日志板塊,它可以設置和微博一般,記錄員工的日常工作中的點滴細節。當然這類信息只有管理層和本人有訪問權限,這樣員工掌握的信息就不會隨著他的離職而帶走。許多商業銀行開辟一個新的市場所采取的策略之中都會考慮雇傭一位當地銀行的中層領導,這樣對于迅速打開當地市場會有非常好的效率,因為當地銀行老員工對于當地市場、當地顧客都比較了解。這樣一位員工的流失會給原商業銀行帶來巨大的損失,為了減少這方面的損失就需要將一線員工掌握的信息進行量化,變為銀行內部可共享的資源。員工可以在工作日志中記錄重要客戶的生日、家庭住址、家庭成員等等,這對客戶維護是非常有必要的。建立員工工作日志可以通過以下三個步驟實現:首先,開辟工作日志板塊和服務后臺;其次將工作日志平臺作為信息發布、交流平臺,促使員工習慣使用;最后對日志記錄優秀者加以獎勵。
4.4金融欺詐檢測
金融欺詐的形式和主體都具有多樣性,但是都是有規律可循的,針對上述出現的三種類型的金融欺詐,可利用數據挖掘技術進行欺詐檢測。欺詐檢測的基本流程包括數據比對和清理,數據預處理和轉換,數據的模型套用和計算,人工判斷等四個步驟,流程圖如圖2第一階段,數據比對和清理。應用數據挖掘進行金融欺詐檢測,首先要選擇的是哪些數據是有用的,以及從獲得這些數據的來源。也就是說在合適的地方選擇合適的數據。第二階段,數據預處理和數據轉換。數據挖掘通常處理的是海量的原始數據。數據的預處理是指對原始數據進行同性化處理,使各項指標同趨勢化。第三階段,數據的模型套用和計算。這一過程,是通過運用數據挖掘對收集到的數據進行實時的欺詐檢測,對欺詐的潛在進行定位,并找出隱藏的欺詐模式。第四階段,人工判斷。這一過程主要是人工核對生成的挖掘報告,對檢測的結果做進一步的比對和判斷,消除誤判,對系統模型進行調整改進。這一步就是確認欺詐行為的對于金融欺詐檢測來說是一個不可或缺的步驟。通過這一步驟可以提高數據挖掘的有效性和準確率。以上四個步驟是個循環反復的動態過程,只有在動態運行過程中,才有可能對數據,挖掘模式進行動態調整,從而有可能實現對不斷變化的金融欺詐模式的預警。
5.結束語
商業銀行的信息是其經營的主要內容,信息安全就成為其核心競爭力主要決定力量。根據數據挖掘的性質和特點,從信息保護角度出發,將數據挖掘急速引入銀行日常管理之中,通過以上四個流程應用,改善信息形式、挖掘有價值信息、防止金融詐騙,達到更好的信息保護效果。數據挖掘是信息化的最高層次,是信息化最高應用點的價值所在,它可以將分散的信息變成集中的信息,使孤立的信息變成相互聯系的信息,使無價值的數據變成有價值的信息,我國銀行業要在激烈的同業競爭中立于不敗之地,必須堅定不移采用數據挖掘技術,提高自己的核心競爭力。
參考文獻:
① http://www.datamining.com.cn.
②張國榮.淺析數據挖掘中的隱私保護[J].福建電腦,2005(11).
③王越,曹長修.KDD方法在金融欺詐檢測中的應用[J].計算機工程與設計.2002.(5).
④王實.銀行業CRM理論與實務[M].北京:電子工業出版社,2005. ⑤中華人民共和國國家統計局.中國統計年鑒(2009)[M].北京:中國統計出版社,2010.
⑥李強.數據挖掘在金融業CRM中的應用[J].今日湖北理論版.2007.1(4):21-22.
⑦田小丹.數據挖掘在銀行CRM管理中的應用研究【J】.商業科技,2006.
⑧丁寧,劉富星.數據挖掘在金融中的應用【J】.經濟與管理,2009(7).
⑨胡,張徽燕.數據挖掘在銀行業中的應用【J】.長春師范學院學報,2006(2).