(湖北國土資源職業學院 湖北 武漢 430000)
大數據(Big Data)概念的興起可以追溯到2000年前后,最初理解為一類海量數據的集合。美國麥肯錫研究所在《大數據的下一個前沿:創新、競爭和生產力》的研究報告中給出了大數據的定義:大數據是指大小超出典型數據庫軟件工具收集、存儲、管理和分析能力的數據集。根據Gartner的定義,大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。大數據在通信、商業銀行、教育等各個領域存在已有時日,近年來隨著互聯網和信息行業的發展進入了快速推廣階段。
大數據不僅有傳統數據定義的“三個V”,即數量(Volume)、速度(Velocity)和種類(Variety),還包含了更重要的第四個V——價值(Value)。
阿姆斯特丹大學提出了大數據體系架構框架的5V特征,在原有4V基礎上增加了真實性(Veracity)特征,包括數據可信性、真偽性、來源和信譽、有效性和可審計性等特性。
商業銀行競爭日益激烈,基于數據的精細化運營需求日益迫切是商業銀行大數據發展的內在需求。商業銀行經過多年的信息積累沉淀了大量高價值的數據,發展商業銀行大數據成為必然方向。
據愛分析《中國大數據行業報告》中指出,2017年大數據行業整體市場規模1 000億元,其中行業應用細分市場規模為700億元,是大數據行業最大細分領域,大數據在商業銀行、政務、互聯網成熟度最高。基礎平臺整體市場規模在100億元左右,通用技術整體市場規模在200億元左右。行業應用層,大數據在各個行業應用差異較大,應用相對成熟的商業銀行、政府領域市場規模為200億元。
商業銀行、政務、互聯網這三個行業的IT投入居各行業前列,隨著“互聯網+政務”的普及、政務云和政務大數據的落地,政府2017年IT投入超過800億元,占中國IT總投入的5%~10%。商業銀行一直是重IT投入的行業,以銀行為例,2017年中國銀行業整體IT投資為800億元,整個商業銀行行業的IT投資突破千億元大關。
在大數據時代,商業銀行數據迅速膨脹并呈現出幾何級數的增長態勢。由于行業特性,商業銀行在長期業務開展過程中積累了海量數據。從數據涵蓋范圍來看,數據類型包括以工資、公積金、消費貸款等為代表的結構化數據和以文檔、圖片、音像和地理位置信息等種類繁多的非結構化和半結構化數據。商業銀行每創收100萬美元,會平均產生820GB的數據,數據強度高居各行業之首,由此可知商業銀行在大數據應用方面具備天然優勢。
商業銀行數據體量龐大,在數據處理過程中存在很多問題,主要包括:
第一,數據治理體系化建設匱乏。現階段商業銀行尚未形成系統的數據治理方法和體系,缺乏有效的數據分類、整理和加工。
第二,數據資源管理整合度不高,內部可用信息使用率低下。當前商業銀行的數據在組織內部處于割裂狀態,缺乏順暢的共享機制,難以實現數據的有效整合和使用。
第三,數據內容復雜多樣,難以充分挖掘數據資源潛在價值。造成這一現狀的原因在于商業銀行非結構化數據占比不斷上升,數據構造方法重復率高,且關系復雜。
國內商業銀行現處于數據資產化、產業化的起步階段,且銀行運用大數據技術以描述性數據分析為主,預測性數據建模為輔;以自身交易和客戶數據為主,外部數據為輔。數據資產目前最主要的作用是趨勢預測和決策支持,典型的應用場景集中在營銷分析、內部運營和風險管控等方面,具體應用案例包括交叉銷售、客戶群體劃分、信用評分及違約監測等。當前我國商業銀行大數據應用深度、廣度和頻度都與國際先進銀行存在著巨大差距,迫切需要拓寬數據應用層面,實現數據資產增值。
1.大數據技術框架
大數據技術框架的組成部分包括處理系統、平臺基礎和計算模型。首先,處理系統必須穩定可靠,同時支持實時處理和離線處理多種應用,支持多源異構數據的統一存儲和處理等功能。其次,平臺基礎要解決硬件資源的抽象和調度管理問題,以提高硬件資源的利用效率,充分發揮設備的性能。最后,計算模型需要解決三個基本問題:模型的三要素(機器參數、執行行為、成本函數)、擴展性與容錯性、性能優化。這些要求對構建大數據技術框架提出了非常高的要求。
2.大數據應用推進和落地
商業銀行大數據應用雖然在風控、反欺詐、征信等領域初見成效,但在其他層面暫時還處于探索階段。究其原因,一方面只有當數據分析轉變為企業業務方式后才產生價值;另一方面商業銀行在新建應用系統的過程中缺乏數據思維,沒有充分了解大數據分析的價值、戰略和流程。同時,大數據應用投資效果難以衡量,領域建模未得到充分重視。
3.數據安全與個人隱私
現階段用戶數據的收集、存儲、管理和使用缺乏規范,主要依靠商業銀行自律,用戶無法確定自己隱私信息的用途。此外,鑒于國內商業銀行體制機制限制以及尚未健全的商業銀行法律法規體系,許多商業銀行機構擔心擅自使用數據會觸犯監管和法律底線,同時數據處理不當可能會給自身帶來聲譽風險和業務風險,因而在駕馭大數據層面難以付諸實際行動。
商業銀行數據從數據類型上進行劃分,大致可以分為結構化數據、半結構化數據與非結構化數據三大類。
結構化的數據源自商業銀行運營數據倉儲(ODS)和數據倉庫(EDW)。ODS主要實現企業數據整合、共享和準實時運營監控等功能,EDW為企業提供分析決策服務。而通過Hadoop等組件的應用可以將數月前甚至幾年前的歷史數據進行遷移保存。在分布式存儲結構下,結構化數據的存儲計算可以得到巨大的改善,可對海量離線數據進行離線分析,將離線數據優勢最大化,為商業銀行用戶打造立體用戶畫像提供最全面的數據支撐。
半結構化數據的整合在數據整合中是最為復雜的。商業銀行可對接來源于外部單位所提供的不同類型數據庫或Excel等的數據。“打通”多源異構的數據是項目中遇到的最困難的部分,數據整合完畢可快速進行建模分析。
商業銀行對于非結構化的處理的方法還是比較原始的。非結構化數據涵蓋的范圍比較廣泛,有新聞、視頻、圖片以及社交網絡等數據。
從技術角度來看,商業銀行大數據主要分為數據接入、數據存儲、數據計算、數據分析四層。目前商業銀行大數據典型的應用場景包括精準營銷、輿情監控與股價預測、智能投顧、智能投研、監管科技、信貸風險評估、信息可視化、消費信貸、供應鏈商業銀行、風險定價、黑產防范等。特別是在監管科技方面,大數據堪稱市場風險、非法集資、異常交易等監測利器。
以前借款需要很長時間的審核,尤其是線下取證、財務報表、抵押擔保、審批流程、領導簽批、最后借款等環節,根據內在的大數據信用評估和內控技術,能夠實現實時計算借款人的信用額度,在信用額度內實現即時放款。這是傳統商業銀行領域難以想象的。而這種快速借款模式,將成為未來互聯網商業銀行時代的標準配置。
幫助雙方站在同一個平臺上相互模擬、相互評估與相互決策。商業銀行信息可視化已經成為經濟分析、管理決策、績效評價等工作的必備工具,它將始終貫穿商業銀行活動的全過程。在技術變革的推動下,商業銀行可視化成為未來發展趨勢。數據可視化的最大價值并不僅在于直接將數據呈現出來,讓人直觀地感受到數據,更在于思維模式和決策方式的轉變。可以利用數據的可視化重新定義商業銀行領域的數據模型,判斷商業銀行價值模型中的爆發點與增長點的關聯。
在數據集成的基礎上,運用大數據、云計算技術,將數據清洗,處理,然后輸入模型,就能還原真實世界,得出精準信息,以此作為決策依據。未來的決策中,人的主觀因素會弱化,大數據提供的信息使決策更加科學智能化、動態實時化。
供應鏈金融的風險控制從授信主體向整個鏈條轉變。供應鏈核心企業擁有良好的資產、充足的資金和高額的授信額度。而依附于核心企業的上下游企業可能需要資金,但是貸不到款。供應鏈金融可以由核心企業做擔保,以產品或應收賬款做質押,幫助上下游企業獲得資金。
應用大數據技術,可以統一管理商業銀行內部多源異構數據與外部征信數據,可以更好地完善風控體系。內部可保障數據的完整性與安全性,外部可控制用戶風險。
智能投顧業務提供線上的投資顧問服務,能夠基于客戶的風險偏好、交易行為等個性化數據,采用量化模型,為客戶提供低門檻、低費率的個性化財富管理方案。智能投顧在客戶資料收集分析、投資方案的制定、執行以及后續的維護等步驟上均采用智能系統自動化完成,且具有低門檻、低費率等特點,因此能夠為更多的零售客戶提供定制化服務。
商業銀行服務的方式和工具隨著技術的成熟發生變化,但商業銀行的本質不會改變,即解決信息不對稱的問題。而大數據恰恰提供了一個解決信息不對稱問題的有效渠道。目前商業銀行大數據的應用挑戰至少包括三方面。
一是商業銀行行業的數據資產管理應用水平仍待提高。
二是商業銀行大數據應用技術與業務探索仍需突破。
三是商業銀行大數據的行業標準與安全規范仍待完善。
相關機構應及時出臺促進商業銀行大數據發展的產業規劃和扶持政策,并分階段推動商業銀行數據開放、共享和統一平臺建設,強化商業銀行大數據行業標準和安全規范建設。
商業銀行機構是大數據天生的合作者,一方面自身有著利用技術紅利帶來收益沖動,另一方面又有國內較好的信息化基礎。因此商業銀行大數據發展也促進了商業銀行行業從多方面實現管理的轉型和業務產品的創新,其中包括信用風險、客戶服務、智能運營以及商業銀行本身的產品。而商業銀行行業在大數據領域里有著較好的場景應用,例如,銀行、保險、證券等。同時互聯網公司在大數據基礎上開展商業銀行業務,這些業務跨過銀行傳統的信貸領域,開始向轉賬匯款、現金管理、資產管理、供應鏈商業銀行、支付等領域蔓延。
商業銀行跟互聯網的融合是大勢所趨,商業銀行向互聯網發展,互聯網向商業銀行轉型,已經成為整個科技和互聯網商業銀行發展的焦點。中國是全球第二大經濟國,銀行業向實體經濟、創新驅動的轉型中,利用大數據技術,必將成為中國銀行業的新增長點和新亮點。