朱永佳 宋俊典 蔡浩淼

摘 要
在當今社會,隨著各個行業信息化程度的提高,產生和積累了大量復雜數據。這些數據將突出數據挖掘技術的重要價值。本文論述了數據挖掘在金融行業的五個應用,也為今后的工作提供指導。
關鍵詞
大數據;數據挖掘;金融行業
中圖分類號: TP311.13;F832 ? ? ? ? ?文獻標識碼: A
DOI:10.19694/j.cnki.issn2095-2457.2020.09.048
Abstract
In today's society,with the improvement of the informatization of various industries,a large amount of complex data is generated and accumulated. These data will highlight the important value of data mining technology. This article discusses five applications of data mining in the financial industry and provides guidance for future work.
Key Words
Big data;Data mining;Finance industry
0 引言
隨著計算機技術和網絡技術的飛速發展,社會上各個行業的信息化程度大幅提高。這為行業提供了高效率和便利的工作條件,與此同時,大數據也蘊藏著巨大的商業價值。如何使用數據挖掘技術從大數據中提取寶貴的價值,并將其運用于行業的戰略和計劃,為行業提供科學的指導,是亟待解決的問題。本文討論了基于大數據背景下數據挖掘在金融行業的應用。
1 大數據的基本概念
1980年初,著名的未來學家阿爾文·托夫勒(Alvin Toffler)在他的《第三次浪潮》一書中將大數據稱贊為“第三次浪潮的典范”。1980年,許多專家和學者談到了中國海量數據的處理和管理,但是由于客觀條件的限制以及大數據未能引起足夠的重視,因此暫時忽視了巨大的信息資源[1]。隨著計算機技術的發展,互聯網的應用以及以智能手機和平板電腦為代表的新型移動設備的出現,許多行業,特別是金融行業大大提高了電子化和信息化的程度。結果,由各種軟件系統應用程序生成的數據量呈現爆炸性增長的趨勢。大數據正在改變人們的生活和對世界的理解方式,更多的變化正在發生。
大數據的概念非常抽象,它具有許多屬性,例如高維度、復雜性、強噪聲、低值密度、社會屬性等。隨著人們對大數據的理解,其社會屬性中包含的資源引起人們不斷研究和探索。2012年3月,美國政府發布了《大數據研究與發展計劃》,投資2億美元啟動了大數據研究與發展計劃[2],以增強從大數據中提取和分析信息的技術和能力,旨在加強國家安全,改變教育和學習方式,加快科學和工程領域的創新速度和水平。2012年4月,歐洲信息學和數學研究協會ERCIM新聞雜志發表了關于大數據的專刊[3],討論了大數據時代的問題,例如數據管理和密集數據研究的創新技術,大數據整理和挖掘所需要的工具和科學方法。
2 數據挖掘
數據挖掘,有時也稱為數據或知識發現。數據挖掘一般是指從龐大、復雜、隨機、不規則和模糊的實際數據中通過算法探索價值的信息的研究過程。
數據挖掘技術是將應用統計理論、智能技術和數據庫技術結合應用的產物。根據執行順序,主要有五種方法,它們是分類、估計、預測、聚類及可視化。
數據挖掘的基本過程可以表示為圖1。借助數據挖掘技術和工具,大數據的處理和應用已成為現實。人們的工作和日常生活離不開信息,對知識的需求將發生變化。
3 數據挖掘在金融行業中的應用
國際金融的電子化和信息化始于20世紀60年代。在金融產品多樣化且網絡流行的時代中,每天有大量復雜金融數據產生。在激烈的市場競爭中成功的關鍵在于,金融行業的決策者是否可以利用數據挖掘技術有效利用和發展這龐大的復雜數據,然后制定科學、合理、潛在的計劃和策略。
金融行業中使用的數據挖掘主要可以從以下幾個方面進行討論。
1)構建多維數據分析的數據挖掘模型和數據倉庫
數據挖掘在金融行業的應用是全方位的。在銀行和證券業,根據時間、地理空間或組織部門等不同的查詢債務和稅收變化,根據不同的需求分別建立數學模型,并從提供的統計信息方向建立最大值、最小值、和、平均值等模型,從專業技術方向建立數據倉庫、數據立方體、多特征和發現驅動的數據立方體、特征和比較分析以及離群點分析模型[4]。這將為數據處理和應用做準備。
2)分析客戶狀態
金融行業的代理商擁有龐大的客戶群。因此,客戶與各種金融企業之間的交流和合作產生了大量數據。在確保客戶信息和數據安全的情況下,基于固定的時間間隔(例如每月)的收入和支出信息來區分收入、消費能力和還款能力等客戶狀態,這目前已成為現實。通過客戶的數據挖掘結果,來管理復雜的客戶關系、區分客戶、識別關鍵客戶、挖掘客戶需求、描述客戶的行為路徑,然后預測客戶流失的可能性,采取措施留住客戶,并減少客戶流失。
大數據可以幫助金融機構從以產品為中心轉變為以客戶為中心。例如,一家具有強大競爭力的國內股份制銀行,通過收集客戶的信用卡支出和社交媒體信息,可以準確區分客戶的消費偏好;并根據ATM交易軌跡和手機地理位置信息,實時獲取客戶的地理位置信息,并在其附近及時向客戶推送與其偏好相符的商店折扣活動。此外,銀行通過客戶的財務記錄和社交平臺互動信息,分析出客戶的社交網絡關聯圖,識別出有影響力的社會熱點客戶,然后將金融產品推薦給有影響力的社會熱點客戶,擴大他們的影響力和營銷范圍[5]。
3)企業風險管理
金融領域中的各種業務,通常伴隨著大量的貨幣流通活動,會產生相應的業務數據。預防金融風險和識別金融欺詐已成為金融公司需要重點關注和管理的問題。在執行這些工作時,除了以前的方法外,目前使用數據挖掘技術可以分析、發現與行業發展有關的風險信息和用戶的個人信用信息,預測風險水平,并為決策提供參考數據。廠商為了避免風險,從大量的金融業務數據和客戶交易信息中獲取信息。[6]例如,在銀行信用卡管理中使用數據挖掘技術,可以分析客戶信用卡的使用模式,了解客戶使用信用卡的習慣,并動態監視信用卡的使用狀態。一旦出現客戶信用卡異常使用情況,發卡機構可以采取預防措施以減少損失。數據挖掘技術還可以用于分析某些欺詐模式,找出欺詐模式的共性,并為金融企業提供預警和參考,加強企業監督管理。
4)預測市場趨勢
市場是瞬息萬變的,但也有其規則,其中財務數據相對完整。金融機構使用數據挖掘技術,從日新月異的數據中發現并掌握市場規則,預測產品價格趨勢和客戶需求變化,開發和制造以市場為導向的產品,以占領市場機會并增強金融企業的市場競爭力。
5)為偵查經濟犯罪提供支持
經濟犯罪是金融業面臨的問題之一,包括洗錢、惡意透支、偽造信用卡等。為了提供解決經濟犯罪的線索,可以集成多個數據庫的信息。例如某個地區的銀行交易數據庫、犯罪歷史數據庫;然后通過分析工具來檢測異常數據,例如,分析某個時段內大量現金流動的人。根據時間和客戶群以圖表形式顯示交易活動的數據可視化工具、區分客戶和活動之間關系的分析工具、過濾出不相關屬性并進行屬性分類的分類工具、高度相關的聚類工具,通過這些工具對不同的案例進行分組,通過異常點分析工具檢測異常的資金轉移量或其他行為,通過序列模式分析工具分析異常訪問序列的特征[7]。這些數據挖掘工具可以識別活動的重要連接和模式,并為調查人員提供檢測線索。
4 總結
在大數據時代,尤其是在金融領域,數據挖掘是從海量數據中提取重要信息的強大工具與技術。本文簡要介紹了在大數據時代背景下使用數據挖掘技術和工具從五個方面為金融行業提供的支持服務。作者希望可以為相關人員的研究工作提供參考,同時,也為作者以后對數據挖掘在其他行業的應用提供參考。
參考文獻
[1]Tu Xinli,Liu bo,Lin Weiwei.Survey of big data[J],Application Research of Computers,2014,31(6).pp.1612-1617.
[2]Li Guojie,Cheng Xueqi.Big Data Research:Science Technology And Economic Social Development of the Major Strategy Areas in the Future Research Status and Scientific Thinking of Big Data[J],Bulletin of Chinese Academy of Sciences,2012,27(6).pp.647-657.
[3]Big data [J].ERCIM News,2012.pp.89.
[4]Jiang Yuxuan,Chen Yucheng,Zhang Qiaoling.Research On Application of Data Mining Technology In the Financial Industry [J].Business,2013,36.pp.145.
[5]Sha sha.The Application of Big Data in Finance Industry[J],Financial computer of China,2014,6.pp.34.
[6]Tao Liu.Application of data mining technology in the financial field[J].Tianjin Science& Technology,Feb.2015,Vlo1.42 NO.2,51-52.
[7]Zhu Jing,Li Shijun.The Analysis of Financial Data Based on Data Mining[J],Computer knowledge and technology,2010,6(1).pp.18-19.