999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在銀行客戶提升中的應用研究

2021-06-28 19:13:56牛亞琴盧苗苗
電腦知識與技術 2021年10期
關鍵詞:數據挖掘

牛亞琴 盧苗苗

摘要:隨著金融行業競爭愈加劇烈,加之互聯網金融的快速發展,銀行業利差不斷收窄、波動劇烈,使其正面臨著全方位的挑戰。如何更有效地進行精準營銷在很大程度上決定銀行是否能在激烈的競爭中脫穎而出。該研究將80%預處理后數據作為訓練集,20%的數據用于驗證集,利用數據挖掘技術中的 Logistic回歸和XGBoost兩種客戶提升模型分別對存量客戶數據進行了比對分析。通過對比兩種模型的ROC和Lift曲線后發現XGBoost模型提升客戶數量更多、預測準確率較高。

關鍵詞:銀行業;數據挖掘;客戶提升

中圖分類號:TP311? ? ? ?文獻標識碼:A

文章編號:1009-3044(2021)10-0205-02

Abstract: With the fiercer competition in the financial sector and the rapid development of Internet finance, the banking industry is facing comprehensive challenges due to the narrowing and drastic fluctuation of interest rate spreads. How to carry out precision marketing effectively determines whether it can stand out in the fierce competition. In this study, 80% of the pre-processed data was taken as a training data, and 20% of the data was used for a validation set. Through data mining techniques, two customer improvement models including Logistic regression and XGBoost were used for comparative analysis of the existing customer data. By comparing the ROC and Lift curves of these two models, it was found that the XGBoost model can simultaneously improve the number of the customers and the accuracy of prediction.

Key words: banking industry; data mining; customers improvement

隨著大數據時代來臨,越來越多行業利用數據挖掘技術鎖定目標客戶群,從而進行精準營銷,降低經營成本,提升整體效益。對公業務是商業銀行的經營基礎和利潤效益的主要來源,對公業務的發展直接影響商業銀行經營狀況與資產質量,因此對公業務營銷能力的提升首當其沖。本文通過比對XGBoost和Logistic回歸兩種算法,尋找影響客戶提升的主要因素。一方面可以幫助銀行找出具有提升空間的潛在客戶,并有針對性的為用戶提供其感興趣的服務和產品,推動用戶的價值成長;另一方面可以幫助銀行確定影響客戶提升的主要因素,通過調整市場和產品戰略來改善這些因素,進一步提升銀行的競爭力。

1數據挖掘技術

數據挖掘是發現暗藏的、未被發現的知識的行為,是指從海量的、隨機的數據中抽取那些隱含的、有利用價值的知識的過程[1]。數據挖掘是對數據庫技術的一種深層次的應用,提高了信息資源的使用價值和效率,更好地解決日益復雜多變的決策問題,進一步提高決策的準確性和可靠性[2]。數據挖掘的過程可以分為定義問題、分析數據、數據收集及預處理、建立模型、模型評估及模型應用等六個階段。

2 數據抽取、數據探索以及數據預處理

以我國北方A銀行為例,該行存量對公客戶中,年日均小于10W以下的客戶數量在全行對公客戶中占比65%,具有相當大的提升空間。通過技術分析手段可從未提升客戶中發掘有潛力的客戶進行針對性營銷,從而提升客戶活躍度,增加銀行業績。確定好客戶提升價值模型后,即可對某A銀行歷史數據中抽取數據進行探索和預處理,主要包括客戶號、開戶時長、基本賬戶標志、近6-12個月AUM日均余額、交易金額等屬性。

2.1 數據探索

銀行的數據主要存放于ODS數據庫和數據倉庫中,銀行數據倉庫80%的數據來源于ODS系統,而ODS數據庫中的數據來源于不同交易系統,通過數據抽取、加載過程完成系統內數據更新。

2.2 數據預處理

在信息大爆炸的當今社會,銀行業同樣順應時代潮流需要對客戶信息進行高效處理。客戶的信息數據根據具體情況需要存儲在不同操作系統(如Linux、IBM AIX)的數據庫中,但是數據庫的種類較多,包括Oracle、Sybase以及DB2等。因此,在數據抽取(Extract)、轉換(Transform)、加載(Load)時不可避免地會出現一定程度的數據質量問題。為得到準確客戶信息,需對海量數據進行有目的性的清理,最大限度保證預測模型的準確性,為客戶提升提供數據質量上的保證。數據清洗是對“臟數據”的處理,是解決對象識別問題、減少錯誤和不一致性的必要過程。目前已存在成型的數據清洗框架模型,如Bohn模型,Trillium模型和AJAX模型,根據其結構特點,可從源數據層、ODS層和數據倉庫層對數據進行清洗。本文中的清洗方法是通過ETL工具Datastage實現。具體清洗過程如下:

1)源數據層清洗:當數據從銀行外部源數據文件和源數據庫中抽取到ODS系統時對數據進行清洗稱為數據模式清洗。造成數據模式問題的主要原因是屬性之間缺乏完整性約束和數據庫設計不合理。

2)ODS層清洗:數據加載到ODS系統后對數據行清洗,為清洗數據實例。“臟”數據通常在屬性值中以“臟”數據的形式出現:即異常值、空值、錯誤值和拼寫錯誤等。

3)數據倉庫層清洗:上述兩步清洗完成后,數據將從ODS系統加載到數據倉庫中。從數據庫中提取數據,可能會提取重復記錄,這一步的清洗工作是清除重復的記錄。

3 模型構建

數據預處理后,根據本次數據挖掘的要求,利用客戶的歷史信息來建立客戶提升模型,判斷其是否為可提升用戶是一個二分類問題。客戶提升模型常用的算法有Logistic回歸模型、決策樹模型、神經網絡模型、XGBoost模型。按照可解釋性和以往經驗,本研究選擇Logistic回歸模型和XGBoost模型進行比較,然后選擇冠軍模型進行預測,生成潛在提升客戶名單,為對公基礎戶、有效戶提升,提供精準營銷支持,為銀行業績增長需求提供有力數據支撐。根據銀行存量客戶數,分析年日均小于10w以下的客戶數量,通過分析構建模型從年日均小于10w以下的客戶中發掘有潛力的可以提升的客戶。將預處理后的數據中選擇80%的數據作為訓練數據,20%的數據用于驗證集。通過數據驗證兩種算法構建的模型,輸出模型訓練結果,用驗證集數據驗證模型訓練結果的準確性。通過驗證集的預測結果輸出預測概率,通過ROC曲線的AUC值評估模型效果,利用Lift提升度曲線評估預測效果。

4 實驗結果

4.1 ROC曲線

圖1為Logistic和XGBoost模型的ROC曲線,ROC曲線離左上角越近的點預測準確率越高。該方法簡單、直觀,可觀察分析學習器的準確性,并可用肉眼做出判斷。利用ROC曲線下方面積(AUC值)評估模型優劣,AUC取值越高模型越準確。Logistic模型AUC取值為0.76,XGBoost模型AUC取值為0.85。

4.2Lift曲線

Lift曲線衡量的是與隨機抽樣模型相比,模型的預測能力“變好”了多少,lift曲線越平滑,模型的效果越好。圖2表示logistic和XGBoost模型的Lift曲線,由圖可知,logistic模型隨著數據急劇減少,XGBoost模型減少的相對緩慢。

5結束語

建立有效的客戶價值提升模型對銀行決策可以提供有力的技術支撐,采用數據挖掘的方法尋找潛在的提升客戶,從而為企業提供更好的營銷策略是非常有效的手段。本文采用Logistic回歸算法和XGBoost算法進行分析預測,經過實驗模擬與數據驗證,使用ROC曲線和Lift曲線對比,綜合兩種評估指標發現XGBoost模型提升客戶數量更多、預測準確率較高,最終選擇XGBoost模型為最終模型。

參考文獻:

[1] 段薇,馬麗,路向陽.基于信息增益和最小距離分類的決策樹改進算法[J].科學技術與工程,2013,13(6):1643-1646,1652.

[2] 許惠君,李彩林,劉曉安.數據挖掘技術在水庫調度中的研究與應用[J].計算機與數字工程,2006,34(9):61-63.

【通聯編輯:代影】

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 夜夜高潮夜夜爽国产伦精品| 亚欧成人无码AV在线播放| 亚洲AV一二三区无码AV蜜桃| 东京热av无码电影一区二区| 精品超清无码视频在线观看| 国内精品久久久久久久久久影视| 91青青在线视频| 欧美日韩福利| 香蕉国产精品视频| 91精品伊人久久大香线蕉| 日韩AV手机在线观看蜜芽| 亚洲女同一区二区| 国产性爱网站| 国产精品微拍| 午夜影院a级片| 无码专区国产精品一区| 伊人久久久大香线蕉综合直播| www.亚洲一区| 日韩第九页| 亚洲另类色| 精品人妻AV区| 国产门事件在线| 亚洲精品在线影院| 欧洲极品无码一区二区三区| www欧美在线观看| 亚洲人成网7777777国产| 在线观看视频一区二区| 日韩在线永久免费播放| 欧美a在线看| 亚洲天堂精品在线| 一级毛片在线免费看| 国产精品久久久久久影院| 亚洲成人一区二区三区| www.youjizz.com久久| 影音先锋丝袜制服| 天天色天天综合网| 五月婷婷丁香综合| 欧美亚洲日韩中文| 999精品视频在线| 精品人妻系列无码专区久久| 国产黄在线免费观看| 理论片一区| vvvv98国产成人综合青青| 国产综合日韩另类一区二区| a级毛片一区二区免费视频| 久久96热在精品国产高清| 男女性色大片免费网站| 国产欧美日韩专区发布| 美女无遮挡免费网站| 噜噜噜久久| 这里只有精品国产| 丁香综合在线| 国产18页| 无码AV高清毛片中国一级毛片| 午夜三级在线| 亚洲日本韩在线观看| 国产精品自在线天天看片| 成人免费网站在线观看| 久久精品国产在热久久2019| 精品久久久久久中文字幕女| 91香蕉视频下载网站| 不卡的在线视频免费观看| 亚洲 欧美 偷自乱 图片 | 好紧好深好大乳无码中文字幕| 欧美伊人色综合久久天天| 国产欧美在线观看一区| 99热这里只有精品免费国产| 99久久国产综合精品2020| 国产又粗又猛又爽视频| 一区二区三区四区在线| 亚洲日本中文字幕天堂网| 美女免费黄网站| 日本一区二区不卡视频| 亚洲无码精彩视频在线观看| 国产精品hd在线播放| 99视频在线精品免费观看6| 国产幂在线无码精品| 久久久精品久久久久三级| 成人在线综合| 国产成人精品2021欧美日韩| 亚洲高清资源| 露脸一二三区国语对白|