999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

探索商業(yè)銀行在大數(shù)據(jù)挖掘技術(shù)領(lǐng)域的應(yīng)用

2017-09-23 03:02:07羅素文孫元浩
計算機應(yīng)用與軟件 2017年9期
關(guān)鍵詞:數(shù)據(jù)挖掘分析模型

羅素文 韓 路 許 勤 孫元浩

1(中國銀行股份有限公司上海市分行 上海 200233)2(星環(huán)信息科技(上海)有限公司 上海 200233)

探索商業(yè)銀行在大數(shù)據(jù)挖掘技術(shù)領(lǐng)域的應(yīng)用

羅素文1韓 路1許 勤1孫元浩2

1(中國銀行股份有限公司上海市分行 上海 200233)2(星環(huán)信息科技(上海)有限公司 上海 200233)

由于大數(shù)據(jù)的快速發(fā)展,傳統(tǒng)的以業(yè)務(wù)經(jīng)驗?zāi)J竭M行的數(shù)據(jù)庫營銷面臨極大挑戰(zhàn)。針對這種情況,提出基于大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)方法。首先了解業(yè)務(wù)需求,根據(jù)業(yè)務(wù)目標設(shè)計模型,接著進行數(shù)據(jù)整合、數(shù)據(jù)清洗等,最后建立模型、對模型結(jié)果進行評估。實驗結(jié)果表明,應(yīng)用大數(shù)據(jù)挖掘技術(shù)能有效提高精準營銷的成功率,進行風險防控以及運營優(yōu)化管理。

大數(shù)據(jù) 數(shù)據(jù)挖掘 精準營銷 風險防控 運營優(yōu)化

0 引 言

隨著大數(shù)據(jù)時代的到來,商業(yè)銀行數(shù)據(jù)資產(chǎn)的價值也愈發(fā)重要。為此,探索數(shù)據(jù)的應(yīng)用場景和商業(yè)模式,建立技術(shù)平臺,推動商業(yè)銀行從傳統(tǒng)數(shù)據(jù)庫營銷到數(shù)據(jù)化運營,最終到運營數(shù)據(jù)的轉(zhuǎn)變,成為各家商業(yè)銀行重點工作。筆者所在的銀行依托分行大數(shù)據(jù)平臺,致力于大數(shù)據(jù)+人工智能+數(shù)據(jù)挖掘的探索與研究。從2014年就啟動了數(shù)據(jù)挖掘的相關(guān)工作,開發(fā)了卡分期模型、信用卡疑似套現(xiàn)評分模型、信用卡客戶流失預(yù)警模型、信用卡逾期預(yù)警模型、網(wǎng)點選址優(yōu)化模型、大額存單交叉營銷模型、中高端客戶流失預(yù)警模型等。下面就精準營銷、風險預(yù)警、運營優(yōu)化三個主要應(yīng)用場景介紹近三年運用大數(shù)據(jù)挖掘技術(shù)建模實踐的成效。

1 精準營銷

我行基于大數(shù)據(jù)平臺豐富的數(shù)據(jù)來源及高效的分布式計算技術(shù),通過邏輯回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機等機器學習算法,結(jié)合業(yè)務(wù)目標進行分析挖掘、構(gòu)建模型、制定精準營銷方案與策略。下面以大額存單交叉銷售模型和信用卡賬單分期模型為例簡要介紹建模方法及收效。

1.1 大額存單交叉銷售模型

個人大額存單產(chǎn)品自推廣以來,維持了較高的存款貢獻與客戶層級上升貢獻,是分行應(yīng)對同業(yè)競爭、拓展存款和客戶的技術(shù)手段和措施。為更好地推動大額存單客戶群的維護與拓展,爭攬客戶行外資金,亟需通過該交叉銷售模型找出高響應(yīng)的客戶進行大額存單精準營銷活動。

1.1.1 建模樣本及目標變量定義

建模樣本定義為資產(chǎn)5萬~100萬的客戶,模型的目標變量定義為首次購買大額存單的客戶。時間窗口定義:觀察期,6個月,表現(xiàn)期,3個月,經(jīng)統(tǒng)計分析,樣本的目標變量過少。為此,我們將兩個觀察期和表現(xiàn)期的數(shù)據(jù)分布疊加起來,重新整合樣本后進行建模。

1.1.2 數(shù)據(jù)預(yù)處理

源數(shù)據(jù)來自客戶基礎(chǔ)屬性、客戶持有產(chǎn)品、客戶交易行為、客戶基礎(chǔ)屬性變化、客戶持有產(chǎn)品變化、貸款信息、代發(fā)薪信息、跨行轉(zhuǎn)賬信息等數(shù)據(jù)。數(shù)據(jù)預(yù)處理主要包括變量衍生、異常值檢驗及處理、缺失值檢驗及處理三個部分組成。

變量衍生:指根據(jù)業(yè)務(wù)的一些經(jīng)驗值和數(shù)據(jù)分析結(jié)果,主要針對客戶交易行為衍生了分渠道、分產(chǎn)品每月的交易金額最大值、均值、最小值及每個產(chǎn)品和渠道對應(yīng)的交易趨勢等變量。

異常值檢驗及處理:異常值是指一個變量的值非常極端或者出現(xiàn)頻率非常低。對于一般的數(shù)值型變量根據(jù)蓋帽原則,將最大值cap值P99分位數(shù);有業(yè)務(wù)實際意義的,根據(jù)業(yè)務(wù)邏輯來處理。對應(yīng)字符型變量通過查看其分布來檢驗,并根據(jù)業(yè)務(wù)邏輯來處理異常值。

缺失值檢驗及處理:對缺失值處理同樣要分數(shù)值型和字符型兩部分,對應(yīng)數(shù)值型變量缺失值的填充方法有總體均值填充、類均值填充、回歸預(yù)測填充等,本次模型主要采用總體均值填充的方法和業(yè)務(wù)實際來填充。對字符型變量的缺失值我們用N來填充。

1.1.3 分析建模

變量首次篩選:由于源變量較多,首次篩選去掉那些對目標變量影響不大的變量將會減少后續(xù)工作量。結(jié)合變量的IV值和單個變量進入邏輯回歸模型的結(jié)果,篩選出相對重要的變量。

變量分組:由于LOGISTIC回歸只能對數(shù)值型變量進行建模,對字符型變量需要預(yù)處理或分組衍生出啞變量,同樣,對數(shù)值型變量也做了分組處理。我們在目標變量的監(jiān)督下,對變量進行分組處理。并將分組結(jié)果轉(zhuǎn)換為變量對應(yīng)的woe值。

變量二次篩選:對轉(zhuǎn)換為woe值后的變量做共線性診斷,剔除相關(guān)性較強的變量。

模型開發(fā):首先將建模樣本分為訓練集和驗證集,采用逐步回歸的方法進行LOGISTIC回歸的開發(fā)。基于此模型結(jié)果我們可以預(yù)測出資產(chǎn)5~100萬的客戶首次購買大額存單的可能性的大小。根據(jù)模型的評分結(jié)果,給定營銷組A、B和對照組C、D,其中A和C是響應(yīng)率前10%的客戶,B和D組是響應(yīng)率后90%的客戶。前10%的客戶提升度為5倍,營銷組A的成功率約為對照組D的9倍。

我行業(yè)務(wù)部門開展了為期1個月的大額存單交叉營銷活動,最終大額存單銷售量為近500位客戶,購買大額存單近600筆,認購總金額2億多元,人均認購金額超過50萬元。購買客戶中,AUM月均較上月新增的客戶近400位,占比約78%,AUM提升金額近5 000萬元,高于中高端客戶平均增幅,帶動了分行開門紅個人存款及客戶發(fā)展工作。

1.2 信用卡賬單分期

1.2.1建模樣本及目標變量定義

針對最近兩年有消費的信用卡客戶,篩選當月賬單余額絕對值>1 111且賬單月內(nèi)消費金額>1 111的客戶,預(yù)測其在未來一個月分期的可能性的大小。

1.2.2 數(shù)據(jù)預(yù)處理

源數(shù)據(jù)包括每日卡信息表、中銀卡新發(fā)卡數(shù)據(jù)表、中銀卡關(guān)系表、中銀卡客戶信息數(shù)據(jù)、中銀卡賬戶遲繳數(shù)據(jù)、中銀卡交易數(shù)據(jù)、賬單客戶信息表。數(shù)據(jù)預(yù)處理主要包括變量衍生、異常值檢驗及處理、缺失值檢驗及處理三個部分組成。

變量衍生:針對客戶的消費行為衍生了客戶近6個月消費金額、最大消費金額、月均消費金額、分期金額、分期次數(shù)、利息次數(shù)等變量。

異常值檢驗及處理:數(shù)值型變量通過查看其分位數(shù)來檢驗,根據(jù)蓋帽原則將最大值cap值P99分位數(shù),當P99分位數(shù)為0,但最大值不為0時,將P99分位數(shù)以上的值設(shè)為1;字符型變量通過查看其分布來檢驗,并根據(jù)業(yè)務(wù)邏輯來處理異常值。

缺失值檢驗及處理:對缺失值處理同樣要分數(shù)值型和字符型兩部分,對應(yīng)數(shù)值型變量缺失值的填充方法有總體均值填充、類均值填充、回歸預(yù)測填充等,本次模型主要采用總體均值填充的方法和業(yè)務(wù)實際來填充。對字符型變量的缺失值用N來填充。

分析建模流程同大額存單交叉銷售模型一致。根據(jù)模型結(jié)果,可預(yù)測出信用卡客戶賬單分期的可能性的大小,業(yè)務(wù)人員通過模型打分的篩選結(jié)果進行精準營銷,取得了良好的業(yè)務(wù)成效。根據(jù)模型結(jié)果撥打賬單分期響應(yīng)率高的前60%的客戶基本可覆蓋98%的分期客戶。通過近10個月電話外呼對每月符合賬單分期的客戶進行卡戶分期營銷,項目期間卡戶分期累計新增交易額近7億元,同比增長20.5%,實現(xiàn)手續(xù)費收入近4 000萬元,同比增長24%,手續(xù)費貢獻占比37.7%。

2 風險預(yù)警

隨著互聯(lián)網(wǎng)金融迅速崛起,各家商業(yè)銀行紛紛研究大數(shù)據(jù)風控的應(yīng)用場景,本文結(jié)合大數(shù)據(jù)、人工智能、銀行風險防控等技術(shù),為銀行加強金融風險管控,保護客戶資金安全提供保障。

2.1 中高端客戶流失預(yù)警模型

我行2016年一季度中高端客戶降級流失率為20%左右,中高端客戶的流失導致的損失是比較嚴重的。為預(yù)測中高端客戶流失的可能性,需找出潛在的流失客戶,支撐客戶經(jīng)理的維護工作,定制差異化的產(chǎn)品、服務(wù)和營銷策略來挽留客戶,以防客戶流失。

經(jīng)過對歷史數(shù)據(jù)的分析驗證,建模樣本及目標變量的定義為:當前6個月資產(chǎn)月日均20萬以上,且相對前6個月資產(chǎn)減少不超過50%的客戶,未來6個月任意月份資產(chǎn)月日均減少90%以上的可能性的大小。

數(shù)據(jù)預(yù)處理及分析建模流程同大額存單交叉銷售模型一致。模型上線后的樣本外數(shù)據(jù)驗證結(jié)果前10%客戶提升度為3倍,同建模結(jié)果基本一致。經(jīng)過模型評分的數(shù)據(jù)支持,近半年分行客戶降級流失率減少5%,挽回近5 000萬的資產(chǎn)。

此模型的結(jié)果同時部署到分行大數(shù)據(jù)平臺midas工具中,利用大數(shù)據(jù)平臺的分布式計算能力,能夠?qū)崟r得到模型打分結(jié)果,并將客戶的一些影響流失的重要指標情況實時反饋給客戶經(jīng)理。下一步,我們將基于此建模方法利用大數(shù)據(jù)平臺的midas進行機器學習,不斷地對模型結(jié)果進行迭代優(yōu)化,形成客戶流失預(yù)警模型的閉環(huán)營銷流程。

2.2 信用卡疑似套現(xiàn)評分模型

信用卡套現(xiàn)行為給銀行帶來了呆壞賬的風險,需要通過系統(tǒng)智能化的識別,根據(jù)持卡人及商戶的交易行為特征,建立疑似套現(xiàn)模型,提高疑似套現(xiàn)卡片的甄別率及工作效率的同時,降低銀行風險敞口。

通過分析客戶最近6個月的消費情況,對客戶是否存在套現(xiàn)給定一個評分,該模型是一個經(jīng)驗?zāi)P汀?/p>

為此引入兩個概念,客戶在某商戶的大額交易:客戶在商戶交易單筆金額大于3 000元;客戶在某商戶的可疑金額:最近6個月,客戶在某商戶大額交易筆數(shù)至少3筆,且累計交易金額大于等于50 000元。

信用卡套現(xiàn)主要從客戶角度和商戶角度入手,如果商戶涉嫌套現(xiàn),那么商戶消費金額中有很大比重來自套現(xiàn),再引入商戶可疑度指標,設(shè)為ε,商戶可疑度=所有客戶在該商戶的可疑消費金額/該商戶的所有消費金額。涉嫌套現(xiàn)的商戶一般不正規(guī)、不知名、手續(xù)費較低。

對商戶信息進行清洗和分類,引入白名單,在知名商戶的消費不計入套現(xiàn)。不可疑商戶標準:普通商戶可疑度<0.25;房車商戶可疑度<0.3;第三方支付商戶可疑度<0.1;批發(fā)類商戶可疑度<0.15。

如果客戶涉嫌套現(xiàn),其在可疑商戶消費金額的比重就較大,引入指標α、β、γ,定義M為客戶的總消費金額,Mi為客戶在某商戶的可疑金額,Mj為客戶在某商戶的可疑金額2,即最近6個月內(nèi),客戶在某商戶至少5個月有大額交易,且累計交易金額≥5萬元。Mx為客戶的可疑金額,定義為客戶在所有商戶的可疑金額之和。

(1)

(2)

(3)

這樣,我們初步得到評分公式:

0.2(log10Mx-5)

(4)

同時經(jīng)過分析我們發(fā)現(xiàn),取現(xiàn)越多和在知名商戶的消費越多,客戶套現(xiàn)的概率越低,最后我們得到優(yōu)化的評分公式:

(5)

n1:最近6個月內(nèi),客戶在可疑商戶每筆消費3 000元以上的次數(shù)。

n2:最近6個月內(nèi),客戶在可疑商戶每筆消費9 900元以上的次數(shù)。

模型應(yīng)用于信用卡高額度客戶排查、套現(xiàn)排查、套取積分等排查工作中,按模型提供數(shù)據(jù),已開展對套現(xiàn)評分最高的500張卡片進行排查,共處置近90張卡片,成功率為業(yè)務(wù)經(jīng)驗排查的6倍,為分行優(yōu)化信用卡資產(chǎn)結(jié)構(gòu)及客戶質(zhì)量、有效遏制不良資產(chǎn)的新增提供有效的決策支持。

3 運營優(yōu)化

在構(gòu)建了網(wǎng)點選址優(yōu)化模型后,對其中四家支行的選址進行了對比分析。該模型主要基于客戶位置、屬性及商圈經(jīng)濟等數(shù)據(jù)的人流分析、潛在客戶分析、位置畫像分析、人群畫像分析和應(yīng)用偏好分析,提供金融網(wǎng)點評估建議,作為網(wǎng)點選址優(yōu)化的依據(jù)。

3.1 人流分析

分析人流密度及分布,主要評估人口類型是居住人口、工作人口還是流動人口。

3.2 潛在客戶分析

分析客戶的活動區(qū)域分布、客戶的基本屬性信息、消費信息等數(shù)據(jù)。通過look-alike相似人群擴展機器學習算法,將高PA客戶群作為種子用戶,作為機器學習的正樣本,剩下的客戶則為負樣本,從而將上述問題轉(zhuǎn)化為一個二分類的模型,正負樣本組成學習的樣本。經(jīng)過對模型的訓練,利用模型結(jié)構(gòu)對客戶進行打分,最終得到我們想要的潛在高PA客戶群,即根據(jù)相似人群的擴大,尋找出符合業(yè)務(wù)的潛在客群。

3.3 位置畫像分析

通過對周邊資源的分析,以及金融同業(yè)的分析,評估周邊交通便利層度。

3.4 人群畫像分析

主要分析客戶的年齡、性別、學歷、職業(yè)、婚育狀況、車輛情況、應(yīng)用使用偏好、消費品位、消費品類等多維度。

3.5 應(yīng)用偏好分析

本文著重分析客戶對金融類APP的偏好,主要包括金融同業(yè)、互聯(lián)網(wǎng)金融機構(gòu)等消費傾向的分析。

四家支行從上述五個方面對比分析發(fā)現(xiàn):四家支行的定位差別很大,支行1處于核心區(qū)域,位置環(huán)境優(yōu)越,人群質(zhì)量和業(yè)務(wù)都占優(yōu),潛在客戶群大,各方面都具有明顯的優(yōu)勢;支行2和支行3處于人口密集區(qū),中國銀行手機銀行APP安裝率較高,說明老客群體相對較多,50歲以上人群在四個支行中人群占比最高;支行4相對于其他三個支行劣勢較多。

4 結(jié) 語

大數(shù)據(jù)挖掘可讓金融機構(gòu)更加了解客戶,在一段時間內(nèi),大數(shù)據(jù)在金融應(yīng)用中還將以營銷、風控和運營為主要場景。未來,金融機構(gòu)在合規(guī)的前提下,將引入更多維度的外部數(shù)據(jù)。在大數(shù)據(jù)分析挖掘取得成效的基礎(chǔ)上,一方面豐富數(shù)據(jù)指標體系,進行模型的優(yōu)化工作,全口徑掌握客戶使用銀行產(chǎn)品和服務(wù)的狀態(tài),以及與其他客戶的關(guān)系,對客戶進行全視角的風險評估;另一方面,充分利用大數(shù)據(jù)平臺計算架構(gòu)的優(yōu)勢,基于大數(shù)據(jù)平臺的分布式計算能力進行機器學習,為業(yè)務(wù)發(fā)展提供實時的決策與支持。

[1] 霍魁.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)在銀行中的應(yīng)用[J].商,2015(26):191-192.

[2] 彭爽.商業(yè)銀行轉(zhuǎn)型升級的大數(shù)據(jù)戰(zhàn)略分析[J].中國商論,2016(1):71-73.

[3] 宋志德.論我國商業(yè)銀行業(yè)務(wù)創(chuàng)新[J].商業(yè)文化,2015(6):96-97.

[4] 王雅軒,頊聰.數(shù)據(jù)挖掘技術(shù)的綜述[J].電子技術(shù)與軟件工程,2015(8):204-205.

[5] 崔冬梅.大數(shù)據(jù)時代之統(tǒng)計數(shù)據(jù)挖掘?qū)嵶C[J].統(tǒng)計與決策,2016(4):180-182.

[6] 劉鳳艷.基于聚類分析的證券業(yè)客戶分層實證研究[J].赤峰學院學報(自然科學版),2016(8):99-101.

[7] 曹凌雁,曹慧,劉向榮.基于數(shù)據(jù)挖掘技術(shù)的信用卡透支影響因素研究[J].知識經(jīng)濟,2015(2):87-88.

[8] 張覺文,張心蓓.我國電子銀行業(yè)務(wù)現(xiàn)狀及發(fā)展趨勢[J].統(tǒng)計與管理,2015(7):60-61.

[9] 許佳馨,劉曉星,崇章.大數(shù)據(jù)對商業(yè)銀行的影響分析[J].農(nóng)業(yè)發(fā)展與金融,2016(5):51-52.

[10] 南楠.基于關(guān)聯(lián)規(guī)則的銀行潛在客戶挖掘研究[J].電子商務(wù),2016(8):48-50.

EXPLORETHEAPPLICATIONOFBIGDATAMININGINCOMMERCIALBANKS

Luo Suwen1Han Lu1Xu Qin1Sun Yuanhao21

(BankofChinaShanghaiBranch,Shanghai200233,China)2(TranswarpTechnology(Shanghai)Co.,Ltd,Shanghai200233,China)

Due to the rapid development of big data, the traditional database management with business experience model is facing great challenge. In view of this, we propose a data mining technology based on big data. We first understand the business requirements, design the model according to the business goal, then carry on the data integration and the data cleaning, finally establish the model and evaluate the model results. The experimental results show that the application of big data mining can effectively improve the success rate of precision marketing, risk prevention and control and operational optimization management.

Big data Data mining Precision marketing Risk prevention and control Operation optimization

TP311

A

10.3969/j.issn.1000-386x.2017.09.009

2017-06-02。羅素文,碩士,主研領(lǐng)域:數(shù)據(jù)挖掘,機器學習。韓路,碩士。許勤,高工。孫元浩,碩士。

猜你喜歡
數(shù)據(jù)挖掘分析模型
一半模型
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統(tǒng)及其自動化發(fā)展趨勢分析
3D打印中的模型分割與打包
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 国模极品一区二区三区| 国产精品专区第1页| 国产精品三区四区| 亚洲中文在线看视频一区| 色婷婷视频在线| 久久黄色小视频| 国产91精选在线观看| 国产成人综合久久精品下载| 亚洲高清在线天堂精品| 久久九九热视频| 都市激情亚洲综合久久| 又猛又黄又爽无遮挡的视频网站| 又爽又大又光又色的午夜视频| 国产成人做受免费视频| 亚洲天堂网2014| 日本精品视频| 97国产在线观看| 亚洲精品免费网站| 国产第一页第二页| 99精品欧美一区| 日韩黄色精品| 亚洲性色永久网址| 97色伦色在线综合视频| 国产亚洲一区二区三区在线| 99热线精品大全在线观看| 人人看人人鲁狠狠高清| 91年精品国产福利线观看久久| 久久综合成人| 亚洲国产黄色| 在线欧美日韩国产| 日本一区二区不卡视频| 久久香蕉国产线看观| 999国产精品永久免费视频精品久久| 成人国产免费| 青青国产成人免费精品视频| 日韩小视频在线观看| 福利在线不卡| 国产第一页屁屁影院| 91精品国产自产91精品资源| av大片在线无码免费| 99激情网| 国产区在线看| 毛片免费视频| 一级毛片免费不卡在线| 日本欧美中文字幕精品亚洲| 日韩色图在线观看| 精品伊人久久久香线蕉| 色综合日本| 精品视频第一页| 午夜高清国产拍精品| 91久久偷偷做嫩草影院电| aaa国产一级毛片| 99久视频| 日本a∨在线观看| 成人免费黄色小视频| 韩日午夜在线资源一区二区| 亚洲天堂网2014| 国产交换配偶在线视频| 国产偷国产偷在线高清| 欧美福利在线播放| 国产精品xxx| 国产9191精品免费观看| 嫩草影院在线观看精品视频| 国产黑丝一区| 亚洲综合狠狠| 日本AⅤ精品一区二区三区日| 九色国产在线| 国产免费羞羞视频| 天天综合网在线| 午夜国产理论| 成·人免费午夜无码视频在线观看| 午夜精品久久久久久久无码软件 | 无遮挡一级毛片呦女视频| 熟妇丰满人妻av无码区| 大香网伊人久久综合网2020| 波多野结衣爽到高潮漏水大喷| 色婷婷综合在线| 精品午夜国产福利观看| 精品无码国产自产野外拍在线| h网址在线观看| 欧美午夜性视频| 午夜福利视频一区|