999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于稅務(wù)數(shù)據(jù)進行小微信貸風險模型研究

2019-11-11 12:18:11劉聯(lián)盟
卷宗 2019年29期
關(guān)鍵詞:模型

劉聯(lián)盟

摘 要:小微企業(yè)或企業(yè)主的純信用貸款融資服務(wù)一直是金融機構(gòu)的難題,如何在風險可控的前提下擴大業(yè)務(wù)規(guī)模是亟待解決的,所以需要做一些基于稅務(wù)數(shù)據(jù)的風控建模的研究,以作為重點解決信貸風險不對稱的問題。當前在風險模型策略中也更為注重量化分析,所以借此論文研究的機會進行擬定題目方向的研究,提升自身的研究分析能力。本文從銀行等金融機構(gòu)的信用風險管理中稅務(wù)數(shù)據(jù)的價值入手,詳細闡述了其在建模方向的應(yīng)用,并提出了相應(yīng)的困難。

關(guān)鍵詞:風控;模型;小微信貸;稅務(wù)

小微金融融資難,其本質(zhì)是源于三個不對稱,即信息不對稱,風險不對稱,成本收益不對稱。綜合國內(nèi)外學者對小企業(yè)融資模式的研究成果來看,大多是希望通過破解信息不對稱問題,來解決其融資過程中遇到的問題,其中風險控制又是關(guān)鍵。盡管近年來,我國商業(yè)銀行正在逐步推行流程銀行改革,大中小行業(yè)銀行也都在對線上化的信用貸款進行了一定程度的嘗試,這些對小微企業(yè)的融資起到了部分促進作用,但依然成效不大。為此,筆者認為重點是從數(shù)據(jù)源著手,提高銀行風險模型和策略的決策能力來減輕小微企業(yè)信息不對稱問題,依托銀稅互動的背景,大力挖掘稅務(wù)數(shù)據(jù)在風控領(lǐng)域的應(yīng)用價值,通過解決風控和成本不平衡的難點逐步解決小微企業(yè)融資難題。

1 小微信貸的意義和價值

小微客群數(shù)量龐大、分布廣泛,他們貼近市場、貼近用戶,活躍在市場競爭最為激烈的領(lǐng)域,是經(jīng)濟增長和市場創(chuàng)新的微觀基礎(chǔ)。

在我國“以票管稅“的大環(huán)境 下,發(fā)票信息與稅務(wù)信息緊密相連。在各類小微企業(yè)融資模式中,稅務(wù)信息模式在風控效果提升、成本與效果兼顧兩方面均具備優(yōu)勢,成為當前各金融機構(gòu)越來越重視的模式。具體而言,稅務(wù)信息具備覆蓋的企業(yè)面廣、信息維度多且與風控效果相關(guān)性大、信息準確度高、電子化存儲方便等優(yōu)勢。其中,稅務(wù)數(shù)據(jù)的信息維度優(yōu)勢尤為突出,這其中包含企業(yè)主營商品分析、繳稅記錄、稅務(wù)信用等級、采購商品分析、銷售額排名區(qū)間、水電支出等信息。

當前情況下,提升風控水平是破解小微信貸成本和風控的兩難問題的最佳手段,同時可以更好地提高貸款決策的有效性和科學性。金融結(jié)構(gòu)可以借助稅務(wù)數(shù)據(jù)來構(gòu)建的企業(yè)經(jīng)營全景視圖來進行風險控制、產(chǎn)品營銷、業(yè)務(wù)創(chuàng)新等活動,真正有效的發(fā)揮數(shù)據(jù)和資金價值,進一步促進經(jīng)濟發(fā)展,落實普惠金融建設(shè)。

2 基于稅務(wù)數(shù)據(jù)的風控建模的實現(xiàn)

本文采用的是一個融合模型,即通過兩個機器學習模型建模,然后在進行邏輯回歸建模。首先會介紹數(shù)據(jù)探索和處理過程,以及特征構(gòu)造等建模前的基礎(chǔ)內(nèi)容。然后介紹Logsitc Regression 的基本原理、數(shù)學模型以及主要的方法。之后詳細介紹了 Random? Forest、Xgboost 在融合模型中的應(yīng)用,對算法的原理及其實現(xiàn)方式進行了詳細的闡述,并對必要環(huán)節(jié)的處理過程進行解釋。主要包含以下幾個重要步驟:

2.1 數(shù)據(jù)探索

數(shù)據(jù)探索要弄清楚這些問題:有哪兒些字段?樣本數(shù)據(jù)長什么樣子?基本特征是什么?分布是什么樣?有什么特殊之處?數(shù)據(jù)之間有沒有關(guān)系(相關(guān)性分析)?樣本數(shù)據(jù)是否能滿足建模需求?

數(shù)據(jù)探索是在具有較為良好的樣本后,對樣本數(shù)據(jù)進行解釋性的分析工作,它是數(shù)據(jù)建模的較為前期的部分。數(shù)據(jù)探索并不需要應(yīng)用過多的模型算法,相反,它更偏重于定義數(shù)據(jù)的本質(zhì)、描述數(shù)據(jù)的形態(tài)特征并解釋數(shù)據(jù)的相關(guān)性及其業(yè)務(wù)意義。通過數(shù)據(jù)探索的結(jié)果,我們能夠更好的開展后續(xù)的數(shù)據(jù)挖掘與數(shù)據(jù)建模工作。

2.2 數(shù)據(jù)處理

對原始數(shù)據(jù)進行處理是論述本文的一切的前提,這部分工作十分繁復,其中主要是對相關(guān)數(shù)據(jù)的抽取,對數(shù)據(jù)類型進行處理,數(shù)據(jù)進行歸一化處理,缺失值填充的方法評估,去除噪聲數(shù)據(jù),對極值處理,并對確認錯誤的數(shù)據(jù)進行修正或刪除。由此產(chǎn)生的高質(zhì)量的數(shù)據(jù)才能進行下一步的特征構(gòu)造工作。

2.3 特征構(gòu)造

這部分涉及到如何構(gòu)造特征,特征作為模型效果的直接因素,在數(shù)據(jù)建模工作中占了大部分工作量,也是模型建設(shè)中最重要的工作,從多樣化的業(yè)務(wù)邏輯中尋找特征構(gòu)造方法,利用特征工程通用的技術(shù)方法去驗證特征效果,并使用專業(yè)性知識構(gòu)造特征生成模型。由此構(gòu)造出有效且解釋性強的特征,不僅對模型效果有極大提升作用,還能對業(yè)務(wù)意義提供參考。

2.4 模型原理和模型構(gòu)建評估

2.4.1 Logistic? Resgression

Logistic? Resgression 是以概率學理論為基礎(chǔ)所衍生出的非線性回歸模型,針對解決二分類問題的回歸模型,為了擬合因變量 y 與自變量(x1,x2,…,xn)之間關(guān)系而構(gòu)造的數(shù)學模型,是一種廣義的線性回歸分析模型,較常用于數(shù)據(jù)挖掘,醫(yī)學上的疾病分析和診斷,信貸評分卡等領(lǐng)域。

2.4.2 Random Forest

Random Forest算法是由多個基模型組成的分類算法?;跊Q策樹用隨機的方式建立一個森林,在得到森林之后,當有一個新的輸入樣本進入的時候,就讓森林中的每一棵決策樹分別進行判斷。既然 Random? Forest 是一種多模型組合算法,那它一定是由元分類器組成的,它的元分類器是 CART 樹。每次進行訓練的樣本集沒有使用全集,而是使用抽樣的方法,抽樣方法是 Bagging 方法抽取有差異的子集,在樹的分支時也采用隨機選擇分裂特征的方式。通過使用以上方法,增強了 Random? Forest 算法較好的抗噪能力,并且由此也使得其分類效果十分優(yōu)秀。

2.4.3 Xgboost

Xgboost 將通用 Tree? Boosting 算法進行了工程化實現(xiàn),梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)是 Tree Boosting 算法的代表,而它也被稱為 MART(Multiple Additive Regression Tree)。

2.4.4 模型構(gòu)建

通過之前生成的特征變量,進行變量的必要篩選和入模調(diào)整,構(gòu)建一整套違約預測模型,對融合模型和單模型進行效果對比,并對模型中必要的模塊的實現(xiàn)方法及過程進行論述。

2.4.5 模型評估

效果評估方式包含KS檢驗和ROC檢驗:

1)KS檢驗主要是驗證模型對違約對象的區(qū)分能力,一般用在模型預測建模的信用樣本的信用評分后,將樣本按違約率與非違約率分成兩部分,然后用KS值來檢驗兩組樣本的信用評分是否具有顯著性差異。

2)ROC曲線及AUC系數(shù)主要用來檢驗違約預測模型對客戶進行正確的排序能力。ROC曲線重點描述在一定累計好客戶比例下的累計壞客戶的比例,模型的分別能力越強,ROC曲線越往左上角靠近。AUC值表示ROC曲線下方的面積。AUC越高則模型的風險區(qū)分能力也就越強,AUC的最大值是1,也即是理論上的完美信用違約模型。

3 當前遇到的困難和后續(xù)展望

3.1 當前遇到的困難

一是對稅務(wù)數(shù)據(jù)的業(yè)務(wù)含義認識上的片面性,導致無法構(gòu)造出一些十分有價值的變量,可能致使最終模型效果無法達到預期;二是數(shù)據(jù)實證分析遇到阻滯,影響論文寫作的階段性推進;三是企業(yè)上下游數(shù)據(jù)因普通發(fā)票開具的信息以及接收到的信息不完整,上下游的統(tǒng)計數(shù)據(jù)可能會與企業(yè)實際交易情況存在細微的誤差。

3.2 后續(xù)展望

綜上所述,通過本文的研究,給出了利用稅務(wù)數(shù)據(jù)對小微信貸領(lǐng)域的風控模型進行分析和挖掘的一個思路和方向,并取得了初步的成果,但是由于本人知識面的狹窄和經(jīng)驗上的不足,該研究并不完美,還存在著許多需要完善的地方,有待未來繼續(xù)努力。未來可以進一步研究的內(nèi)容包括:

1)對數(shù)據(jù)的深度分析和使用,采集更多的數(shù)據(jù),除了本文所使用的稅務(wù)基礎(chǔ)數(shù)據(jù)之外,還可以納入更多的與企業(yè)經(jīng)營相關(guān)的數(shù)據(jù),包括不限于水電費用信息,企業(yè)進銷項中更多維度的數(shù)據(jù)。此外對于數(shù)據(jù)的處理,需要研究更優(yōu)的數(shù)據(jù)清理方式,更加有效的消除異常數(shù)據(jù),填補空缺數(shù)據(jù)。最后還要對小微企業(yè)的經(jīng)營數(shù)據(jù)做深度分析,提高特征數(shù)據(jù)的粒度,尋到更多有效的與違約強相關(guān)的數(shù)據(jù)特征。

2)使用一些最新的算法來進行違約預測,利用目前前沿的深度學習技術(shù)對違約模型進行優(yōu)化。

4 結(jié)束語

綜上所述,小微信貸領(lǐng)域的數(shù)據(jù)模型的應(yīng)用還處在探索與發(fā)展階段,但是這也是當前數(shù)據(jù)挖掘應(yīng)用領(lǐng)域的熱點研究方向。本文以作者實際經(jīng)驗出發(fā),介紹了在當前國家政策的大力支持下,小微企業(yè)融資難、融資貴的現(xiàn)象依然一直存在,分析融資難的本質(zhì)原因分析,以及解決小微企業(yè)融資的現(xiàn)實意義,針對小微企業(yè)融資難的問題,一方面,通過“銀稅互動”、“銀商互動”、對接產(chǎn)業(yè)中的交易數(shù)據(jù)、與正規(guī)持牌的第三方征信機構(gòu)合作等方式,不斷拓展充實小微企業(yè)的經(jīng)營信息;另一方面,結(jié)合稅務(wù)數(shù)據(jù)和機器學習算法,動態(tài)搜集企業(yè)經(jīng)營的相關(guān)信息線索、提煉數(shù)據(jù)特征。豐富和完善企業(yè)信用評估的維度,將傳統(tǒng)的評分卡建設(shè)轉(zhuǎn)變?yōu)槿诤夏P偷臉?gòu)建,切實提高金融結(jié)構(gòu)的小微信貸風險把控能力。

企業(yè)的稅務(wù)相關(guān)數(shù)據(jù)中也存在很多值得挖掘的信息等待人們?nèi)グl(fā)現(xiàn),盡管本論文的研究內(nèi)容還有許多不足之處,但隨著未來研究的進一步開展,相關(guān)領(lǐng)域的研究必然會取得更大的突破,為數(shù)據(jù)建模在小微信貸領(lǐng)域的應(yīng)用取得更大的成果。

參考文獻

[1]姜強,趙蔚,王朋嬌,等.基于大數(shù)據(jù)的個性化自適應(yīng)在線學習分析模型及實現(xiàn)[J].中國電化教育,2015(1):85-92.

[2]洪娟.大數(shù)據(jù)環(huán)境下商業(yè)銀行“小微貸”競爭策略研究[J].南方金融,2014(03):80-82.

[3]王妍.構(gòu)建大數(shù)據(jù)“云銀行”金融模式突破小微企業(yè)融資瓶頸[J].對外經(jīng)貿(mào),2015(07):114-116.

[4]李雅芹,楊慧中.一種基于Bagging算法的高斯過程集成建模方法[J].東南大學學報:自然科學版,2011,41(B09):93-96.

[5]李航.統(tǒng)計學習方法[M].北京:清華大學出版社,2012.

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产在线一区二区视频| 国产精品永久在线| 国产黑人在线| 久久福利片| 国产午夜人做人免费视频中文 | 18黑白丝水手服自慰喷水网站| 国外欧美一区另类中文字幕| 国产精品尤物在线| 国产免费网址| 国产AV无码专区亚洲A∨毛片| 无码精品一区二区久久久| 国产理论一区| 欧美日韩福利| 亚洲精品无码av中文字幕| 亚洲综合激情另类专区| 一级一级特黄女人精品毛片| 精品人妻一区无码视频| 日韩精品毛片| 国产精品自在拍首页视频8 | 久久国产成人精品国产成人亚洲| 天天色综合4| 国产自在线播放| 九九久久精品免费观看| 久久中文字幕2021精品| 日韩精品久久久久久久电影蜜臀| 国产激情无码一区二区APP| 2021无码专区人妻系列日韩| 欧美成人精品一级在线观看| 欧美视频二区| 综合色区亚洲熟妇在线| 国产在线视频欧美亚综合| 国产精品一老牛影视频| 她的性爱视频| 国产成人综合亚洲网址| 国产欧美亚洲精品第3页在线| 亚洲日韩高清无码| 就去色综合| 久久久精品国产亚洲AV日韩| 亚洲美女久久| 日韩在线中文| 亚洲精品片911| 国外欧美一区另类中文字幕| 亚洲中文精品久久久久久不卡| 国产日韩欧美中文| 免费在线不卡视频| 久久青草精品一区二区三区| 亚洲色欲色欲www网| 国产精品自拍露脸视频| 高潮毛片无遮挡高清视频播放| 国产黑丝一区| 99热最新网址| 久久美女精品国产精品亚洲| 在线观看国产小视频| 色综合中文综合网| 亚洲人成网址| 国产在线观看一区精品| 国产成人亚洲精品无码电影| 伊人福利视频| 国产一区亚洲一区| 亚洲天堂区| 自拍偷拍欧美| 色噜噜综合网| 国产午夜福利在线小视频| 国产精品无码AⅤ在线观看播放| 欧美专区在线观看| 无码国产偷倩在线播放老年人| 91久久精品国产| 久久激情影院| 日韩毛片免费视频| 免费一级毛片不卡在线播放| 怡红院美国分院一区二区| 国产chinese男男gay视频网| 亚洲成人福利网站| 欧美.成人.综合在线| 国产综合欧美| 欧美一区二区精品久久久| 亚洲综合二区| 无码有码中文字幕| 亚洲日韩久久综合中文字幕| 婷婷开心中文字幕| 成人日韩欧美| 国产精品免费电影|