999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的中小企業貸款意愿預測研究

2017-03-28 09:40:54蘇曉麗陳暮紫鄭麗芬葉展望
數碼世界 2017年3期
關鍵詞:百度信息模型

蘇曉麗陳暮紫鄭麗芬葉展望

1. 北京工商大學計算機與信息工程學院 2、3、4中央財經大學管理科學與工程學院

基于機器學習的中小企業貸款意愿預測研究

蘇曉麗1陳暮紫2鄭麗芬3葉展望4

1. 北京工商大學計算機與信息工程學院 2、3、4中央財經大學管理科學與工程學院

本文以某銀行1887家貸款意愿已知的中小企業為研究對象,依托大數據環境下的網絡爬蟲技術,從互聯網采集中小企業的工商、失信、裁判、百度以及招聘信息,建立影響中小企業貸款意愿的指標體系,并利用決策樹和Logistic回歸算法分別對中小企業貸款意愿進行預測。最后通過準確率、F測度和ROC面積等評價指標的對比分析發現,決策樹模型的預測結果優于Logistic回歸模型,并且企業是否有百度信息、是否發生工商變更、一級行業對中小企業的貸款意愿有顯著的影響,為銀行發掘貸款目標客戶提供有益參考,同時在一定程度上緩解了中小企業融資難、融資貴問題。

大數據 機器學習 中小企業 貸款意愿預測

1 引言

所謂精準營銷,就是使用數據驅動,在正確的時間通過正確的渠道提供正確的信息給正確的人的營銷活動。對于銀行來說,營銷的首要目標是要找到正確的客戶——即有貸款意愿的客戶。在我國企業總數中,中小企業占比超過99%,是我國國民經濟和社會發展的重要力量。然而,由于我國中小企業的經營規模往往較小,企業自有資金有限,同時,缺乏健全的日常管理及財務管理制度,存在嚴重的信息不透明,長期以來制約我國中小企業生存和發展的融資難題,依舊突出。

因此,在大數據時代背景下,依托互聯網爬蟲技術,獲取中小企業信息,并使用機器學習的算法實現對中小企業貸款意愿的預測具有重要的現實意義,一方面在一定程度上緩解了中小企業融資難、融資貴問題,另一方面,為銀行挖掘有貸款意愿的目標客戶提供了有益參考。

2 數據來源與指標體系的建立

本文以某銀行的1887家貸款意愿已知的中小企業為研究對象,通過互聯網爬蟲技術,從11315、工商、失信、裁判、百度、招聘等網站獲取海量公開的中小企業信息,通過變量缺失、內部關聯強度和相似度等的整理和排除,共選取16個變量構成影響中小企業貸款意愿的指標體系,并對這些指標影響中小企業貸款意愿的相關關系進行了一定的經濟學假設,具體指標如表1所示。

表1 影響中小企業貸款意愿的指標體系

3 實證分析

3.1 決策樹模型

決策樹在分類、預測和規則提取等領域有著廣泛應用。本研究主要采用CART算法,目的是將中小企業劃分為兩類,有貸款意愿的企業和無貸款意愿的企業,決策樹的各節點即影響中小企業貸款意愿的各個指標。CART決策樹是一種十分有效的非參數分類和回歸方法,通過構建樹、修剪樹、評估樹來構建一個二叉樹。CART算法主要采用最小GINI信息增益來選擇節點屬性。

本研究樣本為1887家貸款意愿已知的中小微企業,按照7:3的比例,將樣本分為訓練樣本和測試樣本,其中訓練樣本1358家,測試樣本529家。通過R軟件中的Rpart函數實現基于CART算法的分類回歸樹模型,分析結果如圖1所示。

從圖1可以看出,在16個候選變量中共有6個顯著變量,決策過程為:

①是否有百度信息。在測試樣本中29%的企業有百度信息,其中有貸款意愿的占比38%,故判斷這些企業沒有貸款意愿;而剩下的71%的企業沒有百度信息,但其中有貸款意愿的企業占比90%,故沒有百度信息的企業貸款意愿更加強烈。

②是否納稅。在29%的有百度信息的企業中,納稅企業占比25%,但這部分企業有貸款意愿的占比28%,故判斷納稅企業沒有貸款意愿;而另外4%沒有納稅信息的企業中,有94%的企業有貸款意愿,故沒有納稅信息的企業貸款意愿更加強烈。

③企業類型和是否工商變更。通過圖1決策樹,可以看出這兩個變量的取值,并不影響企業的貸款意愿,故這兩個變量相比另外4個變量對企業貸款意愿的影響程度相對較低,但相對于沒有進入決策樹的變量,二者對貸款意愿的影響程度相對較高。

④一級行業。對于沒有百度信息但有工商變更的個體工商戶在全體樣本中占比8%,其中一級行業是批發零售業的企業占比7%,其中有貸款意愿的企業占比44%,故判斷這部分企業沒有貸款意愿;而一級行業不是批發零售業的企業占比2%,有貸款意愿的企業占比91%,故判斷這部分企業有貸款意愿。

表2 Logistics回歸結果

圖1 Rpart決策樹

⑤經營年限。沒有百度信息、企業類型為個體工商戶、發生工商變更、一級行業為批發零售業的企業占比7%,這部分企業中,經營年限為5-10年的有4%,有貸款意愿的占比35%,故判斷它們沒有貸款意愿,而經營年限不是5-10年的占比3%,其中55%的企業有貸款意愿,故判斷這部分企業有貸款意愿。

3.2 Logistic模型

在本研究中,P表示中小企業有貸款意愿的概率,1-P表示中小企業無貸款意愿的概率,β0為常數,X1,...,Xi為解釋變量,即影響中小企業貸款意愿的各個指標,β1,β2,...,βi為回歸系數,ε為隨機誤差。

本研究通過R軟件中的glm函數逐步回歸實現Logistic模型,結果如表2所示。

通過表2可知,共有7個變量的P-Value的值都遠小于0.05,分別為是否工商變更、是否有經營地址、是否有信用網址、是否有百度信息、主要人員個數未知、一級行業其他以及到我行的距離10公里以外,并依次用X1,X2,...,X7分別表示。由Logistics模型可知:企業有貸款意愿的概率P與各顯著變量Xi的關系可用如下式所示:

其中是否有信用網址、一級行業其他、到我行的距離10公里以外等三個變量的系數為正,它們與企業貸款意愿呈正相關,且系數越大,貸款意愿越大;而是否工商變更、是否有經營地址、是否有百度信息、主要人員個數未知等四個變量的系數為負,它們與企業貸款意愿呈負相關,且系數越大,越沒有貸款意愿。

表3 兩種算法預測結果評估表

3.3 模型結果的對比分析

分類模型通常利用準確率、精確率、召回率、F值和ROC面積等指標進行評估,本研究中將有貸款意愿的中小企業標注為正類,無貸款意愿的中小企業標注為負類。則共出現四種情況:

真正類(True Positive,TP):被模型預測為有貸款意愿的有貸款意愿樣本;

假正類(False Positive,FP):被模型預測為有貸款意愿的無貸款意愿樣本;

假負類(False Negative,FN):被模型預測為無貸款意愿的有貸款意愿樣本;

真負類(True Negative,TN):被模型預測為無貸款意愿的無貸款意愿樣本。

①準確率(Accuracy),反映的是正確預測樣本所屬類別的概率。

一般情況下,模型的ROC>0.5,即認為模型的效果較好。通過表3結果的對比分析發現,決策樹模型的準確率、精確率、召回率、F測度和ROC面積均優于Logistic模型,預測效果更好。

4 結論

本文依托大數據環境下的網絡爬蟲技術,全方面獲取企業在第三方網站上的信息,突破了傳統研究中影響中小企業貸款意愿指標體系的局限性;并且通過決策樹和Logistic模型分別對企業貸款意愿進行預測,結果表明決策樹模型預測效果更好,一方面幫助銀行更加精準地篩選目標客戶,另一方面也在一定程度上緩解了中小企業融資難問題。但本文存在的不足是,兩種模型的顯著變量對企業貸款意愿的影響方向并不完全和假設方向一致,這也是本文今后應該深入研究的地方。

[1]楊茜. 基于大數據的客戶細分模型及精確營銷策略研究[D].南京郵電大學,2015

[2]張良均,云偉標等.R語言挖掘與實戰[M].北京:機械工業出版社,2015:89-95

本文受國家自然科學基金(71673315)、北京市社科基金(16yjb036)的資助。

猜你喜歡
百度信息模型
一半模型
重要模型『一線三等角』
Robust adaptive UKF based on SVR for inertial based integrated navigation
重尾非線性自回歸模型自加權M-估計的漸近分布
百度年度熱搜榜
青年與社會(2018年2期)2018-01-25 15:37:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
百度遭投行下調評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
百度“放衛星”,有沒有可能?
太空探索(2014年4期)2014-07-19 10:08:58
主站蜘蛛池模板: 人妻丝袜无码视频| 国产一区二区影院| 扒开粉嫩的小缝隙喷白浆视频| 久久国产免费观看| 免费Aⅴ片在线观看蜜芽Tⅴ | 99爱视频精品免视看| 国产另类乱子伦精品免费女| 国产精品午夜福利麻豆| 真实国产精品vr专区| 国产精品视频久| 国产欧美高清| 亚洲成a人在线观看| 国产一区自拍视频| 亚洲天堂视频在线观看免费| 久久不卡国产精品无码| 亚洲国产午夜精华无码福利| 国产成人狂喷潮在线观看2345| 毛片免费视频| 老色鬼久久亚洲AV综合| 三上悠亚在线精品二区| 欧美精品三级在线| 国产精品私拍在线爆乳| 中文字幕 日韩 欧美| 青草视频免费在线观看| 国产成人欧美| 国产欧美日韩综合一区在线播放| 特级毛片8级毛片免费观看| 午夜欧美在线| 国产va免费精品观看| 亚洲精品亚洲人成在线| 精品综合久久久久久97| 精品久久久久成人码免费动漫| 996免费视频国产在线播放| 人妻精品全国免费视频| 五月六月伊人狠狠丁香网| www中文字幕在线观看| 天天综合网色中文字幕| 久久一本日韩精品中文字幕屁孩| 婷婷色一二三区波多野衣| a级毛片免费看| 自拍亚洲欧美精品| 久久中文无码精品| 99re热精品视频中文字幕不卡| 久久香蕉欧美精品| 免费毛片a| 婷婷成人综合| 国产午夜福利片在线观看| 欧美狠狠干| 国产精品福利一区二区久久| 色偷偷男人的天堂亚洲av| 国产综合在线观看视频| 国产成人亚洲无码淙合青草| 亚洲一区二区视频在线观看| 国产三级毛片| 国产精品毛片在线直播完整版| 亚瑟天堂久久一区二区影院| 久久精品视频亚洲| 久久精品嫩草研究院| 乱系列中文字幕在线视频 | 日韩欧美国产中文| 日韩精品亚洲精品第一页| 欧美福利在线| 国产成人免费| 男女精品视频| 99精品影院| 婷婷午夜天| 色窝窝免费一区二区三区| 欧美一级夜夜爽www| 老熟妇喷水一区二区三区| 国产精品成人免费综合| 欧美成人综合在线| 国产精品部在线观看| 自慰网址在线观看| 一本大道无码日韩精品影视| 欧美午夜视频| 日韩一区二区在线电影| 99999久久久久久亚洲| 成人免费午夜视频| www.亚洲一区二区三区| 国产在线观看精品| 91免费片| 成人福利在线视频|