999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于邏輯回歸的個人信用評分卡模型研究

2024-06-03 00:00:00張俊麗郭雙顏任翠萍馬倩
現代信息科技 2024年5期

收稿日期:2023-08-01

基金項目:2020年陜西省教育科學“十三五”規劃課題(SGH20Y1480);2022年西安歐亞學院校級項目(2022GCPY01)

DOI:10.19850/j.cnki.2096-4706.2024.05.003

摘" 要:構建有效的個人信用風險評價系統,用以應對潛在的個人信貸風險,這對金融行業和社會公眾皆有重要的現實意義。文章首先對數據進行清洗、預處理,然后通過WOE編碼分箱、IV值進行變量篩選,構建了邏輯回歸模型并基于邏輯回歸模型建立了個人信用評分卡模型,該模型可輔助決策者制定合理的授信政策、定價策略以及其他相關業務運營策略。

關鍵詞:個人信用評估;評分卡;AUC

中圖分類號:TP39;O212.1 文獻標識碼:A 文章編號:2096-4706(2024)05-0012-05

Research on Personal Credit Score Card Model Based on Logistic Regression

ZHANG Junli1, GUO Shuangyan2, REN Cuiping1, MA Qian1

(1.Xi'an Eurasia University, Xi'an" 710065, China; 2.Shaanxi Branch of Bank of Communications, Xi'an" 710004, China)

Abstract: Building an effective personal credit risk assessment system to address potential personal credit risks is of great practical significance for the financial industry and the general public. This paper first cleans and preprocesses the data, and then uses WOE coding and binning and IV values for variable screening. A logistic regression model is constructed, and a personal credit score card model is established based on the logistic regression model. This model can assist decision-makers in formulating reasonable credit policies, pricing strategies, and other related business operation strategies.

Keywords: personal credit evaluation; score card; AUC

0" 引" 言

隨著經濟和互聯網技術的高速發展,信用消費的方式逐漸興起,已融入人們的日常生活,如住房貸款、汽車貸款,以及個人信用卡、螞蟻花唄、借唄、京東白條金條等小額消費貸款。這些金融服務的使用都離不開個人信用,其中個人信用風險評估是一個必不可少的環節[1-3]。因此,對個人信用風險進行合理評估,對客戶是否會違約進行預測,成為金融機構控制風險的重要手段。信用消費產業的健康發展,可以為消費者帶來極大的便利。對金融機構來說,信用消費有著廣闊的市場空間,蘊含著巨大的利潤增長點;對金融市場來說,信用消費可以分散金融風險,促進金融體系的健康發展;對社會經濟來說,信用消費能夠拉動社會需求,促進經濟增長。

在如今這個信息時代,互聯網技術的發展也帶動了互聯網金融行業的繁榮。互聯網金融是指傳統金融機構與互聯網企業利用互聯網技術和信息通信技術實現資金融通、支付、投資和信息中介服務的新型金融業務模式。簡單來說就是利用互聯網技術實現了更快捷、更便利的支付、征信、投資理財、融資、信貸業務。現如今,不僅可以通過手機進行網購,還可以通過手機申請信貸,例如人們所熟知的花唄、京東白條等?;ヂ摼W金融的發展從面對面的業務辦理向手機業務辦理方向發展。隨著居民購買力的不斷提高,信貸、信用卡這一系列具備信貸消費功能的產品接踵而來。而個人平常使用這些產品時無不反襯著消費者的信用特征信息,金融機構可以通過諸如此類的個人征信記錄來審批是否向某人提供貸款或信貸等服務。對客戶信用風險的準確預測對銀行和金融企業來說至關重要,可以最大限度地減少向客戶放貸的風險,降低做出錯誤決策的概率。因此,相對于傳統操作中業務人員的主觀判斷,信用評分模型更具客觀性、全面性、準確性、效率性。

目前,消費信用正處于高速發展的階段,一些信用企業在經營上也面臨著大大小小的風險。為了促進我國消費信貸的良性發展,需要建立科學、合理的個人信用風險評估與預測機制。與此同時,促進行業健康發展、健全個人征信系統、嚴評用戶的違約風險、防范不良信貸的發生、提升信貸機構風險管控能力變得更加重要。在信貸產品不斷涌現與數據利用率低下的客觀矛盾下,應用數據挖掘技術進行個人信用評價具有十分重要的意義。實行個人信用評價不但可以提升銀行的審批效率,還可以降低銀行的信貸風險,規避人工審核過程中出錯情況的發生。這對于金融業的發展具有舉足輕重的作用。

1" 個人信用風險評估介紹

個人信用指的是客戶與信貸機構之間(即受信人與授信人之間),為滿足受信人個人生活消費需求,建立在誠實守信基礎上的一種履行契約關系、遵守契約約定的能力。所以個人信用評估即是授信人對受信人在信貸過程中所承擔的還貸義務及其可信程度做出判斷和評估。個人信用評價也是一個客戶償債能力和履約能力的綜合反映和寫照。狹義上說,信貸機構評價的是客戶的履約能力、償債能力和守信程度;廣義上是指客戶個人履行各類經濟承諾的守信程度和可信任程度。個人信用評估,又稱“消費者信用評估”,它是根據對客戶的個人信用歷史資料,綜合微觀環境和個人特征(內外主客觀原因)的考察,結合經濟、金融、司法、社會、工商、財產等因素(例如信用歷史記錄、行為記錄、個人特征、交易記錄),通過使用科學、嚴謹的分析方法或信用風險評估模型,對客戶的償付能力或信用程度進行全面的判斷和評估,從而根據評估結果對客戶進行信用評級。

個人信用風險評估的方法有很多,傳統的個人信用風險評估主要是評估人員根據自己的主觀意愿對客戶進行評判。由于這種方法的不確定性因素和主觀因素太多,評判指標過少,從而會造成評估結果的非全面性和非有效性。隨著基于統計方法的個人信用評估模型的大量涌現,我們現在可以十分客觀地預測客戶的個人信用等級[4-7]。

個人信用評估方面在國外已有150年的發展歷史,最早啟用的評估方法是Fisher于1936年提出的判別式分析法。在這150年的發展歷程中,判別分析法、非參數分析法、人工智能和統計學方法紛紛應用在信用評估上。以往學者通常將個人信用評估問題分成分類和回歸這兩大問題。分類問題是根據多個貸款人在相同地點以及類別中的特征指標,去判斷不同貸款人的所屬類別。分類問題的主要算法有:線性判別、神經網絡、遺傳算法、K近鄰、分類樹;回歸問題是指根據多個貸款人在未知的所屬類別中的特征指標,估計和預測其信用分數和違約概率,線性回歸是這類問題將會用到的重要方法。在國內,個人信用體系起步較晚,2000年才開始起步。這個時期最典型的方法便是:銀行要求客戶填寫一張表單,然后銀行根據預定義的計分表對每個指標進行打分,再根據打分結果決定是否接受該客戶的申請。而預定義計分表中每個指標的權重分數都是根據專家的主觀意見和經驗給出的,缺少必要的信用評價機制和懲戒規范機制[8,9]。因此,如果信貸機構想要降低信貸所帶來的風險,就必須科學有效、公平公正、有理有據地對個人信用風險進行評估。

本文采用數據挖掘技術,建立并訓練優化模型,從而科學有效地對個人信用風險進行快速評估。希望能夠在加強及完善互聯網金融個人信用風險評估方面盡一點綿薄之力,可以在某種程度上幫助機構拒絕信用風險高的人,達到規避信用風險高人群所帶來的損失,即達到降低風險的目的。

2" 個人信用風險變量選擇及分箱

本文所用到的分析數據來自Kaggle平臺,總共挑選20 000條數據。原始數據特征為47維,其中包含匿名特征15個。本文以isDefault為因變量,以貸款金額、貸款期限、貸款利率、貸款等級等46個變量作為自變量進行分析研究。

IV值的全稱為Information Value,即信息量或信息價值[10],它是評分卡模型中的一個常見指標,廣泛應用于金融風控領域。其主要作用是在構建分類模型時對變量進行篩選,對輸入變量進行編碼和預測能力評估。IV值用于衡量自變量預測能力的大?。◤娙酰?,與其相似的還有信息增益、基尼系數等。

對IV值的解釋預測力如表1所示。

表1" IV值的解釋預測力

IV值范圍 預測能力 選擇

<0.02 無預測能力 不納入模型變量候選集

[0.02, 0.1) 較弱 根據實際情況決定是否納入模型變量候選集

[0.1, 0.3) 中等 根據實際情況決定是否納入模型變量候選集

[0.3, 0.5) 強 納入模型變量候選集

≥0.5 很強 具有可疑性,需進一步調查

WOE值的全稱是Weight of Evidence,由于各個變量的量綱和取值區間存在很大的差別,通常會對變量的取值進行分箱并計算WOE值。若要對一個變量進行WOE編碼,首先需要對這個變量進行分箱處理。分箱后,對第i組進行以下運算:

其中:n為分組個數,表示各分組中“壞”客戶占總“壞”客戶的比例,表示各分組中“好”客戶占總“好”客戶的比例。因此,引入WOE的轉換,對變量進行篩選并計算WOE、IV值。

如圖1所示,根據計算出的各變量IV值,過濾IV值<0.02的變量,保留interestRate、ficoRangeLow、ficoRangeHigh、dti、loanAmnt、revolUtil、installment、annualIncome、grade、term、verificationStatus、homeOwnership這12個變量。

利用WOE轉換對變量進行分箱,以“ficoRangeHigh”為例,輸出變量的分箱統計表,如表2所示。

采用上述分箱方法對數據進行分箱處理,部分數據如表3所示。

圖1" 變量IV值

3" 基于邏輯回歸的個人信用風險評估

現如今常用的個人信用風險評估方法主要有邏輯回歸法、判別分析法、人工智能法和非參數分析法。本文建立了基于邏輯回歸的個人信用評分卡模型。

為了深入挖掘影響違約的顯著因素,首先按照7:3的比例將數據集拆分為訓練集和測試集,在測試集上對模型進行訓練,得到邏輯回歸模型,如表4所示。

從邏輯回歸模型結果可以看出,變量interestRate、ficoRangeLow、dti、loanAmnt、annualIncome、term、verificationStatus、homeOwnership均對違約有顯著影響。

繪制模型的ROC曲線,得到模型的AUC值為0.708,模型的分類效果較好,如圖2所示?;谧罴验撝?.199,可計算得到模型的準確率為0.73,表示測試集數據中有73%的客戶會被正確歸類,精確率達到0.45,表示預測為違約的客戶中確實發生違約行為的客戶占比為45%,召回率達到0.76,表示客戶發生違約并被模型預測出來的比例為76%。

圖2" ROC曲線

4" 基于邏輯回歸的個人信用評分卡模型

評分卡是一種以分數形式衡量一個客戶信用風險大小的憑借,評分卡設定的分值刻度可以通過將分值表示為比率對數的現行表達式來定義。在實際應用中,計算出每個變量各分箱對應的分值。當有新用戶產生時,對應到每個分箱的值,將這些值相加,最后加上初始基礎分,得到最終的結果。如果用戶的某個變量發生改變,由一個分箱變成另一個分箱,只需將更新后所在分箱的值進行替換,再重新相加即可得到新的總分。因此,可以說個人信用評分卡模型具有很強的業務應用價值。

結合logistic模型和評分計算表達式,可以將評分卡改為以下形式:

其中,Score為信用得分,A為“補償”,B為“刻度”,顯然,違約概率越高,信用得分越低。采用個人信用評分卡模型,可以通過對不同用戶的各種特征進行量化評分,實現對用戶信用水平的評估,如表5所示。

根據各變量得分表最終可得各樣本的分值,如圖3所示。銀行或金融機構可以首先根據個人信用評分卡模型中各預測變量不同分類的信用評分,結合自身的業務需求對每個用戶進行量化評分。然后,根據評分的分布特征設定相應的閾值,將用戶劃分為不同的類別。通過這種方式可以有效控制風險,實現收益的最大化。

圖3" 得分分布圖

5" 結" 論

本文首先對變量進行了WOE轉換、分箱處理,并計算每個變量的IV值來對變量進行選擇,剔除相關性不高的變量,然后基于邏輯回歸模型建立了個人信用評分卡模型。通過個人信用評分卡模型,金融機構和其他組織可以更加準確地評估借款人、客戶的信用風險程度。這有助于決策者制定合理的授信政策、定價策略以及其他相關業務運營策略;同時也可以幫助用戶了解自己的信用狀況,并采取相應的措施來改善自身的信用評分。

參考文獻:

[1] 都珂珂,黃全生,張玥.我國個人信用評估模型綜述 [J].經營與管理,2021(1):166-172.

[2] 戴蓓蓓.基于組合預測模型的商業銀行個人信貸風險預測 [J].經濟研究導刊,2022(35):69-72.

[3] 毛子林,劉姜.基于機器學習方法的信用風險評估綜述 [J].經濟研究導刊,2021(23):117-119.

[4] 劉念,王文君,高家鳴,等.檢驗檢測機構信用風險評價指標體系建設研究 [J].中國標準化,2023(23):218-222.

[5] 呂秀梅,張儒.網絡小額貸款業務個人信用風險評估——基于DNN-SMOTEENN-ExtraTrees組合模型 [J].數學的實踐與認識,2023,53(7):14-21.

[6] 楊柳,孫帶.基于多分類器串并聯結構的個人信用評估模型 [J].湘潭大學學報:自然科學版,2022,44(6):1-11.

[7] 黃寶鳳,祁婷婷.基于特征工程的個人信用風險評估組合模型 [J].中國統計,2021(6):37-39.

[8] 范彥勤,黃海午,楊智凱.基于特征工程和樹增強貝葉斯網絡的個人信用評估研究 [J].桂林航天工業學院學報,2022,27(4):573-579.

[9] 張俊麗,仲崇麗,楊震,等.基于數據挖掘的上市公司高送轉預測 [J].財務管理研究,2021(6):90-95.

[10] 張華.基于邏輯回歸的駕駛員信用評估研究 [J].計算機時代,2023(3):25-27+35.

作者簡介:張俊麗(1982—),女,漢族,陜西韓城人,副教授,碩士,研究方向:數據挖掘與機器學習。

主站蜘蛛池模板: 91精品日韩人妻无码久久| 91外围女在线观看| 老司机aⅴ在线精品导航| 色噜噜久久| 久久久精品国产亚洲AV日韩| av大片在线无码免费| 综合亚洲色图| 一级成人a毛片免费播放| 一边摸一边做爽的视频17国产| 国产一级精品毛片基地| 亚洲无码A视频在线| 成人午夜视频网站| 亚洲天堂日韩av电影| 全部毛片免费看| 五月婷婷综合网| 999在线免费视频| 亚洲有无码中文网| 婷婷丁香在线观看| 一级毛片中文字幕| 欧美精品v日韩精品v国产精品| 精品欧美一区二区三区久久久| 在线观看免费国产| 成年看免费观看视频拍拍| 国产av一码二码三码无码| 最新亚洲av女人的天堂| 欧美精品不卡| 黄色网址免费在线| 久热这里只有精品6| 一级做a爰片久久免费| 天堂在线视频精品| 日韩欧美中文在线| 国产成人高清亚洲一区久久| 久久久久国产一级毛片高清板| 伊人国产无码高清视频| 国产清纯在线一区二区WWW| 中文字幕亚洲第一| 日韩国产欧美精品在线| 一区二区午夜| 午夜国产理论| 午夜福利免费视频| 亚洲三级电影在线播放| 欧美天堂久久| 97se亚洲综合不卡| 成人免费视频一区| 亚洲色图欧美一区| 国产欧美日韩视频怡春院| 国产亚洲精品yxsp| 久久黄色免费电影| 欧美国产综合视频| 天堂av综合网| 成年免费在线观看| 国产美女精品在线| 露脸一二三区国语对白| 亚洲美女久久| 国产区福利小视频在线观看尤物| 亚洲一区免费看| 幺女国产一级毛片| 亚洲成网777777国产精品| 高清乱码精品福利在线视频| 麻豆精品在线播放| 国产在线精品99一区不卡| а∨天堂一区中文字幕| 久久国产热| 亚洲aaa视频| 欧美日本激情| 国产极品粉嫩小泬免费看| 夜夜操国产| 欧美午夜一区| 国产18在线| 91免费在线看| 亚洲视频一区| 国产女同自拍视频| 亚洲日韩精品无码专区| 国产欧美中文字幕| 久久精品无码一区二区日韩免费| 婷婷开心中文字幕| 91色综合综合热五月激情| 亚洲欧美在线综合图区| 欧美在线视频不卡第一页| 亚洲一区二区三区中文字幕5566| a级毛片免费看| 最新午夜男女福利片视频|