999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Logistic模型的企業公共信用綜合評價方法研究

2023-04-29 17:28:54顧遵雷
信息系統工程 2023年5期
關鍵詞:信用評價研究

顧遵雷

摘要:公共信用綜合評價是政府部門實施分級分類監管,構建以信用為基礎的新型監管機制的重要支撐,在提高跨部門資源整合能力、優化資源配置、防范化解風險等方面發揮了積極作用。在充分研究、借鑒國內外、業內外信用評級優秀做法基礎上,結合實際情況,基于Logistic模型,利用公共信用數據,對企業公共信用綜合評價指標和方法進行研究和探索,并對評價模型進行驗證分析。

關鍵詞:信用評價;邏輯回歸;研究

一、前言

(一)研究背景和意義

公共信用綜合評價是政府部門實施分級分類監管的重要依據,是構建以信用為基礎的新型監管機制、推進社會信用體系建設高質量發展、促進形成新發展格局的的重要基礎。2019年7月,國務院辦公廳出臺《關于加快推進社會信用體系建設構建以信用為基礎的新型監管機制的指導意見》(國辦發〔2019〕35號),要求加強事前、事中、事后全流程監管。特別是在事中環節信用監管中,要求對市場主體開展全覆蓋、標準化、公益性的公共信用綜合評價,定期將評價結果推送至相關政府部門、金融機構、行業協會商會參考使用,并依照有關規定向社會公開。2022年3月,中辦國辦印發《關于推進社會信用體系建設高質量發展促進形成新發展格局的意見》指出要加快健全以信用為基礎的新型監管機制,全面建立企業信用狀況綜合評價體系,以信用風險為導向優化配置監管資源。

(二)研究思路和目標

1.研究的思路

研究借鑒金融機構信用評級、省內外公共信用綜合評價、相關行業信用評價工作實踐,對比分析評價指標,研究建立評價模型指標,采用回歸分析方法,利用樣本數據進行建模,并利用樣本外的數據,對模型的效力進行驗證。利用評價模型對市場主體進行評價,并對評價結果進行分析。

2.研究的目標

基于我省法人信用基礎數據庫,構建公共信用綜合評價指標,建立可行的、科學的評價模型,對我省企業進行公共信用綜合評價,支撐政府部門實施分級分類和精確有效監管[1]。

(三)研究的內容和方法

1.研究的內容

研究利用Logistic回歸模型建立公共信用綜合評價模型,主要包括:構建評價指標體系,對模型變量預測強度進行分析,構建評分模型,利用K-S值、GINI系數判斷模型的分區能力等。

2.研究的方法

(1)資料分析法。梳理分析國家及省關于社會信用體系建設、構建新型監管機制等文件要求,梳理借鑒國內外信用評級或信用評價的理論方法,為公共信用綜合評價提供制度和理論支撐。

(2)比較分析法。通過對兄弟省市、相關行業部門,以及第三方信用服務機構的信用評價方法進行比較分析,總結各自優勢、特點和經驗,提煉出對我省公共信用綜合評價的有用的思路、方法和模型。

(3)調查分析法。通過開展實地調研,學習借鑒先進做法和經驗,對現有數據進行分析歸納,建立評價指標,并邀請專家對指標選擇、模型設計等方面進行論證,使評價指標和模型更具科學性和權威性。

二、評分模型原理和方法

(一)選擇擬合函數

目前,常用建模方法非常多,如判別分析、線性回歸、邏輯回歸及分類樹等統計方法;或是機器學習、類神經網絡、基因算法及專家系統等非統計方法。由于公共信用綜合評價是通過企業的行為特征信息來預測其“好”與“壞”,因此本文采用邏輯回歸(Logistic)方法建立評分模型。logistic回歸是一種廣義線性回歸(generalized linear model),它是一種分類算法,用于解決因變量為二分類(0or1)或多分類問題的方法[2]。對于分類問題而言,其輸出因變量的范圍應該在(0,1)之間,選用Sigmod函數可以有效地擬合分類問題的期望輸出。Logistic回歸模型的適用條件:

1.因變量為二分類的分類變量或某事件的發生率。但是需要注意,重復計數現象指標不適用于Logistic回歸。

2.殘差和因變量都要服從二項分布。二項分布對應的是分類變量,所以不是正態分布,進而不是用最小二乘法,而是用最大似然法來解決方程估計和檢驗問題。

3.自變量和Logistic概率是線性關系。

4.各觀測對象間相互獨立。

(二)自變量處理和分析

1.自變量處理

(1)連續型變量分箱處理和WOE轉化

對于連續性變量進行分箱處理。首先按照頻數盡量平均分成多組,初步形成變量分組,然后在初步分組的基礎上合并相似組形成最終分箱[3]。分組合并時,需要按照如下標準進行:

①不同的分箱間好壞比例要有差異;

②單一變量應維持至多8個區間;

③每個分箱中的好/壞件數至少大于等于10;

④每個分箱中記錄數占比至少大于2%;

⑤每個分箱好壞比率的排序需要和業務常識保持一致。

其中③和④是通常情況下的標準,在特殊情況下,這兩個標準要求會適當提高或放松。

變量分箱完成后,對變量進行WOE轉換,用每個分組的WOE值替換原來的變量值。

(2)分類型變量的分箱和虛擬變量引入

對于分類型變量,可以將每個屬性作為一個分箱。Logistic回歸中分類變量需要使用啞變量來操作。

2.自變量分析

在建立模型的過程中,可以通過以下兩個指標對模型變量的預測強度進行分析。

(1)WOE(Weight Of Evidence)跡象權數,表示當前分箱中好壞客戶的各自占總體好壞客戶比例的差異,描述了預測變量與目標變量之間的關系。WOE絕對值越高,表示該組違約和正常企業區分度越高,反之,區分度越低[4]。

(2)IV(information value)信息值,又稱VOI(Value Of Information),用來表示變量預測能力的強度,可用于單變量篩選。IV越高,說明該自變量與因變量關聯度高,預測強度高,適合納入預測模型。

(三)參數估計

邏輯回歸模型的參數是用最大似然法估計。極大似然估計是一種統計方法,利用已知的樣本結果信息,反推最具有可能(最大概率)導致這些樣本結果出現的模型參數值。每個觀察值yi皆為0或1,因此,yi~Bernoulli(π),i=1,…, n(此為白努利分配,n為樣本數)。

(四)模型建立

邏輯回歸得到的是因變量為“1”和“0”比值的自然對數,即ln(odds),其中odds也稱勝算率。若要以分數形態呈現,必須要經過轉換,轉換公式為:

Score=ln(odds)×Scale+Location

轉換的步驟如下:

1.設定odds為某一固定值的分數為l;

2.設定odds每增加1倍時,相對增加的分數為p,此分數也成為了PDO(Point of double odds);

3.將odds=1:1和2:1時的分數套入公式,解方程可以得出Location 的值為l,Scale的值為p ln (2);

4.最后得到評價模型計算公式為:

Score=ln(odds)×? p? +l。

三、信用評分模型建立與實證分析

建模的步驟主要分為:模型設計、建模數據準備、變量選取、建立模型、模型評估、完成信用評分表。

(一)模型變量的設計

1.觀察期和表現期

(1)觀察時點(Observation Point)

觀察時點是指所需樣本選取的時間點,該時點下的企業信息即是評價模型用來評價客戶及預測企業將來是否發生失信的重要參考。

(2)觀察期間(Observation Period)

觀察期間是指開發樣本在觀察時點之前一段時間,該期間是對樣本信息進行觀察和提煉的時期。本課題選取的觀察期間為12個月。

(3)表現時點(Outcome Point)

表現時點是最終判斷樣本屬于失信或非失信的時間點。

(4)表現期間(Outcome Period)

觀察時點至表現時點這段時間為表現期間。表現期是對觀察點上企業進行監控的時間周期,該期間內企業會被分類成失信企業、非失信企業或無法確定。

2.失信企業的表現定義

在表現期間存在行政處罰記錄、執行案件記錄(未履行案件)、失信被執行人記錄、聯合懲戒記錄的企業視為失信企業。沒有上述信息的企業視為非失信企業。

3.排除規則

模型開發樣本應具備群體代表性,而且必須有準確的預測信息和表現信息,才能使模型更加準確。因此對于一些特殊企業,如已被注銷、吊銷的企業,其行為無法預測,將不包含在評分模型開發中。

(二)建模數據準備

從全部數據中抽取兩類樣本:開發樣本和檢驗樣本。開發樣本時建立模型的實際數據集。檢驗樣本用于檢驗模型的穩健性。本次共選取50萬家在業企業作為樣本數據,70%為開發樣本,30%為驗證樣本。

(三)變量分析及選取

對影響企業信用綜合評價結果的因素進行逐一分析,計算WOE和IV值,判斷指標預測強度,刪除預測強度低的指標。以注冊資金為例做如下分析:

該變量是連續性變量,對其進行分箱處理,并進行WOE轉化,計算IV值,得到結果如表1。

IV為0.34,該變量預測強度高,可納入評價模型。經過同樣的方法分析,納入模型的變量包括:注冊資本、成立年限、所屬行業、欠稅記錄條數、嚴重失信記錄條數、行政處罰條數、執行案件記錄條數、法定代表人嚴重失信記錄條數、法定代表人執行案件條數、關聯企業嚴重失信條數、關聯企業執行案件記錄條數。

(四)模型的建立

將樣例數據中表現期有失信記錄的企業因變量設為1,無失信記錄的企業因變量設為0。將樣例數據導入SPSS軟件進行回歸分析,得到結果如表2。

根據上表的回歸結果,結合每個指標的分值權重,在確定好標準評分、標準ODDS和PDO后,按照上文的轉換公式和轉換步驟,最終得到模型評分卡。

(五)模型的評估

1.區分度指標驗證

以注冊資金為例,利用不保留樣本數據計算模型的K-S值和基尼系數,以判斷模型的預測能力。按照該指標得分進行分段并由低到高排序,計算各分段失信企業占比累計與正常企業占比累計差值,K-S=MAX(失信企業占比累計-正常企業占比累計)。經計算,各指標K-S值和基尼系數均在可接受范圍內[5]。

2.群體穩定度指標驗證

群體穩定度指標(PSI)是用來衡量群體評分卡在開發群體時點與現行評分時點的評分對象的差異程度。按照PSI計算方法,各指標PSI計算結果顯示穩定度均在中等以上,驗證合格。

四、結語

本次研究,主要是基于Logistic模型,利用目前已歸集的公共信用信息,構建評價指標、建立評價模型。隨著公共信用信息歸集范圍不斷擴大,已經數據的不斷積累,今后將定期評估、完善評價指標,用新數據定期迭代評級模型,不斷修正評分卡,并定期發布企業公共信用綜合評價結果。

參考文獻

[1]劉開元.隨機森林與邏輯回歸模型在違約預測中的應用[J].信息與電腦(理論版),2016(21):111-112.

[2]阿明翰,張達敏,李偉.邏輯回歸在信用卡風險評估模型構建中的應用[J].內江科技,2016(9):41-42.

[3]徐喆.邏輯回歸模型在互聯網金融P2P業務信用風險的應用[J].統計科學與實踐,2015(11):26-29.

[4]姜明輝,許佩,任瀟,等.個人信用評分模型的發展及優化算法分析[J].哈爾濱工業大學學報,2015(5):40-45.

[5]朱艷敏.基于信用評分模型的小微企業貸款的可獲得性研究[D].蘇州:蘇州大學,2014.

作者單位:江蘇省戰略與發展研究中心

猜你喜歡
信用評價研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
試析電子商務環境下中小企業信用評價
淺析我國信用卡風險管理
基于AHP灰色關聯分析的企業電子商務信用評價研究
商(2016年25期)2016-07-29 21:07:14
基于校園一卡通的學生信用管理模型設計
主站蜘蛛池模板: 四虎影视无码永久免费观看| 国产青榴视频| 手机永久AV在线播放| 国产成人精品免费视频大全五级| 99精品在线看| 日韩美女福利视频| 亚洲国产欧美国产综合久久| 国产18在线| 狠狠色噜噜狠狠狠狠奇米777| 最新精品久久精品| 成人午夜免费观看| 日韩美毛片| 日韩午夜片| 亚洲综合亚洲国产尤物| 凹凸国产熟女精品视频| 日韩国产黄色网站| 美女扒开下面流白浆在线试听| 亚洲视频三级| 丁香亚洲综合五月天婷婷| 亚洲AV免费一区二区三区| 国模视频一区二区| 久久精品无码一区二区国产区| 一区二区三区成人| 一本大道香蕉久中文在线播放| 国产极品美女在线观看| 午夜天堂视频| 亚洲精品无码av中文字幕| 91精品国产情侣高潮露脸| 日本高清有码人妻| 国产9191精品免费观看| 国产成人夜色91| 欧美亚洲一二三区| 亚洲男人的天堂在线观看| 亚洲精品成人福利在线电影| 四虎成人免费毛片| 亚洲水蜜桃久久综合网站| 久久国产精品夜色| 4虎影视国产在线观看精品| 亚洲精品国产首次亮相| 自慰网址在线观看| av尤物免费在线观看| 久久一级电影| 国产亚洲视频免费播放| 午夜精品一区二区蜜桃| 嫩草国产在线| 99热线精品大全在线观看| 国产精品夜夜嗨视频免费视频| 欧美激情综合一区二区| 国产成人综合久久精品尤物| 成人毛片免费观看| 欧美视频在线第一页| 好紧好深好大乳无码中文字幕| 91毛片网| 55夜色66夜色国产精品视频| 日韩欧美中文字幕在线韩免费| 色婷婷在线影院| 国产第二十一页| 中文字幕中文字字幕码一二区| 欧美午夜在线观看| 永久免费AⅤ无码网站在线观看| 午夜欧美理论2019理论| 欧美一道本| 亚洲av无码牛牛影视在线二区| 日韩精品中文字幕一区三区| 精品少妇人妻无码久久| 国产精品亚洲片在线va| 日韩小视频网站hq| 亚洲成A人V欧美综合天堂| 啦啦啦网站在线观看a毛片| 国产一级毛片高清完整视频版| 久久久波多野结衣av一区二区| 4虎影视国产在线观看精品| 国产成熟女人性满足视频| 在线视频一区二区三区不卡| 成人蜜桃网| 激情乱人伦| 亚洲成人精品在线| 亚洲水蜜桃久久综合网站| 欧美精品一二三区| 久久精品国产在热久久2019| 激情無極限的亚洲一区免费| 国产一级视频久久|