秦春艷 李道波 王 鈺 袁 勛
(西南財經大學天府學院,四川 綿陽 621000)
新三板市場的開辟為很多中小微企業提供了新的融資渠道,但是調查結果顯示,銀行貸款仍然是中小微企業融資的主要手段,由于銀行跟企業之間的信息不對稱,造成了中小微企業很難獲得銀行貸款,影響企業經營,對中小微企業進行合理的信用評級十分必要,本文力求建立適合于中小微企業的信用評級體系和計算方法,對中小微企業進行信用評級。
企業信用評級的數據一般是各個企業的年份型數據,數據離散程度較高,很多模型要求數據服從正態分布,因此這類模型用于信用評級誤差較大。Logistic 回歸分析方法對數據的要求不高,不必要數據服從正態分布,所以適合于信用評級。很多學者嘗試利用Logistic 回歸分析方法進行信用評級。石慶焱等(2004)利用Logistic 回歸分析方法與判別分析、線性規劃、神經網絡模型對比,發現神經網絡模型的準確率最高,Logistic 回歸分析穩定性最高。李志輝等(2005)將Logistic回歸分析方法與主成分分析法、Fisher、BP 神經網絡模型作比較,發現Logistic 回歸分析對商業銀行風險識別和預測能力較強。
機器學習,神經網絡模型在信用評級中一般準確率較高,但是往往需要的數據較多,而且對過程的解釋力不強。Logistic 回歸分析的信用評級方法不僅可以用來預測分類,還能進行變量的選擇,參數估計,結果解釋性強,操作方便,對數據沒有太多要求。Logistic 回歸分析方法對數據個數與變量個數有要求,一般要求自變量個數少于分類最少的類別個數的1/10,因此自變量個數一般不能太多,然而信用評級的指標體系一般指標個數多,往往都是20 個以上,就要求樣本個數在1000 個左右,一般實際比較難達到這樣的數據要求,因此很多研究者采用主因子分析的方式對變量進行降維,因子分析降維具有一定的隨機性,對數據要求較高,大樣本情況下很難達到,往往結果并不理想,且結果解釋往往不合實際。本文力求尋找一種更加簡單便捷且解釋力強的降維方法,求解小樣本情況下的信用評級問題。
有序Logistic 回歸指因變量為有序的多分類數據,通過擬合“因變量水平數-1”個二分類的Logistic 回歸的方法進行預測,一般稱為累計logit 模型。以因變量4 個水平為例,假設因變量取值為1,2,3,4,5,6,對應概率分別為P1,P2,P3,P4,m 個自變量的模型如下:
本文收集了2022 年底四川省新三板上市的98 家企業財務和非財務數據,刪除數據不全的6 家企業,還剩92 家企業。選取的財務指標有流動比率、速動比率、資產負債率、經營現金流量負債比、產權比率、總資產報酬率、凈資產收益率、盈余現金保障倍數、成本費用利用率、應收賬款周轉率、存貨周轉率、總資產周轉率、固定資產周轉率、流動資產周轉率、總資產增長率、凈利潤增長率、營業收入增長率、營業利潤增長率、參保人數、成立年限、注冊資本、專利信息、商標信息、著作權、軟件著作權、供應商客戶數量、控股企業個數、對外投資次數、行政處罰次數、被執行金額等32 個指標作為評級指標,利用下面的公式對數據進行標準化處理。
由于指標比較多,樣本量相對較少,因此需要對變量進行降維。首先利用SPSS 軟件,通過因子分析提取主成分的方法進行降維,結果如表1 所示。

表1 因子分析總方差解釋
由表1 可知,由于變量較多,數據量較大,因此變量之間的相關性不是很強,因子分子的降維效果不好,只提取了75.903%的信息,損失信息較多。再通過成分矩陣發現,因子分子降維后的變量比較難解釋其實際意義。這也是信用評級問題普遍遇到的問題,變量太多須要降維,而因子分析的結果并不理想。因此本文嘗試先利用經濟學知識主觀建模,再使用熵權法對變量進行降維。
首先從經濟學角度出發,利用財務報表相關知識主觀對指標進行分類,這種分類方式雖然主觀,但是結果往往科學、合理、解釋力強,再結合相關性分析,去掉多余變量,建立指標體系。然后利用熵權法計算各三級指標在二級指標中的權重(見表2)。

表2 三級指標熵權法權重
熵權法計算過程如下:
(1)熵值
(2)區分度
(3)權重
然后利用下面的算式計算二級指標變量值:
其中εi表示各變量在二級指標中的權重,Zi是標準化之后的數據。
表3 為降維后的部分數據形式,由表4 可知,降維后的指標相關性較差,與因變量信用等級都是正相關,均通過了p=0.05 的假設檢驗,作為評級指標體系比較合理,適合進行回歸分析。

表3 熵權法降維后部分數據

表4 降維后二級指標的相關性分析
首先將啟信寶網站各個企業綜合得分作為因變量,本文利用SPSS 軟件有序Logistic 回歸,計算得到表5。

表5 Logistic回歸模型擬合信息
從表5 對模型中所有自變量的偏回歸系數全為0 進行似然比檢驗,結果p=0.00 <0.01,說明至少有一個自變量的偏回歸系數不為零,即至少有一個自變量與因變量的關系顯著,模型有意義。
表6 平行線檢驗即檢驗模型的系數與分割點是否相關,用于檢驗各個自變量對因變量的影響在各個方程中是否相同,是有序Logistic 回歸分析的前提,這里p=1 >0.01,說明各個回歸方程相互平行,可以使用有序Logistic 回歸分析進行分析。

表6 平行線檢驗
由表7 所有系數的P 值均小于0.01,所有系數有意義,所選自變量對因變量均有顯著影響。且各個自變量的系數均大于0,表示自變量水平提高時,會提高信用等級,例如償債能力因子系數108.82,表示企業的償債能力提高時,會提高信用等級的可能性很大。且償債能力的系數最大,說明償債能力是影響信用評級的最主要因素,償債能力指標涵蓋了流動比率和速動比率等因素,因此應該綜合分析企業狀況,并不是越高越好。本文測算結果與實際相符,說明計算結果可靠。根據表7 可以得到有序Logistic 回歸模型。

表7 有序Logistic回歸參數估算值
logitP1=96.145+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2)=109.71+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2+P3)=119.199+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2+P3+P4)=129.793+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
logit(P1+P2+P3+P4+P5)=139.366+108.82×x1+54.943×x2+39.556×x3+21.582×x4+26.173×x5+29.895×x6+30.226×x7+19.445×x8
同時計算得到有序Logistic 回歸分析預測正確率為95.6%,預測效果比較好。
本文再次利用神經網絡模型對上述熵權法降維后的數據進行預測。
由表8,各個變量系數均為正,因此都與因變量評級數正相關,且償債能力系數最大,對信用評級影響最大,與有序logistic 回歸結果一致,但是神經網絡訓練集正確率為92.2%,測試集準確率89.3%,不及logistic 回歸,且中間過程的解釋不如logistic 回歸明顯。

表8 神經網絡參數估算值
本文以四川省新三板上市的中小微制造企業為研究對象,嘗試建立一種合適的中小微企業的信用評級體系和方法,中小微企業和銀行之間建立信息關系,方便中小微企業向銀行貸款以及新三板市場融資。實踐證明主觀利用經濟學原理建立指標體系、熵權法降維、有序logistic 回歸預測信用等級的方法可行,指標體系解釋力強,logistic 回歸預測準確率高。償債能力是企業經營狀況的重要標識,也是企業信用評級的最強影響因素,預測結果與實際相符,因此本文建立的評級指標有效,模型測算方法值得參考。