曾梓銘
(桂林電子科技大學 商學院,廣西桂林 541004)
農業供給側結構性改革使現代農業體系不斷完善發展,農業產業化速度和規模空前提升,農業中小企業的融資需求不斷增加,從而催生出龐大的農業融資市場。然而,由于農業中小企業自身普遍存在信用弱、抵押物少、資金周轉困難等問題,加上農產品具有價格波動大、生產周期長、易腐爛變質等特點,使其很難向商業銀行獲取融資。供應鏈金融的出現,為解決農業中小企業融資難問題提供了新途徑。供應鏈金融以整條供應鏈為考察對象,改變了傳統的風險管理模式,將針對單個企業的風險管理轉為對整條供應鏈的風險管理。
然而,由于信息不對稱,商業銀行對于農業中小企業的營運情況、盈利狀況等信息掌握不完全,融資過程存在較大不確定性,容易引發信用風險。同時,加上信用風險在供應鏈上具有傳導性,單個企業的信用風險容易傳染到供應鏈上其他企業,使風險危害成倍擴大,對供應鏈穩定運作產生沖擊。我國農業供應鏈金融處于發展初期,商業銀行對利用供應鏈金融進行融資的農業中小企業的資信水平評估尚不成熟,農業中小企業仍存在較高的信用風險。因此,如何有效提高供應鏈金融信用風險評估水平,降低貸款風險的發生,是農業供應鏈金融健康發展的關鍵。
在供應鏈金融風險評估方法上,胡海青等(2011)[1]結合核心企業信用狀況和供應鏈關系,發現基于SVM的信用風險評價模型在供應鏈金融風險評估中更具有優越性。吳屏等(2015)[2]通過歸納線上供應鏈金融風險因素的特征,建立基于BP神經網絡的信用風險評估體系并驗證了其有效性。逯宇鐸等(2016)[3]以汽車上市中小企業為研究樣本,運用Lasso-logistic模型進行變量篩選和參數估計,得出了較高的評估準確率。戴昕琦(2018)[4]結合線上供應鏈金融融資模式特點,利用隨機森林模型與SMOTE 算法構建信用風險評估模型,證明了基于C-SMOTE算法的隨機森林模型能顯著降低商業銀行線上供應鏈金融風險。李健等(2019)[5]以汽車供應鏈作為樣本,運用隨機森林模型和盲數理論篩選變量,并通過對比多種評估模型的預測效果,發現PSO-SVM模型具有較高的預測準確率。
在農產品供應鏈金融的研究上,方煥等(2017)[6]在理論分析的基礎上,構建Logistic模型來預測農業類企業的違約情況,為供應鏈金融信用風險評估提供了新的理論思路。楊軍等(2017)[7]對農業中小企業的三種融資模式進行分析,并構建Logistic模型對農業供應鏈金融信用風險進行評估。鄒建國等(2019)[8]運用主體加債項的評估方法,結合主成分分析和Logistic回歸度量供應鏈金融模式下的農戶信用增進。
綜上所述,眾多學者對供應鏈金融信用風險的評估方法進行了多方面研究,但在農業供應鏈金融信用風險評估上,大多學者仍然采用Logistic模型。隨著計算機技術的發展,機器學習算法開始廣泛應用于信用風險評估,并取得良好效果。鑒于此,以農業中小企業為研究樣本,將SVM模型用于構建農業供應鏈金融信用風險評估體系,以提升評估準確率。
通過對以往文獻采用的評估指標進行歸納和總結,結合醫藥供應鏈金融信用風險的特征,篩選出如下指標:凈資產收益率(X1)、資產報酬率(X2)、資產凈利率(X3)、銷售凈利率(X4)、成本費用利潤率(X5)、資產負債率(X6)、流動比率(X7)、速動比率(X8)、產權比率(X9)、現金流動負債比(X10)、營業收入增長率(X11)、營業利潤增長率(X12)、凈利潤增長率(X13)、總資產增長率(X14)、存貨周轉率(X15)、應收賬款周轉率(X16)、流動資產周轉率(X17)和總資產周轉率(X18)。
由于選取了18個初始變量,變量維數較高,無論是使用經典計量算法或機器學習算法,都存在模型指標的高相關性和高維性,導致模型擬合過度、參數估計無效等后果。因此先對變量進行因子分析,提取出具有主要解析能力的變量,再利用得到的變量進行實證分析。
1.Logistic模型。Logistic模型受自變量的多維相關性影響很大,需要先采用因子分析法,減少變量之間的相關性,選出有代表性的自變量。Logistic回歸模型的前提是企業的守約概率服從Logistic分布,把供應鏈金融信用風險評估體系中一系列指標(Xk,k=n)作為自變量,通過建立Logistic回歸模型預測企業是否有違約風險。Logistic模型的Y作為因變量,只有0和1兩個取值,0為違約,1為守約。
2.SVM模型。支持向量機(SVM)是機器學習方法中常用的分類模型,近幾年廣泛應用于信用風險研究。支持向量機的原理是尋找一個最優分類超平面分割訓練樣本,確保最小的分類錯誤率。分類超平面表示為:

其中w是可調整的權值向量,b是偏置。歸一化后,使線性可分的樣本集合(xi,yi),xi∈Rn,n是樣本數量,yi∈{+1,-1}(i=1,2,…,n),滿足:

支持向量機的核心思想是盡可能使兩個分開的類別具有最大間隔,這樣才能使分隔有更高的可信度,使新樣本有更好的泛化能力。由兩個平面距離推導可得分類間隔為2/‖w‖,即‖w‖最小化等價于分類超平面最大化。為了方便后續求導和計算,進一步等價于‖w‖2/2最小化。使式(2)等號成立的樣本點叫做支持向量,滿足條件(2)的最小超平面被稱為最優分類超平面。
通過選取58家上市農業中小企業為研究對象,利用RESSET數據庫獲取企業2017-2018年度相關數據。在116個樣本中,違約樣本為78個,無違約樣本為38個。
在做因子分析之前,需要檢驗各變量之間的關聯度,判斷變量是否適合做因子分析。利用變量做KMO和Bartlett檢驗,得到KMO值為0.731(KMO>0.6),說明適合做因子分析。利用最大方差旋轉分析法,得到前5個因子的累計方差貢獻率為81.4%,表明這5個因子能夠較好地反應所有變量信息。因此,選取前5個因子作為初始變量,進行實證分析。
1.基于 Logistic 模型的信用風險評估。運用Logistic模型,將上述因子分析得到的5個主因子作為自變量,企業信用水平作為因變量進行回歸分析,得到回歸結果如表1。

表1 方程中的變量
根據表1結果可知,最終篩選出F1、F3、F4和F5這四個變量,可以得出Logistic回歸模型的概率方程為:

從表2可知,模型對違約企業判別的準確率為76.3%;對無違約企業判別的準確率為94.9%,模型的總體評估準確率為88.8%。經進一步計算,Logistic模型的第一類錯誤率為23.7%,第二類錯誤率為5.1%。

表2 Logistic模型評估結果
2.基于SVM的信用風險評估。同樣將提取的5個主因子作為解析變量,運用Python3的Anaconda科學計算平臺構建SVM模型,對116個樣本進行信用風險評估。為了確保模型的有效性,對選取81個樣本(接近總樣本數的70%)作為訓練集,用于構造SVM模型;選取35個樣本作為測試集,以檢驗模型的泛化能力。
SVM分類模型引入核函數能夠實行高維空間的內積運算,從而解決非線性分類。通過選擇合適的核函數和調節相關參數,可以提高SVM分類模型的預測準確率。本文選擇徑向基核函數(RBF)來實現SVM模型在高維空間的內積運算,并綜合考慮最大分類間隔和最少錯分樣本,在高維空間構造軟間隔,采用交叉驗證方法確定參數C=80,gamma=0.1。
以訓練集112家企業的數據為基礎,將5個主因子作為輸入向量進行訓練,使用徑向基核函數(RBF)建立SVM預測模型。運用得到的RBFSVM模型對測試集樣本進行測試,預測效果如表8。

表3 SVM模型評估結果
由表3可知,模型對訓練集樣本的評估準確率為93.8%,對測試集樣本的評估準確率為94.3%,模型的總體評估準確率為94.0%。經進一步計算,可得SVM模型總體第一類錯誤率為10.5%,第二類錯誤率為3.8%。
3.兩種模型評估結果對比。由表4可知,SVM模型的總體預測準確率為94.0%,比Logistic模型高了5.2%,說明SVM模型具有更高的評估準確率。第一類錯誤率表示對違約樣本的識別能力,因此第一類錯誤率通常比第二類錯誤率更重要。SVM模型的第一類分類錯誤率為10.5%,比Logistic模型低了13.3%,表示SVM能更加有效地識別違約企業,滿足商業銀行對中小企業信用風險評估的要求。

表4 評估結果對比
本文以上市農業中小企業為研究樣本,構建供應鏈金融信用風險評估體系,并分別運用Logistic模型和SVM模型進行信用風險評估。結果表明,SVM模型的總體評估準確率比Logistic模型高了5.2%,第一類分類錯誤率低了13.3%,證明了在農業供應鏈金融下SVM模型的優越性和有效性,為農業供應鏈金融信用風險評估提供了新方法。