王威 劉芬



【關鍵詞】 模糊間隔孿生支持向量機; 財務危機; 預警模型
【中圖分類號】 F275? 【文獻標識碼】 A? 【文章編號】 1004-5937(2021)22-0079-08
一、引言
財務危機是指企業無力償還到期債務或支付經營費用而面臨破產的一種現象[ 1 ]。面對日益復雜的市場環境,許多看似財務健康的企業往往會突然陷入困境,這一方面嚴重影響了企業的正常經營,另一方面也給企業股東和利益相關者帶來極大的損失。因此,在財務危機發生之前發出預警,提醒企業規避可能發生的財務風險,對企業經營管理來說具有重要的意義。但從我國證券市場的歷史來看,在財務危機出現之前,一般很難從企業經營過程中發現直接的證據。如何根據企業的內外部影響因素合理構建預警模型,有效地發現和防范可能出現的企業財務危機成為學術界研究的一個熱點問題。
從本質上來說,企業財務危機預警屬于典型的二分類問題,現有的預警方法主要包括兩大門類:統計學分析方法和機器學習方法。傳統的財務危機預警模型主要是基于統計學分析方法,其中應用較為廣泛的是Logistic模型。其主要優點是計算比較簡單,同時模型具有較好的解釋性。Ohlson[ 2 ]使用Logistic模型對企業財務危機預警進行研究,證明了其有效性;方匡南等[ 3 ]考慮企業財務指標間的網絡結構關系,構建了基于網絡結構的Logistic模型;肖振紅和楊華松[ 4 ]針對財務危機預警模型中指標信息冗余及Logistic模型預測精度問題,提出了基于L1/2正則化Logistic回歸的上市企業財務危機預警模型;楊貴軍等[ 5 ]針對財務數據質量檢測問題,提出基于Benford-Logistic企業財務風險預警模型等。但Logistic模型在企業財務危機預警中仍存在一些難以克服的缺陷:一是基于線性模型,難以處理財務危機預警這種非線性問題;二是對樣本數量要求比較高,實踐中難以獲取大量合適的樣本來滿足模型要求;三是難以解決解釋變量的多重共線性對預警性能的影響等。這都嚴重限制了Logistic模型在財務危機預警中的應用范圍。
隨著人工智能技術的發展,機器學習方法在財務危機預警領域獲得了迅速發展。其中最具代表性的是支持向量機(Support Vector Machine,SVM),主要思想是VC維和結構風險最小化。SVM在處理財務危機預警這種小樣本、非線性和高維數據分類問題中體現出特有優勢。Shin等[ 6 ]分別使用SVM和神經網絡方法進行了財務危機預警研究,結果證明對于此類小樣本問題,SVM有更好的效果;Gestel等[ 7 ]根據荷蘭企業的財務數據,使用SVM模型進行了財務危機預警;王妹禧[ 8 ]利用雙正交混合核函數修正SVM進行財務危機預警;石先兵[ 9 ]綜合主成分分析法與SVM構建財務危機預警模型,以滬深A股主板t-3年的制造業上市企業財務數據為研究樣本展開預測等。這些研究都證明SVM在財務危機預警中的良好效果。然而,SVM在實際應用中也遇到了一些難點,首先是樣本的數據不平衡問題。財務危機的定義很多,考慮到國內上市企業所處經濟與監管的環境,本文將發生財務危機的企業定義為因為財務狀況和其他財務狀況異常被滬深證券交易所進行特別處理(Special Treatment,ST)的上市企業,并由此展開研究。根據中國證監會截至2019年12月的數據,中國歷年上市企業ST的比例只占總數約1%,因此樣本數據的類別分布極不均衡。在這種情況下,如使用隨機抽樣,SVM方法分類的結果會偏向多數類樣本,忽略了更為重要的少數類樣本。因此,在以往大多數研究中,通常會使用一一配對的非隨機抽樣解決這個問題,但這樣又會高估模型的預警性能。其次是“異常”樣本的影響。受到人為或市場的影響,財務危機樣本數據中會出現一些無法完全剔除的野值和隨機噪聲的影響,由于SVM是通過同等對待所有樣本數據來構造決策超平面,這些野值和噪聲造成的擬合現象,也會對分類的精度和穩健性產生較大影響。
隨著科學技術的進步,各種SVM的改進方法紛紛被提出。Jayadeva等[ 10 ]提出了孿生支持向量機(Twin Support Vector Machine,TSVM),其將原有的SVM問題轉化為兩個較小的凸規劃問題,構建兩個相互不平行的超平面,有效地減少了計算的復雜度。在此基礎上,為減弱噪聲數據的影響,Gao等[ 11 ]將模糊隸屬度的概念與孿生支持向量機相結合,并在其中引入間隔以使結構風險最小化,提出了模糊間隔孿生支持向量機(Fuzzy Margin Twin Support Vector Machine,FMTSVM),為SVM的應用提供了新工具。
因此,為解決SVM在財務危機預警應用中存在的問題,本文提出將FMTSVM引入企業財務危機預警領域展開研究。目的主要包括三點:一是利用其雙決策超平面的特性,通過對不同類型樣本數據設置不同的懲罰系數來減少財務危機預警中樣本數據不平衡對預警精度造成的影響;二是根據樣本數據特征,考慮不同類型中各樣本點作用的差異,通過給單個樣本設置不同的模糊隸屬度來消除財務危機預警中野值和噪聲等異常樣本數據對預警結果的影響;三是通過把原有SVM預警模型中的二次規劃問題轉換為兩個凸規劃問題進行求解,提高預警模型的學習效率,有效地縮短分類時間。從已掌握研究文獻來看,現有對FMTSVM模型的研究還是以對算法的改進和優化為主,未發現有文獻運用該模型對企業財務危機預警問題展開研究,本文的研究具有一定的創新性。
二、模型與方法
(一)FMTSVM模型
給定(xj,yj)為財務危機預警樣本數據的集合,j=1,…,m。其中yj∈{-1,1}為預警變量,用來表示企業在短時間(1—3年)內發生財務危機的情況;xj∈Rn為解釋變量,用來表示企業相應的財務和非財務指標;m個樣本數據中包含m1個yj=1的正樣本(財務危機企業)和m2個yj=-1的負樣本(正常企業)。由此,正樣本數據點的集合可用矩陣A∈Rm ×n來表示,負樣本數據點的集合可用矩陣B∈Rm ×n來表示。同時在樣本集中引入一個模糊變量sj,0