徐凱 何金萍 萬春 黃迅



【摘 要】 文章以成都高新技術企業為研究對象,將不平衡樣本處理技術ADASYN與人工智能技術SVM相結合,構建ADASYN-SVM智能識別模型,對成都高新技術企業利潤操縱進行識別研究。研究結果表明:ADASYN技術能夠有效解決不平衡樣本問題,與SVM支持向量機、BMD貝葉斯判別、BP神經網絡、LR邏輯回歸等其他判別模型相比,ADASYN-SVM模型具有最優的識別性能。故運用ADASYN-SVM智能模型,能夠準確地對成都高新技術企業的利潤操縱行為進行有效識別。
【關鍵詞】 利潤操縱; 智能識別; ADASYN-SVM模型; 高新技術企業
【中圖分類號】 F224? 【文獻標識碼】 A? 【文章編號】 1004-5937(2019)07-0048-05
一、引言
成都作為西部地區經濟發展的重要引擎,承擔著技術創新、產業結構升級、推動西部經濟迅速崛起的重任[ 1 ]。而高新技術企業作為科技進步與創新的代表,正是引領成都實現經濟飛躍的重要動力[ 2 ]。然而,受利益驅使,部分企業通過利潤操縱行為進行非法盈余管理,這必然破壞金融資源在各企業間的公平有效分配,從而對西部地區產業結構的優化升級,甚至對新常態下中國經濟的持續健康穩定發展產生不利影響[ 3 ]。顯然,構建科學有效的模型對成都高新技術企業的利潤操縱行為進行識別研究勢在必行。
目前,學者們主要運用了單變量、多變量(Multiple Discriminant Analysis,MDA)、邏輯回歸、概率比回歸等傳統的統計模型以及以人工神經網絡(Artificial Neural Network,ANN)為代表的智能模型對企業的利潤操縱行為進行識別研究[ 4-8 ]。盡管都取得了良好的識別效果,但上述模型卻存在前提假設過于嚴格、易陷入局部最小、過學習、欠學習等眾多缺陷,從而一定程度上制約了上述模型在利潤操縱行為識別中的應用[ 9 ]。而人工智能領域的后起之秀——支持向量機(Support Vector Machine),由于具有全局最優、良好的泛化推廣性能、能有效處理小樣本問題等諸多優勢,受到廣大學者的認可,從而被廣泛應用于財務危機預警、違約風險判斷、信用風險識別等眾多研究領域,并取得了良好的研究效果[ 10-12 ]。因此,本文將引入SVM智能模型對成都高新技術企業的利潤操縱行為進行識別研究。
實踐中需要注意的是,未進行利潤操縱的企業往往較利潤操縱的企業更多,因而這兩類數量不同的企業樣本構成了一組不平衡樣本。當SVM在面對這樣一組不平衡樣本建模時,由于更容易受以未進行利潤操縱的多數類企業樣本信息的影響,從而使得識別結果更傾向于多數類樣本,因此不利于監管者準確地掌握企業的經營行為[ 13 ]。因此,解決不平衡樣本問題就成為SVM建模的關鍵。而合成少數類過采樣技術(Synthetic Minority Over-sampling Technique,SMOTE)作為不平衡樣本處理方法中最為經典的一類方法,其良好的處理性能已獲得廣大學者的認可[ 14 ]。但SMOTE在樣本生成過程中,由于忽略了鄰近樣本的分布特征,使得生成的少數類樣本往往出現較多重疊信息,從而使得SMOTE方法的應用出現挑戰。令人欣喜的是,隨著研究的不斷深入,已有學者開發出自適應合成抽樣方法(Adaptive Synthetic Sampling Approach,ADASYN),通過利用少數類樣本的密度分布來有效生成少數類樣本,從而克服了SMOTE方法的缺陷[ 15 ]。因此,本文針對SVM模型的不平衡樣本問題,將引入ADASYN方法進行克服,從而提升SVM模型在利潤操縱行為識別上的性能。
基于上述分析,加之前期筆者曾利用改進Z模型和FSVM模型對財務危機進行預警研究[ 16-17 ],本文以成都高新技術企業為研究對象,將ADASYN與SVM人工智能技術相結合,提出ADASYN-SVM智能模型,并對成都高新技術企業利潤操縱進行研究,從而為成都市政府高效準確地監管高新技術企業的經營行為提供良好借鑒。
迄今為止,圍繞利潤操縱識別問題,已有部分學者開展了卓有成效的研究:李延喜等[ 18 ]針對中國上市公司,從財務指標異常的視角展開了企業利潤操縱行為的識別研究,但并未構建科學有效的識別模型;姚宏等[ 19-21 ]分別運用了主成分分析法、貝葉斯判別法以及邏輯回歸模型對中國上市公司利潤操縱行為的識別進行了建模;李雙杰和陳星星[ 8 ]引入BP神經網絡模型對中國上市公司的利潤操縱進行了智能識別。盡管上述研究都取得了良好效果,但他們并未對不平衡樣本問題展開研究,也未引入SVM人工智能技術建立識別模型,同時更未針對成都高新技術企業展開研究。本文與上述研究文獻相比,具有顯著的差異性。
二、ADASYN-SVM利潤操縱識別方法
(一)SVM智能方法介紹
假設xi=(xi1,xi2,…,xik)為刻畫高新技術企業利潤操縱識別行為的指標變量。其中,i=1,2,…,n,表示共n家高新技術企業,yi∈{+1,-1}表示企業i是否進行利潤操縱的狀態指標。若“+1”代表高新技術企業i進行了利潤操縱,則“-1”代表未發生利潤操縱。于是,指標變量X與狀態指標Y就組合成樣本集合(X,Y)。然后基于yi((wTxi)+b)+ξ≥1的前提條件,就能夠求解如下最優問題:
三、實證研究
(一)樣本選擇
本文以中國A股市場中的成都高新技術上市公司為研究對象,從Wind上市公司違規數據庫中獲得利潤操縱上市公司樣本。對未進行利潤操縱上市公司的樣本選擇其2016年相關指標變量來進行識別建模。對利潤操縱上市公司,一方面選擇其利潤操縱年份前一年的相關指標變量進行識別;另一方面選擇屬于利潤操縱上市公司但其在2017年并未進行利潤操縱的公司,用其在2016年的相關指標變量來進行識別建模。因此,未進行操縱上市公司的樣本有63個,利潤操縱上市公司樣本最終有29個,不平衡樣本比例為2.17:1。
(二)指標變量選擇與提取
為選擇能夠準確刻畫企業利潤操縱行為的指標變量,本文借鑒李雙杰和陳星星(2013)的研究成果,共選擇了27項指標變量對利潤操縱行為進行刻畫,具體見表1。由于指標變量較多,易引發數據冗余問題,故本文運用主成分分析方法對指標變量進行提取。最終提取出9個指標變量,其累積貢獻率能達到80%以上,表明提取的指標變量信息能夠涵蓋原始指標變量80%的信息,具有較強的代表性。
(三)實證結果與分析
在獲得成都高新技術企業樣本數據集的基礎上,為更科學有效地開展利潤操縱識別的實證研究,本文基于十折交叉驗證法進行驗證。同時,本文將ADASYN-SVM與SVM、貝葉斯判別(BMD)、邏輯回歸(LR)、BP神經網絡(BPNN)進行實證對比研究,從而展示ADASYN-SVM模型優越的識別性能。本文的實驗皆通過Matlab2015b編程軟件完成。實證結果如表2和圖1所示。從表2和圖1可以發現,從準確率來評價,本文提出的ADASYN-SVM具有最高的準確率;從一類錯誤來評價,盡管本文提出的ADASYN-SVM一類錯誤較SVM和BPNN低,但卻較BMD和LR高。一類錯誤代表的是未進行利潤操縱的高新技術企業被識別錯誤的概率,這并非是政府監管層所關注。他們最為關注的還是由二類錯誤代表的利潤操縱企業被識別錯誤的概率,從表2和圖1可以明顯發現,ADASYN-SVM的二類錯誤遠遠低于其余模型的二類錯誤。由此可見,本文提出的ADASYN-SVM模型具有最優的識別性能,同時也證明了ADASYN能夠非常有效地克服不平衡樣本問題。
進一步,為了檢驗本文提出的ADASYN-SVM模型的識別準確率和二類錯誤與其余模型之間的差異是否顯著,本文對各模型的性能評估結果進行了配對樣本T檢驗,結果如表3和表4。從表3和表4可以發現,本文提出的ADASYN-SVM在識別準確率上顯著高于LR和BPNN模型,而在二類錯誤上顯著低于其他所有模型,從而證明了ADASYN-SVM模型在識別性能上顯著優于其他模型。
四、結論
為對成都高新技術企業的利潤操縱行為開展識別研究,本文首先引入ADASYN技術解決不平衡樣本問題,進而引入SVM智能技術進行識別模型的構建并開展實證研究。結果表明,相較貝葉斯判別模型、邏輯模型、BP神經網絡以及SVM模型,本文提出的ADASYN-SVM在識別準確率上顯著高于其他識別模型,而在二類錯誤率上卻顯著低于其他識別模型,從而表明ADASYN技術能夠有效地解決不平衡樣本問題,并提升SVM對高新技術企業利潤操縱的識別性能。
基于上述分析,本文認為,運用ADASYN-SVM智能模型,能夠準確地對成都高新技術企業的利潤操縱行為進行識別,從而有助于提升成都政府部門對成都高新技術企業經營監管的科學性與有效性,對推動成都金融經濟持續、健康、高效發展具有重要的理論指導和現實意義。
【參考文獻】
[1] 余麗霞,張志英,張麗宇.成都構建區域性金融中心的SWOTE分析[J].軟科學,2010,24(8):82-87.
[2] 羅雨澤,羅來軍,陳衍泰.高新技術產業TFP由何而定?——基于微觀數據的實證分析[J].管理世界,2016(2):8-18.
[3] 肖成民,呂長江.利潤操縱行為影響會計穩健性嗎?——基于季度盈余不同匯總方法的經驗證據[J].會計研究,2010(9):17-24.
[4] FITZPATRICK P.A comparison of the ratios of successful industrial enterprises with those of failed companies[R].The Accountants Publishing Company,1932.
[5] ALTMAN E A. Financial ratios,discriminate analysis and the prediction of corporate bankruptcy[J].Journal of Finance,1968,23(4):589-609.
[6] OHLSON J A.Financial ratios and the probabilistic prediction of bankruptcy[J]. Journal of Accounting Research,1980,18(1):109-130.
[7] LAITINEN E K .Predicting a corporate credit analyst's risk estimate by logistic and linear models[J].International Review of Financial Analysis,1990,8(2):97-121.
[8] 李雙杰,陳星星.基于BP神經網絡模型與DEA模型的中國上市公司利潤操縱研究[J].數理統計與管理,2013,32(3):440-451.
[9] 楊海蘭,周培祥.基于SVM的中國家族企業引入外部職業經理人風險預測研究[J].經濟體制改革,2017(5):122-128.
[10] 張貴生,張信東.基于近鄰互信息的SVM-GARCH股票價格預測模型研究[J].中國管理科學,2016,24(9):11-20.
[11] 肖斌卿,柏巍,姚瑤,等.基于LS-SVM的小微企業信用評估研究[J].審計與經濟研究,2016(6):102-111.
[12] 衣柏衡,朱建軍,李杰.基于改進SMOTE的小額貸款公司客戶信用風險非均衡SVM分類[J].中國管理科學,2016,24(3):24-30.
[13] AKBANI R, KWEK S, JAPKOWICZ N. Appling support vector machines to imbalanced datasets[M]// The 15th European Conference of Machine Learning.New York:Springer-Verlag,2004:39-50.
[14] CHAWLA N, BOWYER K, HALL L, et al. SMOTE: Synthetic minority over-sampling technique[J].Journal of Artificial Intelligence Research,2002(16):321-357.
[15] HE H, BAI Y, GARCIA E A, et al. ADASYN: Adaptive synthetic sampling approach for imbalanced learning[C]//Proc. Int'l J. Conf. Neural Networks,2008:1322-1328.
[16] 徐凱,邱煜,黃月娥.基于改進Z模型的財務危機預警研究:來自醫藥行業上市公司的經驗證據[J].會計之友,2014(33):66-69.
[17] 徐凱,黃迅,劉金彬.基于最優模糊SVM的財務危機預警研究:來自成渝經濟區上市公司的經驗證據[J].會計之友,2015(12):73-77.
[18] 李延喜,姚宏,高銳.上市公司利潤操縱行為識別模型研究[J].管理評論,2006,18(1):3-9.
[19] 姚宏,李延喜,高銳.基于主成分分析的上市公司利潤操縱識別模型[J].管理科學,2007,20(5):83-91.
[20] 李延喜,高銳,包世澤,等.基于貝葉斯判別的中國上市公司利潤操縱識別模型研究[J].預測,2007,26(3):56-60.
[21] 姜金玲,李延喜,高銳.基于logistic的上市公司利潤操縱行為識別模型研究[J].經濟管理,2008,30(19):77-82.
[22] 宋新平,丁永生.基于最優支持向量機模型的經營失敗預警研究[J].管理科學,2008,21(1):115-121.