姚文博 劉珊珊

摘 要:本文基于logistic回歸分析,結合上市公司財務數據,逐步明晰財務數據與非財務數據對舞弊行為識別的影響機制,并為應用大數據技術構建一個實用、精確的舞弊識別模型,完成實證性檢驗。以往研究表明,固定資產增長率、經營現金流量對流動負債比率、每股投資活動現金凈流量、每股收益、股權集中度五個財務指標的變動對財務舞弊產生重要影響。本文根據公司四大財務指標,通過對公司經營能力、償債能力、盈利能力以及發展能力的分析,選取具體財務指標與非財務指標對公司經營狀況以及舞弊狀況進行模型擬合。本文以2014年-2017年中國120家上市公司的財務數據為基礎量化指標,以此為樣本建立了公司舞弊的預測模型,隨機抽取20家上市公司財務數據驗證,驗證效果良好,模型具有可信性,并對模型進行評價與對大數據環境下的舞弊識別進行展望。
關鍵詞:Logistic回歸;財務舞弊;舞弊識別
一、文獻綜述
大數據時代的來臨對各行各業產生了廣泛深刻的影響,大數據技術應用也逐漸滲透在財務與審計領域。在此背景下將大數據技術應用于風險的前瞻和內部控制疏漏,特別是財務造假問題的防范尤為重要。在現有相關文獻的論述中,眾多學者展開了研究與探索,主要涵蓋以下方面:
1.舞弊理論與舞弊模型構建
基于“三因素論”、“GONE”理論典型的舞弊理論,學者嘗試構建并完善各類財務舞弊識別模型一般過程為指標選取、指標處理、模型構建、模型檢驗與評價。洪文洲等在基于Logistic回歸模型的上市公司財務報告舞弊識別研究構建了向后回歸法的回歸模型,研究了上市公司財務報告的識別。李清等提出了會計舞弊指數的構建基礎與構建方法,比較了Logistic模型與會計舞弊指數的優缺點。張曾蓮等基于壓力、機會和借口三因素綜合了強制性信息與自愿性信息,搭建了更為全面有效的預測指數體系,并選取了證監會發布的公司舞弊樣本對模型進行了實證檢驗。
2.大數據環境下的舞弊識別
內部審計作為一種審計監督機制的重要一環,在舞弊的識別與防范方面發揮重要作用。大數據時代的到來使得各大新型信息技術應運而生,應用此類技術可以輔助審計工作人員快速、精準地實現審計目標,迎來了機遇。與此同時,龐大的數據及其真實性問題的暴露也帶來了挑戰。馬瀅等從審計證據、程序、方法等六個角度分析了大數據環境下內部審計的機遇,從制度、人員、應用技術、硬件等六個維度闡釋了該環境帶來的挑戰,最終提出大數據審計是技術發展下審計的必然結果的觀點。大數據時代對公司的內部控制提出了更高層次的創新性要求。桑梅研究了大數據時代對審計模式與審計技術的影響,從內控思想、內控水平與共享性及人才資源三方面分析了存在的問題并指出了針對性的措施。在大數據時代,將大數據技術應用至內部審計與報表分析工作中成為一種新的趨勢與常態。造假識別方面,高健通過報表分析與大數據結合的思路,提出了從財務報告實施角度逆向發現信息失真的手段,為發現舞弊與提高會計信息質量提供了新思路。汪士果等通過挖掘數據集和會計舞弊紅旗標志、算法以及分類器評價方法的歸類比較,為審計工作中數據的選擇與模型的優化提供了借鑒意義。
二、基于Logistic回歸的舞弊識別模型構建
1.樣本選擇
考慮到近期存在舞弊行為的公司尚且沒有被監管機構認定,這兩者之間有一定的時滯性,故本文選取舞弊公司樣本來源于在2014年1月1日至2017年12月31日期間,受到中國證監會正式行政處罰的中國非金融業的A股上市公司,并選取在行業較為成熟的交易所上市公司作為配對樣本,因為其數據便于獲取,同時發生舞弊的可能性相對較小。在樣本選擇時進行了如下處理過程:
(1)樣本公司選擇原則:為了盡量降低客觀因素和無關變量的影響,需按照1:1的比例從中選擇行業規模與資產總額以及行業配對的60對舞弊與非舞弊公司,且差額浮動在10%以內,確保樣本的規模因素可能對模型構建產生的影響,共計120個樣本。在選擇樣本時,本文剔除了B股公司與金融企業,剔除了所有ST公司,且挑選在各行業內發展較為成熟的公司作為對比樣本。
(2)樣本數據選擇原則:財務數據選取舞弊公司被處罰當年的上一年年報數據,行業類型以及資產的規模則源于公司被處罰當年的信息列示公告,若在選定的時間范圍內連續舞弊,則綜合考慮舞弊典型性與敏感性,選擇最為典型的舞弊年份。本文樣本數據均來源自國泰安數據庫。
2.指標選取
上市公司舞弊是采用不同類型調節利潤的手段,可在財務與非財務各項指標的異常中得到體現。本文在已有文獻研究的基礎上,基于舞弊理論,從壓力、機會、借口與其他四方面入手選取指標。指標涵蓋財務指標與非財務指標。
壓力角度主要選取評價公司償債能力、經營能力、盈利能力、現金流情況、風險水平與發展能力的相關指標,對企業的財務狀況進行了較為全面的反映。機會角度選取公司治理綜合信息中股東數、股權制衡度、Z指數等指標以及三會召開情況。借口角度選取董事、監事、高管的年薪總額與持股比例等體現不同股權所有人利益關系的相關指標來衡量較難量化的高管心理動機所致行為。其他項目中選取審計信息變量,包括審計意見、審計費用、股票簡稱變更等管理指標。
在指標選取中,我們主要遵循如下原則:(1)非舞弊公司與舞弊公司差異顯著。指標務必在舞弊與非舞弊間存在顯著差異,有利于凸顯舞弊所致的指標差異,進而在后續統計分析中提升模型的準確程度。(2)數據完整性與連續性。一方面應考慮選取指標的覆蓋面盡可能完整,能夠全面客觀反映企業經營狀態,能夠在企業采用虛增理論,少記成本費用時發生較明顯變化。另一方面為了后續統計分析的操作可行性與準確性,本文剔除了樣本公司數據披露不完整、大面積缺失或未能查詢到舞弊年份前后完整數據的相關指標,最終保留指標50個。
在確定指標體系后,從國泰安經濟金融數據庫中查詢相關數據,并進行如下處理:(1)指標增量計算:為了盡可能避免企業通過利潤操縱等手段美化當期數據,本文計算了各項財務指標披露的舞弊發生年份與舞弊發生前一年的增量。(2)部分指標剔除與補缺:剔除全部樣本公司在舞弊年份大面積缺失或披露不完全的指標,個別樣本的個別缺失數據用該指標的平均值代替。同時為了盡可能減少量綱造成的非必要影響,本文對所選指標的相關數據進行了標準化處理。
3.顯著性分析
完成財務指標增量計算后對所選取的財務指標變動指標與非財務指標進行檢驗,找出舞弊公司與非舞弊公司在一定顯著性水平下有顯著性差異的特征指標。既往文獻中對變量指標進行顯著性檢驗的方法主要有兩種:單變量檢驗與獨立樣本檢驗。為了更好突出舞弊公司組與非舞弊公司組同一指標的均值差異,本文采用獨立樣本的檢驗,在0.1顯著性水平下有如下九個指標通過檢驗:△X9(存貨與收入比)、△X16(資產報酬率B)、△X17(總資產凈利潤率B)、△X20(凈資產收益率B)、△X28(折舊攤銷)、△X39(流動資產比率)、△X40(營運資金比率)、△X44(流通股比率)、△X47(股權制衡度),本文選取上述九個指標進行回歸方程的擬合。
4.因子分析
經過上述單變量顯著性檢驗我們得到舞弊公司與非舞弊公司的顯著差異指標及某項指標與財務舞弊正相關或負相關。模型中如果變量之間存在多重共線性會影響到模型的檢驗效果,應該挑選出不具有明顯相關性的指標,因此需要對上述指標進行相關性分析,即利用因子分析法濃縮指標,找出主要影響因子,從而達到提高模型的預測準確度的目的。通過SPSS檢驗,KMO取樣適切性量數值為0.599,Bartlett球形檢驗的顯著性為0,適合通過主成分分析進行因子濃縮。經主成分提取后9個相關財務與非財務指標被濃縮為4個因子,記作X1、X2、X3、X4,其成分矩陣如下表:
5.舞弊模型擬合
(1)擬合函數選擇及結果判斷
通過對已有研究的分析,本文選擇Logistic回歸采用函數
進行擬合,該模型通過最大似然值估計參數,特點是函數的取值范圍在0-1之間,可以設定函數表示舞弊行為發生的可能性, 例如函數值大于某一閾值時判定其發生舞弊行為,且根據之前已有研究,該模型識別普遍具有較好的效果。
因上市公司舞弊與否呈嚴格的兩點分布,即是與否,Logistic回歸模型適用性強。本文設定舞弊公司該項值為1,非舞弊公司該項值為0,同時設定判定值為0.5。當P值大于0.5時判定其存在舞弊標志,P值小于等于0.5時,不認為其存在舞弊特征。
(2)擬合過程
上述指標處理過程后可得到清晰明確的自變量與因變量,下一步為利用相關處理后的舞弊公司及配對非舞弊公司相關數據建立Logistic回歸模型。本文采用二元線性回歸模型擬合進行模型構建。將通過檢驗與因子分析的濃縮因子引入SPSS二元線性回歸分析程序中,定義非舞弊公司因變量值為0,舞弊公司值為1。以舞弊發生情況為因變量,濃縮因子為自變量擬合,擬合結果如表2所示:
根據上表結果可得出回歸方程表達式:
三、模型檢驗與評價
1.模型檢驗
基于隨機選取的20家舞弊與非舞弊公司2019年財務數據計算相關指標并代入模型檢驗,并與2020年舞弊情況進行對比。選取檢驗樣本時挑選的公司均不在樣本中,進一步加強檢驗的隨機性。此外,挑選最近年度財務數據,保證模型檢驗的時效性。按照上述原則,本文選取了10家因報告舞弊被證監會公開處罰的公司與10家運營狀況良好的公司作為檢驗樣本。經模型檢驗,12家公司被判定為舞弊公司,8家公司被判定為非舞弊公司。檢驗效果總體良好,但模型存在放大公司舞弊風險的不足,有待優化。
2.模型評價與優化角度
(1)模型評價
本模型選取指標體系較為全面,模型結構較為簡潔,可理解性強,模型對舞弊公司的識別能力較強。模型應用范圍較廣,可在以下方面發揮作用:審計人員可借助模型初步識別被審計單位發生財務舞弊的可能性;非財務管理人員也可運用模型分析預測財務舞弊可能性,進而為公司治理與內部控制制度的完善提供參考;證券市場投資者也可使用檢驗模型洞悉被投資公司的財務狀況,進而降低投資風險。
該模型仍然存在不足:其最為突出的問題是模型準確率有待進一步提高。此外,該模型存在放大公司舞弊風險的可能,且閾值的確定存在主觀性,這將導致指標異常不明顯的舞弊公司未能被識別出以及相關指標輕微波動的非舞弊公司被誤判。
(2)模型優化角度
針對模型構建中存在的問題和模型的不足,該舞弊識別模型仍可以從如下角度進行優化:
從樣本及指標體系的選取角度,本文樣本數量相對較少,可借助大數據工具擴大樣本量。如引入所有A股非金融公司,通過擴大樣本量優化模型,提升模型概括性。選取指標時本文雖盡可能覆蓋各種可能的舞弊指標,但樣本中舞弊公司的舞弊原因并不完全相同,導致不同樣本的異常指標難以統一化,難以找到一套統一且有效的指標體系。此外,本文選取的非財務指標的量化也具有優化空間。從閾值選擇角度看,本文閾值選取基于較少的樣本量,且具有一定的主觀性,可從擴大樣本量及優化閾值選取的角度進行優化。
四、大數據背景下基于財務指標的舞弊識別展望
伴隨著大智移云時代的來臨,數字化信息呈指數型爆炸增長,大數據的分析處理應用逐漸深入企業日常管理之中。利用大數據,構建舞弊模型是數據技術的重要應用,目前在實際運用過程中仍面臨一些挑戰。但可以相信,與傳統數據分析相比,大數據舞弊模型可以更高效地處理信息,并對企業未來財務信息狀況做出合理預測。傳統數據分析多針對企業內部結構化資料進行統計分析描述診斷,通過過去數據反映。而新型的大數據分析則科學有效地利用企業內外部全方面資料進行快速分析、行為預測,進行最優化的仿真模擬,預測未來以優化決策。舞弊模型運用專業工具、技術和模型,對大量無序數據進行分析擬合,以獲得有價值的隱含信息,并對結果分析解釋,增強企業財務信息質量,實現全面審計的預先期望。在如今信息高速發展的時代,財務信息已經不局限于對過去的數據分析整理,合理預測未來并防范未知風險的創新預測分析才是大勢所趨。利用新的理論和技術,實現傳統人工到大數據分析的逐步轉型,無論是從深度還是廣度,都可以全方位提升審計效率和準確性。由此可見,基于logistic回歸分析構建舞弊識別模型創新技術在應用于會計、審計和財務領域,為企業合理規避風險與獲取信息使用者的信任仍具有充足的完善與優化空間與可期的發展前景。
參考文獻:
[1]洪文洲,王旭霞,馮海旗.基于Logistic回歸模型的上市公司財務報告舞弊識別研究[J].中國管理科學,2014,22(11).
[2]李清,閆世剛.Logistic回歸會計舞弊識別模型與會計舞弊指數比較研究[J].東北師大學報(哲學社會科學版),2018(4).
[3]張曾蓮,高雅.財務舞弊識別模型構建及實證檢驗[J].統計與決策,2017(9).
[4]馬瀅,喬羽.大數據環境下公司內部審計面臨的機遇和挑戰[J].新經濟,2016,(27):73-74.
[5]桑梅.大數據時代公司財務內部控制探討[J].財會學習,2020(12):246,248.
[6]高健.基于大數據的公司財務造假識別[J].中外企業家,2015(9).
[7]汪士果,張俊民.基于數據挖掘的會計舞弊識別問題研究綜述[J].中南財經政法大學學報,2011(1).
[8]高利芳,何磊,李藝瑋.企業反賄賂內部審計的主觀動因研究——基于世茂集團的案例分析[J].重慶工商大學學報(社會科學版),2020,37(02):75-86.