999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XGBoost算法的財務造假識別研究

2022-09-21 02:55:16王圣潔
關鍵詞:財務模型企業

王圣潔

(青島大學 經濟學院, 山東 青島 266061 )

為有效改善融資環境,拓寬融資渠道,2021年10月在北京召開的中央經濟工作會議中明確提出全面推行注冊制,企業融資環境得到大幅改善,眾多企業乘著注冊制的東風得以蓬勃發展。資本市場的價值發現功能則越來越依托于企業持續的信息披露,信息披露真實、準確與完整對投資者而言至關重要。在可以預見的將來,全面注冊制改革會使上市企業數量激增,如何在眾多上市企業中及時發現財務造假,決定了A股市場的參與者能否享受到中國經濟發展的紅利,也是監管機構所面臨的嚴峻現實問題。在傳統監管渠道受限的新形勢下,以機器學習替代人的學習,再加以人的輔助識別,可以更有效地對企業是否違規做出準確判斷,使得證券市場參與者可以在真實信息中進行投資決策,促進我國資本市場繼續平穩發展。

1 文獻綜述

1.1 舞弊風險因子理論

財務造假有兩方面的誘因。一方面是管理層主管的動機。馬永義等[1]對比違規企業與未違規企業的財務報表,認為公司內部對利益的追逐是導致我國財報信息失真、財務舞弊多發的最主要原因;Huang等[2]按照企業生命周期理論對處于不同生命周期的企業進行分析,認為在企業發展的不同階段,影響舞弊動機的關鍵要素也不同。另一方面是客觀上由于監管缺位所帶來的舞弊機會。王守海等[3]將受處罰公司與未受處罰公司的報表進行對比,發現公司制度的不完善是財務違規公司產生財務舞弊的主要誘因;趙彥昌[4]發現,董事會成員數量與公司違規披露行為成反比,董事會人數越多,會計違規披露的機會越少;Ozdemir[5]的研究表明,董事會的多樣性使得對公司的管理與控制更為有效,從而使公司違規減少。

1.2 財務舞弊識別模型

洪文洲等[6]選取2004—2013年間財務報表造假的44家上市企業作為樣本,構建了包含27個核心指標的符合中國資本市場現狀的logistic回歸模型,研究發現舞弊企業的其中11個指標與非舞弊企業有顯著性差異;李清等[7]提出logistic回歸中可能會遇到的問題,即logistic回歸適用的前提是舞弊企業與非舞弊企業可以明確區分,而事實是學者可以從證監會等公開渠道獲取確定的舞弊企業,而作為對照組的非舞弊企業,其是否進行了舞弊往往需要許多專業的判斷,具有一定的不確定性;Mukherjee等[8]等通過Logistic回歸、高斯樸素貝葉斯模型和隨機森林、決策樹兩類非參數方法對財務造假進行判斷,發現隨機森林與決策樹分類器的識別性能最佳;Jan[9]嘗試使用遞歸神經網絡和長短時網絡兩種深度學習算法構建財務違規模型,實證結果表明,作為RNN模型的特殊形式,LSTM模型在所有性能指標上均優于RNN模型,LSTM模型實現了性能上的全超越;酈金粱等[10]在公司財務違規識別領域首次對XGBoost算法進行了初探,在50%的覆蓋度下有近80%的準確率;張培榮[11]依據文獻篩選識別財務造假的重要性指標,對制造業樣本進行檢驗,證實了XGBoost的良好性能;洪湛輝[12]依據出現頻率選取了11個自變量并通過分箱法進行數據的分析,使用滬深主板數據進行訓練,在驗證環節,模型使用被風險警示企業的財務數據作為驗證集,成功預測到了ST企業進行財務造假的情況,起到了預警作用;梁龍躍等[13]認為,審計報告是企業信息披露中的重要部分,使用BERT方法對文本特征進行提取,研究發現,加入這些描述性文本后,模型的識別效率顯著提升。

1.3 現有研究的不足及研究設想

現有研究具有以下不足:(1)指標選取依賴過往文獻,沒有針對財務造假的新形勢、新手段做出更新。選取的指標也多為低維線性數據,不能發揮機器學習算法處理高階數據的優越性,以這些指標構建的指標體系解釋能力不強;(2)當前研究多使用隨機森林與GBDT算法,而近年在機器學習競賽中性能強大的XGboost算法卻還未有較多應用,在識別效率上具有一定的缺失。

鑒于此,本文以A股市場上市公司作為研究樣本,結合監管動態更新指標體系,并加入高階非線性的指標,以完善財務造假的識別體系。在算法使用上,本文選取XGBoost算法,并針對識別領域的實際需求優化模型參數,試圖構建性能更優異的識別模型。

2 指標與模型

2.1 財務造假識別指標體系構造

本文以舞弊風險因子模型作為研究變量的選取基礎,并加入了能發揮識別作用的非財務指標,構建基礎指標體系,見表1,尋找對企業識別財務造假具有關鍵作用的指標。

表1 基礎指標體系Tab.1 Initial input index system

續表

2.1.1 數據來源

本文以2016—2021年間A股市場上市公司的數據作為研究標的,使用CSMAR國泰安數據庫與WIND萬得數據庫進行數據的搜集與整合工作,并通過國家企業信用信息公示系統、裁判文書網對企業的非財務信息加以驗證。

2.1.2 數據選擇

通過CSMAR數據庫中近6年證券監督管理機構對有關公司的處罰公告,提取303家因財務造假受到處罰的樣本公司,排除了15家金融類企業,最終挑選出符合研究標準的企業288家,493個樣本。按1∶1的比例選取一定標準的未違規企業的財務數據作為對照組,保持樣本總體的平衡性,最終選擇了986個樣本,包括493個實驗組樣本與493個對照組樣本,共計41 412個樣本數據。

2.2 財務造假識別模型構建

XGBoost是處理分類問題性能優異的訓練模型,本文依照陳天橋博士于2016年提出的XGBoost算法設置訓練的目標函數:

(1)

2.3 模型性能測度方法

機器學習領域常用的綜合評價方法是ROC曲線。ROC曲線使用正反樣本衡量識別精度,考慮到現有文獻對識別精度較偏重而忽略了模型覆蓋度的情況,本文結合混淆矩陣對ROC曲線的橫縱坐標做了一定的修改,從而在測量精度與覆蓋度兩個維度對模型性能進行評估測試,定義如下兩個指標:準確率=TP/(TP+FP) ,覆蓋率=TP/(TP+FN),其中,TP代表違規樣本被正確識別為違規的樣本數,FP代表未違規樣本被錯誤識別為違規的樣本數,FN代表違規樣本被錯誤識別為未違規的樣本數。

2.4 模型參數優化

使用隨機方法選擇90%的數據作為樣本訓練組數據,剩余10%作為樣本測試組數據,同時,在訓練方法上采用十折交叉驗證的方法,將訓練數據分為十組,其中九組用作訓練,剩余一組用作驗證,通過Harmonica算法優化參數,見表2。

表2 XGBoost算法優化后參數Tab.2 Parameter after optimization of XGBoost algorithm

3 模型性能測試與結果分析

鑒于資本市場上財務報表使用者的需求多樣,監管部門希望及時找到財務報表造假的企業,維護資本市場良好運轉;投資者則希望找到更多的未違規企業,以期將更多運行良好的企業納入自己的選股池,分散股票市場風險。因此,為了滿足不同報表使用者的需求,本文對優化參數后的模型進行測試,評價其在面對違規公司和未違規公司時的性能。

3.1 識別財務違規企業

證券監管部門的首要目標是及時精準發現上市公司的財務舞弊行為,打擊違法行為,維護資本市場良性發展,因此證券監管部門更關心模型在識別違規企業時的性能,如圖1所示,隨著模型覆蓋率的提高,模型的準確率有所下滑,原因在于為了提高覆蓋度,學習器會將盡可能多的樣本都判定為違規類別,因此導致準確率的下降。由圖1可知,經檢驗的模型對樣本外數據的判別準確度從18%到100%,相應地,識別范圍的比例從100%到5%。

圖1 違規樣本的準確率與覆蓋率曲線Fig.1 Accuracy and coverage curve of illegal sample inspection

在實際應用中,證券監管部門可以根據目標在準確率與覆蓋率之間進行權衡。若監管部門想要以100%的準確率找到違規公司,則可以從選取企業的樣本中找到5%的典型違規公司,進而證監會可以將這些公司當做典型予以打擊。若是監管部門希望對A股上市公司進行一次全面篩查,可以通過調整參數,以40%的準確率找到近半數的違規公司,從而縮小需要篩查的范圍,用識別模型替代初篩的工作。

3.2 挑選安全投資標的

投資者沒有執法權,也不關心企業是否違規,相比較而言,投資者更關心的是哪些股票沒有違規,因此,股票市場投資者最大的需求是找到足夠多可以安全投資的企業,將其股票加入股票投資池。這就需要投資者衡量自身愿意承擔的風險與期望擴充的股票規模的關系,如果投資者愿意承受更高的錯誤率,可以加入投資池的未違規企業的數量也就更多,相反,如果投資者完全不能承受錯判的風險,模型識別出來的未違規企業就會變少,但是更能保證每一個判斷都是精確的。本文通過調節樣本閾值生成了未違規樣本的準確率與覆蓋率曲線,如圖2所示,模型在樣本內識別找出70%的未違規公司時,仍能保證90%以上的準確率,即使在模型找出全部的未違規公司時,也能保證85%的準確率。

圖2 未違規樣本的準確率與覆蓋率曲線Fig.2 Accuracy and coverage curve of non-compliance sample inspection

把模型帶入實際應用中,2021年底A股市場約有4 000家公司,根據統計我國的上市公司中平均違約率為17%,即約有640家企業進行了財務違規的操作。如果通過訓練后的機器學習模型進行判斷,則可以從17%違約概率的樣本中,篩選出錯誤率為8.7%,涵蓋70%未違規企業的股票投資池,即找到2 352家可以投資的公司,只需承擔8.7%的錯誤風險,這大大拓寬了資本市場投資者的選股范圍,這證明從為投資者選股的角度來說,學習器的效果已經非常顯著了。并且,如果對訓練好的模型進行外包并加入可視化操作窗口,投資者就可以根據自身能接受的風險水平與期望拓寬的股票池之間權衡,在85%~100%的精確度上自由選擇,以獲取不同數量未違規公司股票。

3.3 穩健性檢驗

為了證實本文構建的包含財務指標與非財務指標的上市公司財務造假識別模型的良好性質,本文在機器學習三大類算法,即傳統分類算法、神經網絡算法、集成學習算法中分別選取代表性算法,其中,在傳統分類算法中選擇支持向量機模型,在神經網絡算法中選取BP神經網絡模型,在集成學習算法中分別選取了采用Bagging策略的隨機森林算法與采取Boosting策略的GBDT算法,并利用上述4種算法分別調試參數,與本文算法針對同一樣本分別展開預測,最終通過繪制的ROC曲線評價其性能,結果見表3。

由表3可知,本文XGBoost算法的優異性能得到了驗證;此外,不管通過何種機器學習算法驗證,其都能有近八成以上的準確率,F1分數在七成以上,這說明了無論采用何種訓練策略,構建的包含財務指標與非財務指標的財務造假識別指標體系都具有一貫的良好表現,從而,指標體系識別財務造假的穩健性得以檢驗。

表3 模型性能結果評價Tab.3 Performance evaluation of SVM, RF, Ann and AdaBoost models

3.4 特征重要性圖表

通過XGBoost算法可以生成指標特征重要性表,確定對識別財務造假最重要的指標變量,根據決策樹的算法邏輯,最重要的指標是使不確定性下降最多的指標。故本文只列出前十個重要特征,見表4。

表4 特征重要性表Tab.4 Characteristic importance chart

由表4本文分析總結并得出以下結論:

1)非財務指標的重要性開始凸顯,這與文獻綜述中的結論相左,一個合理的解釋是,傳統方法不能保證數據的平衡性。在一般的樣本中,未采取財務造假手段的公司占大多數,使得識別模型更多向非舞弊企業傾斜,從而導致對財務舞弊樣本的學習不充分,不能有效地反映舞弊企業的重要特征;當數據平衡之后,非財務指標的重要性有明顯提高,在排名前十的重要性特征中有五個是非財務指標,尤其是企業涉訴案件數排名第一。這說明在有側重的非平衡數據集中,財務指標對非財務舞弊公司刻畫效果極佳;而在平衡數據集中,非財務數據的重要性隨之也在上升,這代表非財務指標在識別企業財務造假方面具有優良的性質。

2)涉訴案件數、審計意見類型、股權集中度、三會召開情況和股票換手率五項非財務指標是識別上市公司財務舞弊的關鍵性指標。如果一個企業與眾多客戶供應商都走到了訴訟公堂的地步,那說明企業的經營情況已經極大惡化,為了挽回敗局,企業進行了財務造假,用虛假披露穩定市值,從而繼續經營;第二重要的特征是審計意見類型,一般來說,隨著證券監督管理部門對提供證券中介服務機構的管理日益嚴格,審計機構伙同上市公司共同造假的代價越來越沉重,這使得審計機構為了自身持續的發展,從嚴核查企業財務報表,如實發表審計意見,同時,審計人員的專業性可以幫助投資者規避其專業性不足的缺點,并提供上市公司是否財務造假的明確意見,幫助資本市場識別企業財務造假問題;排名第三位的是股權集中度,這說明股權結構也會在很大程度上影響企業是否進行舞弊的重大決策,當一股獨大且經營不佳時,公司的三會治理結構形同虛設,公司整體的運營也會發生偏離;股票換手率指標也在前十之列,上市公司股價反映了市場投資者對公司的信心,而證券市場投資者建立信心的基礎是公司經過審計的報表,因此,一旦公司知情股東發現,自身根據信息對公司股價產生的預期低于證券市場參與者通過閱讀公司財務報表所產生的預期,他們就會通過大規模的賣出交易降低股票下跌所帶來的損失。

基于此,本文對證券監督管理部門提出以下幾點政策建議:

1)證券監督機構應當更加關注上市公司涉及訴訟的情況,可以采取與人民法院、仲裁委建立互連互通的溝通系統,及時知曉企業所涉及的重大訴訟。其次,要強化中介機構的職能,要求其對企業所涉及的重大訴訟及時上報,并要求公司與保薦機構主動對涉案情況進行排查,及時提交訟所出具的法律意見書;同時,對外披露企業所面臨的訴訟情況,對投資者發出風險警示。

2)提高審計機構的角色地位,加強對審計機構的監督與處罰力度。審計后的財務報表可以視為審計機構對被審計公司的背書,但是這種背書也是一把雙刃劍,審計機構受雇于上市公司,其審計的獨立性可能受到威脅,一旦審計機構因報酬問題對上市公司做出妥協,報表的真實性就無從保證。因此,首先要提高審計機構在資本市場中的角色地位,具有糾錯的話語權。而證券市場的投資者,并非都具有財務的專業性,可以信賴的就是經過審計的財務報表,在這種情況下其有極大可能相信財務數據并得出完全錯誤的判斷。因此,證券監督管理部門加強對財務造假的監管,要加大對審計機構的懲處力度,使其不能也不敢參與企業的造假活動。

3)解決企業融資困難問題,為企業減負。之所以現金比率與資產負債率成為影響企業是否舞弊的重要因素,一個原因在于我國現在的融資渠道單一,多數企業只有向銀行貸款這一種方式,而在企業出現財務問題需要貸款救急來維持生產乃至扭轉敗局時,糟糕的財務狀況又不符合銀行貸款所要求的高標準,不免有些企業為了生存鋌而走險,選擇在財務報表上造假。因此證券監督管理部門可以適當放開債券的發行門檻,允許這些陷入財務困境或融資困難的企業發行紓困債券或集合債券,或者由上下游國有企業牽頭,發行供應鏈金融債券,只有拓寬了融資渠道,才能使那些只是因為受環境影響而面臨資金短缺的企業不至于鋌而走險,從而抑制其進行財務造假的動機,減少舞弊行為的發生。

4 結束語

本文的主要研究成果有如下幾個方面:

1)將XGBoost算法引入舞弊識別領域,驗證了該算法在財務造假識別應用中的可行性。

2)本文設計的能夠有效識別企業財務造假的指標體系,包含了代表企業經營與狀況的財務指標與非財務指標,利用XGBoost訓練生成了識別預警模型,可以供證券市場監管部門與股票投資者依照自身的需求對上市公司是否進行財務造假進行判斷,性能優異。

3)利用XGBoost生成的特征重要性表,確定了對于識別具有重要作用的特征指標,并借此對如何利用這些重要特征指標找到企業財務造假的事實提出政策建議:重視企業涉訴案件在識別企業舞弊中的重要作用,提高審計機構的角色地位,解決企業融資困難問題。

猜你喜歡
財務模型企業
一半模型
企業
當代水產(2022年5期)2022-06-05 07:55:06
企業
當代水產(2022年3期)2022-04-26 14:27:04
企業
當代水產(2022年2期)2022-04-26 14:25:10
黨建與財務工作深融合雙提升的思考
現代企業(2021年2期)2021-07-20 07:57:18
重要模型『一線三等角』
敢為人先的企業——超惠投不動產
云南畫報(2020年9期)2020-10-27 02:03:26
論事業單位財務內部控制的實現
重尾非線性自回歸模型自加權M-估計的漸近分布
欲望不控制,財務不自由
主站蜘蛛池模板: 国产特级毛片| 99久久精品免费观看国产| 国产色爱av资源综合区| 久久亚洲AⅤ无码精品午夜麻豆| 国产乱人伦精品一区二区| 多人乱p欧美在线观看| 国产在线精品人成导航| 中文国产成人久久精品小说| 欧美19综合中文字幕| 成·人免费午夜无码视频在线观看 | 色综合天天操| 国产欧美日韩资源在线观看| 亚洲欧洲自拍拍偷午夜色无码| 日韩欧美中文字幕在线精品| 日本三级欧美三级| 亚洲国产成人麻豆精品| 自偷自拍三级全三级视频| 久久黄色影院| www中文字幕在线观看| 欧美成人手机在线视频| 国产精品黄色片| 午夜限制老子影院888| 狠狠v日韩v欧美v| 尤物国产在线| 国产成人免费视频精品一区二区| 乱人伦视频中文字幕在线| 国产91视频免费观看| 91精选国产大片| 久久公开视频| 亚洲最大福利视频网| 丰满人妻久久中文字幕| 五月婷婷综合网| 亚洲综合精品香蕉久久网| 免费高清a毛片| 九月婷婷亚洲综合在线| 国产午夜无码专区喷水| 亚洲视频四区| 亚洲免费福利视频| 国禁国产you女视频网站| 九色视频最新网址 | www.av男人.com| 波多野结衣久久精品| 欧美日本在线| 18黑白丝水手服自慰喷水网站| 亚洲精品第一页不卡| 黄片一区二区三区| 99热这里只有精品免费| 欧美福利在线观看| 92精品国产自产在线观看| 国产免费福利网站| 五月激激激综合网色播免费| 日韩欧美中文在线| 99视频国产精品| 国语少妇高潮| 天天综合网色| 国产一级毛片高清完整视频版| 在线免费观看AV| 激情综合网激情综合| 日韩毛片基地| 国产99视频精品免费视频7| 五月婷婷欧美| 中国黄色一级视频| 婷婷中文在线| 18禁不卡免费网站| 亚洲婷婷在线视频| 在线观看欧美精品二区| 中文字幕亚洲另类天堂| 九九久久精品免费观看| 喷潮白浆直流在线播放| 亚洲视频一区| 91久久夜色精品国产网站| 国产丝袜无码精品| 极品国产在线| 亚洲日本中文字幕乱码中文| 国产精品太粉嫩高中在线观看| 黄色网在线| 日韩午夜片| 久久午夜夜伦鲁鲁片不卡| 国产精品尤物在线| 少妇精品在线| 欧美国产菊爆免费观看| 欧美97欧美综合色伦图|