999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的企業(yè)內部控制重大缺陷預測

2022-02-28 17:52:09劉瑾趙納暉
財會月刊·上半月 2022年2期
關鍵詞:機器學習

劉瑾 趙納暉

【摘要】企業(yè)在全面建設和實施內部控制機制的過程中普遍存在“報喜不報憂”現(xiàn)象, 信息披露與真實運營情況嚴重脫節(jié), 內部控制存在重大缺陷。 基于機器學習的重大缺陷預測模型能挖掘特征信息, 對可能存在的重大缺陷進行識別和預警, 以防止?jié)撛诘慕洜I風險積累到一定程度并在發(fā)生損失后才引起重視。 通過構建包括內部治理機制、外部環(huán)境風險、財務狀況、監(jiān)管與信息溝通四個維度的預測指標體系, 利用2012 ~ 2019年滬深兩市A股上市企業(yè)數(shù)據(jù), 經過研究后發(fā)現(xiàn): 以XGBoost為代表的集成模型在預測性能上強于個體學習器, 在不平衡、高維度、相關關系不明確的數(shù)據(jù)集上的預測效果較為穩(wěn)健, 營業(yè)凈利率、凈資產收益率、產品市場競爭等指標對預測結果的貢獻程度較大。

【關鍵詞】內部控制重大缺陷;預測模型;機器學習;XGBoost算法

【中圖分類號】 F830.33? ? ?【文獻標識碼】A? ? ? 【文章編號】1004-0994(2022)03-0123-9

一、引言

內部控制的目標在于防范和控制風險, 促進企業(yè)實現(xiàn)發(fā)展戰(zhàn)略。 由于企業(yè)無法預測未來所有風險, 且受管理層認知能力和成本效益原則的限制, 內部控制總有缺陷。 根據(jù)信號傳遞理論, 內部控制缺陷, 特別是重大缺陷是判斷企業(yè)存在經營風險的重要信號[1] , 披露內部控制重大缺陷會產生負面效應[2-4] , 因此企業(yè)披露缺陷信息的內生動力不足[5] 。 在國家強制披露要求下, 公開的內部控制信息逐漸成為技術操作與監(jiān)管規(guī)則之間的博弈產物[6] , 諸多隱瞞和不充分披露現(xiàn)象頻繁發(fā)生, 如長生生物毒疫苗、獐子島扇貝絕收、雅百特財務造假等事件, 導致社會經濟系統(tǒng)中的委托代理機制、產權有序流動、資源有效配置無法順利運行[7] 。 內部控制重大缺陷預測是根據(jù)企業(yè)披露的財務或非財務數(shù)據(jù)和其他相關信息, 運用恰當?shù)姆椒ǎ?對可能存在的重大缺陷進行識別和預警的過程, 其旨在降低企業(yè)與股東、債權人、投資者及政府監(jiān)管部門間的信息不對稱, 減少利益相關者為收集真實信息或對披露信息進行證偽而付出的交易成本。 預測研究提供了一種基于控制論的前饋控制方式, 通過整合數(shù)據(jù)挖掘特征信息, 參照“以預期為標準——衡量實際——比較實際與預期——確定偏差——分析偏差原因”的路徑, 主動識別內部控制重大缺陷, 從而指導未來行動[8,9] 。

關于內部控制缺陷預測的研究主要從缺陷認定、缺陷影響因素和預測方法三個方面展開。 內部控制缺陷的認定結果回答了企業(yè)是否存在缺陷以及哪些屬于重大缺陷的問題, 能反映企業(yè)內部控制建設的執(zhí)行效果。 然而, 我國內部控制規(guī)范還未對如何劃分不同等級的缺陷做出明確說明, 也未針對財務報告與非財務報告內部控制進行合理區(qū)分, 政策和實務層面普遍存在規(guī)范缺失、概念模糊和重視程度不夠等問題。 學者普遍認為有財務舞弊、重大財務重述行為的企業(yè)存在內部控制重大缺陷[10] , 但隨著外部經營環(huán)境變遷及內部組織結構再造, 影響內部控制缺陷存在的因素從會計與審計領域, 涵蓋到組織結構、經營業(yè)務等, 正向市場化水平、法律環(huán)境、政府管制等宏觀方向深入擴展, 非財務因素的作用日益顯著[11-14] , 因此構建預測模型應綜合考慮財務因素和非財務因素。 在預測方法上, 已有研究采用邏輯回歸和判別分析達到的預測準確率約為70% ~ 80%[15,16] , 預測性能仍有較大進步空間。 隨著人工智能技術迅速進入大眾視野, 重大缺陷預測方法從統(tǒng)計計量過渡到機器學習[17,18] 。 基于支持向量機、BP神經網(wǎng)絡、集成算法等機器學習的預測模型從數(shù)據(jù)中學習經驗知識的能力比傳統(tǒng)計量模型更強, 可從大量非線性、高維度、高噪聲的數(shù)據(jù)中提煉有用信息, 獲得更好的預測效果。

綜合上述分析, 本文試圖回答以下問題: 如何建立適合我國上市企業(yè)的內部控制重大缺陷預測指標體系; 通過比較不同機器學習算法, 基于集成算法的預測模型性能是否優(yōu)于已有研究; 哪些因素對預測結果的影響更為突出。 本文可能的貢獻在于: 一是, 從內部控制關鍵要素出發(fā), 結合實證經驗證據(jù), 從內部治理機制、外部環(huán)境風險、財務狀況、監(jiān)管與信息溝通四個維度構建預測指標體系。 二是, 應用機器學習算法構建預測模型, 通過對比邏輯回歸、支持向量機、決策樹、BP神經網(wǎng)絡、隨機森林和XGBoost六種模型, 尋找預測效果最好的模型。 現(xiàn)有文獻大多基于線性回歸方法, 解釋能力強但預測能力弱, 本文展示了機器學習特別是集成學習在預測性能上的優(yōu)勢, 檢驗了預測指標體系的實用性。 三是, 通過特征貢獻度分析進一步發(fā)掘預測模型的改進空間。

二、理論分析

(一)內部控制缺陷識別與認定

制度理論認為, 有必要用權利與義務安排或權威機構來限定企業(yè)追逐其目標的邊界, 協(xié)調不完善的沖突。 內部控制缺陷的認定來源于被廣泛認可的COSO出臺的《內部控制——整合框架》和《企業(yè)風險管理——整合框架》, 將控制缺陷定義為會對企業(yè)實現(xiàn)目標的能力造成不利影響的已被察覺的、潛在的或實際的缺點, 并按照影響程度將缺陷分為重大缺陷、重要缺陷和一般缺陷。 基于資源有限性和成本效益的考量, 判斷內部控制缺陷不僅要看控制系統(tǒng)是否存在缺點或不足, 還要看這種缺點或不足在多大程度上阻礙了企業(yè)發(fā)展[19] , 因此從偏離目標的可能性和程度來看, 識別重大缺陷更為迫切。 然而, 債權人、投資者及政府監(jiān)管部門等主要通過企業(yè)公開披露的內部控制評價報告、內部控制審計報告、財務報告獲知重大缺陷信息, 被動地接收認定結果。

綜合而言, 判斷企業(yè)是否存在內部控制重大缺陷時, 除了參考重大缺陷存在跡象, 還應主動從其他公開渠道尋找可靠、客觀的認定結果, 這有利于后續(xù)的模型構建。 例如, 證監(jiān)會自2001年起公布的行政處罰公告和市場禁入公告中披露的上市企業(yè)財務報表造假、重大擔保或重大關聯(lián)方交易未按規(guī)定披露或故意遺漏、企業(yè)高管非法從事證券交易等行為, 可以作為內部控制薄弱表現(xiàn)的確鑿認定并與其他重大缺陷跡象互補。

(二)內部控制缺陷影響因素

借鑒《內部控制——整合框架》, 《上市公司內部控制指引》、《企業(yè)內部控制基本規(guī)范》及配套指引、《公開發(fā)行證券的公司信息披露編報規(guī)則第21號——年度內部控制評價報告的一般規(guī)定》等文件的頒布標志著我國內部控制規(guī)范體系基本形成。 企業(yè)依據(jù)內部環(huán)境、風險評估、控制活動、信息和溝通、內部監(jiān)督五個要素構建自身內部控制體系, 涵蓋了發(fā)展戰(zhàn)略、公司治理、組織架構、企業(yè)文化、社會責任、財務活動等諸多因素, 但內容繁瑣的內部控制體系仍無法防止舞弊、腐敗和重大風險的發(fā)生, 反而導致實務中產生更多的缺陷。 因此, 構建內部控制重大缺陷預測指標體系應立足于基本國情和企業(yè)需求, 結合已有實證研究, 優(yōu)先解決內部控制中存在的迫切現(xiàn)實問題[20] , 而不是無止境地擴充內部控制的內涵和邊界, 將所有相關影響因素全部納入[21] 。

綜合以上分析, 從內部控制關鍵要素出發(fā), 沿波討源地發(fā)掘缺陷存在的原因, 能指導預測指標體系的構建過程, 其中控制環(huán)境是基礎, 控制活動是實現(xiàn)手段, 監(jiān)管是對控制活動的動態(tài)反饋, 該反饋通過信息傳遞與溝通來完成。 控制環(huán)境是對建立、加強或削弱特定政策、程序及其效率產生影響的各種因素的總稱, 任何企業(yè)的內部控制都存在于一定的控制環(huán)境之中[22] , 良好的控制環(huán)境能從根源上增強內部控制的執(zhí)行效果。 控制活動貫穿整個組織, 遍及各個層級、業(yè)務單位和流程以及技術環(huán)境, 最基本的控制活動是交易控制。 財務狀況在某種程度上反映了重要交易的閉環(huán)流程, 從財務數(shù)據(jù)的異常變動中能發(fā)現(xiàn)缺陷存在的跡象。 監(jiān)管過程能及時評價內部控制的有效性, 并對發(fā)現(xiàn)的缺陷加以改進, 是對控制活動的動態(tài)反饋, 而信息與溝通能確保上述反饋在企業(yè)內部、企業(yè)與外部之間進行有效溝通。 本文從控制環(huán)境、控制活動、監(jiān)管與信息溝通三個方面構建內部控制重大缺陷預測指標體系, 基于控制環(huán)境的重要性, 進一步將其分為內部治理機制和外部環(huán)境風險。

(三)基于機器學習的預測模型

機器學習已被廣泛應用于金融欺詐識別、信用風險評估、財務困境和財務舞弊識別等方面, 為制定管理決策提供了不少助力[23-26] , 內部控制缺陷的預測方法也從統(tǒng)計學習過渡到機器學習。 在應用機器學習方法之前, 相關研究一般利用計量模型對變量進行因果分析, 這兩類方法在模型可解釋性和預測能力上有不同權衡: 計量模型注重解釋現(xiàn)象并尋找現(xiàn)象背后的規(guī)律, 要求闡明模型擬合好壞的原因和變量之間的互動關系, 追求較為簡單的函數(shù)形式和易于解釋的模型估計結果; 機器學習不拘泥于可解釋性, 能從數(shù)據(jù)中學習更多經驗知識, 在大量非線性、高維度、高噪聲的數(shù)據(jù)中發(fā)掘有用信息, 能較為靈活地選擇函數(shù)形式來擬合數(shù)據(jù), 因此預測能力較強。

在主流機器學習算法中, 邏輯回歸對線性關系的擬合效果較好, 適合特征與變量之間線性關系較強的數(shù)據(jù); 支持向量機是堅持數(shù)學原理的小樣本學習方法, 基于核方法將輸入數(shù)據(jù)映射到一個高階的向量空間來解決分類問題, 對樣本平衡性的要求較高; 決策樹由一系列“分而治之”方式組織的樹狀結構組成, 數(shù)據(jù)根據(jù)不同特征被劃分為不同的子集, 采用信息增益或基尼系數(shù)作為評判標準; BP神經網(wǎng)絡是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡, 通過反向傳播不斷調整整個網(wǎng)絡的權值和閾值, 但參數(shù)較多、難以訓練, 且輸出結果較難解釋; 隨機森林以隨機方式構建了一個由很多相互不關聯(lián)的決策樹組成的森林, 利用信息增益或基尼指數(shù)度量以某個特征進行劃分后的數(shù)據(jù)集的純度, 以此來確定劃分特征; XGBoost采用貪心算法來枚舉所有特征可能的劃分情形, 據(jù)此確定最優(yōu)特征集合, 最終的預測值是每個基學習器預測值之和。 值得注意的是, 沒有任何算法可以完美地解決所有問題, 各類機器學習算法有著各自擅長的數(shù)據(jù)集, 預測模型需要通過不斷的實踐才能達到最佳。

三、研究設計

(一)數(shù)據(jù)來源與樣本選擇

根據(jù)財政部和證監(jiān)會的監(jiān)管規(guī)定, 所有主板上市企業(yè)自2012年起著手內部控制體系建設, 分類分批地披露內部控制信息, 故本文將樣本時間范圍劃定為2012 ~ 2019年, 研究對象為滬深兩市A股上市企業(yè)。 參照我國內部控制制度規(guī)范, 基于公開數(shù)據(jù)的可獲得性, 本文對內部控制重大缺陷的認定范圍是: ①上市企業(yè)董事、監(jiān)事及高級管理人員舞弊或違法披露會計相關信息; ②內部控制評價報告中披露內部控制無效; ③內部控制審計報告出具否定或保留意見; ④披露重大會計差錯導致的財務重述。 根據(jù)迪博內部控制與風險管理數(shù)據(jù)庫、國泰安經濟金融研究數(shù)據(jù)庫、萬德經濟數(shù)據(jù)庫和中國證券監(jiān)督管理委員會網(wǎng)站信息公開欄目中的信息, 剔除金融業(yè)上市企業(yè)(其治理結構與財務報告結構異于一般行業(yè)企業(yè))及缺失數(shù)據(jù)后, 手工整理得到20966個樣本。 具體而言, 2012 ~ 2019年的樣本量分別為1975、2107、2306、2445、2582、2977、3210、3364,? 其中認定存在內部控制重大缺陷的樣本量分別為24、48、61、55、55、64、114、136。

(二)變量定義

1. 內部治理機制維度。 借鑒相關研究成果, 內部治理機制可通過股權制衡度、機構持股比例、董事會規(guī)模、獨立董事占比、管理層權力、高管薪酬指標來衡量。 股權制衡度過高可能導致股東之間出現(xiàn)內斗, 致使企業(yè)決策的執(zhí)行效率下降; 風險投資機構經常扮演著積極的角色, 通過提供資金與技術支持、參與董事會席位等方式對企業(yè)起到認證和監(jiān)督作用, 防止內部控制重大缺陷的產生; 董事會規(guī)模過大會使得協(xié)調與組織工作更加繁瑣、管理效率低下, 阻礙內部控制機制發(fā)揮作用, 過小則可能導致決策過程易受大股東控制; 獨立董事憑借其專業(yè)素養(yǎng)和從業(yè)經驗, 能在“一權獨大”或“內部人控制”的情況下客觀表達自身立場, 監(jiān)督管理層行為并防止內部控制失效; 兩職合一是違背權力制衡的典型控制缺陷, 管理層權力這一定序指標可通過兩職兼任情況來度量; 薪酬激勵能引導管理層制定和執(zhí)行有效的內部控制制度, 解決代理沖突。 具體指標的定義見表1。

2. 外部環(huán)境風險維度。 如果不熟悉國內外經濟發(fā)展差異、制度與法律規(guī)則、市場競爭與文化等情況, 企業(yè)將面臨巨大的系統(tǒng)風險[38] , 內部控制體系的更新速度也無法在短期內邁進國際化進程, 內部控制存在重大缺陷的可能性增加。 在行政力量和市場力量作用于國民經濟的背景下, 制度環(huán)境不可避免地受到政府各類動機和行為的影響。 在市場化水平較高地區(qū), 企業(yè)對競爭壓力更為敏感, 也更有動力通過建立和實施內部控制提升財務報告質量、提高經營效率; 在市場化水平較低地區(qū), 更多的政府干預行為使得企業(yè)通過尋求政治關聯(lián)獲取經濟利益, 從而忽視內部控制的監(jiān)督作用[39,40] 。 根據(jù)經濟變遷理論, 產品市場競爭是提高經濟效率最強大的力量, 激烈的競爭會壓縮盈利空間, 降低信息不對稱程度, 也在無形之中強化了內部控制的實施環(huán)境[41,42] 。 參照Doyle等[43] 的研究, 如果企業(yè)經營業(yè)務涵蓋范圍較廣或子公司數(shù)量較多, 不同業(yè)務之間的產品差異、經營策略、行業(yè)地位等因素可能導致合并報表編制難度增大, 從而產生內部控制缺陷; 此外, 上市時間越長、規(guī)模越大的企業(yè), 內部控制建設情況越好。

綜上所述, 本文選取國際化程度、市場化程度、產品市場競爭、業(yè)務復雜度、上市年限和托賓Q值作為衡量企業(yè)外部環(huán)境風險的指標, 具體指標的定義見表2。

3. 財務狀況維度。 內部控制最基本的功能是保證資金活動與財務報告的真實性、完整性和可靠性, 因此內部控制重大缺陷研究離開不財務活動。 我國內部控制制度規(guī)范針對資金與資產管理、采購與銷售業(yè)務、財務報告和預算等活動詳細闡述了各種控制措施, 體現(xiàn)了財務狀況在內部控制體系建立過程中的重要性。 財務特征能反映企業(yè)內部控制質量, 財務狀況和盈利能力越差, 內部控制質量越低[43-46] ; 存在應收賬款相關內部控制缺陷的企業(yè), 其應收賬款周轉率顯著低于行業(yè)平均水平, 存在任何類型內部控制缺陷的企業(yè), 其總資產收益率與凈資產回報率均低于行業(yè)平均水平[47] 。 經營活動、投資活動和籌資活動是內部控制缺陷的高發(fā)地, 可選取能反映企業(yè)盈利能力(總資產凈利潤率、凈資產收益率和營業(yè)凈利率)、營運能力(應收賬款周轉率、總資產周轉率)、償債能力(速動比率、資產負債率、權益乘數(shù))、發(fā)展能力(每股凈資產增長率、凈利潤增長率)的財務指標來衡量財務狀況[48] 。 此外, 處于財務困境之中的企業(yè)可能會為了盡快擺脫困境而忽略對內部控制的投資與建設, 因此本文將Altman破產風險預測模型中的Z值和累計非經常性損益也作為衡量企業(yè)財務風險的代理變量, 財務風險越大, 企業(yè)越可能存在內部控制重大缺陷。 具體指標的定義見表3。

4. 監(jiān)管與信息溝通維度。 對于財務狀況差、經營風險大的企業(yè), 審計人員將投入更多審計資源并收取更高的風險溢價費用, 規(guī)模較小的審計機構收取的風險溢價會高于規(guī)模較大的審計機構[51] 。 審計任期體現(xiàn)了監(jiān)管的連續(xù)性, 與內部控制缺陷發(fā)生概率顯著正相關。 根據(jù)于忠泊等[52] 提出的市場壓力假說, 媒體關注度較高的企業(yè)的管理層可能會考慮自身聲譽, 從而有更強的動機加強內部控制制度的建立和實施, 防止財務舞弊丑聞的發(fā)生。 媒體監(jiān)督正逐步成為新興市場上有效彌補法制環(huán)境發(fā)展不足的重要手段, 新聞曝光引發(fā)諸多關注, 社會輿論促成企業(yè)整頓, 直接快速的媒體發(fā)揮著監(jiān)督代理人的治理作用, 在企業(yè)、投資者和政府監(jiān)管部門之間架起信息溝通橋梁[53] 。 此外, 統(tǒng)計顯示, 逐年增加的訴訟次數(shù)和涉案金額對上市企業(yè)的持續(xù)經營構成重大威脅[54] , 顯著影響了內部控制合規(guī)性目標的實現(xiàn)。 上述影響因素雖不是內部控制缺陷存在的直接原因, 但能從側面反映企業(yè)內部控制質量, 具體指標的定義見表4。

四、模型構建與結果分析

(一)模型構建流程

內部控制重大缺陷預測模型的構建流程如圖1所示, 經過模型預處理、模型訓練、模型驗證與評價步驟后, 根據(jù)評價指標選擇最佳模型。 本文模型的構建過程均在Python3.7環(huán)境上運行。

(二)特征工程

數(shù)據(jù)和特征決定了機器學習的上限, 選擇算法和訓練模型的過程是為了逼近這個上限。 特征攜帶的信息量越大, 尋找最佳參數(shù)花費的時間越少, 模型復雜度也越低, 因此特征工程在機器學習中的重要性毋庸置疑。 本文對上文四個維度的29個特征進行了特征處理和特征選擇工作。 首先, 對特征進行無量綱化處理, 使數(shù)據(jù)間具有可比性; 其次, 采用非參數(shù)檢驗初步探索特征與標簽之間的相關關系、特征之間的相關關系, 判斷特征在統(tǒng)計上是否具有識別內部控制重大缺陷的能力, 以減少噪音數(shù)據(jù), 提高模型預測效率。

卡方檢驗可用于判斷離散型特征與標簽間的相關性或獨立性, 卡方值越大, 說明相關關系成立的可能性越大; Mann-Whitney U檢驗是秩和檢驗方法, 用于正態(tài)分布、方差齊性等無法達到t檢驗要求的情形, 可用于判斷標簽在某連續(xù)性特征上是否有顯著差異。 根據(jù)表5的檢驗結果, 除國際化程度與機構持股比例之外, 其他特征均在5%的水平上統(tǒng)計顯著, 表明內部控制重大缺陷企業(yè)與非重大缺陷企業(yè)在其余27個特征上確實存在差異, 故剔除這兩個指標。 特征間相關性系數(shù)越大, 表明其共線性程度越高, 而進行Spearman秩相關檢驗可進一步剔除那些共線性程度較高的特征, 避免其影響模型預測效果。 Spearman秩相關檢驗結果中系數(shù)大于0.5的特征基本為財務類指標(如表6所示), 可能是因為財務指標的數(shù)據(jù)來源和計算方式較其他特征而言更具強關聯(lián)性。 考慮到Z-score指標在大量實證中的重要影響以及財務指標強相關性帶來的數(shù)據(jù)噪音, 本文又剔除了托賓Q值、總資產凈利潤率、速動比率、資產負債率。 經過特征工程, 本文篩選出23個特征用于后續(xù)模型構建。

(三)模型訓練、驗證與評價

缺陷預測實質上是機器學習中的分類問題。 與深度學習相比, 機器學習在較小樣本量的面板數(shù)據(jù)集上更有應用優(yōu)勢, 因其數(shù)據(jù)維度較低且不需對原始二維數(shù)據(jù)進行張量變換。 本文選擇邏輯回歸、支持向量機、決策樹、BP神經網(wǎng)絡、隨機森林、XGBoost算法構建內部控制重大缺陷預測模型的原因在于: 現(xiàn)有研究已使用了線性判別、支持向量機、BP神經網(wǎng)絡方法[17,18] , 通過比較六種機器學習算法, 能豐富內部控制缺陷預測研究的探索實踐并發(fā)掘預測效果更好的模型。 考慮到時間因素, 模型訓練時先將樣本分為訓練集1(2012 ~ 2016年的數(shù)據(jù))、訓練集2(2013 ~ 2017年的數(shù)據(jù))、訓練集3(2014 ~ 2018年的數(shù)據(jù))、訓練集4(2012 ~ 2018年的數(shù)據(jù)), 分別對應驗證過程的測試集1(2017年的數(shù)據(jù))、測試集2(2018年的數(shù)據(jù))、測試集3(2019年的數(shù)據(jù))、測試集4(2019年的數(shù)據(jù)), 不同數(shù)據(jù)集應用不同算法的機器學習模型, 能得到更穩(wěn)健的預測結果(模型訓練參數(shù)略)。

預測結果根據(jù)真實類別與預測類別的組合被劃分為真正例(True Positive)、假正例(False Positive)、真反例(True Negative)和假反例(False Negative)四種情況, 以混淆矩陣表示, 如表7所示。

在驗證過程中, 輸入測試數(shù)據(jù)后, 模型會生成某類標簽的預測概率(如某企業(yè)被預測有重大缺陷的概率), 將測試樣本按概率值降序排列, 分類過程就是尋找閾值并將其“截斷”為兩類的過程, 大于某閾值為一類, 否則為另一類。 如果閾值較大, 則在靠后位置截斷, 能最大程度地查全正例; 如果閾值較小, 則在靠前位置截斷, 能最大程度地查準正例。 ROC曲線(Receive Operating Characteristic Curve)和AUC值(Area Under ROC Curve)就是從上述角度出發(fā)衡量模型泛化性能的最佳指標。 ROC曲線的橫坐標FPR(False Positive Rate)代表模型將多數(shù)類判斷錯誤的情形, 縱坐標TPR(True Positive Rate)表示模型捕捉少數(shù)類的能力, 能夠衡量模型在盡量捕捉少數(shù)類時誤判多數(shù)類的情況會如何變化。 ROC曲線圍成的面積即為AUC值, AUC值越大, ROC曲線越接近左上角, 預測效果越好。

(四)結果分析

不同算法的預測模型在各個數(shù)據(jù)集上的表現(xiàn)如表8所示, 初步表明預測指標體系的可用性。 比較而言, 隨機森林和XGBoost兩種集成模型在不同時間跨度的數(shù)據(jù)集上的預測效果都強于另外四個個體學習器, 且XGBoost模型略優(yōu)于隨機森林模型, 預測結果較為穩(wěn)健, 表明相較于個體學習器, 以XGBoost為代表的集成模型在企業(yè)內部控制重大缺陷預測問題上具有更好的預測性能和應用價值。 機器學習領域的一個基本定理是: 沒有算法能完美地解決所有問題, 每種算法都有擅長的問題領域。 上述結果初步表明, 本文建立了適合我國上市企業(yè)的內部控制重大缺陷預測指標體系, 且經過對比, 基于XGBoost算法的集成模型預測效果最佳。

集成學習算法優(yōu)于個體學習器的原因可能在于: 一是, 重大缺陷樣本與非重大缺陷樣本的訓練樣例數(shù)量差別較大。 本文所選樣本中, 重大缺陷樣本的占比基本為3%左右, 致使二分類結果出現(xiàn)較多“假”陽性現(xiàn)象, 影響了預測效果。 一般來說, 訓練集的正例越多, 測試集捕捉少數(shù)類樣本的性能越好, 邏輯回歸、支持向量機、BP神經網(wǎng)絡等算法對數(shù)據(jù)集正反例平衡性的要求更高。 二是, 特征數(shù)量較多會降低模型性能。 邏輯回歸對高維數(shù)據(jù)不太友好, BP神經網(wǎng)絡因連接權重參數(shù)較多且計算復雜, 容易陷入局部極值。

對于同屬于集成學習算法的XGBoost模型和隨機森林模型, 前者在各數(shù)據(jù)集上的預測效果略優(yōu)于后者的原因也值得深入討論。 兩者在算法原理上的區(qū)別主要表現(xiàn)在三個方面: 基學習器生成規(guī)則, 最優(yōu)劃分特征的確定, 匯總基學習器獲得預測值的組合方式。 隨機森林采用自助采樣生成互不關聯(lián)的基學習器(決策樹), 每個基學習器對隨機選擇的特征子集基于信息增益或基尼指數(shù)進行后續(xù)分割, 最后所有基學習器并行投票決定最終結果; 而XGBoost的基學習器為樹模型或線性模型, 采用貪心算法來枚舉所有特征可能的劃分情形以確定最優(yōu)劃分特征, 串行地生成一系列基學習器, 使得前一個基學習器分類錯誤的樣本在后續(xù)訓練中會得到更多關注, 把預測值與真實值之差作為目標函數(shù)進行參數(shù)優(yōu)化和更新, 最終預測值是基學習器預測值之和。 對于集成學習算法, 特征貢獻度能體現(xiàn)模型優(yōu)先選擇哪些特征來訓練數(shù)據(jù)并應用于測試集進行預測, 這一指標可用于反映上述兩種算法的差異。

如表9所示, 平均貢獻度的排序結果表明, 兩種模型中凈資產收益率、營業(yè)凈利率、產品市場競爭指標都對預測結果的影響較大; XGBoost模型中財務特征與非財務特征占比較為平衡, 而隨機森林模型中財務特征占比較大。 因此, XGBoost模型在各數(shù)據(jù)集上的預測效果略強于隨機森林模型的原因可能在于, 前者更多地使用非財務類指標來訓練數(shù)據(jù), 因此在未來研究內部控制重大缺陷問題時可繼續(xù)發(fā)掘非財務類特征。 此外, 兩種模型特征貢獻度的合計值表明, 隨機森林模型在訓練數(shù)據(jù)時沒能涵蓋到更多的特征, 而XGBoost模型對特征的選擇范圍更廣, 訓練時學到的信息也更多。 隨著未來數(shù)據(jù)量和相關特征的增加, XGBoost在模型構建和訓練過程中存在更大的優(yōu)化空間, 值得學者繼續(xù)研究。 通過比較不同機器學習算法, 本文選擇的最佳預測模型是基于XGBoost算法的預測模型。

五、結論與啟示

(一)結論

內部控制重大缺陷預測模型旨在識別內部控制有嚴重缺陷的企業(yè), 使其能在管理、投資、評價和監(jiān)管等決策中得到預警提示, 有針對性地對缺陷進行糾正和改進。 進一步地, 從預測指標體系出發(fā), 尋找企業(yè)可能存在的欠合理的內部治理機制、嚴重的外部環(huán)境風險、異常的財務狀況等, 有利于識別組織內部控制缺陷根源、及時制定解決策略并防止損失擴大。 本文的主要結論如下:

1. 建立內部控制重大缺陷預測指標體系具有可行性。 本文從內部治理機制、外部環(huán)境風險、財務狀況、監(jiān)管與信息溝通四個維度建立了內部控制重大缺陷預測指標體系, 且經特征工程處理后, 篩選出23個預測特征。 不同時間跨度、不同算法基礎上的預測模型的AUC值基本都在0.7以上。

2. 集成模型在不平衡、高維度、相關關系不明確的數(shù)據(jù)集上的預測效果較為穩(wěn)健, 預測性能整體強于個體學習器。 針對數(shù)據(jù)集的不平衡特性, 后續(xù)研究可以從更多正式或非正式數(shù)據(jù)來源增加正例(存在內部控制重大缺陷)樣本和信息含量。 除本文認定的證監(jiān)會行政處罰公告和市場禁入公告內容外, 應繼續(xù)發(fā)掘可靠的認定證據(jù), 如審計署公告、中央及地方政府公開披露的信息、民眾實名舉報等, 甚至利用大數(shù)據(jù)爬蟲軟件匯總經過證實的上市企業(yè)負面新聞。

3. XGBoost模型略優(yōu)于隨機森林模型。 由于算法原理不同, XGBoost模型能夠學習到更多的特征信息, 特征的選擇范圍更廣。 此外, 特征貢獻度排序表明, XGBoost模型能抓取更多的非財務特征, 隨著未來數(shù)據(jù)量和相關特征的增加, XGBoost在模型構建和訓練過程中存在更大的優(yōu)化空間。

(二)啟示

扎根于我國企業(yè)內部控制建設現(xiàn)狀, 著眼于利益相關者的現(xiàn)實需求, 本文的研究啟示在于:

1. 從企業(yè)自身視角來看。 我國資本市場的基本特征仍然是“新興加轉軌”, 市場機制不夠完善、市場運行效率不高, 整體發(fā)展水平仍然處于初級階段。 國家出臺關于公司治理、風險管理、內部控制的監(jiān)管要求以保障資本市場的有效運行, 但企業(yè)在制定和執(zhí)行上述規(guī)則時可能出現(xiàn)概念混淆的情況, 從而導致內部控制措施缺乏針對性。 內部控制重大缺陷預測模型為企業(yè)提供了主動正視問題的途徑, 避免企業(yè)對政策無所適從、控制成本劇增等情況。

2. 從債權人、投資者視角來看。 由于信息不對稱程度較高, 債權人、投資者等利益相關者在資本市場中處于弱勢地位, 損失事件頻繁發(fā)生令其非常關心如何獲取高質量的相關信息。 內部控制重大缺陷預測模型為利益相關者提供了一種判別方式, 能在企業(yè)信息公布之前通過模型整合已有信息進行預判, 在公布之后對比偏差來識別可能存在的投資風險, 以指導未來決策行為。

3. 從政府監(jiān)管視角來看。 我國在建立與完善社會主義市場經濟體制的過程中, 政府監(jiān)管存在監(jiān)管依據(jù)不足、多頭監(jiān)管普遍、監(jiān)管方式傳統(tǒng)等問題, 而內部控制重大缺陷預測模型通過運用現(xiàn)代科技手段促進政府監(jiān)管的精準化和智能化, 推動了監(jiān)管方式創(chuàng)新。

【作者單位】中國財政科學研究院研究生院, 北京 100124

【 主 要 參 考 文 獻 】

[1] 羅紹德,唐群力.企業(yè)內部控制的新制度經濟學解析[ J].審計與經濟研究,2003(6):58 ~ 60.

[2] Hammersley J. S.,Linda A. Myers, Jian Zhou.The failure to remediate previously disclosed material weaknesses in internal controls[ J].Auditing:A Journal of Practice and Theory,2012(2):73 ~ 111.

[3] 楊清香,俞麟,宋麗.內部控制信息披露與市場反應研究——來自中國滬市上市公司的經驗證據(jù)[ J].南開管理評論,2012(1):123 ~ 130.

[4] 王亞男,戴文濤.內部控制抑制還是促進企業(yè)創(chuàng)新?——中國的邏輯[ J].審計與經濟研究,2019(6):19 ~ 32.

[5] 佘曉燕,畢建琴.負面偏好與上市企業(yè)披露內部控制缺陷信息關系研究[ J].管理科學,2018(4):45 ~ 61.

[6] 宋京津.技術與規(guī)則的博弈——美國上市公司內控信息披露發(fā)展進程探析[ J].江西社會科學,2010(1):91 ~ 95.

[7] 李連華.公司治理結構與內部控制的鏈接與互動[ J].會計研究,2005(2):64 ~ 69.

[8] 維納著.郝季仁譯.控制論[M].北京:科學出版社,1963: 1 ~ 199.

[9] 林鐘高,徐虹,胡誠.內部控制治理邏輯:權力制衡觀抑或信息觀[ J].財經科學,2009(4):88 ~ 94.

[10] 丁友剛,段然.內控缺陷認定標準:混沌和亂象——基于科學判斷與或有事項準則的思考[ J].會計研究,2020(3):141 ~ 156.

[11] Hoitash U.,Rani Hoitash,J. C. Bedard. Corporate governance and internal control over financial reporting: A comparison of regulatory regimes[ J].The Accounting Review,2009(3):839 ~ 867.

[12] Johnstone K., C. Li, K. H. Rupley. Changes in corporate governance associated with the revelation of internal control material weaknesses and their subsequent remediation[ J].Contemporary Accounting Research,2011(1):331 ~ 383.

[13] 陳志軍,董美彤,馬鵬程等.媒體與機構投資者關注對內部控制的交互作用——來自國有企業(yè)的經驗數(shù)據(jù)[ J].財貿研究,2020(9):99 ~ 110.

[14] 陳艷利,喬菲.內部控制信息披露有效性的影響因素和作用機制[ J].財經問題研究,2015(10):87 ~ 94.

[15] Franklin Mitchell. Sarbanes Oxley Section 404: Can material weakness be predicted and modeled?An examination of the ZETA model in prediction of material weakness[D].Minneapolis:Walden University,2007.

[16] 王茜,戴文濤.基于判別分析的內部控制重大缺陷預測研究[ J].財經問題研究,2012(5):48 ~ 54.

[17] 王海林.企業(yè)內部控制缺陷識別與診斷研究——基于神經網(wǎng)絡的模型構建[ J].會計研究,2017(8):74 ~ 80.

[18] 陳淼琳.基于支持向量機的上市公司內部控制重大缺陷預測模型研究[D].北京:首都經濟貿易大學,2017.

[19] 楊有紅,李宇立.內部控制缺陷的識別、認定與報告[ J].會計研究,2011(3):76 ~ 80.

[20] 宋建波,蘇子豪,王德宏.中國特色內部控制規(guī)范體系建設的思考[ J].會計研究,2018(9):11 ~ 16.

[21] 李心合.內部控制研究的困惑與思考[ J].會計研究,2013(6):54 ~ 61.

[22] 夏寧,孟焰.內部控制環(huán)境的“三分法”:理論框架與內在檢視[ J].中央財經大學學報,2013(4):86 ~ 91.

[23] Kim Soo Y., Arun Upneja. Predicting restaurant financial distress using decision tree and Ada-Boosted decision tree models[ J].Economic Modelling,2014(36):354 ~ 362.

[24] Lina Chi-Chen,An-An Chiu,Shaio Yan Huang,et al.. Detecting the financial statement fraud: The analysis of the differences between data mining techniques and experts' judgments[ J].Know-

ledge-Based Systems,2015(89):459 ~ 470.

[25] Sanaz Nami,Shajari Mehdi. Cost-sensitive payment card fraud detection based on dynamic random forest and k-nearest neighbors[ J].Expert Systems with Applications,2018(15):381 ~ 392.

[26] Askari Sikdar,Anwar Hussain. IFDTC4.5:Intuitionistic fuzzy logic based decision tree for e-transcational fraud detection[ J].Journal of Information Security and Applications,2020(52):1 ~ 13.

[27] 李穎琦,俞俊利.股權制衡與內部控制有效性——基于2008-2010年釀酒類上市公司的案例分析[ J].會計研究,2012(2):50 ~ 56.

[28] Tang Alex P.,Li Xu. Institutional ownership and internal control material weakness[ J].Quarterly Journal of Finance and Accounting,2010(2):93 ~ 117.

[29] Hermanson Dana R., Zhongxia Ye. Why do some accelerated filers with SOX Section 404 material weaknesses provide early warning under Section 302?[ J].Auditing:A Journal of Practice and Theory,2009(2):247 ~ 271.

[30] 李越冬,嚴青.風險投資“抑制”還是“放縱”內部控制缺陷?[ J].科研管理,2019(8):101 ~ 112.

[31] 劉焱,姚海鑫.高管權力、審計委員會專業(yè)性與內部控制缺陷[ J].南開管理評論,2014(2):4 ~ 12.

[32] 呂景勝,趙玉梅.董事會特征對內部控制失效的影響研究——基于中國上市公司的數(shù)據(jù)分析[ J].中國軟科學,2016(5):93 ~ 106.

[33] Krishnan Jayanthi. Audit committee quality and internal control: An empirical analysis[ J].The Accounting Review,2005(2):649 ~ 675.

[34] 雷輝,劉嬋妮.董事會特征對內部控制質量的影響——基于我國A股上市公司面板數(shù)據(jù)研究[ J].系統(tǒng)工程,2014(9):11 ~ 18.

[35] 郭軍,趙息.高管權力、制度環(huán)境與內部控制缺陷[ J].系統(tǒng)工程,2016(7):73 ~ 77.

[36] 許瑜,馮均科,李若昕.CEO激勵、媒體關注與內部控制有效性的關系研究[ J].審計與經濟研究,2017(2):35 ~ 45.

[37] 許寧寧.管理層能力與內部控制——來自中國上市公司的經驗證據(jù)[ J].審計研究,2017(2):80 ~ 88.

[38] 王海林,王曉旭.企業(yè)國際化、信息透明度與內部控制質量——基于制造業(yè)上市公司的數(shù)據(jù)[ J].審計研究,2018(1):78 ~ 85.

[39] 劉啟亮,羅樂,何威風,陳漢文.產權性質、制度環(huán)境與內部控制[ J].會計研究,2012(3):52 ~ 61.

[40] 趙淵賢,吳偉榮.企業(yè)外部規(guī)制影響內部控制有效性研究——來自中國上市公司的經驗證據(jù)[ J].中國軟科學,2014(4):126 ~ 137.

[41] 楊婧,許晨曦.產品市場競爭、內部治理與內部控制缺陷認定標準[ J].會計研究,2020(6):158 ~ 170.

[42] 尹律,徐光華,易朝暉.環(huán)境敏感性、產品市場競爭和內部控制缺陷認定標準披露質量[ J].會計研究,2017(2):69 ~ 75.

[43] Doyle Jeffrey T.,Weili Ge,Sarah McVay. Accruals quality and internal control over financial reporting[ J].The Accounting Review,2007(5):1141 ~ 1170.

[44] Ashbaugh-Skaife Hollis,Daniel W. Collins, William R. Kinney. The discovery and reporting of internal control deficiencies prior to SOX-mandated audits[ J].Journal of Accounting and Economics Research,2006(1):166 ~ 192.

[45] Ge Weili, Sarah McVay. The disclosure of material weaknesses in internal control after the Sarbanes-Oxley Act[ J].Accounting Horizons,2005(3):137 ~ 158.

[46] Rice Sarah C., David P. Weber. How effective is internal control reporting under SOX 404? Determinants of the (non-)disclosure of existing material weaknesses[ J].Journal of Accounting Research,2012(3):811 ~ 843.

[47] 鄧春梅,高然,晏雨薇等.內部控制質量對企業(yè)運營目標的影響:來自應收賬款內部控制缺陷的證據(jù)[ J].中央財經大學學報,2019(4):60 ~ 75.

[48] 齊保壘,田高良.基于財務報告的內部控制缺陷影響因素研究[ J].管理評論,2012(4):133 ~ 140.

[49] 王西子,吳聯(lián)生.審計師收取客戶債務風險溢價了嗎?[ J].審計研究,2020(2):57 ~ 66.

[50] 許江波,賀小丹.未能發(fā)現(xiàn)還是動機選擇?——內部控制缺陷披露困境的成因[ J].經濟與管理研究,2016(3):123 ~ 130.

[51] Hoag Matthew L., Carl W. Hollingsworth. An intertemporal analysis of audit fees and section 404 material weaknesses[ J].Auditing: A Journal of Practice and Theory,2011(2):173 ~ 200.

[52] 于忠泊,田高良,齊保壘等.媒體關注的公司治理機制——基于盈余管理視角的考察[ J].管理世界,2011(9):127 ~ 140.

[53] 逯東,付鵬,楊丹.媒體類型、媒體關注與上市公司內部控制質量[ J].會計研究,2015(4):78 ~ 85.

[54] 毛新述,孟杰.內部控制與訴訟風險[ J].管理世界,2013(11):155 ~ 165.

[55] Chen Yangyang,F(xiàn)erdinand A. Gul, Cameron Truong, et al.. Audit quality and internal control weakness: Evidence from SOX 404 disclosures[ J].SSRN Electronic Journal,2012(1):1 ~ 61.

[56] 蔣學洪,王瑞華,楊艷文等.內部控制審計與審計費用的實證研究—來自中國上市公司的經驗證據(jù)[ J].新疆大學學報(哲學·人文社會科學版),2019(3):10 ~ 19.

(責任編輯·校對: 喻晨? 陳晶)

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網(wǎng)絡搜索數(shù)據(jù)的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網(wǎng)中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 国产精品吹潮在线观看中文| 欧美精品1区| 国产在线观看人成激情视频| 伊人久久婷婷| 免费一看一级毛片| 99尹人香蕉国产免费天天拍| 国产日韩欧美精品区性色| 99re热精品视频中文字幕不卡| 91丝袜美腿高跟国产极品老师| 亚洲精品国产精品乱码不卞| 日韩东京热无码人妻| 91成人试看福利体验区| 制服丝袜亚洲| 久久亚洲中文字幕精品一区| 国产精品久久久久久搜索| 国产精品视频白浆免费视频| 99热这里只有精品2| 亚洲香蕉久久| 亚洲码在线中文在线观看| 99久视频| 伊人成人在线视频| 国产精品视频观看裸模| 丝袜无码一区二区三区| 波多野结衣一区二区三区四区视频 | 久久一日本道色综合久久| 久久婷婷六月| 综合色天天| 99热免费在线| 在线观看亚洲精品福利片| 亚洲日产2021三区在线| 乱人伦视频中文字幕在线| 久草国产在线观看| 婷婷六月天激情| 天堂成人av| 真人免费一级毛片一区二区| 亚洲动漫h| 国产浮力第一页永久地址| 无码AV高清毛片中国一级毛片| 91精品免费高清在线| 亚洲高清在线播放| 欧美成人综合在线| 欧美日韩在线国产| 欧美第二区| 色网站免费在线观看| 亚洲第一成年人网站| 区国产精品搜索视频| 91日本在线观看亚洲精品| 欧美在线国产| 国模极品一区二区三区| 亚洲无码视频喷水| 人妻少妇乱子伦精品无码专区毛片| 国产v欧美v日韩v综合精品| 成人国产精品网站在线看| 麻豆精品视频在线原创| 亚洲日本www| 99久久免费精品特色大片| 天天干天天色综合网| 狠狠色狠狠综合久久| 91精品国产91欠久久久久| 亚洲综合中文字幕国产精品欧美 | 日本在线欧美在线| 四虎综合网| JIZZ亚洲国产| 成人小视频在线观看免费| 国产成人高清亚洲一区久久| 久久男人资源站| 狠狠做深爱婷婷久久一区| 国产69精品久久久久孕妇大杂乱 | 亚洲成人精品| 亚洲综合欧美在线一区在线播放| 伊人成人在线视频| 久久99精品久久久久久不卡| 丝袜亚洲综合| 国产后式a一视频| 婷婷六月激情综合一区| 日韩毛片免费视频| AV无码一区二区三区四区| 精品人妻无码中字系列| 亚洲日本中文字幕天堂网| 亚洲国产精品无码久久一线| 久久国产精品波多野结衣| 国产精品hd在线播放|