【摘要】當前的財務舞弊大數據識別, 實際上是先用顯著指標對舞弊公司樣本“畫像”, 再依據畫像結果尋找與舞弊樣本相似的有舞弊嫌疑的公司。這種通過舞弊樣本“畫像”識別財務舞弊的做法, 存在著刻舟求劍、 按圖索驥、 盲人摸象、 準確率幻覺等問題。造成這些問題的根本原因在于, 當前的財務舞弊大數據識別忽視了財務舞弊“人的行動”本質。因此, 有必要回到財務舞弊“人的行動”本質, 重構財務舞弊大數據識別模式。重構財務舞弊大數據識別, 應以演繹推理的方式獲得真實舞弊行動的知識, 并以真實舞弊行動作為識別重點。具體的思路是: 首先通過假構法領悟真實的財務舞弊行動, 再以指標組合的形式刻畫財務舞弊行動, 最后參照金稅系統篩選出存在舞弊行動的公司。
【關鍵詞】財務舞弊;大數據識別;準確率;人的行動
【中圖分類號】 F275" " "【文獻標識碼】A" " " 【文章編號】1004-0994(2024)10-0026-6
上市公司財務舞弊是資本市場的“毒瘤”, 有效識別財務舞弊是資本市場健康發展的重要保障。與傳統的依賴會計邏輯識別財務舞弊相比, 利用大數據識別財務舞弊無疑具有更高的效率。自Loebbecke和Willingham(1988)基于美國證監會(SEC)會計和審計強制公告數據構建財務舞弊風險識別模型(L/W模型)以來, 財務舞弊大數據識別日漸成為財務舞弊識別的主流方式。但任何事物均有兩面性, 財務舞弊大數據識別也是如此。因此, 本文擬在回顧國內相關文獻的基礎上, 總結當前財務舞弊大數據識別的基本做法和發展趨勢, 剖析財務舞弊大數據識別存在的問題及其成因, 并對財務舞弊大數據識別提出改進設想。
一、 財務舞弊大數據識別的基本做法與發展趨勢
1. 基本做法。從國內相關文獻的研究內容看, 當前財務舞弊大數據識別主要分為四個步驟: 第一, 選取以往的舞弊公司和非舞弊公司作為對照樣本。比如: 張新民和吳革(2008)選取滬深兩市上市公司1998 ~ 2006年40家財務報告舞弊公司和40家正常公司為樣本; 劉樹磊和李強(2011)選取17家制造業舞弊公司和17家制造業非舞弊公司作為對照樣本。第二, 遴選與財務舞弊可能有關的指標。比如: 洪文洲等(2014)遴選出可能對財務報告舞弊敏感的27個指標; 王威(2020)綜合財務及非財務指標, 從盈利能力、 營運能力、 償債能力、 治理結構等方面設計了15組29個解釋變量。第三, 篩選出與財務舞弊顯著相關的指標。比如: 皇甫冬雪(2011)通過方差檢驗發現, 在遴選的28個解釋變量中有13個指標在舞弊樣本和非舞弊樣本間存在顯著差異; 洪文洲等(2014)通過對舞弊公司和非舞弊公司進行雙樣本t檢驗, 發現在其遴選的27個指標中, 折舊率變動指數等11個指標的系數在5%的水平上顯著; 韓麗榮等(2015)通過Wilcoxon符號秩檢驗, 篩選出應收賬款周轉天數變動指數等11個指標用以判別財務舞弊。第四, 構建識別模型擬合指標與財務舞弊之間的相關關系, 并以此作為預測財務舞弊的依據。比如, 熊方軍和張龍平(2016)通過構建邏輯(Logistic)財務舞弊識別模型分析發現, 強制回歸的ESTAT CLASS正確率達到78.57% , 混合逐步回歸的ESTAT CLASS正確率達到71.43%。
2. 發展趨勢。從國內相關文獻的時間脈絡看, 財務舞弊大數據識別呈現出兩個明顯的發展趨勢。
(1) 數據類型逐漸多樣化。早期財務舞弊大數據識別主要利用的是上市公司的財務數據。比如, 余玉苗和呂凡(2010)從財務指標的動態增量信息入手, 發現“固定資產增長率、 經營現金流量對流動負債比率、 每股投資活動現金凈流量、 每股收益、 股權集中度五個財務指標的變動對財務舞弊產生重要影響”。由于僅利用財務指標識別財務舞弊存在局限性, 學者們開始在財務指標之外引入非財務指標以識別財務舞弊。比如: 張新民和吳革(2008)引入公司內部治理機制方面的非財務指標識別財務舞弊; 李建標和任雪(2012)檢驗了會計師事務所特征和上市公司治理狀況對審計風險識別的影響, 發現“國有控股性質、 兩職合一分別與審計風險恰當識別負相關和正相關”; 孫麗亞(2010)、 王敏和李瑕(2011)從舞弊三角理論出發, 利用誘因、 機會和手段等非財務數據對財務舞弊進行識別; 洪葒等(2012)按照GONE理論選取了代表貪婪、 機會、 需要(壓力)和暴露的四類變量, 發現公司股權性質和國有持股比例有利于上市公司財務舞弊識別; 管揚威和朱衛東(2014)基于CRIME五因素論, 從造假者、 秘訣、 激勵、 監管機制、 最終結果五個方面構建了指標與模型識別ST公司的財務舞弊; 葉康濤和劉金洋(2021)借助我國上市公司強制披露的銷售量、 生產量、 庫存量等非財務信息, 考察非財務信息是否有助于識別企業的財務舞弊行為。隨著財務舞弊識別研究的深入, 近年來越來越多的非財務指標被引入財務舞弊識別。比如: 趙納暉和張天洋(2022)將上市公司定期報告中的管理層討論與分析文本引入財務舞弊識別; 曹策等(2023)通過提取股評文本的情感特征, 將情感特征引入財務舞弊識別。
(2) 識別模型日漸豐富。長期以來, 財務舞弊識別主要是通過構建Logistic回歸模型實現的。Logistic回歸的做法是: 通過將舞弊公司與非舞弊公司分別賦值為1和0, 測度各識別指標與舞弊行為之間的相關系數。比如: 洪文洲等(2014)選取了2004 ~ 2013年因財務報告舞弊被中國證監會公開行政處罰的44家上市公司和44家財務報表正常的公司為對照樣本, 建立向后逐步法的邏輯回歸模型作為財務報告舞弊識別模型; 張曾蓮和高雅(2017)選取2005 ~ 2013年中國證監會公布的61家財務舞弊上市公司及61家對比公司, 利用應收賬款指數、 資產收益率、 現金流量利息保障倍數、 自愿性信息披露質量等識別指標, 通過Logistic回歸構建財務舞弊識別模型。近些年來, 隨著大數據科學的發展, 越來越多的機器學習方法被引入財務舞弊識別。比如: 陳慶杰(2012)利用RBF神經網絡模型進行財務舞弊識別, 發現“RBF能將模式識別問題用非線性向高維投射, 從而進行更有效的數據分類”; 金花妍和劉永澤(2014)將支持向量機方法引入舞弊識別, 通過支持向量機與Logistic回歸的耦合構建識別模型, 發現“支持向量機算法下的總體識別率比Logistic回歸模型高, 表現出分類器的良好性能”; 曹策等(2023)使用RCC 并行網絡方法進行財務舞弊識別, 發現“該方法在識別上市公司財務舞弊的任務上較其他模型取得了更好的效果”。
二、 財務舞弊大數據識別的主要問題
從實質看, 當前財務舞弊大數據識別是先對舞弊樣本“畫像”, 再參照畫像結果尋找有舞弊嫌疑的公司。通俗地說, 財務舞弊大數據識別是以在舞弊公司與非舞弊公司之間顯著不同的指標為舞弊公司的“體征”, 用統計或機器學習方法對這些體征“上色”或“細描”, 最后得出一幅“指標與舞弊相關性”的畫像。毋庸置疑, 統計或機器學習的方法越精細, 畫像結果在區分樣本中的舞弊公司和非舞弊公司時效果越好。但如果跳出所選樣本, 用樣本上的“畫像”去識別樣本之外的公司是否存在財務舞弊, 準確率很可能不容樂觀。
1. 刻舟求劍。上市公司財務舞弊具有動態異質性, 世界上沒有一成不變的財務舞弊。黃世忠等(2020)在分析2010 ~ 2019年我國上市公司財務舞弊時發現, 這段時間“財務舞弊主要集中在對利潤表的粉飾和操縱上, 收入舞弊成為財務舞弊的重災區, 占比高達68.14%, 費用和成本舞弊成為財務舞弊的第二和第四大類型, 占比分別為22.12%和15.04%”; 而在分析2020 ~ 2021年低財報可信度上市公司時, 四位學者發現, “財務稅務維度所觸發異常特征占比為37%左右, 其他四個維度所觸發異常特征占比高達70%以上”, “非財務信息對財務舞弊模型預警準確性影響重大”(葉欽華等,2022a)。
財務舞弊的動態異質性說明, 不能對基于往年樣本得到的經驗(模型結果)抱有過高期望。從已有研究看, 財務舞弊大數據識別均是從“往年”案例中選擇舞弊公司和非舞弊公司作為對照樣本并展開研究的。這種基于“往年”樣本得到的模型結果, 很可能會隨著財務舞弊的動態變化而逐漸變得不可靠。比如: 洪文洲等(2014)選取2004 ~ 2013年的公司樣本, 利用財務指標與向后逐步法的Logistic回歸模型, 能夠達到87.9%的識別準確率; 而熊方軍(2015)選取2013 ~ 2014年的公司樣本, 利用財務指標與向后逐步法的Logistic回歸模型, 只能在舞弊樣本上達到79.55%以及非舞弊樣本上達到62.66%的識別準確率。因此, 利用往年樣本得到的模型結果來預測未來的上市公司, 很可能是刻舟求劍。
2. 按圖索驥。上市公司財務舞弊具有行業異質性。不同行業上市公司實施財務舞弊, 都會結合本行業的特點選擇最隱蔽、 最不容易被發現的財務舞弊手段; 行業不同, 財務舞弊手段也不同。對有形資產較易查實的公司而言, 交易造假無疑是更合乎理性的舞弊選項。以保千里為例, 其主要從事以視像技術為基礎的功能硬件、 智能硬件的研發、 設計、 生產與銷售, 功能硬件和智能硬件造假容易被發現, 所以其選擇通過對外投資和應計項目將資金轉出體外以配合、 實施和掩蓋舞弊。而對有形資產不易查實的公司, 存貨等資產造假可能是更理性的選擇。以康美藥業為例, 作為一家中藥公司, 其原材料和商品的價小量大特點無疑會讓其傾向于選擇存貨造假。葉凡等(2021)發現, 康美藥業2016年和2017年存貨增長率、 庫存商品增長率高于應付款項增長率, 作為中藥龍頭企業, 一般對上游供應商應具備談判優勢, 卻大量使用現金采購原材料, 該行為不符合商業邏輯, 十分費解。
財務舞弊的行業異質性說明, 世界上不存在完全相同的事物, 必須具體問題具體分析, 不能對基于所有行業樣本得到的一般經驗(模型結果)抱有過高期望。從所有行業中選擇樣本公司, 必然會出現“樣本公司選擇得越多, 被剔除的指標越多”的情況。不難理解, 樣本數量越多, 特定行業上市公司的特殊舞弊手段和舞弊特征越容易在大樣本中變得不顯著而被剔除。比如: 張新民和吳革(2008)基于以往文獻遴選出13個指標并選擇40家財務報告舞弊公司和40家正常公司為樣本進行研究時, 最后留下8個主要指標作為解釋變量建立財務報告舞弊識別模型; 余玉苗和呂凡(2010)基于以往文獻初步選取38個指標并選擇248個樣本作為訓練集進行研究時, 最后只留下4個顯著性指標作為解釋變量建立舞弊識別模型。因此, 利用基于所有行業樣本得到的模型結果來預測特定行業上市公司的財務舞弊, 很可能是按圖索驥。
3. 盲人摸象。當前識別財務舞弊的指標主要是借鑒以往文獻的研究成果獲得的, 比如: 陳慶杰(2012)進行財務舞弊識別時, 選取的31個變量中除經理人特征外, 其他全部來自現有關于財務報告舞弊因素研究成果的總結; 曾小青和唐湘勇(2021)借鑒Persons、 Ravisankar、 熊方軍、 Rezaee、 錢蘋等學者的研究遴選財務指標和非財務指標。以這種方式得到的指標, 其實是以往文獻對以往文獻觀察到的樣本或數據進行研究后, 發現的與當時財務舞弊相關的指標。比如: 曾小青和唐湘勇(2021)在其研究中遴選出財務杠桿率、 流動資產比率、 資產周轉率、 公司規模四個與財務舞弊相關的指標, 是因為Persons發現“財務舞弊公司通常具有較高的財務杠桿率和流動資產比率、 較低的資本周轉率和較小的公司規模”, 而Persons的結論是Persons對自己所處年代的樣本數據進行研究后的結果。近些年雖然有不少文獻開始從相關理論入手遴選財務指標, 但這只是在以往相關指標的基礎上作“增量”工作。比如, 李清和任朝陽(2015)將“舞弊鉆石”理論引入財務舞弊識別, 仍是依據“舞弊鉆石”理論和現有文獻提取舞弊識別指標。
借鑒以往文獻遴選指標, 實則是用以前觀察到的相關指標“盲人摸象”。某些對財務舞弊確有影響的未知變量, 可能自始就沒有被納入研究范圍內。因此, 對財務舞弊識別而言, 構建一個完整的財務舞弊識別理論指導指標遴選, 遠比擴大數據類型和改進大數據識別模型重要。令人欣喜的是, 有學者已經認識到這一問題并開始構建財務舞弊識別的理論。比如, 葉欽華等(2022b)提出, 應從財務稅務、 行業業務、 公司治理、 內部控制、 數字特征五個維度, 構建財務舞弊識別框架。
4. 準確率幻覺。在樣本選擇和指標遴選的基礎上, 當前財務舞弊大數據識別會采取特定模型擬合舞弊樣本與指標的相關關系, 并通過擬合的相關關系識別舞弊公司。由于前文所論述的三個問題, 這類大數據識別的有效性必然是有限的, 或者是在所選樣本上準確率很高而在樣本之外準確率很低。張熠等(2022)指出, “各類經營活動與經營狀態預示企業是否開展財務舞弊操作的概率是不同的, 且這種概率高低在業務層面并不存在顯性的判斷邏輯, 也不能依據經驗進行量化區分”。但是, 已有文獻總能通過多種手段不斷提高所謂的識別準確率, 進而形成準確率幻覺。這些手段包括:
(1)控制樣本選擇。關于控制樣本選擇, 有控制舞弊公司樣本選擇以及控制非舞弊公司樣本選擇兩種方式。比如, 孫麗亞(2021)最初選擇的是55家舞弊樣本、 55家控制樣本, 考慮到“舞弊樣本中有1家舞弊特征識別率為21.43%, 低于25%”, 最后只選擇了53家舞弊樣本和53家控制樣本。換言之, 為了保證所選指標的相關性, 對明明是舞弊但不完全滿足識別指標的舞弊公司, 其采取將該公司樣本剔除的做法。在這種控制樣本選擇的做法下, 所謂的準確率在多大程度上是可靠的, 令人懷疑。
(2)采用更精細的擬合模型。以神經網絡模型為例, 神經網絡模型借助計算機系統不斷地重復尋找權重的過程, “反復迭代直到最終預測結果與實際結果一致或者在一定的誤差范圍內”, 從而精確衡量指標權重(指標與舞弊之間的相關程度)以區分舞弊樣本與非舞弊樣本。這樣一種更精細的可以將誤差控制在一定范圍內的擬合模型, 自然會比相對粗糙的Logistic回歸有著更高的識別準確率。比如, 曾小青和唐湘勇(2021)發現, 在同樣樣本和指標的基礎上, “基于多層神經網絡模型構建的財務舞弊識別模型有更好的識別效果”。這種在樣本身上改進識別模型帶來的高識別準確率, 僅是改進模型的自然結果, 不代表大數據識別有著根本性進步。
(3)僅披露樣本上的識別準確率。按正常邏輯, 模型結果只有放在舞弊情況不明的公司身上檢驗, 才能得到真正的識別準確率, 但現有研究文獻多是披露在舞弊樣本上的識別準確率。比如, 管揚威和朱衛東(2022)在構建深度學習模型識別財務舞弊時提出, “精確率表示模型預測出的舞弊類樣本中被正確預測的比例, 召回率則表示所有的舞弊類樣本中被正確預測的比例”。這種將既定樣本身上得到的擬合結果用來檢驗既定樣本的做法, 準確率不高恐怕才是咄咄怪事。
三、 財務舞弊大數據識別的理論反思
為什么財務舞弊大數據識別會出現這樣或那樣的問題?其根本原因在于, 當前財務舞弊大數據識別忽視了財務舞弊本質。財務舞弊本質上是人的行動, 是舞弊者為實現自身目的所實施的具體行為。忽視財務舞弊“人的行動”本質, 很可能使財務舞弊大數據識別從一開始就存在著嚴重的邏輯缺陷。
1. 過度依賴舞弊樣本。經濟學上對人的行動作出系統性說明的是奧派經濟學家米塞斯。米塞斯在其《人的行動》(1949)一書中提出了人的行動理論, 并據此構建了奧派經濟學特有的方法論基礎。米塞斯指出, “人的行動是有目的的行為”, “是自我對外部刺激和環境條件所作的有意義的反應, 是一個人面對決定其生活的宇宙所作的有意識的調整”(路德維希·馮·米塞斯,2013)。換言之, 人的行動取決于自身的“目的”, 同時又受制于自身所面臨的“外部刺激和環境條件”。因此, 人的行動的一個基本特征是: 外部刺激和環境條件相同而目的不同, 人的行動必然不同; 目的相同但外部刺激和環境條件不同, 人的行動也有所不同。在財務舞弊上, 這個基本特征表現為財務舞弊天然具有動態異質性和行業異質性。在不同時期, 財務舞弊總會基于當時的“外部刺激和環境條件”選擇(對當時而言)最優的舞弊行動; 在不同行業, 財務舞弊總會基于本行業的“外部刺激和環境條件”選擇(對本行業而言)最優的舞弊行動。
正因為這個基本特征, 米塞斯認為“人的行動科學所必須面對的經驗, 是一些復雜現象的經驗。沒有任何實驗室適合做有關人的行動的試驗。我們永遠不可能只觀察到一種變化因素, 而視某事物之所有其他條件為不變因素”, “歷史經驗傳導的信息, 不能成為一種建筑材料, 用以搭砌理論, 也不能據以預測未來的事物”。米塞斯的這一觀點, 在財務舞弊識別上同樣是成立的。過去的舞弊公司樣本只能反映過去的舞弊行動, 過去舞弊樣本的畫像結果不能用于預測未來的舞弊行動; 同樣地, 所有行業的舞弊樣本只能反映當前所有行業共同的舞弊行動特征, 所有行業舞弊樣本的畫像結果不能提供關于特定行業的更多舞弊信息。可以說, 正因為忽視了財務舞弊“人的行動”本質, 當前的財務舞弊大數據識別才過度依賴于舞弊樣本, 總以為通過方法的創新(如神經網絡模型、 支持向量機等)就可以實現對財務舞弊的有效識別。
2. 未認清財務舞弊的識別重點。對于人的行動, 米塞斯認為其包括目的、 物件、 因果關系認知、 經濟權衡、 手段五個基本要件。其中: 目的是行動的誘因, “一個完全滿足其生存狀況的人, 不會有改變事物的動機”, 自然不可能行動; 物件是行動的基礎, 沒有物件可用就無法行動; 因果關系是物件和目的之間的聯系(物件能夠通過某種方式達成目的), 人在行動之前必然有因果關系認知, 知道怎樣利用物件能夠達成目的; 經濟權衡是人對多種物件應用方案的經濟考量, 人總是選擇能夠實現目的且成本最小的方案; 手段是最終的現實行為, 是對物件的實際運用, “某一物件只有當人們確實使用它時, 才稱其為手段”。根據五個要件, 人的行動可以表述為: 因特定目的, 人有了行動的欲望; 在行動之初, 人會審視一下現有可用物件可以怎樣利用以達到目的; 因果關系認知越多, 從物件到目的的可選方案就越多; 在具體選擇哪種行動方案時, 人會進行經濟權衡, 選擇成本最小且能實現目的的方案; 最后, 按照選定方案, 人發生了真實的行動, 即物件利用。
米塞斯界定人的行動范疇, 其用意除了借此指出人的行動不適宜用類似物理的實證方法研究之外, 更意在強調經濟學研究的是人的真實行動。雖然所有的“人的行動”都包含目的、 物件、 因果關系認知、 經濟權衡、 手段五個要件, 但目的、 因果關系認知、 經濟權衡“是純粹主觀的, 因人而異, 因人在其生命的不同時期而異的”, 既難以觀察亦難以測量。所以, “對于奢侈和節儉孰優孰劣之類的問題, 它們(指經濟學)不發表任何意見”, “人的行動學和經濟學研究的是行動個體所選擇、 用以實現目的的手段”, 即真實行動。這一觀點, 對財務舞弊識別而言同樣是適用的。作為人的行動, 財務舞弊識別自然也應當研究真實發生的財務舞弊行動, 而不是舞弊行為真實發生以前的目的或舞弊行為發生以后的結果。但從當前的財務舞弊大數據識別看, 現有研究似乎并沒有清楚認識到真實的舞弊行動這一識別重點。早期以財務數據為識別指標的做法, 事實上是以舞弊行動之后的結果作為識別重點, 這種做法在某種程度上可以說是舍本逐末。近些年來引入非財務數據作為識別指標的做法, 又顯然是將目的、 因果關系認知、 經濟權衡等作為識別重點[如洪葒等(2012)按照GONE理論選取了代表貪婪、 機會、 需要和暴露的四類變量], 這種做法在某種程度上可以說是混淆了財務舞弊可能與真實財務舞弊行動之間的區別。
四、 重構財務舞弊大數據識別: 以人的行動為基礎
鑒于當前財務舞弊大數據識別的邏輯缺陷, 本文認為應當回歸財務舞弊“人的行動”本質, 重構財務舞弊大數據識別模式。正如米塞斯所言, 要獲得可靠的經濟學知識, 只能從“人的行動是有目的的行為”這一先驗認識出發, 通過演繹推理的方式獲得。財務舞弊大數據識別也應當拋卻當前財務舞弊大數據識別對舞弊樣本的過度依賴, 以演繹推理的方式獲得對財務舞弊行動的認識, 進而借助真實的舞弊行動這個重點識別哪些公司有財務舞弊的嫌疑。具體的重構思路如下:
1. 通過假構法領悟真實的財務舞弊行動。假構法是奧派經濟學在人的行動范疇基礎上, 以演繹方式獲得可靠經濟學知識的最主要方法。所謂假構法, 是一種構建假想模型, 通過對照假想模型領悟現實中人的行動的方法。比如, 為了說明市場經濟下人的行動, 奧派經濟學構建了孤立經濟(魯濱遜式)模型。在孤立經濟下, 人的行動方式是“自產自用”, 沒有任何人與人之間的交換; 孤立經濟下的人, 只需要考慮如何利用手頭的資源(包括時間)最大程度地滿足自己的需求。與孤立經濟模型下人的行動相比, 市場經濟下人的行動有著明顯的不同。在市場經濟下, 人的行動是以最大程度滿足“消費者需求”為直接目的, 以間接滿足自身需求為最終目的的; 市場經濟下的人只有讓自己處于“為他人提供最好服務的航道”, 才能獲得最大的收入, 繼而最大程度滿足自身的需求。正是通過與孤立經濟模型進行對比, 奧派經濟學獲得了一系列堪稱定理的市場經濟結論, 如價格是市場經濟下消費者態度的體現, 也是“決定持續變動著市場狀況的力量”(無形之手)。同樣, 為了說明政府干預下人的行動以及經濟波動下人的行動, 奧派經濟學還構建了純粹市場模型、 靜止狀態模型以及穩態循環模型。
對于真實的財務舞弊行動, 假構法提供了一種很好的思路: 先構想正常的財務行動, 再領悟財務舞弊行動。如何構想正常的財務行動?傳統財務管理理論已經為此提供了堅實的基礎。財務管理理論看似講的是在不同事項上公司應當怎樣決策, 實際上也描述了在不同事項上正常公司會怎么做。例如: 籌資理論告訴我們, 正常公司在不需要籌資時不會大幅增加籌資規模; 在舉債和股權融資兩種方式間, 正常公司會選擇籌資成本較低、 對財務風險影響較小的籌資方式。再如: 存貨理論告訴我們, 在上年存貨周轉率下降、 存貨跌價準備增加的情況下, 正常公司在本年不會大幅增加存貨持有量; 在上年儲存邊際成本大于采購邊際成本時, 正常公司不會大幅度增加存貨持有量。由于財務管理理論覆蓋了籌資、 投資、 運營、 分配等環節, 只要用心揣摩, 自然可以構想出在所有環節正常的、 理性的公司行動。
在描述出正常公司全部行動表現的基礎上, 自然就可以領悟到財務舞弊行動是什么樣子, 或有財務舞弊嫌疑的公司是什么樣子。例如, 籌資理論告訴我們, 正常公司在不需要籌資時不會大幅增加籌資規模, 所以在不需要籌資時大幅增加籌資規模的行為, 自然就是不正常的、 有財務舞弊嫌疑的(俗稱“存貸雙高”)。同樣地, 存貨理論告訴我們, 在上年存貨周轉率下降、 存貨跌價準備增加的情況下, 正常公司在本年不會大幅增加存貨持有量, 所以在上年存貨周轉率下降、 存貨跌價準備增加的情況下, 大幅增加存貨持有量的行為, 也是非理性的、 不正常的、 有財務舞弊嫌疑的。依此方式, 在描述出正常公司全部行動表現后, 即可領悟到全部的財務舞弊行動。
2. 以指標組合的形式刻畫真實的舞弊行動。在領悟到真實的財務舞弊行動后, 如何刻畫真實的舞弊行動是識別有舞弊嫌疑公司的關鍵。從人的行動范疇看, 剔除掉目的、 因果關系認知和經濟權衡等主觀要件后, 人的行動范疇就只剩下物件和手段(物件的使用)。如果將物件稱為條件、 將手段稱為行為, 真實行動即可表述為“在一定條件下利用物件的某種行為”。也就是說, 真實行動實際上有“一定條件”和“利用物件的行為”兩個基本要件, 所有的真實行動均可以通過“一定條件”和“利用物件的行為”的組合形式表達出來。
對財務舞弊行動來說, 也是如此。所有的財務舞弊行動均可以表達為“一定條件”和“利用物件的行為”的組合形式。以存貸雙高的舞弊行動為例, 該行動表現為在不需要籌資的時候公司進行了大規模的籌資。如果用“一定條件”和“利用物件的行為”的組合形式表達, 該財務舞弊行動就可以表述為“籌資需求偏低and籌資規模偏大”。當然, 這樣的組合還只是一個粗略刻畫真實舞弊行動的框架, 對于何為“籌資需求”、 何為“籌資規模”還需進一步細化。應當指出, 在將所有的財務舞弊行動轉化為指標組合后, 就會得到一個涵蓋籌資、 投資、 運營、 分配等所有環節財務舞弊行動的指標組合體系。這個體系包括識別籌資階段財務舞弊的指標組合, 也包括識別投資、 運營等階段財務舞弊的指標組合。
3. 仿照金稅系統利用大數據。怎樣判斷財務舞弊行動指標組合中的偏高值或偏低值?本文認為, 可以參考金稅系統的做法, 選擇同行業上市公司同一指標值的某一分位數設定預警值。高于或低于相應預警值的, 即判定為偏高或偏低。這樣, 就可以利用大數據篩選出存在真實舞弊行動的公司或有舞弊嫌疑的公司。
舉例來說, 2020年中國證監會在處罰決定書中認定康美藥業2016 ~ 2018年存在通過“偽造、 變造大額定期存單等方式虛增貨幣資金”的財務造假行為(存貸雙高)。前文提到, 存貸雙高可表述為“籌資需求偏低and籌資規模偏大”。如果用“上年末貨幣資金總量/本年度投資活動現金流出量”衡量籌資需求, 用“本年度籌資活動現金凈流量/本年度投資活動現金流出量”衡量本年籌資規模, 那么存貸雙高的財務舞弊行動就可以表達為: “上年末貨幣資金總量/本年度投資活動現金流出量”偏高, 且“本年度籌資活動現金凈流量/本年度投資活動現金流出量”偏高。這里可以選擇同年度中醫藥行業上市公司以上兩個指標的75%分位數為上限、 25%為上限, 作為判斷指標值偏高或偏低的標準。當“上年末貨幣資金總量/本年度投資活動現金流出量”大于行業指標值75%分數時, 就可認定本年度初貨幣資金總量對本年度投資活動現金流出量的覆蓋程度較高, 公司的籌資需求偏低; 當“本年度籌資活動現金凈流量/本年度投資活動現金流出量”大于行業指標值75%分位數時, 就可認定公司籌措了遠超投資需求的資金, 公司的籌資規模偏大。經計算發現, 2016年67家中醫藥上市公司“上年末貨幣資金總量/本年度投資活動現金流出量”75%分位數是2.5685, “本年度籌資活動現金凈流量/本年度投資活動現金流出量”75%分位數為0.4114。以此為標準篩選出中醫藥行業中兩個指標值均超過75%分位數的公司, 會發現康美藥業赫然在列。同樣經計算發現, 2017年和2018年康美藥業的這兩個指標仍然超過了行業75%分位數。可以說, 只要領悟了存貸雙高這樣一種舞弊行動, 早在2017年能夠獲得2016年財務數據時, 就可以發現康美藥業存在舞弊嫌疑。
五、 結語
本文在梳理國內相關文獻的基礎上, 總結了財務舞弊大數據識別的基本做法與發展趨勢, 并指出當前財務舞弊大數據識別存在刻舟求劍、 按圖索驥、 盲人摸象以及準確率幻覺等問題。之所以會有這樣或那樣的問題, 根本原因在于當前財務舞弊大數據識別忽視了財務舞弊本質, 即“人的行動”。正因為忽視了財務舞弊“人的行動”本質, 當前財務舞弊大數據識別總是對舞弊樣本(或歷史經驗)抱有過高期待, 總以為通過方法創新(從相關性分析到機器學習)就能有效識別財務舞弊。因此, 本文提出應當從財務舞弊“人的行動”本質出發, 重構財務舞弊大數據識別模式。在新的模式下, 財務舞弊識別不再是對舞弊樣本數據的盲目利用。具體來說: 財務舞弊識別先從人的行動出發, 通過假構法演繹推理出真實的財務舞弊行動; 再以指標組合的形式刻畫真實的財務舞弊行動; 最后仿照金稅系統的做法篩選出符合指標組合特征的、 有舞弊嫌疑的公司。與當前財務舞弊大數據識別不同的是, 新的模式下舞弊樣本的主要作用在于檢驗新模式的可行性和有效性。
應當坦承的是, 本文重構的識別模式可能存在如下難點:
第一, 領悟財務舞弊行動。當前財務舞弊大數據識別是基于中國證監會的資料對舞弊公司畫像進而尋找哪些公司像舞弊公司, 本文所提的新模式實則是基于正常公司行動領悟財務舞弊行動, 進而尋找有財務舞弊嫌疑的公司。因此, 如何領悟財務舞弊行動至關重要。文中所提的存貸雙高財務舞弊, 在特征及邏輯上都不難理解。但若因此就認為領悟財務舞弊行動毫無難度, 則可能過于輕視了領悟難度。以虛增存貨的財務舞弊為例, 根據最優存貨持有量模型的啟示, 正常公司的存貨行動可以表述為: “在采購成本大于儲存成本的條件下, 企業增加存貨; 在采購成本小于儲存成本的條件下, 企業減少存貨”; 存貨舞弊行動似乎就可表達為: “在采購成本大于儲存成本的條件下, 企業減少存貨; 在采購成本小于儲存成本的條件下, 企業增加存貨”。這樣的領悟在理論上或許沒有問題, 但在將條件和行動轉化為指標時, 就會發現采購成本和儲存成本很難測量(這兩個成本散布在存貨成本、管理費用等項目中)。所以, 領悟財務舞弊行動, 不僅要在理論和邏輯上講得通,還要在測量上具備可行性。
第二 ,構建舞弊行動的指標組合。在構建條件和行為的指標時, 分子和分母皆有多種選擇。究竟選擇哪一種指標, 既需要在理論上講得通, 還需要在舞弊樣本上能夠檢驗通過。例如, 本文以“上年末貨幣資金總量/本年度投資活動現金流出量”衡量一家公司的籌資需求, 但分子并不是僅可選擇“上年末貨幣資金總量”, 分母也不是僅可選擇“本年度投資活動現金流出量”。究竟以何作為指標的分子和分母, 必須要經過舞弊樣本的反復檢驗才能最終確定。
第三, 評判標準的選定。出于說明新財務舞弊識別模式的考慮, 本文在判斷籌資需求和籌資規模時, 將評判標準選定為同行業所有公司指標值的75% 分位數和25%分位數。應當說, 這種標準的設定過于主觀。如何讓評判標準更客觀, 還需要進一步探索。一條可行的思路是, 擴大樣本公司的數量(不僅包括同行業上市公司, 也包括同行業非上市公司, 甚至包括上下游公司), 按大數定理的原理確定評判標準。
【 主 要 參 考 文 獻 】
陳慶杰.基于經理人特征的財務報告舞弊識別模型的改進研究——來自中國上市公司的實證檢驗[ J].經濟問題,2012(8):118 ~ 122.
管揚威,朱衛東.基于CRIME五因素論的ST公司財務舞弊識別[ J].財會月刊,2014(16):12 ~ 16.
韓麗榮,胡瑋佳,高瑜彬.數據安全性:中國A股上市公司異常會計信息與財務報告舞弊風險的識別[ J].河南社會科學,2015(7):46 ~ 51.
洪葒,胡華夏,郭春飛.2012基于GONE理論的上市公司財務報告舞弊識別研究[ J].會計研究,2012(8):84 ~ 90+97.
洪文洲,王旭霞,馮海旗.基于Logistic回歸模型的上市公司財務報告舞弊識別研究[ J].中國管理科學,2014(S1):351 ~ 356.
皇甫冬雪.基于Lib-SVM的損益調整類財務報告舞弊識別模型研究——來自中國證券市場的證據[ J].會計之友,2011(25):75 ~ 79.
黃世忠,葉欽華,徐珊,葉凡.2010~2019年中國上市公司財務舞弊分析[ J].財會月刊,2020(14):153 ~ 160.
金花妍,劉永澤.基于舞弊三角理論的財務舞弊識別模型研究——支持向量機與Logistic回歸的耦合實證分析[ J].大連理工大學學報(社會科學版),2014(1):92 ~ 97.
李建標,任雪.財務舞弊公司的審計風險能識別嗎——會計師事務所和上市公司治理的雙重因素[ J].山西財經大學學報,2012(2):115 ~ 124.
劉樹磊,李強.財務報告舞弊的識別研究——基于制造業上市公司經驗數據[ J].財會通訊,2011(3):130 ~ 133.
路德維希·馮·米塞斯著.余暉譯.人的行動[M].上海:上海世紀出版集團,2013.
王威.稀疏組Lasso-logistic回歸模型在財務報告舞弊識別中的應用研究[ J].數學的實踐與認識,2020(9):49 ~ 58.
熊方軍,張龍平.上市公司財務舞弊的風險識別與證據收集[ J].經濟與管理研究,2016(10):138 ~ 144.
葉康濤,劉金洋.非財務信息與企業財務舞弊行為識別[ J].會計研究,2021(9):35 ~ 47.
葉欽華,黃世忠,葉凡,徐珊.嚴監管下的財務舞弊分析——基于2020~2021年的舞弊樣本[ J].財會月刊,2022a(13):10 ~ 15.
葉欽華,葉凡,黃世忠.財務舞弊識別框架構建——基于會計信息系統論及大數據視角[ J].會計研究,2022b(3):3 ~ 16.
余玉苗,呂凡.財務舞弊風險的識別——基于財務指標增量信息的研究視角[ J].經濟評論,2010(4):124 ~ 130.
張曾蓮,高雅.財務舞弊識別模型構建及實證檢驗[ J].統計與決策,2017(9):172 ~ 175.
張新民,吳革.財務報告舞弊的特征與識別模型研究[ J].財貿經濟,2008(12):36 ~ 40.
趙納暉,張天洋.基于MDamp;A文本和深度學習模型的財務報告舞弊識別[ J].會計之友,2022(8):140 ~ 149.