劉薇 許池東
1935年美國教授Frank Benford發現了Benford定律,即自然發生的數據,只要樣本足夠,數據1到9作為首位數字的概率單調遞減,之后發表了相關研究成果。后來學者們探討了Benford定律在會計與審計領域的應用。應用Benford定律是否可以幫助會計師事務所進行審計質量控制,尤其是優化業務承接決策,以此來降低審計風險?就此問題,本文將結合H事務所的案例作出研究。
1851年美國數學家Simon Newcomb發現其使用的對數表的首頁比后續頁面的磨損更加嚴重。他發現其他現象中的許多類型的數據也有這種奇怪的現象:數字1和數字2相比,數字1作為首位隨機數的頻率更大;數字2和數字3相比,數字2作為首位隨機數的頻率更大;數字3和數字4相比,數字3作為首位隨機數的頻率更大,剩余情況依次類推。
1935年,同樣是在使用對數表的美國教授Frank Benford也察覺到了這種奇怪的現象。他發現,圖書館很多辭典的前幾頁比后來的頁面更臟,磨損更多。Benford教授仔細研究后得出結論:只要數據樣本足夠,數據1到9作為首位數字的概率單調遞減。Benford發現了許多不同的數據,如人口、會計、股票市場、化學和物理常數、宏觀經濟數據、籃球比賽的數量、河流的長度、每個城市的人口分布數據,以及一些雜志中的所有數據等的首位數字出現特點,均與之前發現的規律有一定的相似。最后得出了描述概括規則的數學表達式,被稱為Benford定律,也被稱為數字的第一定律。
Benford定律描述的是自然數1到9在自然狀態下作為首位數出現的頻率,公式為:

其中P表示d1作為首位數字出現的概率。隨著首位(第一位非0)數字的增大,首位數字的隨機比率會逐漸減小,以9為首位數字(最大)出現的隨機概率最小,其分布概率如表1、圖1所示。
從表1和圖1可以明確看出Benford定律的概率分布和基本原則,數字1到數字9作為首位數的頻率是單調遞減的,且程度越來越小。
雖然Benford定律從一開始就被用于各個領域的統計數據質量測試,但它與其他數據質量評估方法一樣,需要限定使用范圍和場合。外國學者Nigrini(1992)分析并驗證了Benford定律,指出根據福特法律使用的數據集必須滿足四個主要要素:
1.數據必須數量足夠才能具有整體數據的重要特征;
2.數據不應有人為限制,并且沒有指定的最大值和最小值;
3.數據的形成應受多種因素的影響,但人為因素的影響應相對較小,不能發生人工估價現象;
4.數據無法按規律排序。
1.國外研究
Carslaw(1988)最早運用Benford定律評估會計領域的數據,他從上市公司年報中提取總收入這一科目,發現該數據集的第二位數字出現0的概率,在統計學意義上顯著大于出現數字9的概率。他分析這一現象可能是由于管理者有意識地提高收入數據造成的,例如將1999記為2000。由此發現新西蘭上市公司管理層實施了積極的盈余管理。Nigrini(1997)將Benford定律廣泛應用到財務審計領域,認為在檢查會計賬目是否造假和納稅申報中企業是否人為操縱財務數據時,可以使用Benford定律加以分析驗證。這是西方學者首次使用Benford定律檢查審計領域中的財務舞弊行為,在此之后,他又將領域擴大到會計和金融,最后更延伸至選舉中的數據造假現象。Nigrini還開發了運用Benford定律對財務數據進行測試的軟件,之后,許多軟件都加入了這一功能,國際上的著名審計軟件ACL和IDEA等也將Benford定律作為內置功能。此后在美國,該定律在部分實用領域進行了實踐。在經濟方面,會計師可以根據這一定律對公司的年度賬目進行分析,查找偽造數據。例如,美國安然公司會計舞弊案披露后,人們發現該公司在2001-2002年所公布的每股盈利數字不符合Benford定律,這證明了安然的高層領導確實改動過這些數據。在宏觀經濟統計領域,Benford定律己被用于評估國內生產總值(GDP)、居民消費價格指數(CPI)和廣義貨幣供應量(M2)等宏觀數據的準確性。在選舉方面,Benford定律也用于投票欺詐發現,科學家在2004年美國總統大選中發現了佛羅里達州的欺詐行為,以及2004年委內瑞拉和2006年墨西哥的投票欺詐行為。
2.國內研究
馮郁,丁國勇(2003)對某高校財務數據的首位數字分布及前兩位數字分布分別運用Benford定律進行分析,發現前兩位數字的分布呈現出“整點效應”現象。張蘇彤(2005)對我國1394家上市公司財務數據進行Benford定律的驗證性測試,同時采用“模擬造假”方式形成了虛假數字進行結果對比,發現上市公司數據與Benford分布更為接近。同時提出,對于大量樣本可以進一步分層測試,發現其中的特征。王忍,曹建新(2006)使用Benford定律分析我國A股年報披露的凈利潤指標時,發現其與Benford理論分布存在較大差異,這種差異不僅存在于虧損企業的數據中,盈利企業也存在人為操縱利潤的可能。王福勝,李勛(2007)指出Benford定律的應用屬于舞弊偵查方法中的分析性復核法,現有的分析性復核法多是從數據內在邏輯關系出發,而Benford方法是從統計學角度檢測數字分布的內在規律,是對傳統舞弊偵查方法的很好的補充,給財務舞弊增加了難度。許存興、王大江、張芙蓉(2009)沒有選取正常的審計報告,而是以出現異常的上市公司年報為數據源(即選取被出具非標準意見的年報),利用Benford定律進行檢測,發現資產負債表數據準確性較好,而利潤表準確性較差;通過比較各季度報表數據準確性,發現第四季度財務數據真實性最高,第二季度財務數據真實性最低。李薈(2012)利用Benford定律研究了上市公司應收賬款和主營業務收入的兩個科目數據主體,并分析了兩個指標首數字的概率分布,結果發現,這兩種分布都遵循Benford定律,但應收賬款與Benford定律符合程度較高,主要業務收入則較低。因此她認為,相比操縱資金往來項目(應收賬款),上市公司更傾向于操縱利潤指標(主營業務收入)進行欺詐。

圖1 Benford定律數字概率分布圖

圖2 資產負債表指標首位數字頻率分布對比圖例

圖3 利潤表指標首位數字分布頻率對比圖例
對會計師事務所來說,審計風險貫穿于審計業務承接、審計程序執行到審計報告的完成以及報告后的整個過程。對這些風險的控制決定了審計質量控制的水平。只有在審計全流程關注審計風險并將其降低至可接受水平,才能避免審計失敗、獲得審計收益。審計客戶的選擇是影響會計師事務所審計風險的重要因素,審計業務承接決策是審計風險控制的第一道防線。如果業務承接不謹慎,沒有識別到客戶的經營困境或者惡意欺詐,就很容易發生審計失敗。而審計失敗帶來的訴訟風險和聲譽損失,對會計師事務所產生的影響也越來越顯著。
Chio、Rajib、Doogar(2004)發現會計師事務所承接業務時,會受到當時法律環境的影響,其承接業務的謹慎性與法律風險強弱正相關,即在訴訟風險高峰時期,更不愿意接受高風險的客戶。Randal Elder et al(2009)研究發現,事務所為了降低審計風險,出具非標準審計意見報告更多地是針對高風險客戶。Esamaddin Khorwatt(2015)認為對客戶的內外環境進行分析是承接新業務時必要的審計程序,即識別評估業務承接的審計風險。
謝榮(2003)提出在進行業務承接決策時,必須把握審計風險的可控性和客戶的整體情況,除了分析企業的財務狀況和經營成果外,還應該詳細分析企業的戰略目標、商業環境、管理層的經營理念和誠信程度。黃婧媛(2003)通過分析業務承接決策過程中各個風險的確認和相互關系,從風險評估的角度出發,建立了一個接受客戶決策的模型。原紅旗、李海建(2004)研究發現,在對公司的選擇上,不同類型的會計師事務所不存在較大差異,而且被審計公司在財務特征上也不存在較大差異。廖義剛、孫俊奇、陳燕(2009)以客戶選擇為視角研究提高注冊會計師的責任,結果表明,會計師事務所更傾向于選擇風險較低的審計客戶,以此規避審計風險,維護聲譽。徐海玲(2016)研究發現,隨著會計師事務所從有限責任制轉為特殊普通合伙制,訴訟風險更大,注冊會計師的法律風險也增大了,會計師事務所會更加慎重篩選所承接的客戶,以此來降低審計風險。

表1 Benford定律數字概率分布表

表2 Pearson相關系數檢驗標準

表3 各指標首位數字頻率分布對比

表4 各數據集觀測頻率和Benford定律下頻率的Pearson相關系數
從國內外文獻回顧看來,現有的關于審計質量控制相關理論起步和實務基礎大多是由國外發展而來,國外的學者研究起步早,對于審計質量控制的研究呈現出在具體案例的基礎上與多學科結合的趨勢,不單單考慮傳統的審計業務相關內容,還聯系到了企業制度和戰略等因素。而國內學者的研究大多是結合我國國內具體的政策背景,綜合運用規范研究和案例研究的方法,對于本土出現的審計風險和審計事故進行研究。
綜上,已有文獻大多研究審計質量控制的目標,在于解決實際工作中可能出現的財務舞弊,財務造假等審計事故,側重在實務層面上,具體剖析現階段影響會計師事務所審計質量的原因和對策,而從會計師事務所審計業務承接的角度進行的研究相對匱乏,可以直接檢索到的國內外相關文獻也比較少,進行實證研究的也極少,大都進行規范性研究。另外,國外和國內學者們對會計師事務所如何優化業務承接決策,降低審計風險,得出的結論也不盡相同,缺乏對具體方法的深入研究,未檢索到將Benford定律應用于事務所業務承接研究的相關文獻。
近年來,在我國政策的扶持下,一些內資所己經打破市場壟斷,形成國際“四大”、本土“八大”的注冊會計師事務所的領軍地位。然而與內資事務所排名躍升相反的是,其受到的處罰也接二連三。由于證監會和財政部的監管愈趨嚴格,會計師事務所在執業過程中可能面臨的風險也在逐漸擴大。因此,對于會計師事務所和監管機構來說,如何及時發現其在業務承接和執行審計業務過程中暴露的風險管理缺陷、迅速建立有效的應對機制,成為當前的一大難題。本文將應用Benford定律檢驗客戶的會計數據可靠性的步驟描述如下:
1.選擇有代表性的數據,采集盡可能多的樣本,并對數據進行初步整理;
2.判斷使用Benford定律評估該數據集的數據準確性是否適用。由于Benford定律存在一定的適用條件,因此在檢測前必須先確認其適用性;
3.對數據進行處理。例如,對含有負值的數據,可以取絕對值;對于為0的數據可以剔除掉等等;
4.提取數據的首位數字,計算其首位數字分布率,與Benford定律進行比較,應用相關系數檢驗方法進行檢驗。本文將采取Pearson相關系數的相似度模型進行檢驗;
5.得出結論。依據給定的顯著水平所對應的臨界值,判斷其是否符合Benford定律。如果符合Benford定律,則說明數據準確性可能較好,如果不符合,則說明數據準確性可能存在問題。
需要說明的是,相似度計算中最常用的方法是基于向量之間相關系數的計算方法,Pearson相關系數是非常適合作為相似度評價標準的一種方法。具體而言,Pearson相關系數利用兩個向量之間的線性相關性來定義向量之間的相似度,其輸出范圍為-1到+1,0代表無相關性,負值為負向,正值為正相關。其統計量公式為:

其中, 是數據集的首位數字為i的觀測頻率, 是Benford定律中首位數字為i的理論頻率。分別表示為對應量的均值。的絕對值越接近1,則數據集的首位數字越傾向于服從Benford定律,認為數據準確性越高。 絕對值越接近0,則數據集的首位數字越傾向于不服從Benford定律,認為數據準確性越低。其具體判斷標準如表2所示:
從Benford定律的相關概述可以看出,通過對數據的統計和Pearson相關系數檢驗法的應用,Benford定律是從一種統計分析的角度,來確定數據的準確性。相對于其他各式各樣的統計數據質量評估方法,利用Benford定律具有很多特性:1.易操作。即便不是專業人員,也能利用相關軟件使用此方法。2.成本低。使用此定律的成本較低,不需要大量的人工與時間,只要數據收集處理符合要求,即可得到對于數據準確性的判斷,完全符合大多數單位對于風險評估的預算預期。
上市公司數據來源主要有年報、半年報、季報以及特殊事項報告等,其中年報審計最為嚴格。其中的財務報表包括資產負債表、利潤表、現金流量表、所有者權益變動表(或股東權益變動表)以及財務報表附注。
本文選取的數據來自由H會計師事務所出具的2014年度審計報告,且審計意見為標準無保留的316家我國上市公司所公布的2007-2012年年度審計報告中的資產負債表、利潤表,數據來源于國泰安CSMAR數據庫。選取的數據均經過證監會認可的審計機構審計,針對有調整的報表選取了最終調整后申報的數據,對同時存在合并與非合并報表的,選取了合并報表。
特別要說明的一點是,“ST”制度對于上市公司的影響巨大,是對上市公司的特別處理措施——暫停上市,亦為退市前的過渡階段。根據中國證監會的有關規定,成為“ST”的原因包括了上市公司出現異常狀況,其中包含財務狀況異常及其他方面的異常;也包括了上市公司連續虧損。連續虧損的上市公司存在巨大退市壓力,也有足夠的經濟利益驅動上市公司相關方鋌而走險,利用各種可能的手段盡可能滿足監管要求,其中就包含了財務造假的可能。當然某些馬上就會被列為“ST”股票的上市公司存在更高的財務造假可能性,該類公司的數量更多,且很多都存在多次造假記錄。綜上所述,將H會計師事務所審計的ST企業數據剔除后,本文最終選定309家企業數據(含2017年證監會行政處罰的000961Y實業公司)。
指標選擇方面,選擇在財務分析中通常使用、投資者關注度高、財務舞弊通常涉及的財務指標,包括從資產負債表指標(Asset)中選取的主要財務項目:應收賬款、資產合計、應付賬款、負債合計、資本公積、未分配利潤、所有者權益;從利潤表(Profit)中選取的主要財務項目:營業收入、營業成本、銷售費用、管理費用、財務費用、利潤總額、凈利潤。
根據上述對Benford定律的描述可以了解到,Benford定律要求第一位數字是有效數字:非負、非零,因此在數據處理時要根據這個原則對所選數據集進行篩選分析。因所選取數據均取自CSMAR數據庫,可知數據均符合非負這一原則,因此在運用數據進行實證研究時,本文運用Python3軟件對所選取數據集進行去零、去空處理,使得各數據集條件符合Benford定律的基本原則。
通過運用Python3軟件及EXCEL軟件計算可知,所選取的308家企業2007-2012年度資產負債表(下文簡稱“308Asset”)包含數據分布為42425,利潤表(下文簡稱為“308Profit”)包含數據分布為40933,被證監會處罰的Y實業公司2007-2012年度資產負債表(下文簡稱為“000961Asset”)包含數據分布為156,利潤表(下文簡稱為“000961Profit”)包含數據分布為156。
根據以上理論和步驟,通過Python3以及Excel軟件分析可得出,選取的4個數據集中首位數字出現的頻率和Benford定律的期望頻率如表3所示。
統計指標Asset的描述性統計如圖2所示,可以看出在Asset指標中統計數字集308Asset總的觀測頻率是呈遞減趨勢的,數字2、數字3的出現頻率出現了輕微的向下浮動,而數字8的出現頻率出現了輕微向下浮動,從整體上看基本與Benford定律的曲線吻合,說明308家H所出具標準無保留意見的上市企業的資產負債表數據符合Benford定律特征。數字集000961Asset總的觀測頻率也呈遞減趨勢,但可以明顯看出數字1的出現頻率明顯高于Benford定律的期望頻率;數字3出現頻率有明顯向上凸起,高于期望頻率;數字5、數字6的頻率有較明顯的向下凹陷,低于期望頻率;數字7、數字8的出現頻率輕微向下浮動,略低于期望頻率。由于有多個數字的出現頻率明顯不符合Benford定律特征,說明000961Y實業公司在2007-2012年度的資產負債表存在較大程度的數據篡改可能。
統計指標Profit的描述性統計如圖3所示,可以看出在Profit指標中統計數字集308Profit總的觀測頻率是呈遞減趨勢的,數字1的出現頻率出現了輕微的向下浮動,而數字5、數字6的出現頻率出現了輕微向下浮動,從整體上看基本與Benford定律的曲線吻合,說明308家H所出具標準無保留意見的上市企業的利潤表數據符合Benford定律特征。數字集000961Profit總的觀測頻率也是呈遞減趨勢,可以明顯看出數字1、數字2、數字8的出現頻率有不同程度的下滑,出現頻率有明顯的偏低;數字4、數字5、數字6、數字9出現頻率有較明顯的凸起(上浮),其出現頻率高于期望頻率。由于有多個數字的出現頻率明顯不符合Benford定律特征,說明000961Y實業公司2007-2012年度的利潤表存在較大程度的數據篡改可能。
綜上所述,從表3和圖2、圖3可以看出,統計數據集308Asset、308Profit中統計數據的第一位數字分布基本都是隨著數字的增加,呈不斷遞減的趨勢,且跟Benford定律期望頻率相差極小,從觀測層面上完全符合Benford定律的基本特征。盡管有部分數字頻率與Benford定律下的期望頻率不是完全吻合,考慮到CSMAR數據庫中數據的取得過程,以及財務報表數據本身就存在一定的調整,有理由相信308家上市企業的2007-2012年度的資產負債表以及利潤表的數據質量是比較可靠的,即對H會計師事務所而言,根據以上信息可以表明這308家客戶是比較誠信的,會計師事務所承接以上企業2012年度的審計業務的審計風險,在客戶誠信層面是比較低的。而統計數據集000961Asset、000961Profit中統計數據的第一位數字分布盡管從整體的角度看是隨著數字的增加有不斷遞減的趨勢,同時可以明顯看到,有部分數字存在階段性遞增現象,而且個別數字的出現概率和Benford定律下的期望概率有較大差異。對此,我們有理由確定,Y實業公司000961的2007-2012年度的資產負債表以及利潤表的數據質量是有待商榷的,存在較大的數據造假可能,即對H會計師事務所而言,根據該信息,可判斷承接Y實業公司2012年度的審計業務的審計風險,在客戶誠信層面是較高的,這對于審計質量控制方面并不是一個好的信號。
Pearson相關系數檢驗:運用統計軟件,求出指標中各數據集內各數字實際出現頻率和Benford定律的期望頻率的Pearson相關系數。
從表4可以看到計算結果,308Asset、308Prfit兩個數據集首數字的分布頻率與Benford定律期望的頻率分布相差很小,且Pearson相關系數均大于0.99,根據相關系數的評估標準,這兩個數據集符合Benford定律,屬于高質量數據集。然而000961Asset、000961Profit數據集中,首數字出現頻率與Benford定律的期望頻率的Pearson相關系數并不理想,相關系數檢測可以看出得到的相關系數均小于0.97,根據相關系數的評估標準,此兩組數據集存在數據篡改的很大可能,需要進一步檢查核實。
綜上所述,按照308Asset、308Profit兩個數據集代表的實際意義,可以推斷出這308家企業2007-2012年度的資產負債表及利潤表中財務數據是較為真實可信的,進而推斷出對于這308家企業的客戶誠信是有保障的,對于H會計師事務所而言,在客戶誠信層面的審計風險是較低的。而根據000961Asset、000961Profit兩個數據集在Pearson相關系數檢驗的表現,可以推斷出Y實業公司的2007-2012年度的資產負債表以及利潤表數據存在較大的數據篡改可能,進而推斷出作為會計師事務所客戶的Y實業公司高層的客戶誠信水平值得商榷,這對于H會計師事務所承接Y實業公司2012年度的審計業務,在客戶誠信方面的風險是較高的。而在2017年證監會的行政處罰書中H會計師事務所的審計失敗也證明了這一點。
1.本文主要針對H會計師事務所2017-2018年間接連被證監會處罰這一現象,從審計業務客戶承接這一角度入手,通過結合Benford定律,對CSMAR數據庫中的H會計師事務所承接2013年度Y實業公司審計業務以及同期承接審計業務的另外308家非ST企業的資產負債表以及利潤表進行研究,得出的結果如下:通過Benford定律對共計309家企業的財務數據進行相關性分析,經過統計檢驗發現所選數據集中,Y實業公司的數據質量存在問題,在資產負債表中具體表現為數字1、數字3作為首位數的出現頻率較Benford定律有大幅度上升,數字5、數字6、數字6作為首位數的出現頻率較Benford定律有一定程度的下降;在利潤表中具體表現為數字4、數字5、數字6、數字9作為首位數的出現頻率較Benford定律有一定程度的上升,數字1、數字2、數字8作為首位數的出現頻率較Benford定律有一定程度的下降。而另外的308家企業的數據集無論是資產負債表還是利潤表,其各數字作為首位數的出現頻率基本與Benford定律相近,數據的質量明顯好于Y實業公司的數據。
2.通過本次分析,以及與2017年H所被處罰事件的相互映照,本文認為Benford定律的檢驗,能夠在會計師事務所承接業務前,對客戶的誠信有一個比較可靠的預估。對于影響審計質量中的不可控因素——執業的工作環境,有一個了解,對于接下來是否承接或承接業務后注冊會計師對于被審計單位數據真實性有一定了解,對開展內部控制測試有一定指導作用。
1.不符合Benford定律分布的數據并不一定存在人為篡改,一些正常的業務活動也可能影響數字分布規律,如合理的四舍五入,以及季節性、政策性等外部因素,對此還需要進一步的研究分析。同樣,符合Benford定律分布的數據也不意味著其數據準確性完全沒有問題,特別是當數據集容量較大的時候,存在準確性問題的數據可能淹沒在數據集的規律中而不能被發現。
2.現實中的舞弊手段與舞弊行為更加復雜,其本身可能對數據分布規律不造成影響。對于某些一般不會在賬目上反映出來的行為,例如回扣、受賄等舞弊行為等,無法利用Benford定律的相關性檢驗進行分析。
3.Benford定律并不能直接確定存在異常的某一項具體數據,只能確定是以哪個數字為首位的數據集存在篡改舞弊的可能,具體問題還需要與其他審計方法結合使用才能發現。
通過對客戶會計數據進行Benford定律驗證,能從總體上把握客戶數據的質量水平,有利于會計師事務所做出是否承接審計業務的決策,以降低審計風險,提高審計質量。
如果會計師事務所已經承接了審計業務,可以對客戶具體賬簿數據進行進一步的Benford定律驗證,找到數據異常的具體賬戶,以確定重點審計領域和重點審計賬戶。