摘 要:奔福德定律被稱為“第一位數分布規律”,它描述了數字1~9在數據首位出現的概率。分析了奔福德定律在政府統計數據質量的可信度問題中應用的可行性,在這個基礎上,嘗試利用此定律分析政府統計數據質量的可信度問題。
關鍵詞:政府統計數據;奔福德定律;數值分析
中圖分類號:F0 文獻標志碼:A 文章編號:1673-291X(2012)12-0001-02
一、研究背景
國外學者對奔福德定律的研究非常廣泛,取得了豐富的成果。國外學者發表關于奔福德定律的文章有很多,許多著名的學者如Pinkham、Raimi、Hill、Nigrini和Carslaw等對奔福德定律的研究都卓有成效。國內對奔福德定律的介紹和研究很少,實踐上也沒有得到廣泛的應用。2005年,中國政法大學法務會計研究中心的張蘇彤教授在中國會計學會2005年學術年會中發表的一篇文章,介紹了奔福德定律及其在審計中的應用。通過驗證性測試,張蘇彤教授發現中國上市公司公布的財務數據可以較好地符合奔福德定律。之后,相繼有不少國內學者發表關于奔福德定律的文章,但大都是應用在審計領域,研究中國上市公司數據造假的問題。
近年來,政府統計數據質量的可信度問題是國家和社會廣泛關注的熱點,為了更好的滿足社會各界對政府統計數據質量的需求,為了進一步提高政府統計數據質量的真實性、可靠性,有必要對政府統計數據質量的可信度問題進行系統深入的研究。
二、奔福德定律介紹
1.奔福德定律的經典理論。奔福德定律是由美國數學家、天文學家賽蒙·紐卡姆在1881年首次發現的。1938年美國通用電器的物理學家弗瑞克·奔福德收集并驗證了總數為20 229個的20組數字,他發現在這些數字中,1在數字中第一位出現的概率大約為30%;2在數字中第一位出現的概率大約為17%;3在數字中第一位出現的概率大約為12%;而8和9在數字中第一位出現的概率約為5%和4%。這一規律因此也被人們稱為“第一位數分布規律”。
1、2、3、4、5、6、7、8、9各數字在樣本數據首位上出現的期望概率(如表1所示)。
2.對奔福德定律檢驗結果的評價。奔福德定律的期望分布是一種對數分布,其標準差公式表示為:
Si=[pi·(1-pi)/n]■
其中,Si表示從1~9每個數字的標準差;pi表示奔福德定律的分布概率;n表示樣本數據量;Z檢驗可以被用來分析數據是否超出可信賴水平,因此Z檢驗可以被用來檢驗數據的可信度。Z檢驗的公式可以表示如下:
Z=■
其中,p′i表示被測數據的實際分布概率;pi表示奔福德定律的分布概率;Si表示從1~9每個數字的標準差;n表示樣本數據量。
根據上述公式計算出的Z值如果是1.96,表示顯著性水平為0.025,即可信度為97.5%,如果計算出的Z值是1.64,表示顯著性水平為0.05,則可信度為95%。
三、奔福德定律應用在統計數據質量可信度問題中的可行性分析
通過參閱大量文獻,可以知道統計數據可以用奔福德定律進行分析。其中參考文獻[7]中明確指出,會計、統計、稅收、金融以及證券市場的各種數字可以很好地符合奔福德定律。統計數據呈自然狀態分布時存在著特定的分布規律,這種分布規律和奔福德定律有著一定的聯系。假設真實的數據可以非常好地符合奔福德定律,那么如果有數據和奔福德定律相背離,就意味著存在數據失真的可能性。統計是一項技術性很強的工作,而計算機統計軟件的使用為奔福德定律的應用創造了條件,使得應用奔福德定律分析問題耗時短,效率高,得出的結果具有一定的參考價值。這說明了,奔福德定律在政府統計數據質量的可信度分析中有一定的可行性。
四、奔福德定律驗證性測試
1.奔福德定律測試結果及對結果的解釋。選取2007年中國政府統計中的生產總值等40項社會經濟總量指標,以31個省市為對象進行分析(即n=1 240)。指標變量的數據來源于《中國統計年鑒(2008)》。整個過程應用Excel軟件,測試結果(如表2所示)。
一般認為,當0.998 0.97 五、小結 當樣本數據出現概率與奔福德定律的相關程度較高,但是分布存在差異時,首先應考慮樣本量大小的影響。其次還要考慮是否存在數據失真,可能是由某些客觀原因造成的數據異常。應該在剔除異常數據后重新測試,從而判斷出異常數據的存在對測試結果是否有影響。如果檢測結果符合奔福德定律的概率分布,并不意味著一定不存在數據失真,在大樣本的情況下,統計人員還應該做分層測試,進而得到更準確的測試結果。 文章需要進一步改進之處:根據“樣本數據越多,測試結果越有效”這一規律,加大被檢測數據的樣本量,使樣本數據的分布隨機性降到最低,使測試效果更加準確;進一步擴大選取的指標范圍,增加樣本數據的來源渠道,使得奔福德定律的應用更具廣泛性;對選取的被檢測數據進行分層次檢驗。本文所得出的結論僅限于對政府統計數據中的若干總量指標數據進行測試,至于其他指標數據是否也可以用奔福德定律進行可信度分析還需要進一步驗證。 參考文獻: [1] 張蘇彤.奔福德定律:一種舞弊審計的數值分析方法[J].中國注冊會計師,2005,(11). [2] 王福勝,李勛,孫遜.奔福德定律在審計中的應用[J].財會月刊,2007,(8). [3] 李勛.奔福德定律在審計中的應用研究[D].哈爾濱:哈爾濱工業大學,2006. [4] 朱文明,王昊,陳偉.基于benford法規的舞弊檢測方法研究[J].數理統計與管理,2007,(1). [5] 許存興,張芙蓉.上市公司資產負債表造假實證分析——基于奔福德定律的研究[J].內蒙古財經學院學報,2009,(3). [6] 王戌.研究和運用現代審計方法應注意的幾個問題[J].中國審計,2004,(9). [7] Hill,T.The power of one[J].New Scientist,1999,(7). [8] 唯美科技,孫志剛,楊聰.Excel在經濟與數理統計中的應用[M].北京:中國電力出版社,2003. [責任編輯 劉嬌嬌]