摘 要:隨著我國經濟實力與國際影響力的不斷提高,人們對宏觀經濟總量及其相關的數據統計準確性越發關注。部分學者對我國宏觀經濟統計數據的準確性存在著質疑,認為其存在著人為操縱因素。引入Benford評價,在分析Benford法則及其檢驗方法的基礎上,進行宏觀經濟統計數據質量的Benford評價及實證研究。研究結果表明,Benford法則在數據可靠性分析上具備較好的穩健性,宏觀經濟統計數據可靠性特征突出,不存在人為操縱現象。
關鍵詞:宏觀經濟 統計數據 質量 Benford 評價 實證研究
中圖分類號:F131.30 文獻標識碼:A
文章編號:1004-4914(2015)07-061-02
一、引言
隨著近年來國民經濟的快速發展,我國經濟實力與國際綜合影響力不斷提高,我國宏觀經濟統計數據質量引起了世界關注,國內外相關機構及學者對宏觀經濟統計的準確性問題進行了大量研究。本文引入Benford法則進行宏觀經濟數量質量的評價。實踐證明,應用Benford法則,其在數據質量評價應用中存在著成本較低,穩健性良好等優勢。在分析Benford法則及其檢驗方法的基礎上,探究其在宏觀經濟統計數據質量的實證研究。
二、Benford法則及其檢驗方法認知
(一)Benford法則的基本認知
Benford法則是以物理學家Frank Benford名字所命名的一種數值規律,其法則認為,人們進行數據處理時,其將較小數字作為首位數字的數據的頻率相對較高。其通過長時間的數據收集與分析,對其規律進行了論證,即“Benford定律”,又被稱之為“首位數法則”。通過研究與推導,Benford依據其定律獲得以下數學表達式:
p(d1)=lg(1+■) d1=1,2,3,…9
在上式中,p(d1)代表的是以d1作為首位數字所出現的頻率參數,首位數字,指的是數據集中數字左側的第一位數字,其數字應非零非負,確保其數據有效性。其公式即Benford法則表達式。
Benford法則的出現,為進行大量數據的數字分布狀況預測提供了理論支持。然而該方法在最初階段缺乏對該現象的合理解釋與證明,隨著學者進一步的研究與論證,對該法則應用的范圍與影響因素進行了明確,如要求數據具備一定規模性,數據形成不執行認為直接賦值,數據不應為按照規律排列的數據集等。
(二)Benford法則在宏觀經濟數據質量中檢測的方法
國內外大量實證性研究表明,應用Benford法則可以進行數據集中的舞弊行為有效檢測,將目標數據所具備的實際數字分布規律與Benford法則條件下的標準分布規律進行對比,獲取評估結果,判斷其實際數據分布規律是否存在不合理現象。如存在,則說明數據統計存在著人為因素證明數據集可靠性較差。Benford法則進行數據檢驗,其本質上屬于一種對比檢驗方法,具體的流程為:第一,選定宏觀經濟指標,進行電子數據采集,其宏觀經濟指標應具備代表性;第二,對所收集的數據集是否符合Benford法則進行判斷,選擇一定的目標字段,Benford法則其數據集適應條件為:數據信息其來源不同,采取隨機抽樣方式形成統計數據;第三,針對選中目標字段,將統計數據進行一定處理,如數據中存在的負值可以取其絕對值,針對首位為0的數據則可以通過數據擴大來提取數字;第四,進行數據異常分析。將所選擇的數據集之中的數據首位進行分離,進行數據首位1—9各個數字所出現的頻率與分布規律進行描述,將其分布規律與Benford法則條件下的分布規律進行對比,計算出其數據分布偏差參數,將所選數據第二位進行分離,采取通道方式進行數字頻率統計與分布規模描述,循環操作并觀察數據是否存在異常,以上操作可通過統計軟件來實現;第五,依據統計結果與數字分布偏差研究,對數據可靠性進行判斷,針對不可靠數據應找出原因,給出結論。
三、宏觀經濟統計數據質量的Benford法則評價及實證研究
在Benford法則進行宏觀經濟統計數據準確性實證研究中,選擇兩個視角進行分析,其一,對我國成立后四個經濟部門的主要宏觀經濟指標數值執行分析,時間階段選擇1949年—2008年期間,采取Benford法則對其經濟指標可靠性進行分析。綜合數值取值可靠性,以分段形式進行縱向研究,進而獲得宏觀經濟統計數據質量狀況。其二,從區域視角進行研究,即以我國主要省份宏觀經濟指標總量進行數據可靠性分析。
(一)我國歷年來宏觀經濟統計數據所具備的可靠性研究
1.宏觀經濟指標選擇。在本研究中,以國民經濟核算統計、政府財政統計、金融業與國際收支平衡四個部門為研究對象,選擇主要的經濟變量,指標選擇中需要考慮指標的全面性、代表性與數據可獲取性。如在民國經濟核算部門,其指標選擇以國內生產總值、居民消費水平、固定資本總額。支付消費支出及股票籌資額等指標;政府財政統計部門中則選擇國家財政收入、國家財政支出、預算外資金收入及支出總額、國家外債余額等指標;金融業部門則選擇現金收入與現金支出、信貸資金總額、流通現金四個指標,國際收支平衡部門則選擇經常項目差額、金融項目差額、儲備資產增減額及凈誤差、資本往來項目差額、儲備資產遺漏等為統計指標。
考慮到我們建國后不同經濟體制的差異,有些項目指標在當時并不存在,為此選擇相近指標作為補充。如固定資本形成總額指標,在1978年之前,我國采取的是固定資產積累額等。在實證研究中,以1950—2008年為時間段,選取指標數據作為數據集,其數據來源為各年《中國統計年鑒》,在數據調取時,存在著一定的數據缺失問題,最終數據獲取情況如下:國民經濟核算數據為246個,政府財政統計數據為265個,金融業部門數據為198個,國際收支平衡部門其數據共108個。
2.指標數據的處理操作。考慮到應用Benford法則需要確保數據首位數字為有效數字,即要求首位數字非零非負,為此,在進行數據分析之前需要進行數據處理,從而為數據提取與分析奠定基礎。針對部分指標數值為負值的數據,取其絕對值將其轉變為正數,針對不同單位數據指標,針對大于0小于1的數據,采取數據提取并乘以100的方法獲取新的數據,其數據處理均可以通過Excel來實現。
3.宏觀經濟統計數據的Benford法則實證分析。在進行實證研究時,其思路設計為:針對每個經濟部門,如其統計指標所選擇的數據可靠性良好,則該組數據的首位及第二位數字所具備的分布規律與Benford法則條件下的規律相符;而如其數據首位及第二位所具備的的分布規律與Benford法則條件下規律差異較大,則可以判斷其統計數據具有不可靠性。
在實證研究過程中,依托Excel軟件來實現。通過應用LEAF函數與MID函數,將每個經濟部門統計數據的第一位數字與第二位數字提取,采取COUNTIF函數,進行經濟部門首位數字與第二位數字1—9自然數所出現頻率的統計,將其統計結果與Benford法則期望頻率進行對比分析。采取擬合優度檢驗,進行數字分布與Benford法則分布狀況的整體擬合程度研究,從而判斷經濟部門所具備的統計數據準確性與可靠性,實現宏觀經濟統計數據質量的評價。
在本研究中,其擬合優度即偏離誤差研究,引入非參數統計x2擬合優度檢驗法,其表達式如下:
首位數字:x2(8)=N×■■
第二位數字:x2(9)=N×■■
在上式中,N代表的是數據樣本個數值,θi代表的是數字i是首位數字或第二位數字時所出現的實際頻率,f(i)代表的是在Benford法則中,數字i作為首位數字或第二位數字所期望出現的頻率。通過公式可以看出,x2所取統計值越大,則其數據分布與Benford法則所期望的分布偏差則會增加,其統計數據的可靠性則越低。反之,隨著x2所取統計值的降低,其與Benford法則所期望的分布擬合度越高,說明統計數據的準確性越好。如表1為國民經濟核算統計數據前兩位數字所出現的頻率與Benford法則期望頻率對比表:
從表1可以看出,國民經濟核算統計數據,其首位數字觀察頻率在整體趨勢上而言,表現為遞減分布規律,只有數字8、9分布頻率相對數字7分布頻率高一些;第二位數字分布頻率沒有呈現出較為顯著的遞減規律,其分布表現為階段性遞減趨勢。從對相關數據頻率及Benford法則期望頻率差異對比,首位數字及第二位數字差異值可以控制在[0,0.1]范圍之內。采取同樣方法,可以進行政府財政統計數據的分析,獲取其首位數字觀察頻率與Benford法則期望頻率大致相同,其差異值控制在[0,0.1]范圍之內。金融業數據中,其觀察頻率與Benford法則之間吻合性偏低,數字出現頻率在1—4范圍內遞減,但在5之后呈現出上升趨勢,但從觀察頻率與Benford法則期望頻率差異值的角度進行分析,其首位數字與第二位數字差異值均控制在[0,0.1]范圍之內。在分析國際收支平衡統計數據時,發現其首位數字分布規律表現出遞減與階段性遞增狀況,第二位數字分布情況較為雜亂,然而其差異值均控制在[0,0.1]范圍之內。采取x2擬合優度檢驗法進行觀察頻率及期望頻率擬合度檢驗,擬合結果顯示,在0.05置信水平條件下,所選四個部門其統計數據首位數字及第二位數字擬合度較好,準確可靠性較高,符合Benford法則。
(二)區域宏觀經濟統計數據質量的Benford法則分析
在區域宏觀經濟統計數據可靠性研究中,為更為全面評價經濟統計數據質量,在研究時間縱向數據的同時,選擇區域2008年的統計數據進行橫向研究。具體指標選擇上,以各主要省份的區域生產總值、區域居民消費水平、資本形成總額、財政統計預算收入及預算支出、政府消費支出等作為主要研究指標,依據統計年鑒,獲取數據共計186個。其研究方法與歷年來宏觀經濟統計數據研究部方法一樣,進行數據第一位數字及第二位數字提取,計算其頻率分布并與Benford法則期望頻率進行綜合對比,以擬合優度檢驗進行整體擬合,從而判斷2008年我國統計數據的準確性。研究結果發現,2008年我國地區宏觀經濟總量統計數據首位數字的觀察頻率呈現出遞減分布趨勢,但其與Benford法則期望分布頻率存在著一定差異,局部存在遞增現象,第二位數字分布其遞減表現不顯著。從觀察頻率與Benford法則期望頻率差異值來分析,其差異控制在[0,0.1]范圍內。進行擬合優度檢驗后發現,我國31個省份其宏觀經濟統計數據的第一位與第二位數字分布與Benford法則期望分布較為符合,不存在較大差異,說明區域宏觀經濟統計數據較為準確,可靠性較高。
四、結語
伴隨著我國國民經濟的快速發展,人們對宏觀經濟總量數據統計的準確性越發關注。為評價我國宏觀經濟統計數據質量,對其進行Benford法則評價與實證研究。在論述Benford法則及其檢驗方法的基礎上,以歷年來宏觀經濟統計數據及區域宏觀經濟統計數據為主要視角,采取Benford法則進行統計數據質量分析。實證研究表明,不論是宏觀經濟統計數據還是區域宏觀經濟統計數據,其數據首位及第二位數字與Benford法則期望分布規律擬合度較高,證明了其統計數據的可靠性與準確性。
參考文獻:
[1] 李鵬.基于Benford法則的GDP統計數據準確性研究[J].商情,2013(9):59,63
[2] 劉云霞,吳曦明,曾五一等.關于綜合運用Benford法則和面板模型檢測統計數據質量的研究[J].統計研究,2012,29(11):74-78
[3] 劉云霞,曾五一.關于綜合利用Benford法則與其他方法評估統計數據質量的進一步研究[J].統計研究,2013,30(8):3-9
[4] 易嬌.GDP數據質量的可信度分析及實證研究[D].湖南大學,2013
[5] 劉明宇.基于Benford法則的城鎮居民人均可支配收入質量評估[J].統計與咨詢,2014(6):30-30,31
[6] 易嬌.GDP數據質量的可信度分析及實證研究[D].湖南大學,2013.DOI:10.7666/d.D390731
[7] 晏正春.基于Benford法則的GDP數據可靠性分析--以四川省為例[J].中小企業管理與科技,2014(33):74-75
[8] 張珺華.我國宏觀經濟統計數據質量的Benford評價及實證研究[D].山西財經大學,2011
[9] 曾五一,薛梅林.GDP國家數據與地區數據的可銜接性研究[J].廈門大學學報(哲學社會科學版),2014(2):110-119
[10] 孫飛,宋向東,鄭陽等.區域宏觀經濟數據質量的檢驗[J].中國集體經濟,2015(1):64-65
(作者單位:河南財經政法大學統計學院 河南鄭州 450002)
[作者簡介:闞珍珍(1980—),女,河南信陽人,河南財經政法大學統計學院講師,主要研究方向:經濟統計]
(責編:若佳)