摘 要:克強指數使用三個經濟指標對某些地區經濟運行狀況進行評估,研究這種評價方法是否適用于所有省份。首先使用Benford法則對克強指數相關指標的各省份2003—2012年年度數據的數據質量進行可靠性研究。在發現鐵路貨運量指標的數據可靠性存在問題的基礎上,對克強指數的指標進行優化改進,改進后的指標體系能夠更好地擬合各省經濟運行狀況。
關鍵詞:克強指數;Benfrod法則;回歸擬合
中圖分類號:F0 文獻標志碼:A 文章編號:1673-291X(2014)31-0006-03
引言
一個國家的經濟運行狀況有許多經濟指標可以反映,這些宏觀經濟指標的數據質量如何,越來越受到關注,地方政府對掩飾篡改經濟數據一直有著強烈的動機和利益考量。如何能甄別經濟數據的真實性和可靠性,進而做出正確的科學的經濟決策一直都為學術界所樂于探討。
克強指數源于李克強總理2007年任職遼寧省委書記時,喜歡通過工業用電量新增、鐵路貨運量新增和銀行中長期貸款新增三個指標分析當時遼寧省經濟狀況??藦娭笖档某霈F為我們提供了一種全新的對地區經濟狀況的評價方法和思路,作為對經濟運行做出判斷的成功范例,對克強指數的研究和改進與完善就顯得非常重要。
一、基礎知識
(一)Benford法則介紹
Simon Neweomb經過大量的統計分析發現許多類型的數字都很好地符合這樣的規律:以1為第一位數的隨機數要比以2為第一位數的隨機數出現的頻率要大,而以2為第一位數的隨機數又比以3為第一位數的隨機數出現的概率要大,并可以此類推。1938年Frank Benford得出這樣一個結論:大自然數據的首位數字的出現頻率符合一個規律,這就是Benford法則[1]。Benford定律的定義:在不同種類的統計數據中,首位數字是數字的概率是:
P(D=d1)=lg(1+1/d1), d1=1,2,…,9 (1)
Benford法則可以用來檢查數據是否存在質量問題。George Judge使用benford法則檢測調查數據的質量[2]。許滌龍將Benford法則用于對M2統計數據準確性的研究[3]。劉云霞運用Benford法則對中國多個國家級開發區主要經濟指標的數據質量進行分析[4]。孟連對中國經濟增長統計數據可信度進行了估計[5]。許憲春對中國國內生產總值核算中存在的問題進行了研究[6]。Mark J.Nigrini提出該法則可用于檢查是否有偽賬[7]。張珺華用Benford法則對中國宏觀經濟統計數據進行了可靠性分析[8]。這些大量的研究都證實了Benford法則在部門數據和宏觀數據質量檢測上的獨特功效。
(二)Benford法則檢驗方法
1.卡方擬合優度檢驗
其中ei是統計數據中首位數字i的實際頻率,bi是Benford法則下首位數字i的理論頻率。在顯著性水平為0.05、自由度是8的條件下,卡方檢驗的臨界值是15.51。如果卡方統計量的值大于臨界值,統計數據首位數字的頻率分布則不符合 Benford分布,即說明該數據可能存在質量問題,應引起注意。
2.Pearson相關系數
Pearson相關系數是用來度量兩個變量X和Y之間的關系線性關系的,取值范圍在[-1,+1]之間。則樣本Pearson相關系數為:
二、實證分析
(一)數據來源及指標選擇
實證分析采用的數據來源于國家統計局網站。克強指數使用三個經濟指標(工業用電量新增、鐵路貨運量新增、銀行中長期貸款新增)對地區經濟運行狀況進行評估。本文選擇克強指數相關的指標:地區生產總值、工業用電量、鐵路貨運量、總貨運量固定資產投入國內貸款四個指標作為研究對象。采用的數據包括31個省市自治區的五個經濟指標從2003—2012年共十年的分省年度數據。
(二)Benford檢驗結果分析
本文首先分別統計了每個指標全國31個省市和自治區十年數據首位數字的頻數,計算出每個數字出現的頻率,以便檢驗各指標首位數字出現的頻率是否符合Benford 法則。表1是各指標數據首位數字出現的頻率分布。
對各指標首位數字的分布頻率與Benford法則的分布頻率進行頻率分布擬合優度檢驗,計算結果(見表 2)。
表2的數據表明,前4個指標的皮爾遜相關系數中,除鐵路貨運量為0.71818外,其它3個指標都在0.985以上。從卡方擬合優度檢驗結果來看,顯著性水平為0.05,自由度為8的卡方統計量臨界值為15.51,除鐵路貨運量之外的其他指標的卡方值都小于此臨界值。從兩種檢驗結果都可以推斷出鐵路貨運量指標數據可靠性存在問題。
為了找出鐵路貨運量數據中存在問題的樣本,逐一剔除鐵路貨運量各省的數據。經計算發現貴州省、江西省、湖北省、湖南省在剔除其省份數據后相關系數明顯變大、卡方值明顯變小。說明這幾個省份數據存在質量問題。綜上所述,克強指數相關指標的數據質量整體可靠,由于全國各省交通運輸發展懸殊,南方幾個省數據的干擾使鐵路貨運量這一指標的數據質量變差。
(三)克強指數優化方案
為了優化克強指數的指標體系我們選取總貨運量指標代替鐵路貨運量。首先計算出總貨運量指標十年數據首位數字出現的頻率分布(如表1所示)。對總貨運量頻率分布進行擬合優度檢驗,檢驗結果(如表 2所示)。從表2看出總貨運量的皮爾森相關系數達到0.95以上,卡方值也小于0.05 顯著性水平的臨界值,可以認為總貨運量比鐵路貨運量具有更高的可靠性,用總貨運量代替鐵路貨運量對地區生產總值進行評估具有更高的可信度。為了驗證猜測,分別使用發電量、鐵路貨運量、固定資產投入國內貸款和發電量、總貨運量、固定資產投入國內貸款對地區生產總值進行線性回歸方程擬合。回歸擬合使用SAS軟件。
首先用發電量、鐵路貨運量、固定資產投入國內貸款擬合地區生產總值。擬合結果中F統計量t為925.50,可決系數為0.9007,方程的擬合度較高。各系數顯著性檢驗的t統計量(分別為-4.75、17.93、-6.66、17.30)都落在拒絕域范圍內,說明各解釋變量對被解釋變量具有顯著性影響。然而雖然擬合方程的統計意義都能得到很好的解釋,鐵路貨運量與地區生產總值卻呈現負相關關系,這與實際不符,也印證了鐵路貨運量存在質量問題的結論。
然后用發電量、總貨運量、固定資產投入國內貸款擬合地區生產總值。擬合結果中F統計量為1 675.5,可決系數為0.9426,方程的擬合度較高。各系數顯著性檢驗的t統計量(分別為-6.89、10.05、3.78、18.27)都落在拒絕域范圍內,說明各解釋變量對被解釋變量具有顯著性影響。經檢驗擬合方程的各變量不存在異方差性和多重共線性。對比兩個擬合結果,有理由認為發電量、總貨運量、固定資產投入國內貸款能夠更好地評估地區生產總值。
結論
本文從克強指數使用的經濟指標出發,基于Benford法則對各省份2003—2012年的地區生產總值、用電量、鐵路貨運量、固定資產投資國內貸款的數據準確性進行了研究。結果顯示鐵路貨運量數據可靠性存在問題。通過逐一剔除各省份的方法找出存在數據篡改的樣本。因此克強指數相關指標不適合評價所有省份的經濟運行狀況。為了優化克強指數的指標體系,選取總貨運量代替鐵路貨運量,分別使用工業用電總量、鐵路貨運量、固定資產投入國內貸款和工業用電總量、總貨運量、固定資產投入國內貸款對地區生產總值進行線性回歸方程擬合。結果顯示總貨運量代替鐵路貨運量可以更好地擬合地區生產總值。因此本文得出結論:克強指數指標體系并不廣泛適用,優化后的指標體系可以更好地評估全國所有省份的經濟運行狀況。
參考文獻:
[1] "George Judge,Laura Schechter.Detecting Problems in Survey Data Using Benford’s Law[J].The Jounal of Human Resources,2009,
44:1-24.
[2] "Hill T.P.A Statistical Derivation of the Significant-Digit Law[J].Stat.Sci,1996,10:354-363.
[3] "許滌龍,金瑛.基于Benford 法則的M2 統計數據準確性研[J].統計與信息論壇,2010,(8).
[4] "劉云霞,吳曦明,曾五一.關于綜合運用Benford 法則和面板模型檢測統計數據質量的研究[J].統計研究,2012,(11).
[5] "孟連,王小魯.對中國經濟增長統計數據可信度的估計[J].經濟研究,2000,(10).
[6] "許憲春.中國國內生產總值核算中存在的若干問題研究[J].經濟研究,2000,(2).
[7] "Mark J.Nigrini.The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies[D].Ph.D.thesis.Cincinnati,University
of Cincinnati,1992.
[8] "張珺華.中國宏觀經濟統計數據質量的Benford評價及實證研究[D].太原:山西財經大學,2011.
The Study of Reliability About Keqiang Index Based on the Benford Law
SONG Xiang-dong,GUO Teng
(Yanshan University College,Qinhuangdao 066004,China)
Abstract:Keqiang index uses three economic indicators to assess the situation of the economy in some areas,this paper will examine this evaluation method is applicable to all provinces.Firstly,this paper studied the reliability of Keqiang index related indicators about the provinces’ annual data from 2003 to 2012.Then the indicators of Keqiang index is optimized with linear regression.At last the index system was improved to fit the provincial economic situation better.
Key words:Keqiang index;Benford law;Regression fit[責任編輯 " 吳高君]