朱一波
(國家統計局浙江調查總隊,浙江 杭州 310012)
隨著經濟社會發展,公眾對統計數據日益重視,對數據質量的要求也已不僅僅在于數據是否準確,更在于數據是否能真實反映出當前的經濟社會現狀。公眾并不熟悉這些統計數據是如何得到的,他們關心的是這些統計數據是否和他們的切身感受相符合。
從社會對統計數據的需求來看,統計數據質量問題的核心可以整理歸納為準確性、時效性、有效性、可比性等。影響統計數據質量的各方面現實因素有:統計方法的科學性、源頭數據的質量、數據加工的合理性以及統計數據的人為干預等。
國內學者對于統計數據質量評估研究的方向主要集中在兩個方面,一是對評估方法和體系的理論研究,二是運用實證分析方法對統計數據質量進行評估。
本文基于國內外各學者對統計數據質量的檢驗方法,從統計數據匹配性的角度出發檢驗浙江宏觀經濟統計數據:一是以宏觀經濟指標的縱向匹配性來檢驗數據是否可以反映出浙江經濟的波動規律;二是以宏觀經濟指標的橫向匹配性來檢驗數據是否可以及時反映出當前的浙江宏觀經濟信息。
本文參考《浙江省國民經濟和社會發展第十二個五年規劃綱要》的目標中提到的與浙江經濟運行狀況密切相關的宏觀經濟指標,根據統計數據的來源、統計方法、以及政府與民眾對指標的關注程度,選取了以下宏觀經濟統計指標并分為待評估的統計指標和可信統計指標兩類,具體如表1。

表1 各統計指標分類及記號
在浙江統計實踐中,基礎性評估、邏輯性評估已在統計工作中長期進行。因此可以假設前文中待評估的統計指標大部分數據是準確的,并假設可信統計指標的數據均是準確的。
本文需要檢驗的是這些待評估的統計數據是否符合經濟運行及波動的規律,以及是否可以反映出浙江的經濟狀況。因此繼續做出假設:
1.高質量的宏觀經濟統計數據應符合經濟運行的規律,即一個統計指標的數據應在時間上存在縱向匹配性。
2.高質量的宏觀經濟統計數據應該與歷年的經濟狀況相吻合,即同一時期內各宏觀經濟統計數據之間以及與其他經濟數據應該存在橫向匹配性。
在實際檢驗中可以發現,數值型統計指標和比例型統計指標存在顯著區別,因此本文在檢驗各待評估指標的縱向匹配性時將它們分類討論。
1.數據的初步分析與預處理。由于y3即浙江省城鎮人均可支配收入的1979年數據存在缺失,因此對y3只分析其1980年至2011年的年度數據。為消除指數型變量帶來的異方差性,需要對這些數值型統計指標取自然對數。
2.ARIMA模型建立。由ADF檢驗結果可知,lny1、lny2、lny3、lny4、lny5、lny6均為一階單整序列,Ljung-Box檢驗則發現差分后的各變量均非白噪聲。由此對各指標考慮時間序列的隨機性模型,本文采用ARIMA模型。
對這六個變量分別建立ARIMA模型,模型殘差經Ljung-Box檢驗為白噪聲。經殘差圖對比后認為模型預期值與真實值的差距在0.1以上的,是偏離ARIMA模型預期的數據。
3.數據匹配性分析。從各因變量的匹配情況看:lny1與ARIMA模型匹配性最好,僅有1993年的數據偏離了模型預期;lny2、lny3、lny4、lny6與模型匹配性次之,各有三至四個年份的數據與模型有所偏離;lny5與ARIMA模型的匹配性相對較差。
分年度來看:與ARIMA模型不匹配的數據都出現在2000年以前,自2000年開始的各指標數據均與ARIMA模型匹配良好;1993年的各指標數據均高于模型預期,1985年、1988年、1989年等年份出現的次數也較多且偏離方向基本一致,體現出各指標間明顯的聯動性。
比例型統計指標均為比例或百分比數據,它們的特點是單位較為統一,或者可以認為是沒有單位,指標數據的走勢一般會較為穩定。
1.ARIMA模型建立。與數值型統計指標類似,數據匹配性分析仍用ARIMA模型。與前模型的區別在于:
(1)z1、z3、z4為帶截距的平穩序列,z2為帶時間趨勢的平穩序列。
(2)z5、z6則均為一階單整序列,且差分后的z5、z6均為白噪聲序列,無法運用ARIMA模型。
(3)分析acf圖和pacf圖時,發現z1、z3、z4均有比較明顯的周期性,因此運用的是帶季節性的ARIMA模型。
(4)經殘差圖對比后認為,模型預期值與z1、z3、z4的真實值差距在5以上的,或者模型預期值與差分后的z2的真實值差距在1以上的,是偏離ARIMA模型預期的數據。
2.數據匹配性分析。最終數據匹配性分析結論如下:
(1)與模型不匹配的統計數據主要出現在1995年以前,1995年之后僅有2001年的z3略高于模型預期。
(2)差分后的z2與模型有所偏離的年份集中在1981年以前,而之后的模型殘差均較小。
(3)z1、z3、z4與模型有所偏離的年份主要集中在1984年以前以及1989年、1993年這幾個年份,并且偏離方向基本一致,體現出較強的聯動性。
本文在考察統計數據橫向匹配性時,為減少被考察數據對模型造成的影響,使用交叉驗證法,具體方法和步驟為:
(1)對每一個統計指標每一年度的數據分別進行數據橫向匹配性考察。
(2)在考察具體某個統計指標某一年的數據橫向匹配性時,首先假設該指標其他年度的數據是可信的,并繼續假定其他一部分統計指標可信。
(3)以被考察指標為因變量,并以(2)中選定的可信指標作為自變量,先將被考察年度數據剔除之后建立模型。
(4)將被考察年度的自變量指標代入步驟(3)中計算得到的模型,計算得出被考察指標數據的模型預測值或預測區間。
(5)檢驗被考察的數據真實值是否與步驟(4)中計算得到的預測值差距較大,或是否落在了預測區間外,以判斷該數據的橫向匹配性是否存疑,若匹配性存疑則記錄其為高于或低于模型預期。
由于同為數值型變量,為消除指數型變量帶來的異方差性,需要先對各可信統計指標求取自然對數。
由于x1、x2即浙江省進出口值的1985年以前數據存在缺失,因此只考慮對1986年至2011年的宏觀經濟年度數據進行橫向匹配性評估。
本文以可信指標作為自變量,使用線性回歸模型,并運用交叉驗證法,來檢驗待評估指標與可信指標之間的匹配性。
1.自變量的預處理。經過相關分析得知,x1、x2、x3、x4、x5、x6、x7之間存在著非常強的相關性。本文選用主成分分析法旋轉自變量矩陣。旋轉后的各主成分根據其貢獻率的由大到小分別計為px1、px2、px3、px4、px5、px6、px7。
2.模型的預回歸。首先以px1、px2、px3、px4、px5、px6、px7為自變量,并分別以lny1、lny2、lny3、lny4、lny5、lny6、z1、z2、z3、z4、z5、z6為因變量,建立12個回歸模型,并用逐步回歸法篩除的各回歸方程的部分主成分自變量。被篩除的主成分自變量將不再用于之后的橫向匹配性評估。
根據各回歸方程的檢驗結果看:
(1)以z3、z4為因變量的兩個回歸模型F檢驗不顯著,說明兩個居民收入增長率指標是不適合運用這些自變量建立回歸模型的。
(2)lny1、lny2、lny3、lny4、lny5、lny6、z2對應的回歸模型通過了F檢驗, R-squared值也均在0.99以上,說明模型解釋性較強,比較適用于進行橫向匹配性評估。
(3)z1、z5、z6對應的回歸模型通過了F檢驗,說明它們與同年的可信統計指標存在一定程度的關聯。但R-squared值較低,說明模型解釋性較差,得到的匹配性評估結果只能用于參考。
3.數據匹配性分析。根據模型預回歸的結果,z3、z4不適合應用該模型進行匹配性分析,因此僅使用交叉驗證法依次驗證lny1、lny2、lny3、lny4、lny5、lny6、z1、z2、z5、z6的1986年至2011年的各年度數據。其中z1、z5、z6對應模型的解釋性較差,與這三個模型有關的數據質量診斷僅用于參考。
從結果看,1986年以來浙江省大部分宏觀經濟統計數據橫向匹配性良好,詳細情況如下:
(1)浙江全社會投資指標數據完全通過了橫向匹配性檢驗,沒有存疑數據。生產總值、三產增加值、消費價格指數這三項指標的橫向匹配性存疑數據也都不超過一個。
(2)1986年、1992年這兩個年份出現的次數較多,且在這兩年各指標的不匹配情況較為類似,說明這些數據的變化很可能是由于各待評估指標之間相互影響所致,而非僅僅由這些可信指標所決定。
(3)模型認為1986年浙江省生產總值數據偏高,但參考GDP增速的回歸模型看并沒有相應GDP增速過快的情況。
(4)模型認為1986年、1992年、2002年、2011年這四年的三產增加值比重數據橫向匹配性存疑,但是從三產增加值的模型看僅認為有1995年的數據高于預期。
(5)在其他解釋性較強的模型中,除1986年、1992年這兩個年份外,僅有1987年的城鎮居民收入低于預期值,其他數據橫向匹配性良好。
(6)各解釋性較弱的模型中,檢驗得到的橫向匹配性存疑的數據也并不多,也可基本判斷數據與可信指標的橫向匹配性良好。
為進一步分析所有宏觀經濟指標之間的橫向匹配性,可以改進模型,并需要增強假定:首先以所有選定的宏觀經濟指標變量作為一個變量總體,然后在驗證某一個待評估指標的橫向匹配性時,假設變量總體中所有其他宏觀經濟指標均是可信的。
考慮到自變量數量非常多,且自變量之間存在著嚴重的自相關,本文選擇使用人工神經網絡回歸模型來檢驗所有數據的匹配性。
1.變量總體的預篩選。運用五折交叉驗證法驗證后發現z1、z3、z4、z5、z6不適用于使用該模型的,因此考慮將z1、z3、z4、z5、z6從變量總體中篩去,即變量總體中只保留lny1、 lny2、 lny3、 lny4、 lny5、 lny6、 z2、 lnx1、 lnx2、lnx3、lnx4、lnx5、lnx6、lnx7這幾個變量。
2.模型的預估計。在使用神經網絡模型進行數據匹配性評估之前,還需要先確定各因變量下的人工神經網絡模型隱藏層的節點數。本文以變量總體中各待評估指標為因變量,分別使用五折交叉驗證法,來確定各模型的節點數。
3.數據匹配性分析。根據模型預估計的結果,使用交叉驗證法依次驗證lny1、lny2、lny3、lny4、lny5、lny6、z2的1986年至2011年的各年度數據。
根據前文中時間序列模型檢驗數據匹配性的標準,可以認為當lny1、lny2、lny3、lny4、lny5、lny6對應的模型預期值與真實值的差距在0.1以上、或者z2對應的模型預期值與真實值差距在1以上時,判斷其真實值與模型預測值相差過大,數據匹配性存疑。
評估結果顯示在人工神經網絡模型下各宏觀經濟指標之間的橫向匹配性非常優秀,僅有浙江省全社會投資這一指標數據與模型略有不匹配的情況。但在前文中已證得全社會投資指標與可信指標是完全匹配的,因此可認為浙江省各宏觀經濟指標的橫向匹配性非常好。
浙江宏觀經濟統計數據質量較好,具體體現在以下幾點:
1.各指標在時間序列上基本匹配,特別是2000年以后的數據完全匹配,說明隨著統計機制的健全與完善,統計數據的質量也越來越好。1985年以前的統計數據,以及1988年、1989年、1993年這三年份各指標數據出現縱向不匹配,均與對應年份浙江政治、經濟形勢有關。21世紀以來,隨著浙江統計體制機制不斷完善,同時經濟運行也相對穩定,各宏觀經濟數據均未出現時間序列不匹配的情況。
2.同年度下,全省生產總值、服務業增加值及其占生產總值比重、城鎮居民人均可支配收入、農村居民人均純收入、全社會固定資產投資、社會消費品零售總額等宏觀經濟統計指標的統計數據完全匹配,體現出了浙江宏觀經濟數據優異的橫向匹配性。
3.剔除價格因素后的GDP增長率、城鄉居民收入增長率體現出了良好的周期性,反映了經濟周期的規律。居民消費價格指數、工業生產者價格指數則表現出了價格變動的慣性以及其變動量的隨機性,可以認為是在時間序列上匹配的。兩個價格指數既表現出一定的獨立性,同時也與當年的其他宏觀經濟數據表現出一定程度的關聯性。
根據以上對統計數據匹配性的分析,可以得出浙江宏觀經濟統計數據質量較好的結論。
1.保持并提高政府統計水平。要提高統計數據質量,就要繼續健全統計指標和統計方法,進一步規范統計工作,并加強培訓基層統計人員,把好數據質量關。
2.完善獨立的政府統計體制。要保證統計工作的獨立性,同時也要對自身統計工作加強監督和自查。
3.加強統計數據質量評估和控制。要繼續強化對統計數據的質量評估,并建立相應的數據質量評估體系。要明確評價數據質量原則與標準,研究和改進數據質量控制技術方法,最終實現數據質量評估工作的常態化。
4.增加數據透明性,改進統計宣傳工作。政府統計部門應該首先在公眾輿論中有一個權威的、響亮的宣傳聲音,然后逐步增強數據的透明性,才能從根本上減少社會公眾對統計數據的誤解以及不必要、不公正的質疑。