謝 威,趙嵩正
(西北工業大學管理學院,西安710129)
近年來,國際統計界對統計數據質量的內涵進行了一些探索,在某些方面也達成了一致:首先,注重從用戶的角度來衡量統計數據質量,強調用戶對統計信息的滿意程度;其次,鑒于統計數據質量是一個具有豐富內涵的概念,需要建立一個開放、透明的統計數據質量評估管理體系,應從多角度、多方面來衡量[1]。因此,統計數據質量可以定義為:統計數據的一組固有特性滿足使用者需要的程度[2]。統計數據質量具體需要涵蓋哪些特性,則取決于使用者對數據的要求。統計數據質量是一個相對概念,從狹義上講,準確性是統計數據質量的同義詞,是指客觀反映現實情況的程度,統計誤差越小越準確,數據質量越高。從廣義上講,準確性僅是數據質量的一個重要方面,它還包括可獲得性、及時性、相關性、時間和空間上的一致性以及不同數據之間的一致性等。要求我們從統計數據提供者、生產者和用戶等多個角度來衡量數據質量。
本文采用結構方程模型來分析能源統計數據質量的影響因素。結構方程模型(簡稱為SEM)是基于變量的協方差矩陣來分析變量之間關系的一種統計方法,所以也稱為協方差結構分析[3]。該模型能夠很好地解決了多元回歸分析法存在的弱點,并整合了路徑分析、驗證性因素分析與一般統計檢驗方法,可分析變量之間的相互因果關系,包括了因子分析與路徑分析的優點。因此,廣泛應用于社會科學的各個領域。
結構方程模型通常包括三個矩陣方程式[4]:

相應的模型假設如下:
(1)測量方程誤差項d、e的均值為零;
(2)結構方程殘差項ζ的均值為零;
(3)誤差項d與ξ、e與η之間不相關,d與e不相關;
(4)殘差項ζ與d、e、ξ之間不相關。
其中,方程(1)和方程(2)被稱之為測量模型,方程(3)則被稱之為結構模型,有關符號說明見表1。

表1 結構方程模型符號說明
能源統計數據質量是一個多因素集合,是一個內生潛變量,需要通過數據的準確性、可得性、完整性、空間時間一致性、時效性以及對用戶需求的滿足程度來反映。統計方案設計因素、環境因素以及統計人員因素是三個外生潛變量,同樣需要通過一系列外生觀測變量來反映。通過文獻分析及多輪次的頭腦風暴,本文選取了4大類共計18項影響因素作為本文的研究變量。能源統計數據質量的影響因素如圖1所示。

圖1 能源統計數據質量影響因素
通過文獻分析,結合本文建立的模型,做出如下假設:
(1)基于潛變量之間關系的假設
假設1:假設統計方案設計因素、環境因素以及統計人員因素對能源統計數據質量具有影響;
假設2:假設統計方案設計因素、統計人員因素受環境因素的影響;
假設3:假設統計人員因素受統計方案設計因素的影響。
(2)基于潛變量與觀測變量之間關系的假設
假設4:能源統計數據質量可以用數據的準確性、數據的可得性、數據的完整性、數據的空間時間一致性、數據的時效性以及對用戶需求的滿足程度來反映;
假設5:統計方案設計因素可以用統計方法的健全性、調查方式的多樣性、統計方案的可操作性以及統計流程的規范性來反映;
假設6:環境因素可以用資源配置水平、信息化水平、審核制度以及被調查者的合作化程度來反映;
假設7:統計人員因素可以用人員數量、人員穩定性、人員基本素質以及人員業務素質來反映。
(3)基于內生觀測變量之間關系的假設
假設8:假設數據的空間時間一致性受數據的準確性、可得性、完整性和時效性影響;
假設9:假設對用戶需求的滿足程度受數據的準確性、可得性、完整性、空間時間一致性以及時效性的影響。
根據研究需要,共發放了200份調查問卷,回收167份,有效問卷145份,問卷有效回收率72.5%。問卷的測量題目均采用李克特7點量表法測量,“7”代表非常符合,“1”代表非常不符合。
運用SPSS16.0進行探索性因子分析。各變量間的相關系數大部分都在0.4~0.8之間,說明進行因子分析的必要性。限于篇幅,本文在此不再列出變量間的相關系數矩陣。效度檢驗結果見表2。從表2可以看出,本文KMO統計量檢驗取值0.864,根據統計學家Kaiser給出的標準,KMO取值大于0.7,適合進行因子分析;同時,在本文給定顯著性水平0.05的條件下,K方統計量較大,且P值小于0.05,通過了Bartlett球形檢驗。
根據表3所示的方差貢獻率表可以看出,通過因子分析,模型自動提取出3個主成分,12個外生觀測變量能夠解釋總方差的64.262%,涵蓋了原始數據的大部分信息。從中可以看出,旋轉前的3個主成分分別能夠解釋原有12個外生觀測變量總方差的45.501%、10.102%和8.659%,累積方差貢獻率達到64.264%,能夠從總體上反映原有變量的大部分信息。另外,因子旋轉后累積方差并沒有改變,但重新分配了各個因子解釋原有變量的方差,改變了各個因子的方差貢獻,使得因子更易于解釋。

表2 KMO統計量和Bartlett球形檢驗

表3 方差貢獻率表
信度表示對于同樣的對象,運用同樣的觀測方法得出同樣觀測數據結果的可能性[5]。通常用量表的內部一致性來進行信度測試。Cronbach α系數是檢驗量表的內部一致性指標,介于0到1之間,α值越大表示信度越高。根據學者研究,Cronbach α系數信度一般介于0.7~0.9之間,都可算是高信度值[11]。運用SPSS16.0進行信度分析,可以得出,本文設計的問卷量表的Cronbach α系數達到0.929,說明信度較高。
依據研究對象的特點,選取結構方程模型作為研究工具。模型構建如下:首先,以能源統計數據質量作為內生潛變量,通過6個觀測變量來體現;其次,以統計方案設計因素、環境因素以及統計人員因素3項因素作為外生潛變量,分別通過4個觀測變量來體現;最后,以調查問卷題目的協方差矩陣作為基礎數據。利用結構方程軟件AMOS7.0,得到相應的驗證性因子模型,如圖2所示。

圖2 能源統計數據質量影響因素結構方程模型
將數據導入AMOS7.0,建立結構方程路徑圖,進行模型估計與檢驗,分析顯示:
(1)各潛變量之間的路徑系數相應的P值均小于0.05,說明假設1、2、3中描述的潛變量之間的關系在90%的置信度上顯著,即可以說明各潛變量之間具有一定的相關關系。
(2)各潛變量與觀測變量間的載荷系數相應的P值除ξ3→x12為0.07以外,均小于0.05,說明假設4、5、6、7中所描述的潛變量與觀測變量之間的關系在90%的置信度上顯著,即可以說明利用絕大多數觀測變量來反映潛變量是合理的。
(3)各內生觀測變量之間的載荷系數相應的P值除y2→y4以外,均大于0.05,說明假設8、9中描述的內生觀測變量之間的關系在90%的置信度上不顯著,即可以說明絕大多數內生觀測變量之間的相關關系是不顯著的。
依據相應檢驗標準[6~7],通過6個步驟對模型進行修正:第一,修正因子負荷Λx、Λy;第二,修正因子之間的協方差矩陣φ;第三,修正測量誤差的協方差Td、Te;第四,修正路徑系數B;第五,修正路徑系數Γ;第六,修正殘差項的協方差矩陣Ψ。在上述每個步驟中,都要依據模型給出的修正建議進行修正,并重新檢驗參數。針對每個步驟不斷重復這些過程,直到模型參數滿足標準需要。修正后的模型各擬合指標如表4所示。

表4 修正后的擬合指標
從表4中可以看出,c2/df<3,說明模型與現實情況擬合好;除CFI以外,其余GFI、NFI、IFI均大于0.9,說明模型擬合好;RMSEA<0.05,表明模型與數據擬合程度較好。總體上看,能源統計數據影響因素結構方程模型擬合程度較好,具有一定的有效性。
首先,統計方案設計因素、環境因素以及統計人員因子對能源統計數據的質量具有顯著的影響;其次,環境因素對于統計方案設計因素以及統計人員因素具有顯著的影響;再次,統計方案設計因素對于統計人員因素具有顯著的影響。因此,應在對統計數據質量環境進行一定控制的前提下,著重加強統計方案的設計工作,并提高統計人員的數量、質量與穩定性。
首先,在統計方案的設計因素方面,按照估計的路徑系數由強到弱依次進行控制的是:統計方法的健全性、統計方案的可操作性、統計流程的規范性、調查方式的多樣性;其次,在環境因素方面,按照估計的路徑系數由強到弱依次進行控制的是:被調查者的合作化程度、資源配置水平、信息化水平、審核制度;再次,在統計人員因素方面,按照估計的路徑系數由強到弱依次進行控制的是:人員基本素質、人員數量、人員的穩定性、人員的業務素質。
雖然大部分變量之間的關系并未通過顯著性檢驗,但是通過分析我們可以看出,對用戶需求的滿足程度受到數據的時效性、可得性、完整性、空間時間一致性以及準確性的影響;而數據的空間時間一致性受到時效性、完整性以及準確性的影響。因此,對于數據的質量,應重點控制其準確性、時效性以及完整性,在此基礎上追求數據的可得性、空間時間一致性,最終滿足用戶對數據的需求。
[1]茍巧玲.普查數據質量控制存在的主要問題及建議[J].統計與咨詢,2010,(2).
[2]許永洪.統計數據質量的基本概念與數據質量評估的基本模型[J].商業經濟與管理,2010,(12).
[3]李懷組.管理研究方法論(第2版)[M].西安:西安交通大學出版社,2004.
[4]林嵩,姜彥福.結構方程模型理論及其在管理研究中的應用[J].科學學與科學技術管理,2006,(2).
[5]Karen Weber Cullen,Kathy Watson,Issa Zaker I.Relative Reliability and Validity of the Block Kids Questionnaire among Youth Aged 10 to 17 Years[J].Journal of the American Dietetic Association,2008,108(5).
[6]易丹輝.結構方程模型方法與應用[M].北京:中國人民大學出版社,2008.
[7]Paul Barrett.Structural Equation Modeling:Adjudging Model Fit[J].Personality and Individual Differences,2007,42(5).