摘 要:為估計總體某特征(如收入)的答復誤差,需要進行重復抽樣調查。重復抽樣調查樣本分兩步抽取:第一步,從Ω中抽取大樣本S1,其中某個單位的“調查值”記為y,“真值”記為μ,兩者之差為單個單位的答復誤差;第二步,從S1中抽取子樣本S2。答復誤差估計的關鍵是“真值”的估計。
關鍵詞:重復調查;答復誤差;答復方差;答復偏差;誤差模型
中圖分類號:C81文獻標識碼:A文章編號:1672-3198(2008)01-0094-02
1 介紹
在數字性和敏感性問題調查中,回答者提供的問題答復值可能與問題真值不同。統計上把問題答復值與其真值的差異稱為“答復誤差”,包括系統性誤差和隨機性方差。
答復誤差通常使用重復調查方法估計。重復調查就是從總體中抽取一部分單位,對抽取的單位對在原始調查中問過了的問題再問一遍。這樣同一回答者在同一問題上就給出兩個答復。比較這兩個答復,看它們是否相同。如果相同,就認為原始調查答復正確,反之,就認為是答復誤差。國外統計學家一般使用重復調查的答復值與真值之差構造答復誤差模型。
2 答復誤差模型及其估計量
2.1 總體未分層情況下
式(3)的優點是簡單直觀,易于理解和操作。缺點有二:(1)沒有利用與y和μ的輔助信息;(2)遺漏了(n1-n2)個單位的信息。如果充分利用這些被遺漏的信息,將提高答復誤差估計的精度。
為克服這些缺點,在總體分層情況下的答復誤差模型及其估計量中將引入輔助變量n和利用(n1-n2)個單位的信息。
2.2 總體分層情況下
3 答復誤差估計量的方差、偏差和均方誤差的估計
在前面,我們討論了答復誤差 的五個估計量:R12st,R2st,Rx2stR,RSSW和RM。現在討論它們的方差、偏差和均方誤差的估計。由于這些估計量十分復雜,一般誤差公式無力解決它們的估計問題。國外統計學家發明的大折刀方差估計和帶狀方差估計方法能有效用來估計復雜估計量的方差估計。進一步研究表明,在這兩種方法中,帶狀方差估計方法更適合于兩階段抽樣情形下答復誤差 的方差估計。為敘述方便,在此只討論總體未分層的情況。如果總體分層,在每一層使用這里敘述的方法。
3.1 答復誤差估計量的方差估計
4 模擬研究
美國農業統計服務機構(NASS)每年都要組織農業調查以了解各州和全國各個地區農業生產發展的情況。為估計農業調查中的答復誤差,農業調查后又進行了重復調查。根據這兩次調查的結果,以及使用上述公式,我們計算出偏差 的5個估計量12st,2st,x2stR,SSW和M,以及它們的偏差、方差和均方誤差,見下表1。在計算中,取Q=300。
參考文獻
[1]Biemer,P.and S.L.Stokes(1991).Approaches to the modeling of measurement errors.New york:John wiley and Sons,pp.487-516.
[2]Wright,R.L.(1983).Finite population sampling with multivariate Auxiliary information.Jounnal of the American Statistical Association,78,pp.879-884.
[3]Cochran,w.(1977).Sampling Techniques,John wiley and sons,Inc.N.Y.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。