許學艷
(廣西師范大學數(shù)學與統(tǒng)計學院 桂林 541004)
隨著我國經(jīng)濟的穩(wěn)步增長,統(tǒng)計工作正在逐步向著與國際接軌的方向發(fā)展,抽樣調查方法將在今后的統(tǒng)計工作中發(fā)揮越來越重要的作用,并將得到更為廣泛的應用。目前在國內,盡管抽樣調查方法已被廣泛使用,但在采用隨機抽樣的過程中往往只注重于得到具體的抽樣估計值,而不夠重視如何給出抽樣調查的精確度。
抽樣調查中,當某個總體由若干個有著自然界限和區(qū)分的子群(或類別、層次)所組成,同時,不同子群之間差別不大,而每個子群內部的異質性比較大時,則特別適合采用整群抽樣的方法。整群抽樣是將總體劃分為若干個群,然后以群為抽取單元,從總體中隨機抽取一部分群,對入選群內所有單元進行調查的一種抽樣方法。國內外專家學者對于簡單隨機抽樣的簡單估計和比估計以及整群抽樣的估計精度做了許多具體的研究。本文基于整群隨機抽樣,研究如何用一個整群樣本來對同樣樣本量下簡單隨機抽樣作簡單估計和比估計,從而降低成本、提高效率和精度。
簡單隨機抽樣又稱單純隨機抽樣,指的是從總體個單元中,逐個不放回地抽取單元,每次抽到尚未入樣的任何一個單元的概率都相等,直到抽足個單元為止。






在抽樣調查中會用到比率估計量的情況有兩類,一類是所需估計的目標值是兩個指標總數(shù)(或均值)的比值,另一類則是所需估計的目標值是某指標的總數(shù)(或均值),但有另一個與密切相關的指標可作為輔助變量。利用輔助變量的信息可改進估計的精度。輔助變量的特點可歸納為以下幾條:必須與主要變量高度相關;與主要變量之間的相關關系整體上相當穩(wěn)定;輔助變量的總體總值必須是已知的,或是容易獲得的;輔助變量的信息質量更好,或信息更容易取得即調查成本更低。實際問題中,X常是Y的前期資料。
總體均值ˉ和總值Y的比估計量定義為


比估計是有偏估計,但樣本量增大時,偏倚趨于零。此時均方誤差與方差近似相等。
當較大時,對于簡單隨機抽樣有




當足夠大時:

而對于簡單估計ˉ,有


為了提高樣本效率,減少樣本量,實際工作中檢查先對總體進行分群,再進行等概率的整群抽樣。整群抽樣的特點為:抽樣框編制得以簡化,實施調查便利、節(jié)省費用。
采用整群抽樣,若群的抽取是簡單隨機的,且群規(guī)模相等,皆等于,則對總體均值?的估計為







如果該總體被等分為N個規(guī)模均為M的群,定義ρ為群內相關系數(shù),描述同一群內成對個體單元之間的相關程度,表達式為



這說明,相同樣本容量下整群抽樣方差約為簡單隨機抽樣方差的1+(-1)ρ倍。也就是說,為了得到相同的估計精度,整群抽樣的樣本容量是簡單隨機抽樣樣本容量的1+(-1)ρ倍。




式中,

在實際的社會調查中,群規(guī)模不等的情況更為常見。從個群中等概率抽取個群的整群樣本,如果各群規(guī)模M不等,那么運用群規(guī)模相等時的估計方法的估計量是有偏的,尤其是當各群規(guī)模M差異很大,且-y與M存在較高相關時,估計量的偏差會很大。



上述估計量的方差為

它的無偏估計為




我們通常預期y與M是相關的,以M為輔助變量,總體均值的比率估計量為

當樣本群數(shù)很大時,總體總值的比率估計量為





為調查某地區(qū)農作物的總產(chǎn)量,以該地區(qū)的村莊數(shù)、種植面積為輔助變量,利用無偏估計量和比率估計量進行估計。

盡管此種方法可獲得無偏估計量,但其估計方差與y之間的差異有關,它適用于y之間幾乎沒有差異的整群抽樣。




本文給出了一種基于整群隨機樣本,同樣樣本量的簡單隨機抽樣精度的評估公式,并通過具體實例與簡單隨機抽樣的簡單估計,以不同的群規(guī)模為輔助變量的比率估計在精度上做了比較。結果表明基于不等整群抽樣的比率估計量的精度更高。