一、引言
對復雜樣本按照理論直接推導出方差估計一則十分困難,二則從節約費用和時間的角度考慮代價也很大。通常采用的替代方法主要有隨機組法、平衡半樣本方法、刀切法和自助法等。本文研究采用基于逆抽樣設計的方法對復雜樣本進行方差估計,并將該方法與傳統方法進行比較,探討其適用條件。
二、逆抽樣設計方法簡介
逆抽樣設計(Inverse Sampling Design,簡稱ISD方法)的思想由Hinkins等提出,Rao等研究了該方法的一些理論性質。該方法的基本思想是,通過選擇一個抽樣機制,對調查得到的復雜樣本進行二次抽樣。二次抽樣機制的設計抵消了初始復雜樣本中的分層、整群抽樣等效應,使得按照該抽樣機制抽選出來的子樣本具有簡單隨機樣本結構,后續分析基于這些具有簡單隨機樣本結構的子樣本進行。下圖為該方法的流程示意圖:
用數學符號來表示,假設進行某項調查,按照某種復雜抽樣設計從一有限總體中抽出了一個大小為n的初始樣本Sp,其中下標p(primary)表示初始樣本。現希望從Sp中抽出一個大小為n'的子樣本s',使得s'被抽中的無條件概率p(s')和簡單隨機抽樣匹配,也即
由于抽取子樣本s'是一個兩步的過程,由全概率公式,有
其中,p(sp)為初始樣本sp被抽中的概率,為sp已被抽選出來的前提下,s'被抽中的條件概率。
如果不依賴于sp,則由(1)式,有
(2)式即為從初始樣本sp中選擇s'的抽樣機制。
逆抽樣設計方法包括了如下基本的三個步驟:
(1)逆掉初始樣本的復雜抽樣設計,使得能夠產生具有簡單隨機樣本結構的子樣本;……p>