1 引言
一般來說抽樣誤差是指樣本指標與總體指標之間的絕對誤差。抽樣誤差是衡量抽樣檢查準確程度的指標,抽樣誤差越大,表明樣本對總體的代表性越小,抽樣調查的結果越不可靠;反之,抽樣誤差越小,說明樣本對總體的代表性越大,抽樣調查的結果越準確可靠。對抽樣誤差深入研究可以發現,抽樣誤差分為抽樣實際誤差和抽樣平均誤差。
抽樣實際誤差是指隨機抽取的某一樣本的樣本指標與總體指標的差數。例如,樣本平均數與總體平均數之差 ,樣本成數與總體成數之差 。由于總體指標的未知性,樣本指標的隨機性(不唯一性),即按照隨機原則從同一總體中抽取樣本容量相同的樣本可以有多重不同的抽取方法,抽取樣本的隨機性,產生的樣本指標也具有隨機性,抽樣實際誤差也是隨機的,是不可求的。
為了用樣本指標去推算總體指標,就需要計算這些抽樣實際誤差的平均數,即抽樣平均誤差。
2 概念提出
(一)抽樣平均誤差的概念
抽樣平均誤差是反映抽樣實際誤差一般水平的指標,確切地說抽樣平均誤差是指樣本平均數(或成數)的標準差,也可以理解為所有樣本指標與總體指標的平均離差。抽樣平均誤差一般用希臘字母 表示,其中抽樣平均數的平均誤差用 表示,抽樣成數的平均誤差用 表示。
抽樣平均誤差的作用表現在它能夠說明樣本指標代表性的大小,抽樣平均誤差越大,說明樣本指標對總體指標的代表性越低;抽樣平均誤差越小,說明樣本指標對總體指標的代表性越高。
雖然某一次的抽樣實際誤差具有不確定性,但是抽樣實際誤差是客觀存在的,是可以計算的。
(二)抽樣平均誤差的計算
根據抽樣平均誤差的概念,抽樣平均誤差用公式可表示如下:
抽樣平均數的平均誤差:
抽樣成數的平均誤差: 是所有可能抽取的樣本個數。
在實際中,由于 、 是未知的,也不可能一一列舉出所有的樣本,計算出每個樣本的指標 、 ,因此無法按以上定義公式來計算抽樣平均誤差。
數理統計證明,抽樣平均誤差的計算公式如下。
1.抽樣平均數的平均誤差公式。
重復抽樣:
不重復抽樣: ( )其中, 稱為修正系數。通常情況下,當 很大時, 幾乎等于 , 可以用 代替。不重復抽樣下抽樣平均數的平均誤差可簡化為: ( ) 在公式中, 是總體標準差,但在實際計算時,總體標準差通常是未知的,在大樣本的情況下,通常用樣本標準差代替。
2.抽樣成數的平均誤差。
重復抽樣:
不重復抽樣: ( )
通常情況下,當 很大時, 幾乎等于 ,不重復抽樣下的抽樣成數的平均誤差計算公式可簡化為: ( ), 上式中 應為總體成數,實際計算時通常用樣本成數 代替。
由于 ,在同樣條件下不重復抽樣的抽樣平均誤差總小于重復抽樣的抽樣平均誤差。將上述抽樣平均誤差計算公式歸納成表4-1。
表4-1 抽樣平均誤差計算公式
項目重置抽樣不重置抽樣
抽樣平均數
平均誤差
抽樣成數
平均誤差
當總體標準差或方差未知時,可以用以下方法解決:
第一, 用樣本方差來代替總體方差,即用 代替 ,用樣本成數 代替總體成數 。 第二, 可用過去全面調查的資料,也可以用過去抽樣調查的資料代替。如果有多個不同的材料,應應選擇方差數值較大的。可見,在相同條件下,不重復抽樣的抽樣平均誤差總小于重復抽樣的抽樣平均誤差。
3 影響抽樣平均誤差的因素
從上述計算抽樣平均誤差的公式中可以看出,影響抽樣平均誤差大小的因素主要有:
1.總體各單位標志值的差異程度
在其他條件不變的情況下,總體標志的變異程度越小,抽樣誤差越小;總體標志的變異程度越大,抽樣誤差越大。抽樣誤差和總體標志的變異程度成正比變化,這是因為總體標志的變異程度越小,表示總體各單位標志值之間的差異越小,則樣本指標與總體指標之間的差異也就會越小。如果總體各單位標志值相等,即總體標志的變異程度為零,則 或 均為零,樣本指標等于總體指標,此時就不存在抽樣誤差。
2.樣本單位數
在其他條件不變的情況下,樣本單位數越多,抽樣誤差越小;樣本單位數越少,抽樣誤差越大。這是因為隨著樣本單位數的增多,樣本結構越接近總體,抽樣調查也就越接近全面調查,當樣本單位數擴大到總體單位數時,則抽樣調查變為全面調查,也就不存在抽樣誤差了。
3.抽樣方法
抽樣方法不同,抽樣誤差也不同,在其他條件不變的情況下,不重置抽樣的抽樣平均誤差總小于重置抽樣的抽樣平均誤差,當 相當大或者 相對于 很小時,兩者的抽樣平均誤差相近。
(作者單位:無錫城市職業技術學院)