999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分層抽樣設計中的樣本量最優分配問題探究

2018-03-09 05:59:29
信息記錄材料 2018年5期
關鍵詞:分配成本

陳 璟

(浙江省杭州第二中學 浙江 杭州 310051)

1 研究背景

調研是人們為了了解某種現象或達到某種目的,有計劃地搜集社會上的相關信息并進行描述、分析和提出解決方案的過程。譬如在我們的校園生活中,老師和同學就常需要展開社會調研活動,如調查高三學生的平均學習時間、中小學生的網絡購物觀念等等。其中,調研中最重要的環節就是抽樣問題。分層抽樣,以其精度、費用等方面的優勢,成為眾多抽樣方法中最常用一種。但在分層抽樣中,該以什么比例抽樣才能保障一定的精度和控制一定的成本是調查人員所需要考慮的問題。因此,本文將對其的抽樣方式進行詳細探究,重點考慮分層抽樣的樣本量分配問題。

本文將關于分層抽樣的記號定義如下:

設總體分為L層,以h 表示層的編號,h=1,2,…,L。

N表示總體單元數,n表示樣本單元數。

第h層的單元總數為Nh,滿足

抽樣比f=n/N,第h層的抽樣比fh=nh/Nh。

第h層總體層權Wh=Nh/N,樣本層權wh=nhn。

2 分層隨機抽樣

在實際問題中,大多數情況下我們的總體目標量是總體均值,總量和比例。其中,總量和比例都可以看成是均值的簡單變化。因此,本文將重點討論跟總體均值相關的估計量的性質。為了探究不同方法的估計效果,這里我們首先給出一個案例。

某工廠生產的機器供應全國2300家用戶,想請用戶對該廠機器進行評分。現在把這些用戶分為本地區、本省外地區以及外省三層,每層中相關資料如表1所示(其中ch為在第h層中的單位成本費用)。

表1 案例數據說明表

我們的目標是設計分層抽樣方案來估計用戶對機器的平均評分。對此,我們提出如下問題:a.如何抽樣操作最簡便;b.如何得到精度最高的估計量;c.怎樣設計抽樣方案使得成本最低。

2.1 簡單隨機抽樣

由于-y是無偏估計,因此其精度可用方差衡量,方差越小,精度越低。利用性質2,我們可得到樣本量n和方差V0之間的關系為。在工廠案例中,S2未知,但可由=2.73得到。表2展示了樣本量n和方差V0間的關系。可以看到,當樣本量從10上升到100時,均值估計的方差下降非常迅速;而當樣本量進一步擴大時,方差的下降速度變慢。

表2 簡單隨機抽樣下n和V0的關系

2.2 分層隨機抽樣

在一些情況下,簡單隨機抽樣常常不便于抽樣工作的組織。而分層抽樣將調研對象按某種屬性(如地域、性別、類型等)劃分成不同的層,再對層內總體進行抽樣往往在實際中有著重要應用。如果對每一層的層內都采取簡單隨機抽樣,就是分層隨機抽樣。在分層隨機抽樣下,我們對總體均值的樣本估計有如下性質

性質1:總體均值Y-的無偏估計為

性質2:

由于在分層抽樣中,我們是按照單元的屬性進行分層,層內單元相似而層間單元相異。同時,從上述性質可以發現,在分層隨機抽樣下,估計量的方差僅和層內方差有關、和層間方差無關。因此,分層抽樣的估計精度一般較高。而如何確定總體樣本量n和每一層的樣本量nh又是分層抽樣的關鍵。

3 分層抽樣下的樣本分配

實際生活中的抽樣工作會受多個因素限制,例如成本等等,都會影響到樣本量的選取。同時,我們收集到的問卷或者信息可能是無回答或者不完整的。因此,本文主要考慮了成本和回答率對樣本分配的影響。

回答率:設每層的回答率為kh,則每層實際需抽的樣本為。

3.1 按層權分配樣本的比例分配

分層抽樣最直接的方法就是按照每層的層權Wh來分配樣本。即,樣本量的分配比例wh=nh/n與各層單位數占總體單位數的比例Wh=Nh/N一致,每一層的抽樣比fh=nh/Nh等于總體的抽樣比f=n/N。當我們確定總樣本量n,即可得到第h層的樣本量nh=nWh。

表3 比例抽樣下樣本量、方差和成本關系表

3.2 精度確定,成本最小的最優分配

盡管比例抽樣操作簡便,但沒有考慮每一層的單位成本。所以,在這一部分我們將探討如何在保證估計有效的情況下使得費用最小的樣本分配方案。

由分層抽樣的性質2,我們要在希望的精度下,找到nh使得所花費的總費用最小。即,

化簡整理后,解得第h層的樣本層權為

這個解就是考慮每層回答率和單位成本,當確定估計精度下使得總成本最少的樣本分配方案。而在精度V(yst)=V0時,我們可知總樣本量n為

事實上,當我們用拉格朗日乘子法求出“成本固定,精度最優”時的樣本分配w’h時,會發現w’h=wh。所以,按照上述比例分配樣本,是能夠同時滿足“精度固定,成本最少”和“成本固定,精度最優”的最優分配方案。

根據如上的最優分配方案對案例中的三個層級分配樣本,可得到表4。這里我們控制均值估計的精度V0和比例估計的4個值一致,并分別基于上述公式算出總樣本量n和變化成本C0。可以看到,當精度相同時,最優分配相對于比例分配需要更多的樣本,尤其是當需要的精度很高時。但是成本卻比比例分配要少。

表4 最優分配下方差、樣本和成本間關系表

3.3 內曼分配

若根據內曼分配來分配案例中的樣本,可得表5。可以看到,當精度一致時,內曼分配所需樣本數要少于比例分布和最優分配。這說明內曼分配在這幾種方法中估計精度最高。但是成本C0也明顯高于其他兩種樣本分配方法。這是由于在本例中,各層的單位成本不同。如果實際情況中的各層單位成本相同,那么內曼分配和最優分配的結果將完全一直。

表5 內曼分配下精度、樣本量和成本間關系表

4 討論

本文重點討論了分層抽樣中的樣本分配問題。希望能為廣大中小學生在社會調研中選擇抽樣方法上提供理論依據。通過一個案例,我們討論了不同分配方法的性質和估計效果,主要結論如下:

方差隨著樣本量的增加而減小,但減小的速度逐漸放慢;

分層隨機抽樣精度比簡單隨機抽樣精度高;

比例分配操作簡便,但估計精度不如內曼分配,成本控制效果不如最優分配;

當各層單位成本相同,最優分配就是內曼分配,且達到精度最高,成本最低的效果。

[1]王曉燕,劉建平.分層抽樣樣本量最優分配問題新探[J].統計與決策,2004(6):17-18.

[2]金勇進,杜子芳,蔣妍.抽樣技術[M].中國人民大學出版社,2012.

猜你喜歡
分配成本
基于可行方向法的水下機器人推力分配
2021年最新酒駕成本清單
河南電力(2021年5期)2021-05-29 02:10:00
應答器THR和TFFR分配及SIL等級探討
遺產的分配
一種分配十分不均的財富
溫子仁,你還是適合拍小成本
電影(2018年12期)2018-12-23 02:18:48
績效考核分配的實踐與思考
鄉愁的成本
特別健康(2018年2期)2018-06-29 06:13:42
“二孩補貼”難抵養娃成本
俄羅斯的分配狀況
主站蜘蛛池模板: 永久在线精品免费视频观看| 国产日本欧美亚洲精品视| 亚洲自拍另类| 亚洲欧美人成人让影院| 久久96热在精品国产高清| 97国产在线视频| 高潮毛片无遮挡高清视频播放| 日韩国产高清无码| 国产一二三区在线| 毛片久久久| 伊大人香蕉久久网欧美| 国产精品成人不卡在线观看| 国产噜噜噜| 香蕉99国内自产自拍视频| 久久久久久尹人网香蕉 | 在线高清亚洲精品二区| 亚洲国产欧美国产综合久久| 国产av无码日韩av无码网站 | 99精品热视频这里只有精品7| 国产一区免费在线观看| 中文字幕在线视频免费| 日韩无码一二三区| 亚洲精品第一页不卡| 一级毛片免费观看不卡视频| 在线色国产| 日本一区高清| 亚洲第一页在线观看| 亚洲日韩高清在线亚洲专区| 国产99久久亚洲综合精品西瓜tv| 白浆免费视频国产精品视频| 国产玖玖视频| 成人综合久久综合| 亚洲精品无码人妻无码| 无码粉嫩虎白一线天在线观看| 久久精品只有这里有| 亚洲va在线∨a天堂va欧美va| 丁香五月亚洲综合在线 | 国产精品99r8在线观看| 伊人AV天堂| 人妻21p大胆| 国产欧美视频一区二区三区| 国产精品林美惠子在线播放| 五月天综合婷婷| 国产男女XX00免费观看| 日韩高清无码免费| 91亚瑟视频| 青草视频久久| 视频国产精品丝袜第一页| 国产精品不卡永久免费| 成人亚洲国产| 99在线视频免费| 国产成人综合亚洲欧美在| 日本爱爱精品一区二区| 亚洲欧洲日韩久久狠狠爱| 中文字幕2区| 国产在线观看精品| 中文字幕 91| 免费在线视频a| 114级毛片免费观看| 天堂中文在线资源| 99re免费视频| 欧美国产日产一区二区| 亚洲欧美不卡中文字幕| 亚洲日韩高清在线亚洲专区| 国产香蕉国产精品偷在线观看| 国产69精品久久久久妇女| 国产一区免费在线观看| 激情综合激情| 亚洲专区一区二区在线观看| 99手机在线视频| 一级毛片免费的| 一级看片免费视频| 黄色一级视频欧美| 色视频国产| 香蕉视频在线观看www| 免费国产不卡午夜福在线观看| av在线手机播放| 国产v精品成人免费视频71pao| 男女精品视频| 99热这里只有精品5| 亚洲精品卡2卡3卡4卡5卡区| 色欲色欲久久综合网|