999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Bootstrap方法在統計推斷中的應用

2020-11-24 08:56:56尤亦玲廣東財經大學
消費導刊 2020年47期
關鍵詞:方法

尤亦玲 廣東財經大學

一、背景

統計推斷是從樣本出發推斷相應的總體, 可以分為參數法和非參數法。早期的統計推斷是以大樣本為基礎的。自1908年,英國統計學家威廉·戈塞特(Willam Gosset)發現了t分布后,就開啟了針對小樣本的研究。1920年,費希爾(Fisher)提出了“似然(likelihood)”的概念,為世人提供了一種更為高效的統計推斷思維方法。1979年,美國斯坦福大學統計學教授Efron,提出了一種新的增廣樣本系統的方法,為解決小樣本的評估問題提供了新的思路,這種方法就是Bootstrap方法,也叫自助法。

統計學中“Bootstrap”法是指從原樣本自身的數據中不斷重復抽樣,從而獲得新的樣本及統計量。它的優勢在于根據給定的原始樣本復制觀測信息,因而不需要進行分布假設或增加新的樣本信息就可以可對總體的分布特性進行統計推斷,屬于一種非參數統計方法。

二、方法理論介紹

(一)Bootstrap重抽樣理論

Bootstrap重抽樣的基本思想是:在原始數據的范圍內作等可能的、有放回的再抽樣, 樣本容量仍為n,原始數據中每個樣本每次被抽到的概率均為1/n , 我們將這種抽樣方法所得的樣本稱為Bootstrap樣本。每次抽樣可得到參數的一個估計值,這樣重復若干次。

設隨機樣本是獨立同分布的,。假設為總體分布F的某個參數,是觀測樣本的經驗分布函數,是的估計,則可以通過以下步驟來實現Bootstrap估計:

第一步,對Bootstrap重復的第b次(b=1,2,…,B),先有放回地從中抽樣得到再抽樣樣本,然后根據計算;

第二步,的Bootstrap估計為的經驗分布函數。

(二)Bootstrap方法的標準差、偏差估計

估計量的標準差的自助法估計,是Bootstrap重復的樣本標準差:

其中。我們將估計量的偏差定義為

事實上,根據上式計算偏差有一個很明顯的難點在于,當的分布未知,或者形式很復雜時,期望的計算也就變得很困難甚至不可能,因此在這種情況下偏差就是未知的。但是當我們擁有樣本數據時,就是的一個估計,而期望可以通過Bootstrap方法進行估計,從而得到偏差的估計:

表示Bootstrap的經驗分布。

可見,一個估計量的Bootstrap偏差估計,就是通過已有樣本的估計量來代替,并使用的Bootstrap重復來估計。對一個有限樣本,有的B個獨立同分布的估計量,則的均值是期望的無偏估計,因此偏差的Bootstrap估計為

其中。若偏差為正,則說明在平均水平上過高估計了,反之,則說明在平均水平上低估了。因此,可以對估計量進行偏差修正,得到

(三)Bootstrap區間估計的四種類型

1.標準Bootstrap

假設是參數的估計量,它的標準差為。如果的分布服從或近似服從正態分布,那么,當顯著性水平為,并且是的一個無偏估計時,就有的(1-)標準正態Bootstrap置信區間為

2.百分位數Bootstrap

該方法的核心在于:統計量在(1-)水平下的置信區間的上下限,分別為估計量的Bootstrap經驗分布的第和第()分位點。

事實上,可以對百分位數區間做進一步修正,得到更好的Bootstrap置信區間,使其具有更好的理論性質和實際覆蓋率。其原理是對(1-)水平下的置信區間,使用兩個因子來調整和()分位數,其一為對偏差(bias)的修正,另一個是對偏度(skewness)的修正。前者記為,后者記為a。我們將這種估計方法估計的結果稱為更優的Bootstrap置信區間,簡稱為BCa。

在計算(1-)BCa置信區間時,首先計算Bootstrap重復經驗分布函數的分位數,即BCa區間的上下界,則上述中的偏差修正因子的估計為

而加速因子是從Jackknife重復中估計得到的。

3.基本Bootstrap

在的分布未知時,由于Bootstrap重復下的樣本分位數滿足

因此,(1-)置信區間為

4.t區間Bootstrap

在多數情況下,即使滿足正態分布假設,且是的一個無偏估計時,也未必服從正態分布,這是因為是我們認為估計出來的。同時,由于Bootstrap估計的分布是未知的,因此也不能認為Z服從t分布。在這種情況下,前人就通過再抽樣的方法得到了一個“t類型”的統計量的分布,以此來改進標準Bootstrap區間估計。

假設觀測樣本,則(1-)水平下的Bootstrap t置信區間為:

根據以往的設計經驗來看,城市居民供水系統多會采取管道分流方式,從城市給水系統中分流至各大住宅小區當中,目的在于及時供給人們日常飲用水源。針對于此,建筑施工單位在進行給排水設計過程中,需要在住宅小區的管道處安裝倒流防止閥裝置,這樣做的主要目的在于避免水流出現嚴重的倒流問題,造成供水壓力的明顯提升。

其中通過以下方法得到:

第一步,計算觀測到的;第二步,從X中有放回地抽樣得到第b個樣本,從中再抽樣計算得到,以及Bootstrap標準差估計,據此可以計算第b個重復下的“t”統計量;第三步,重復上述過程,將的分布作為推斷分布,找出樣本分位數;第四步,根據Bootstrap重復可得標準差估計;第五步,計算置信區間。

從上述計算過程可以發現,Bootstrap t區間法需要進行Bootstrap嵌套,嚴重影響了計算速度。

三、方法分析討論

(一)Bootstrap重抽樣法的應用

假設我們觀察到一組樣本,從中再抽樣,依照抽到1,2,3,4,5的概率分別為0.2,0.3,0.2,0.1,0.2 進行。因此,從中隨機選擇的一個樣本,其分布函數就是經驗分布函數。 事實上,樣本可以看作是從Poisson(2)中隨機產生的,因此利用R軟件我們可以實現對的估計,并與Poisson(2)的分布相比較,結果如下:

圖3.1 Bootstrap重抽樣的估計

(二)標準差、偏差的Bootstrap估計

R軟件中bootstrap程序包里的law82數據集,記錄了美國82所法律學校入學考試的平均成績(LSAT)和GPA,估計二者之間的相關系數,并求樣本相關系數的標準差和偏差的Bootstrap估計。

對于成對數據可以通過樣本相關系數估計相關系數,計算結果顯示,樣本相關系數為0.80,使用bootstrap方法估計的標準差的結果。

此外,在重復2000次下的boot函數計算的標準差估計為0.05,該結果與之前的結果相差無幾。同時,boot函數還給出了該組數據的樣本相關系數bootstrap偏差估計,其結果為-0.000727641。

通過偏差的定義自行編程進行求解,得到的結果bias=-0.0009563065,與boot函數的運算結果非常接近。

(三)Bootstrap區間估計

繼續針對上述law82數據集討論相關系數統計量的95%置信區間,利用boot包里的函數boot.ci可以直接計算得到基本bootstrap區間、標準正態bootstrap區間、百分位數bootstrap區間和BCa區間。我們還可以根據Bootstrap t區間法的定義,利用自編函數來計算相關系數置信區間,結果如下表所示:

表3.1 law82相關系數統計量bootstrap置信區間估計結果

由上表結果可以看出,前兩種估計方法和后三種方法的結果有較大差異,而在后三種方法中,可以看到BCa置信區間的區間長度是最小的,可以認為它的估計是較為準確的。

四、實際數據

考慮bootstrap包里的scor考試成績數據,利用pairs函數繪制每對變量的散點圖,觀察相關性。

圖4.1 scor數據集各變量散點圖

根據上圖所示結果,我們可以猜測(mec,vec),(alg,ana),(alg,st a),(ana,sta)這四組變量間可能具有較強的相關性,利用R軟件計算其相關系數分別為0.55,0.71,0.66,0.61,利用Bootstrap估計樣本相關系數標準差。

表4.1 四組變量相關系數的Bootstrap標準差估計結果

在scor數據下,記協方差矩陣為,其特征根為 ,則

表示了主成分中第一主成分對方差的解釋比例。現令為樣本協方差矩陣的特征根,可以利用boot函數直接得到的Bootstrap偏差和標準差估計,程序運行結果顯示的偏差為0.0022,標準差為0.0472。

利用Bootstrap重復樣本,對的95%置信區間,分別采用百分位數和修正的百分位數Bootstrap置信區間進行估計,并更改重復次數觀察結果,如下表所示:

表4.2 的95%置信區間估計結果

由上表可知,不同的模擬次數會對置信區間的結果造成一定的影響,但總體來說差別不大。

五、總結

本文基于對Bootstrap統計推斷方法的理論介紹,利用實際案例實現了在總體分布未知情況下,對樣本統計量的標準差、偏差估計,以及置信區間估計。其核心思想在于重復抽樣,應用的關鍵在于理解“子樣本之于樣本,等于樣本之于總體”,優勢之處在于小樣本增強。總的來說,Bootstrap是一種應用十分簡便的非參數統計推斷方法。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 色综合日本| 亚洲中文字幕手机在线第一页| 国产精品无码AⅤ在线观看播放| 正在播放久久| 色屁屁一区二区三区视频国产| 久草性视频| 香蕉网久久| 国产精品无码AV片在线观看播放| 国产欧美高清| 成人亚洲天堂| 欧亚日韩Av| 毛片网站在线看| 久久亚洲精少妇毛片午夜无码 | 午夜日本永久乱码免费播放片| 成人日韩欧美| 日韩天堂网| 日韩欧美色综合| 婷婷色婷婷| 亚洲另类色| WWW丫丫国产成人精品| 麻豆AV网站免费进入| 五月婷婷综合网| 在线观看国产精品一区| 欧美精品二区| 亚洲第一成年人网站| 伊人色天堂| 国内精品视频区在线2021| 波多野结衣中文字幕一区二区| 国产亚洲欧美在线视频| 伊人婷婷色香五月综合缴缴情| 欧美亚洲激情| 特级精品毛片免费观看| 久久中文电影| 亚洲无线一二三四区男男| 国产免费高清无需播放器| 夜夜操狠狠操| 成人欧美在线观看| 996免费视频国产在线播放| 成人噜噜噜视频在线观看| 国产日本欧美亚洲精品视| 青草娱乐极品免费视频| 久久精品娱乐亚洲领先| 国产成人免费视频精品一区二区| 91成人在线免费视频| 波多野结衣二区| 农村乱人伦一区二区| 播五月综合| 91蜜芽尤物福利在线观看| 91成人免费观看| 久久综合九九亚洲一区| 先锋资源久久| 538国产在线| 欧美成人区| 蝴蝶伊人久久中文娱乐网| 波多野结衣一区二区三区四区视频| 57pao国产成视频免费播放| 久久精品人人做人人爽电影蜜月| 亚洲国产理论片在线播放| 成人午夜视频免费看欧美| 国产成人成人一区二区| 日本a级免费| 日韩中文精品亚洲第三区| 丁香婷婷久久| 精品91视频| 色天天综合| 台湾AV国片精品女同性| 在线看片中文字幕| 三级视频中文字幕| 国产一区二区三区视频| 婷婷开心中文字幕| 久久国产精品影院| 波多野结衣二区| 久久久久久国产精品mv| 日本在线欧美在线| 亚洲欧洲国产成人综合不卡| 日本一区二区三区精品国产| 久久精品人人做人人综合试看| 国产97色在线| 狠狠ⅴ日韩v欧美v天堂| 欧美性色综合网| 日韩成人高清无码| 最新国产成人剧情在线播放|