999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

異常值對非參數bootstrap法估計的影響分析

2015-01-03 07:31:04常振海
統計與決策 2015年12期
關鍵詞:影響

劉 薇,常振海

(天水師范學院 數學與統計學院,甘肅 天水 741001)

0 引言

若記 X=(X1,X2,…,Xn)為來自總體 F的樣本,要估計的統計泛函為Tn=g(X),那么非參數bootstrap法[1]的思想可以描述為

因為bootstrap方法給每個樣本點以同樣的概率(均為1/n),因此,在樣本中混入異常值時,其估計的效果如何并未見在文獻中專門討論過,本文討論了這個問題。

1 方法步驟

為了能較好地進行分析,我們設計了如下的方法步驟,因為主要在小樣本下進行探討,所以文中固定樣本容量n=20,總體分布為N(1.4,12)。

(1)產生容量為20的服從N(1.4,12)的樣本,其一個樣本的均值為=1.5161,標準差為σ=0.8774,這個均值將作為非參數bootstrap法的總體。

(2)生成含有單側異常值的樣本。

方法是產生容量為50的服從N(-5,12)的樣本,去掉前后各20個值,保留中間的10個值,作為異常小值,用于逐個替換步驟(1)中的樣本,得到5%、10%、20%、40%、50%等比例下的含有單側異常小值情形的樣本。

下面解釋下為什么N(-5,12)的樣本可以作為異常值。在正態分布中,由3σ 原則知,落于| x-μ |≤3σ 之外的x可能性僅有0.27%,我們產生一次樣本,由實際推斷原理,出現這樣的x一般不可能,將被看做異常值。假設方差不變,從圖1中能直觀看出,這里產生的異常值是合理的。

從圖1能看出,在方差相同(σ=1)情形下,μ1≤μ-6σ=1.4-6×1=-4.6 時,以分布 N(μ1,12)產生的點對分布N(1.4,12)的樣本點來說是異常小值,所以本文中以N(-5,12)來產生異常小值是合理的。同理,以N(8,12)產生的點對分布N(1.4,12)的樣本點來說是異常大值也是合理的。

(3)生成含有雙側異常值的樣本。

方法是同時將步驟(2)中產生的異常小值和異常大值替換步驟(1)中的樣本點,則得到10%、20%、40%、50%下的含有雙側異常值的樣本。因為極小極大異常值各最少一個,故這種情形下含異常值比例最小為2/20=10%。

(4)在單側和雙側異常值兩種情形下,分別計算總體均值的非參數bootstrap法點估計、分布形態、區間估計等。

(5)在相應的評判標準下,進行比較分析。

2 模擬分析

序列中混入異常值一般有三種情形:混入異常小值、混入異常大值和同時混入異常小值和異常大值。鑒于單側異常小值和單側異常大值的類似性,下面僅從混入異常小值,同時混入異常小值和異常大值兩個方面進行討論。

賽事組織者與傳播者之間的博弈與第一個博弈的結果密切相關:賽事組織者希望通過集中行使體育賽事轉播權以提高自己的議價權,而傳播者則希望存在多個議價對象,以便降低自己的傳播成本。這一博弈主要引發了前文所提到的壟斷問題:由賽事組織者統一行使體育賽事轉播權是否構成壟斷;將體育賽事轉播權授予一個傳播者專有又是否構成壟斷。

2.1 單側異常值對bootstrap法估計的影響分析

主要考察異常小值的影響,異常大值的類似,不再重復討論。

(1)對點估計的影響。

表1 異常小值對樣本均值非參數bootstrap法估計的影響

從表1能看出,在沒有加入異常小值時,樣本均值的非參數bootstrap法估計為1.5159,與樣本均值1.5161幾乎相等,但加入異常值后,bootstrap法估計就與樣本均值相差較大,且隨著異常值比例的增高,它們相差也越來越大,這點從絕對誤差和相對誤差數值上能很好的反映出來,這兩者的值均逐漸增大,說明點估計距離真值漸遠。從穩定性(標準差和CV)方面看,隨著異常小值比例的提高,bootstrap法估計的穩定性逐漸變差,不過在異常小值的比例為50%時,波動穩定性又有點提高。

(2)對點估計分布形態的影響。

對B=3000個bootstrap法估計,繪制其直方圖,同時考察反映分布形態的參數偏度和峰度,結果見圖2。

圖2 異常小值各比例下bootstrap法估計的直方圖

從圖2能看出,在沒有異常小值的情形下,均值的bootstrap法估計很接近于正態分布,但在5%比例的異常小值影響下,分布的偏度和峰度都發生較大的變化,隨著異常小值比例的增加,分布又回復到接近正態分布。說明異常小值的比例越低,對分布形態的影響越大。

(3)對區間估計的影響。

從圖2中看到,盡管在異常小值比例較高的情形下,bootstrap法估計的分布形態接近于正態分布,但因其點估計與總體真值相差較大,故其區間估計不一定好。采用性質較好的BCa區間[8],bootstrap法估計結果見圖3,每個比例下的區間均進行100次估計,為了能較清楚地顯示,這里僅顯示了前20個區間估計。

圖3 異常小值各比例下bootstrap法區間估計

從圖3能看出,沒有異常值的bootstrap法區間估計幾乎對稱,但加入了5%比例的異常小值后,區間估計的上下限均不同程度地變小了,在10%比例情形下,變小的趨勢進一步加劇,區間估計幾乎覆蓋不住真值了,而到了20%比例時,區間估計竟沒一個能覆蓋真值的,說明隨著異常小值比例的增加,區間估計變得越來越不好。各個比例下100區間估計的上下限及區間長度平均值見表2。

表2 異常小值對樣本均值bootstrap法區間估計的影響

從表2能看出,不僅在圖3中反映的上下限隨異常小值比例的增加逐漸減小的現象,并且區間的長度也越來越長,這都說明異常小值對區間估計的影響是非常不好的。

2.2 雙側異常值對bootstrap法估計的影響分析

(1)對點估計的影響。

在樣本容量為20時,同時存在異常小值和異常大值,最少需要兩個異常值,故考慮的最小異常值比例為2/20=10%,結果見表3。

表3 雙側異常值對樣本均值bootstrap法估計的影響

從表3能看出,和沒有異常值相比,樣本中混入了異常值后其估計的絕對誤差和相對誤差均明顯偏大,并且相對誤差均為負值,說明同時存在異常小值和異常大值的情形下,異常小值的影響更大些。從標準差和CV值上能看出,樣本中加入了異常值后,穩定性逐漸變差。

如果將表3和表1相比,從相對誤差的角度看,雙側異常值對bootstrap法點估計的影響比單側的影響要小。

(2)對點估計分布形態的影響。

類似于單側異常值情形,仍然計算B=3000個bootstrap法估計,繪制其直方圖,同時考察反映分布形態的參數偏度和峰度,結果見圖4。

圖4 異常小值各比例下bootstrap法估計的直方圖

從圖4能看出,這些估計的分布均近似于正態分布,這一點和單側異常值情形不是很類似。分布形態的近似對稱性將對區間估計的覆蓋率很有好處,下面討論這個問題。

(3)對區間估計的影響。

對各個異常值比例下的情形均計算了100個BCa區間,圖5顯示了前20個。

圖5 雙側異常值各比例下bootstrap法區間估計

從圖5能看出,各個比例情形下的區間估計覆蓋率均為1,說明覆蓋率比單側異常值情形下好。100個區間估計的上下限及長度的平均值見表4。

表4 雙側異常值對樣本均值bootstrap法區間估計的影響

從表4能看出,隨著異常值比例的增加,區間的長度逐漸變長,甚至比單側情形下的還要長,說明好的覆蓋率是以犧牲區間長度為代價的,應該說區間估計并不好。

3 結論

綜合上面單側和雙側情形下模擬分析,我們可以得到下面的結論。

(1)在點估計方面,比較表1和表3,同樣的異常值比例下,顯然單側異常值要比雙側異常值影響大;不同的異常值比例下,隨著比例的增加,點估計逐漸變差,距離真值越來越遠。

(2)在點估計的分布形態上,比較圖2和圖3,在同樣的異常值比例下,單側異常值的直方圖比雙側異常值的左偏多一些,峰度則相差不是很大。不同的異常值比例下,隨著比例的增加,分布均接近于正態分布,說明異常值的比例越低,對分布形態的影響越大。

(3)在區間估計上,雙側異常值情形下均能覆蓋真值,但區間長度較長;單側異常值情形下,在異常值比例較低時能覆蓋真值,但比例增高時,區間估計就不能再覆蓋真值,不過相比于雙側情形,區間估計長度短。

[1]Efron B,Tibshirani R J.An Introduction to The Bootstrap[M].New York:Chapman&Hall Ltd,1993.

[2]Hall P,Horowitz J.A Simple Bootstrap Method for Constructing Nonparametric Confidence Bands for Functions[J].The Annals of Statistics,2013,41(4).

[3]Fay M P,Brittain E H,Proschan M A.Pointwise Confidence Intervals for A Survival Distribution With Small Samples or Heavy Censoring Biostat[J].Biostatistics,2013,14(4).

[4]Thai1 H T,Mentré1 F,Holford N H G.A Comparison of Bootstrap Approaches forEstimating Uncertainty ofParametersIn Linear Mixed-effects Models[J].Pharmaceutical Statistics,2013,12(3).

[5]黎光明,張敏強.概化理論方差分量置信區間估計方法的比較[J].統計與決策,2013,(9).

[6]Romano J P,Shaikh A M.On The Uniform Asymptotic Validity of Subsampling and The Bootstrap[J].The Annals of Statistics,2012,40(6).

[7]DiCiccio J,Efron B.Bootstrap Confidence Intervals[J].Statistical Science,1996,11(3).

猜你喜歡
影響
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
影響大師
沒錯,痛經有時也會影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對跳頻通信的影響
如何影響他人
APRIL siRNA對SW480裸鼠移植瘤的影響
對你有重要影響的人
主站蜘蛛池模板: 99久久成人国产精品免费| 老司国产精品视频91| 国产亚洲欧美日韩在线一区| 青青草原偷拍视频| 国产乱人视频免费观看| swag国产精品| 九九热视频精品在线| 五月激情婷婷综合| 2020国产免费久久精品99| 激情无码字幕综合| 99热这里只有免费国产精品 | 第九色区aⅴ天堂久久香| 69av免费视频| 日韩精品欧美国产在线| 欧美劲爆第一页| 亚洲国模精品一区| 国产精品久久久精品三级| 国产专区综合另类日韩一区| 久青草免费在线视频| 日韩大片免费观看视频播放| 中文字幕久久波多野结衣| 精品综合久久久久久97超人该| 亚洲乱码在线视频| 亚洲人成电影在线播放| 91综合色区亚洲熟妇p| 日韩 欧美 小说 综合网 另类| 亚洲人成人无码www| 亚洲成aⅴ人片在线影院八| 国产成人综合久久| 91综合色区亚洲熟妇p| 国产区91| 久久综合伊人 六十路| 77777亚洲午夜久久多人| 亚洲第一区精品日韩在线播放| 亚洲一级无毛片无码在线免费视频| 在线欧美日韩| 青草精品视频| 国产精品吹潮在线观看中文| 午夜无码一区二区三区| 国产色婷婷| 久久91精品牛牛| 黄色网站不卡无码| 91小视频版在线观看www| 高清欧美性猛交XXXX黑人猛交| 亚洲高清资源| 99久久国产综合精品2023| 91精选国产大片| 欧美亚洲国产日韩电影在线| 91精品啪在线观看国产91九色| 黄色成年视频| 国产伦精品一区二区三区视频优播 | 黄色网址手机国内免费在线观看| 伊人久久大香线蕉成人综合网| 黄色网在线| 91成人免费观看在线观看| 97在线免费视频| 综合五月天网| 色成人综合| 无码免费试看| 亚洲精品国产综合99久久夜夜嗨| 亚洲精品天堂自在久久77| 国产精品人莉莉成在线播放| 亚洲天堂在线免费| 中日韩一区二区三区中文免费视频| 国产欧美日韩专区发布| 国产91透明丝袜美腿在线| 一级毛片高清| 久久精品国产一区二区小说| 亚洲中字无码AV电影在线观看| 日本AⅤ精品一区二区三区日| 欧美成人怡春院在线激情| 无码'专区第一页| 999福利激情视频| 日韩在线永久免费播放| 伊在人亚洲香蕉精品播放| 国产成人高精品免费视频| 国产a v无码专区亚洲av| 色色中文字幕| 无码内射中文字幕岛国片| 亚洲欧美精品日韩欧美| 欧美在线网| 免费国产黄线在线观看|