999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

對剔除離群數(shù)據(jù)準(zhǔn)則的探討

2015-07-07 01:50:18趙成鋼
科技與創(chuàng)新 2015年10期

趙成鋼

摘 要:在精密測量中,處理測試數(shù)據(jù)時(shí),需要采用科學(xué)的方法剔除可疑離群數(shù)據(jù),以保證測量結(jié)果的可靠性。簡要論述了常用判斷準(zhǔn)則——萊特(3δ判據(jù))、肖維勒、格拉布斯和t檢驗(yàn)4個(gè)準(zhǔn)則的相關(guān)內(nèi)容,從準(zhǔn)則的定義出發(fā),比較了各準(zhǔn)則之間的區(qū)別和聯(lián)系,并保留了數(shù)據(jù)域的寬窄,提高對其的理論認(rèn)識,以便在日后的數(shù)據(jù)處理工作中更好地使用這些準(zhǔn)則。

關(guān)鍵詞:精密測量;離群數(shù)據(jù);判斷準(zhǔn)則;數(shù)據(jù)域

中圖分類號:TB114 文獻(xiàn)標(biāo)識碼:A DOI:10.15913/j.cnki.kjycx.2015.10.003

1 判斷準(zhǔn)則的數(shù)學(xué)形式

重復(fù)測量某物理量的精度n次,得測得值X1,X2……Xn;某測得值的殘余誤差的絕對值大于標(biāo)準(zhǔn)偏差δs與判別系數(shù)T之積,即:

.

由此可知,該誤差為粗大誤差,測得值Xd為離群數(shù)據(jù),應(yīng)剔除。

式(1)中:

采取t檢驗(yàn)準(zhǔn)則時(shí),剔除可疑離群數(shù)據(jù)Xd后,計(jì)算算術(shù)平均值和標(biāo)準(zhǔn)偏差為:

4個(gè)判斷準(zhǔn)則都有與式(1)相同的判別式,只是其中的判別系數(shù)T不同而已。

2 判別系數(shù)T的確定

2.1 萊特準(zhǔn)則

在萊特準(zhǔn)則下,規(guī)定T=3顯然有其合理性。

對于服從正太分布的隨機(jī)誤差,任意區(qū)間(-Δ,Δ)的差落在該區(qū)間的概率為:

拉普拉斯函數(shù)為:

當(dāng)Δ=3δ時(shí),2φ(3δ/δ)=0.997 3. 這說明,其殘余誤差落在區(qū)間(-3δ,3δ)以外的概率僅為0.27%,即經(jīng)過370次測量才會(huì)出現(xiàn)一次,對于有限次測量來說,可以認(rèn)為這是不可能發(fā)生的。由于3δ判據(jù)實(shí)質(zhì)上是建立在n→∞基礎(chǔ)上的,所以,當(dāng)n有限時(shí),特別是當(dāng)n比較小時(shí),這一判據(jù)并不是十分可靠的。同時(shí),又因?yàn)棣氖铅牡墓烙?jì)值,δ的精密度與測量次數(shù)n有關(guān),所以,在使用過程中,處理n比較大的數(shù)據(jù)群為好。

從另一個(gè)角度也可以說明,n取比較大的值為好。在等精度的n次重復(fù)測量中,如果只有一個(gè)測得值的殘余誤差|Xd-X|

超出某一界限±Tδ,而相應(yīng)的概率Pa=1-2φ(T)=1/n,則按正態(tài)分布規(guī)律可知,此值的殘余誤差為正常超出,因?yàn)閚個(gè)等精度測得值中出現(xiàn)一個(gè)的概率恰好是1/n.這說明,此值中含有隨機(jī)誤差,但是,不含疏忽誤差。如果按以上條件算出的概率Pa值小于1/n很多,則上述正常超出的可能性便會(huì)減小,而含有疏忽誤差的非正常超出的可能性便會(huì)增大。

對于萊特準(zhǔn)則,可估算,取Pa=1-2φ(3)=1/n,則有n=1/(1-0.997 3)=370.

這說明,萊特準(zhǔn)則可用于n比較大的測量數(shù)據(jù)群。經(jīng)驗(yàn)表明,一般n≥50,即可選用萊特準(zhǔn)則判別。

2.2 肖維勒準(zhǔn)則

Pa為殘余誤差落在(-Tδ,Tδ)以外的概率,則:Pa=1-2φ(T).

規(guī)定當(dāng)Pa=1/2n時(shí),則判別該測得值的殘余誤差為含有疏忽誤差的非正常超出,所以,應(yīng)將該值剔除。

由此可得:Pa=1-2φ(T)=1/2n.

其中,φ(T)=(2n-1)/4n.

由n和拉普斯函數(shù)可得肖維勒準(zhǔn)則的T值。

由此可知,肖維勒準(zhǔn)則是萊特準(zhǔn)則的改進(jìn),T判別系數(shù)從定值修正為一個(gè)與n有關(guān)的參數(shù),n增加,T相應(yīng)增大,n越小,保留數(shù)據(jù)域就越小。

對于肖維勒準(zhǔn)則,可估算,取2φ(T)=(2n-1)/2n=0.975,則有n=20;取2φ(T)=(2n-1)/2n=0.997 3,則有n=185.

由此可知,肖維勒準(zhǔn)則可用于測量次數(shù)比較少的數(shù)據(jù)群離群數(shù)據(jù)判別。經(jīng)驗(yàn)表明,一般n=20-100,即可用肖維勒準(zhǔn)則判別。

2.3 格拉布斯準(zhǔn)則

由正太分布原理可知,選定一個(gè)危險(xiǎn)率α.一般選5.0%,2.5%,1.0%,從而建立起T=λ(α,n)的函數(shù)關(guān)系。

在該函數(shù)關(guān)系中,λ(α,n)為測量次數(shù);n為危險(xiǎn)率是α?xí)r的統(tǒng)計(jì)臨界值,可查λ(α,n)表而得。經(jīng)過分析后可知,λ(α,n)值隨α增大而減小,隨n增大而增大。

考慮到危險(xiǎn)率α和測量次數(shù)n雙因子,給出了比較嚴(yán)格的結(jié)果[λ(α,n)來源推導(dǎo)復(fù)雜約],所以,該準(zhǔn)則可用于測量次數(shù)n比較少的數(shù)據(jù)群可疑離群數(shù)據(jù)的判別中。

一般經(jīng)驗(yàn)表明,該準(zhǔn)則用于n≤25的測試數(shù)據(jù)群的可疑數(shù)據(jù)判別中。

2.4 t檢驗(yàn)準(zhǔn)則

t檢驗(yàn)準(zhǔn)則是應(yīng)用分布原理合理檢驗(yàn)測量數(shù)據(jù)的又一種方法。該準(zhǔn)則與格拉布斯準(zhǔn)則一樣,考慮到危險(xiǎn)率α和測量次數(shù)n,建立起T=k(α,n)的函數(shù)關(guān)系。

在該函數(shù)關(guān)系中,k(α,n)為測量次數(shù);n為危險(xiǎn)率是α?xí)r的統(tǒng)計(jì)臨界值,可查k(α,n)表而得。經(jīng)過分析可知,k(α,n)值隨α增大而減小,隨n增大而減小。

考慮到危險(xiǎn)率α和測量次數(shù)n雙因子,給出了比較嚴(yán)格的結(jié)果[k(α,n)來源推導(dǎo)約],所以,該準(zhǔn)則可用于測量次數(shù)比較少的數(shù)據(jù)群可疑離群數(shù)據(jù)的判別。

一般經(jīng)驗(yàn)表明,該準(zhǔn)則可用于n≤20的測試數(shù)據(jù)判別中。

那么,格拉布斯準(zhǔn)則與t檢驗(yàn)準(zhǔn)則有什么關(guān)系呢?可以從計(jì)算標(biāo)準(zhǔn)偏差嚴(yán)格的較差公式出發(fā)進(jìn)行推證:

令:

由λ(α,n)和k(α,n)數(shù)表可知,λ(α,n)隨n的增加單調(diào)增加,k(α,n)隨n的增加單調(diào)減少。當(dāng)n增大到一定數(shù)字時(shí),λ(α,n)>k(α,n).由式(15)可得,B>A,A>λ(α,n),則B>k(α,n).

由式(20)可知,在k(α,n)>λ(α,n)的情況下,計(jì)算并對照λ(α,n)表和k(α,n)表得,當(dāng)A>λ(α,n)時(shí),則B>k(α,n).

由此可知,t檢驗(yàn)準(zhǔn)則的保留數(shù)據(jù)域比格拉布斯準(zhǔn)則窄,即如果可疑數(shù)據(jù)被格拉布斯準(zhǔn)則剔除,那么,它也一定會(huì)被t檢驗(yàn)準(zhǔn)則剔除。

3 體會(huì)

以上各準(zhǔn)則都是人為主觀擬定,但是,又都是以數(shù)據(jù)按正態(tài)分布為前提的。當(dāng)偏離正太分布時(shí),判斷的可行性將會(huì)受到影響,特別是測量次數(shù)減少時(shí)更不可靠。因此,對于可疑離群數(shù)據(jù),除了從測量結(jié)果中及時(shí)發(fā)現(xiàn)和利用剔除準(zhǔn)則鑒別外,更重要的是提高工作人員的技術(shù)水平和工作質(zhì)量,保證不出現(xiàn)有較大誤差的離群數(shù)據(jù)。

另外,可依據(jù)測量準(zhǔn)則度的要求和測量次數(shù)選擇判別準(zhǔn)則。從上述準(zhǔn)則間的聯(lián)系、數(shù)據(jù)域的寬窄和實(shí)踐操作經(jīng)驗(yàn)來看,推薦當(dāng)測量次數(shù)n≤50或n≥10作粗略判別時(shí),可采用萊特(3δ判別)準(zhǔn)則,在其他情況下,采用格拉布斯準(zhǔn)則判別為好。

在有限的測量列中,當(dāng)出現(xiàn)2個(gè)異常數(shù)據(jù)時(shí),通常可認(rèn)為整個(gè)測量結(jié)果是在不正常條件下得到。鑒于此,應(yīng)不斷改進(jìn)和完善測量方法,重新進(jìn)行有效測量。

〔編輯:白潔〕

主站蜘蛛池模板: 黄色国产在线| 九九热精品免费视频| 国产福利一区视频| 日韩小视频在线观看| 精品福利网| 九九精品在线观看| av在线人妻熟妇| 精品久久香蕉国产线看观看gif| 一边摸一边做爽的视频17国产| 亚洲永久色| 欧美狠狠干| 欧美色99| 男人天堂伊人网| 中文字幕 91| 亚洲日本韩在线观看| 国产亚洲视频免费播放| 97久久人人超碰国产精品| 中文字幕第4页| 国产一区二区在线视频观看| av手机版在线播放| 国产丝袜啪啪| 一本色道久久88| 免费三A级毛片视频| 怡红院美国分院一区二区| 欧美激情伊人| 久久国产高潮流白浆免费观看| 久久人人妻人人爽人人卡片av| 国产精品xxx| 亚洲人成影院在线观看| 91精品专区| 亚洲午夜综合网| 日韩欧美国产三级| 久久久久久尹人网香蕉| 国产丝袜无码一区二区视频| 欧美劲爆第一页| 国产综合另类小说色区色噜噜| 91成人在线免费视频| 狠狠色丁香婷婷| 五月婷婷综合网| 国产在线91在线电影| 无码精油按摩潮喷在线播放| 欧美激情网址| 18禁不卡免费网站| 国产在线观看精品| 污视频日本| 国产一级裸网站| 天天色天天综合| 欧美在线一二区| 国产欧美日韩资源在线观看| 亚洲三级视频在线观看| 亚洲精品日产精品乱码不卡| 国产精品夜夜嗨视频免费视频| 在线不卡免费视频| 欧美一区二区三区不卡免费| 美女一级免费毛片| 久久人搡人人玩人妻精品一| 亚洲国产精品无码AV| 伊人大杳蕉中文无码| 久久久久夜色精品波多野结衣| 激情国产精品一区| 国产又粗又猛又爽| 国产自在自线午夜精品视频| 有专无码视频| 国产SUV精品一区二区| а∨天堂一区中文字幕| 九九九国产| 中国一级特黄视频| 亚洲国产精品一区二区第一页免 | 亚洲无线国产观看| 91在线国内在线播放老师| 成年女人a毛片免费视频| 99偷拍视频精品一区二区| 国产色婷婷视频在线观看| 四虎精品国产AV二区| 亚洲第一视频区| av午夜福利一片免费看| 无码中字出轨中文人妻中文中| 国产亚洲欧美日韩在线观看一区二区| 国产精品一线天| 亚洲专区一区二区在线观看| 亚洲精品第一页不卡| 国产人成乱码视频免费观看|