雙參數(shù)指數(shù)分布檢驗問題中樣本容量的確定*

2019-11-25 02:04:00黃圣杰

廣西民族大學(xué)學(xué)報(自然科學(xué)版) 2019年3期

黃圣杰

(廣西師范大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,廣西桂林 541004)

0 引言

雙參數(shù)指數(shù)分布廣泛應(yīng)用于農(nóng)業(yè)、醫(yī)學(xué)、保險等領(lǐng)域.例如,在可靠性領(lǐng)域,其可作為壽命函數(shù);在保險領(lǐng)域,其可作為損失函數(shù),用于健康壽命,災(zāi)情防范,車輛賠付等險種.在假設(shè)檢驗中,大多學(xué)者較為關(guān)注的是第一類錯誤,然而在金融保險等方面,第二類錯誤所帶來的損失往往會明顯高于第一類.因此,在樣本容量不確定情況下,如何有效地同時控制雙參數(shù)假設(shè)檢驗中犯兩類錯誤的概率相當(dāng)重要.雖然,隨著樣本量的增加,兩類錯誤都將減小.然而,樣本容量又直接影響著檢驗結(jié)果的精確度以及實際抽樣的成本和效率,因此盲目地通過增加樣本量來控制兩類錯誤,將大大提高檢驗成本.文獻(xiàn)[1]探究了正態(tài)分布下兩類錯誤和樣本容量之間的數(shù)量關(guān)系;文獻(xiàn)[2]基于上述結(jié)論探究了正態(tài)分布下均值和方差在假設(shè)檢驗中樣本量的確定.文獻(xiàn)[3]探究了雙參數(shù)分布中門限參數(shù)和尺度參數(shù)的分布性質(zhì);文章基于上述研究以及國內(nèi)外相關(guān)研究現(xiàn)狀,在雙參數(shù)的假設(shè)檢驗中,構(gòu)造合理統(tǒng)計量,證明其分布性質(zhì),確定了樣本容量和兩類錯誤之間的數(shù)量關(guān)系,并對其進(jìn)行數(shù)值模擬,論證結(jié)論.

1 模型估計

1.1 模型介紹

雙參數(shù)指數(shù)分布的分布函數(shù)為：

記為Exp(μ,θ),其中μ,θ分別稱為門限參數(shù)和尺度參數(shù),且有μ≥0,θ＞0.

1.2 性質(zhì)與極大似然估計

定理1 設(shè)想X1,X2,…,X n是來自總體Exp(μ,θ)的簡單隨機(jī)樣本,X(1),X(2),…,X(n)為該樣本的次序統(tǒng)計量,則有

證明：根據(jù)次序統(tǒng)計量的性質(zhì)可知：X(1)的概率密度函數(shù)為

又Ga(α,λ)的概率密度函數(shù)為

顯然

樣本似然函數(shù)為：

可以得到(μ,θ)的MLE為：

結(jié)合定理1,根據(jù)Gamma函數(shù)和χ2函數(shù)之間的關(guān)系可以得到以下結(jié)論：

2 兩類錯誤

在假設(shè)檢驗中,觀察值是否落在拒絕域內(nèi)將直接影響著原假設(shè)H0或備擇假設(shè)H1的成立.然而,在H0成立的條件下,由于樣本的隨機(jī)性,觀測值也可能會落在拒絕域內(nèi),從而做出H0不成立的誤判,即所謂的犯“第一類錯誤”,記發(fā)生概率為α;同理,在備擇假設(shè)H1成立的條件下,觀測值亦有可能未落在拒絕域內(nèi),導(dǎo)致犯“第二類錯誤”,記發(fā)生概率為β.當(dāng)選擇統(tǒng)計量的統(tǒng)計量服從卡方分布時,可以用圖1來解釋兩類錯誤的原理：

圖1 兩類錯誤原理Fig.1 Theory of two types of errors

3 門限參數(shù)檢驗情形樣本容量的確定

設(shè)X1,X2,…,X n是來自總體Exp(μ,θ)的簡單隨機(jī)樣本 ,針對如下檢驗：

.數(shù)真值為μ真,則有(2)成立.

因此

為方便起見,記△=|μ真-μ0|,則樣本容量為：

注：事實上,μ真是一個未知數(shù)(若已知,那么假設(shè)檢驗也就沒有意義了),但我們可以將其看作一個“理想的值”,而△則正反映了“理想值”與“現(xiàn)實值”的偏差.因此在最大偏差的條件下,我們不妨將其作為△的取值.事實上,當(dāng)△＞|μ0-μ真|的時候,第二類錯誤也就顯得沒有意義了.

4 尺度參數(shù)的檢驗

設(shè)X1,X2,…,X n是來自總體Exp(μ,θ)的簡單隨機(jī)樣本 ,針對如下檢驗：

同樣地,H1成立時并不服從卡方分布.不妨設(shè)真值為θ真,則有成立.

因此,

當(dāng)n充分大時,根據(jù)中心極限定理可知,故

5 數(shù)值模擬

構(gòu)建密度函數(shù),利用軟件R生成10000個服從總體分布為Exp(2,4)的隨機(jī)數(shù)列.計算在最大偏差值為10% 情況下,α為0.08,β為0.05;α為0.05,β為0.05;以及在最大偏差值為6%情況下,α為0.05,β為0.02時檢驗所需的樣本容量.其結(jié)果如表1所示：

表1 10%,6%偏差時檢驗所需樣本容量Tab.1 The Determination of Sample Size with deviation in 10%and 6%

6 結(jié)論

在總體服從雙參數(shù)指數(shù)分布的假設(shè)檢驗中,本文構(gòu)造了合適的統(tǒng)計量,并證明其服從卡方分布.利用卡方分布的性質(zhì)以及兩類錯誤的定義,計算得到了在同時控制兩類錯誤下時所需的樣本容量.從某種意義上講,在尋找到合適的統(tǒng)計量后,該方法同樣適用其他分布以及多總體下分布的假設(shè)檢驗的樣本容量確定.然而,在實際應(yīng)用中,除了考慮理論上的精度指標(biāo)之外,還應(yīng)結(jié)合勞動成本,科學(xué)性,實踐性等情況,從多方面協(xié)調(diào)出發(fā),得到最優(yōu)樣本容量.

廣西民族大學(xué)學(xué)報(自然科學(xué)版)2019年3期

廣西民族大學(xué)學(xué)報(自然科學(xué)版)的其它文章: 基于AI和VI的智能倉庫教學(xué)模型的研究*; 廣西高校民族傳統(tǒng)體育教育的教學(xué)改革與實踐探析*
——以廣西民族大學(xué)為例; 基于網(wǎng)絡(luò)通信行為分析的入侵檢測技術(shù)研究*; 基于節(jié)點優(yōu)化的無線傳感網(wǎng)絡(luò)拓?fù)淇刂品椒ㄑ芯?; 基于新的無標(biāo)度區(qū)確定方法求取分形路面不平度的分形維數(shù)*; 天頂對流層延遲對降雨情況的預(yù)估*