


極大似然估計是建立在極大似然原理的基礎(chǔ)上的一個統(tǒng)計方法,是概率論在統(tǒng)計學(xué)中的應(yīng)用,是用來估計一個概率模型的參數(shù)的一種方法.本文從極大似然估計的基本原理和具體實例中研究其應(yīng)用.
例1" (2023年2月安徽、吉林、云南和黑龍江四省聯(lián)考數(shù)學(xué)第19題)一個池塘里的魚的數(shù)目記為N,從池塘里撈出200尾魚,并給魚作上標(biāo)識,然后把魚放回池塘里,過一小段時間后再從池塘里撈出500尾魚,X表示撈出的500尾魚中有標(biāo)識的魚的數(shù)目.
(1)若N=5000,求X的數(shù)學(xué)期望;
(2)已知撈出的500尾魚中15尾有標(biāo)識,試給出N的估計值(以使得P(X=15)最大的N的值作為N的估計值).
解析" (1)依題意X服從超幾何分布,且N=5000,M=200,n=500,故E(X)=N×Mn=500×2005000=20.
(2)當(dāng)Nlt;685時,P(X=15)=0,當(dāng)N≥685時,P(X=15)=C15200C485N-200C500N,
記a(N)=C15200C485N-200C500N,則a(N+1)a(N)=C485N+1-200C500NC500N+1C485N-200=(N+1-500)(N+1-200)(N+1)(N+1-200-485)
=(N-499)(N-199)(N+1)(N-684)=N2-698N+499×199N2-683N-684.
由N2-698N+499×199gt;N2-683N-684,當(dāng)且僅當(dāng)Nlt;499×199+68415≈6665.7,則可知當(dāng)685≤N≤6665時,a(N+1)gt;a(N);
當(dāng)N≥6666時,a(N+1)lt;a(N),故N=6666時,a(N)最大,所以N的估計值為6666.
一般結(jié)論" 一般地,如果某批產(chǎn)品中有a件次品、b件合格品,采用不放回抽樣的方式從中抽取n件產(chǎn)品.若從n件產(chǎn)品中抽到k件次品,這批產(chǎn)品的次品率為多少?
解析" 由于從a+b件產(chǎn)品中取出n件產(chǎn)品的總數(shù)為Cna+b,其中次品出現(xiàn)k次的可能為CkaCn-kb.
令N=a+b,則所求概率為hk(N)=CkaCn-kN-aCnN,考慮其單調(diào)性,找到概率最值,最終找到似然估計.
即hk(N)hk(N-1)=CkaCn-kN-aCnNCkaCn-kN-1-aCnN-1=N2-aN-nN+anN2-aN-nN+KN.令hk(N)hk(N-1)=λ,則當(dāng)angt;kN時,λgt;1;
當(dāng)anlt;kN時,λlt;1,即當(dāng)Nlt;ank時,hk(N)是關(guān)于N的增函數(shù);當(dāng)Ngt;ank時,hk(N)是關(guān)于N的減函數(shù),所以當(dāng)N=ank時,hk(N)達到最大值,故次品率為aN=kn.
例2" (2023年12月江西省名校高三聯(lián)考題)某綜藝節(jié)目中,有一個盲擰魔方游戲,就是玩家先觀察魔方狀態(tài)并進行記憶,記住后蒙住眼睛快速還原魔方.為了解某市盲擰魔方愛好者的水平狀況,某興趣小組在全市范圍內(nèi)隨機抽取了100名盲擰魔方愛好者進行調(diào)查,得到的情況如表所示:
用時/秒[5,10](10,15](15,20](10,15]
男性人數(shù)1522149
女性人數(shù)511177
以這100名盲擰魔方愛好者用時不超過10秒的頻率,代替全市所有盲擰魔方愛好者用時不超過10秒的概率,每位盲擰魔方愛好者用時是否超過10秒相互獨立.若該興趣小組在全市范圍內(nèi)再隨機抽取20名盲擰魔方愛好者進行測試,其中用時不超過10秒的人數(shù)最有可能(即概率最大)是(" ).
A.2" B.3" C.4" D.5
解析" 根據(jù)題意得,1名盲擰魔方愛好者用時不超過10秒的概率為20100=15,
設(shè)隨機抽取的20名盲擰魔方愛好者中用時不超過10秒的人數(shù)為X,則X~B20,15,
其中P(X=k)=Ck2015k4520-k,k=0,1,2,…,20,當(dāng)k≥1時,由P(X=k)≥P(X=k+1),
P(X=k)≥P(X=k-1), 得Ck2015k4520-k≥Ck+12015k+145,
Ck2015k4520-k≥Ck-12015k-14521-k, 化簡得4(k+1)≥20-k,21-k≥4k, 解得165≤k≤215,又k∈Z,所以k=4,所以這20名盲擰魔方愛好者中用時不超過10秒的人數(shù)最有可能是4,故選C.
評注" 一般地,設(shè)總體X的未知參數(shù)θ待估,(x1,x2,…,xn)為X的一組樣本觀察值,則當(dāng)X為離數(shù)型時,該組觀察值發(fā)生的概率L(θ)=P(X1=x1,…,Xn=xn;θ)=Πni=1P(Xi=xi;θ)應(yīng)最大,從而求θ的極大似然估計值即求使上式的L(θ)達最大的估計值θ(x1,x2,…,xn).
例3" (2024年4月杭州市模擬考試第19題)在概率統(tǒng)計中,常常用頻率估計概率.已知袋中有若干個紅球和白球,有放回地隨機摸球n次,紅球出現(xiàn)m次.假設(shè)每次摸出紅球的概率為p,根據(jù)頻率估計概率的思想,則每次摸出紅球的概率p的估計值為=mn.
(1)若袋中這兩種顏色球的個數(shù)之比為1:3,不知道哪種顏色的球多.有放回地隨機摸取3個球,設(shè)摸出的球為紅球的次數(shù)為Y,則Y~B(3,p).
注:Pp(Y=k)表示當(dāng)每次摸出紅球的概率為p時,摸出紅球次數(shù)為k的概率.
(i)完成下表:
k0123
P14(Y=k)2764164
P34(Y=k)9642764
(ii)在統(tǒng)計理論中,把使得Pp(Y=k)的取值達到最大時的p,作為p的估計值,記為,請寫出的值.
(2)把(1)中“使得Pp(Y=k)的取值達到最大時的p作為p的估計值”的思想稱為最大似然原理.基于最大似然原理的最大似然參數(shù)估計方法稱為最大似然估計.
具體步驟:先對參數(shù)θ構(gòu)建對數(shù)似然函數(shù)l(θ),再對其關(guān)于參數(shù)θ求導(dǎo),得到似然方程l′(θ)=0,最后求解參數(shù)θ的估計值.
已知Y~B(n,p)的參數(shù)p的對數(shù)似然函數(shù)為l(p)=∑ni=1Xilnp+∑ni=1(1-Xi)ln(1-p),
其中Xi=0,第i次摸出白球,
1,第i次摸出紅球,
求參數(shù)p的估計值,并且說明頻率估計概率的合理性.
解析" (1)由Y~B(3,p),得p=14或34.
(ⅰ)表格如下
k0123
P14(Y=k)27642764964164
P34(Y=k)16496427642764
(ⅱ)由題知Pp(Y=k)=Ck3pk(1-p)3-k.
當(dāng)y=0或1時,參數(shù)p=14的概率最大;當(dāng)y=2或3時,參數(shù)p=34的概率最大.所以=14,y=0,1,34,y=2,3.
(2)對對數(shù)似然函數(shù)進行求導(dǎo),l′(p)=1p∑ni=1Xi-11-p∑ni=1(1-Xi),因此似然方程為1p∑ni=1Xi-11-p∑ni=1(1-Xi)=0,解得=1n∑ni=1Xi,因此,用最大似然估計的參數(shù)與頻率估計概率的是一致的,故用頻率估計概率是合理的.
例4" (2024年4月太原市模擬考試第19題)某制藥公司研制了一款針對某種病毒的新疫苗.該病毒一般通過病鼠與白鼠之間的接觸傳染,現(xiàn)有n只白鼠,每只白鼠在接觸病鼠后被感染的概率為12,被感染的白鼠數(shù)用隨機變量X表示,假設(shè)每只白鼠是否被感染之間相互獨立.
(1)若PX=5=PX=95,求數(shù)學(xué)期望E(X--);
(2)接種疫苗后的白鼠被病鼠感染的概率為p,現(xiàn)有兩個不同的研究團隊理論研究發(fā)現(xiàn)概率p與參數(shù)θ0lt;θlt;1的取值有關(guān).團隊A提出函數(shù)模型為p=ln1+θ-23θ2,團隊B提出函數(shù)模型為p=121-e-θ.現(xiàn)將100只接種疫苗后的白鼠分成10組,每組10只,進行實驗,隨機變量Xi(i=1,2,···,10)表示第i組被感染的白鼠數(shù),將隨機變量圖1Xi(i=1,2,···,10)的實驗結(jié)果xii=1,2,···,10繪制成頻數(shù)分布圖,如圖1所示.
(i)試寫出事件“X1=x1,X2=x2,···,X10=x10”發(fā)生的概率表達式(用p表示,組合數(shù)不必計算);
(ⅱ)在統(tǒng)計學(xué)中,若參數(shù)θ=θ0時使得概率PX1=x1,X2=x2,···,X10=x10最大,稱θ0是θ的最大似然估計.根據(jù)這一原理和團隊A,B提出的函數(shù)模型,判斷哪個團隊的函數(shù)模型可以求出θ的最大似然估計,并求出最大似然估計.參考數(shù)據(jù):ln32≈0.4055.
解析" (1)由題知,隨機變量X服從二項分布,X~Bn,12,由PX=5=PX=95,
即C5n1251-12n-5=Cn-5n12n-51-125=C95n12951-12n-95,得n=100,所以E(X--)=np=50.
(2)(i)A=“X1=x1,X2=x2,···,X10=x10”,
P(A)=[C910p1-p9]3[C210p21-p8]3[C310p31-p7]2[C410p41-p6][C610p61-p4],所以P(A)=(C110)3C2103C3102C4102p251-p75.
(ii)記gp=lnC10103C2103C3102C4102+25lnp+75ln1-p,則g′p=25p-751-p=25-100pp1-p,當(dāng)0lt;plt;14時,g′pgt;0,gp單調(diào)遞增;當(dāng)14lt;plt;1時,g′plt;0,gp單調(diào)遞減;
當(dāng)p=14時,gp取得最大值,即p取得最大值,在團隊A提出的函數(shù)模型p=ln1+θ-23θ20lt;θlt;1中,記函數(shù)f1(x)=ln1+x-23x20lt;xlt;1,有f′1x=11+x-43x=-4x2-4x+331+x,當(dāng)0lt;xlt;12時,f′1xgt;0,f1(x)單調(diào)遞增;當(dāng)12lt;xlt;1時,f′1xlt;0,f1(x)單調(diào)遞減,當(dāng)x=12時,f1(x)取得最大值ln32-16lt;14ln32≈0.4055,則θ不可以估計,在團體B提出的函數(shù)模型p=121-e-θ中,記函數(shù)f2(x)=121-e-x,f2(x)單調(diào)遞增,令f2(x)=14,解得x=ln2,則團隊B可以求出θ的最大似然估計,且θ0=ln2是θ的最大似然估計.
評注" 當(dāng)X為連續(xù)型時,觀察值(x1,x2,…,xn)發(fā)生的概率為0,但由于樣本(x1,x2,…,xn)的概率密度在一點處的函數(shù)值大小反映和決定樣本在該點附近取值的概率大小,因此,觀察值(x1,x2,…,xn)發(fā)生的概率最大可用樣本的概率密度在該觀察值點的函數(shù)值f(x1,x2,…,xn;θ)=Πni=1f(xi;θ)最大來反映和表示(其中f(xi;θ)為總體概率密度)求θ的極大似然估計就是求使以上函數(shù)值達最大的估計值θ(x1,x2,…,xn).
在概率的最值問題研究過程中,不論是用“代數(shù)法”的視角探究最值,還是用“概率原理”去描述推證,均旨在通過不同視角的研究拓展思維.相比而言,“代數(shù)法”多用于論證和試題的解答,“運用概率、統(tǒng)計原理”去描述的方法可增強理解蘊含在實際問題中的概率、統(tǒng)計規(guī)律,更好揭示數(shù)學(xué)本質(zhì).