李 娜 于曉要
(商丘工學院基礎教學部,河南 商丘 476000)
在數理統計中,參數估計是統計推斷的基本問題之一.當總體的分布類型已知,但含有一個或多個未知參數時,如何求出未知參數的估計值或估計出未知參數的取值范圍的一類問題,即是參數估計問題.參數估計一般有兩種形式:其一是通過總體的一組樣本X1,X2,… ,Xn所提供的信息,來求出未知參數θ的估計值,這就是一類點估計問題;其二是通過樣本尋求一個區間使它有一定的把握包含被估的參數,此類即為區間估計問題.求點估計的方法很多,最常用的是矩估計法與最大似然估計法.本文介紹最大似然估計法的基本思想及其應用.
最大似然估計法是參數點估計中一種重要方法,它的思想是由著名數學家高斯提出,后被統計學家費希爾(R.A.Figher)于1912年在一項工作中應用并得到證明.
最大似然估計法的直觀想法是:在條件未知的隨機試驗中,如果某事件已經發生,則根據事件發生的概率最大原則去推斷試驗條件。即:在已經得到試驗結果的條件下,應該尋找使這個結果出現的概率最大的那個估計作為總體未知參數的估計。
若總體X屬離散型,其分布律P{X=x}=p(x;θ),θ∈Θ的形式為已知,θ為待估參數,Θ是θ可能取值范圍.設X1,X2,… ,Xn為來自總體X樣本,則X1,X2,… ,Xn的聯合分布律為
又設x1,x2,… ,xn是相應于樣本X1,X2,… ,Xn的一個樣本值.易知樣本取到觀察值x1,x2,… ,xn的概率,亦即事件發生的概率為

這一概率隨θ的取值而變化,它是θ的函數,L(θ)稱為樣本的似然函數(這里x1,x2,… ,xn是已知的樣本值,它們都是常數).
若總體X屬連續型,其概率密度f(x;θ),θ∈Θ的形式為已知,θ為待估參數,Θ是θ可能取值范圍.設X1,X2,… ,Xn為來自總體X樣本,則的聯合密度為即為樣本的似然函數L(θ).
于是求總體參數θ的最大似然估計值,就轉化為求似然函數L(θ)的最大值問題.因此當L(θ)關于θ可微時,常可從方程解得.又因L(θ)與lnL(θ)在同一處取到極值,因此,θ的最大似然估計也可從方程求得,而后一方程求解往往比較簡便.稱為對數似然方程.結合以上分析,我們可得到求最大似然估計的步驟:
例1 設總體X服從參數為λ的泊松分布,其中λ>0為未知參數,是來自總體X的樣本,求參數λ的最大似然估計量.

關于λ求導,并令其為0,即

解得λ的最大似然估計值,
λ的最大似然估計量,
最大似然估計法也適用于分布中含多個未知參數θ1,θ2,…,θk的情況.這時,似然函數L是這些未知參數的函數.分別令

解上述k個方程組,即可得到各未知參數的最大似然估計值.
例2 設X~N(μ,σ2),μ,σ2均為未知參數,x1,x2,… ,xn是來自總體X的樣本值.求μ,σ2的最大似然估計量.
解X的概率密度為

似然函數為

最大似然估計法是參數點估計中一種重要方法,它是在已經得到試驗結果的條件下, 應該尋找使這個結果出現的概率最大的那個參數值作為總體未知參數的估計值.在一定條件下,只要樣本容量足夠大,最大似然估計與待估的未知參數的真值可相差任意小,最大似然估計法是較理想的估計方法.