陳明
【摘要】 本文介紹參數估計以及Matlab軟件,給出最大似然估計數學定義,闡述了Matlab軟件中Statistics Toolbox中Normfit函數格式和使用說明,并舉例加以說明,最后,強調論文的出發點.
【關鍵詞】 最大似然估計;Matlab;均值與方差
一、引 言
在很多實際問題中,為了進行某些統計推斷,需要確定總體所服從的分布.通常根據問題的實際背景或適當的統計方法可以判斷總體分布的類型,但是總體的分布中往往含有未知參數,需要用樣本觀測數據進行估計,例如,學生的某門課程的考試成績通常服從正態分布N(μ,σ2),其中μ,σ2為未知參數,需要用樣本觀測數據進行估計,這就是所謂的參數估計.它是統計推斷的一種重要形式.Matlab和Mathematica、Maple并稱為三大數學軟件,它在數學類科技應用軟件中在數值計算方面首屈一指,用于算法開發、數據可視化、數據分析以及數值計算的高級技術計算語言和交互式環境,主要包括Matlab和Simulink兩大部分.Matlab含有30多個工具箱,其中Statistics Toolbox是專門用于統計的工具箱,包含200多個m文件(函數),主要支持概率分布、參數估計、描述統計、線性模型、非線性模型等應用.
二、最大似然估計數學定義
設總體x為隨機變量,其分布的概率函數或密度函數已知,但θ為未知參數,x1,x2,…,xn為樣本觀測值,稱
L(θ)=∏ n i=1 P(xi,θ)=P(x1,θ)P(x2,θ)…P(xn,θ)
為似然函數.當θ=θ ^ 時,似然函數達到最大值,即稱θ ^ =θ ^ (x1,x2…xn)為參數θ的最大似然估計值,而θ ^ 可由方程 dL(θ) dθ =0解出,上述方程稱為似然方程.
三、Normfit函數說明
Normfit函數可求正態總體參數的最大似然估計和置信區間,其格式為[muhat,sigmahat,muci,sigmaci]=Normfit(x,P),其中x為樣本觀測值向量,1-P為置信度,muhat為總體均值μ的最大似然估計,muci為置信度1-P的置信區間,sigmahat為總體方差的最大似然估計,sigmaci為置信度1-P的置信區間.
四、舉例說明
從某公司生產的藥丸中隨機抽取10個,測得滾珠的直徑(單位:mm)如下:
15.14 14.81 15.11 15.26 15.08 15.17 15.12 14.95 15.05 14.87
若藥丸的直徑服從正態分布N(μ,σ2),其中μ,σ2未知,求μ,σ2最大似然估計和置信水平為90 % 的置信區間.
利用Matlab軟件,輸入如下代碼:
>>x=[15.14 14.81 15.11 15.26 15.08 1517 15.12 14.95 15.05 14.87]
>>[muhat,sigmahat,muci,sigmaci]=Normfit(x,0.1)
其計算結果為muhat=15.0560,sigmahat=0.1397,muci=[14.9750,15.1370],sigmaci=[0.1019,0.2298],即總體均值μ的最大似然估計為15.0560,90 % 置信區間為[149750,15.1370],總體方差σ2最大似然估計為0.1397,90 % 置信區間為[0.1019,0.2298].
五、結束語
本文利用Matlab實現最大似然估計有兩個主要原因.第一是問題本身,即利用該軟件來計算結果,得出正確答案.第二是熟悉Matlab軟件,正如本文開頭所述,Matlab是數學專業軟件,作為數學的重要分支統計學,熟練使用數學軟件進行統計學計算既是必備能力也是學生發展的需要.
【參考文獻】
[1]張賢明.MATLAB語言及應用案例[M].第1版.南京:東南大學出版社,2010.
[2]盛驟,謝式千,潘承毅.概率論與數理統計[M].第4版.北京:高等教育出版社,2010.
[3]鄭喜英,孔波.基于Matlab的概率統計教學研究[J].河南教育學院學報(自然科學版),2014,23(1):56-60.