孔令才
概率論與數理統計是現代數學的重要分支。近年來,隨著計算機的迅速普及,概率統計在經濟、管理、金融、保險、生物、醫學等方面的應用得到長足發展。正是這種廣泛應用性,使得概率統計成為今天各類各專業大學生最重要的數學必修課之一。然而,傳統的概率統計教學過于偏重理論的闡述、公式的推導、繁瑣的初等運算;同時,缺乏與計算機的結合,給學生的學習帶來很多困難。本文介紹概率統計中的主要問題在Matlab中的實現,把學生從繁瑣的計算中解放出來,把更多的時間和精力用于基本概念和基本理論的思考和方法的創新,從而提高教師的教學效率和學生的學習效率。
一、常用概率密度的計算
Matlab中計算某種概率分布在指定點的概率密度的函數,都以代表特定概率分布的字母開頭,以pdf(probability density function)結尾,例如:unidpdf(X, N):計算1到N上的離散均勻分布在X每一點處的概率密度;poisspdf(X, Lambda):計算參數為Lambda的泊松分布在X每一點處的概率密度;exppdf(X, mu):計算參數為mu的指數分布在X每一點處的概率密度;normpdf(X, mu, sigma):計算參數為mu, sigma的正態分布在X每一點處的概率密度。其他如連續均勻分布、二項分布、超幾何分布等也都有相應的計算概率密度的函數。
除計算概率密度的函數外,Matlab中還有計算累積概率密度、逆概率分布函數及產生服從某分布的隨機數的函數,分別以cdf,inv和rnd結尾。
二、隨機變量數字特征的計算
(一)數學期望與方差
對離散型隨機變量,可利用Matlab矩陣運算計算出其數學期望和方差;而對于連續型隨機變量,則可以利用Matlab符號運行計算。對常見分布,Matlab還有專用的函數計算其期望與方差,如binostat, expstat, normstat, poisstat可用于計算二項分布、指數分布、正態分布和泊松的期望和方差。另外,Matlab中提供了計算方差和標準差的函數var與std。
(二)協方差與協方差矩陣
Matlab中,函數cov(X)用于計算隨機變量的協方差或協方差矩陣。
三、樣本統計量及其分布
(一)樣本統計量及經驗分布函數
Matlab中,函數[h, stats]=cdfplot(X)返回樣本經驗分布函數圖像和樣本數據的幾個重要統計量,包括最小值、最大值、均值、中值和標準差。
(二)抽樣分布
數理統計中常用的X2分布、t分布、F分布,Matlab中也有相應的函數計算其概率密度,分別為chi2pdf(X, V), tpdf(X, V), fpdf(X, V1, V2),其用法與前面介紹的計算其他常用分布的概率密度的函數相似。
四、參數估計
對服從正態分布N(u,б2)的觀測數據向量X, Matlab中用函數normfit或mel來估計其參數和置信區間,而函數mle也可以用來估計服從其他分布的樣本數據的參數和出置信區間。
例:命令R = exprnd(3,1,10)返回一組服從參數為3的指數分布的隨機數,容量為10.
[p, pci] = mle('Exponential',R,0.05)則返回其均值的極大似然估計p = 4.3756及其置信水平為1-0.05=0.95的置信區間( 2.5611, 9.1247).
對于服從二項分布、指數分布、泊松分布和均勻分布等其它常見分布的數據,Matlab也有相應的計算極大似然估計和置信區間的函數,分別為binofit, expfit, poissfit, unifit等,其用法與normfit相似。
五、假設檢驗
對于假設檢驗,在Matlab中可以利用逆累積分布函數(如逆正態累積分布函數norminv),結合簡單的計算給出檢驗結果。但Matlab中也有專門用于假設檢驗的函數:對方差已知時的單個樣本均值檢驗可以用ztest,對單個樣本均值可以用ttest,對兩個樣本均值差可以用ttest2等。
總之,對于概率統計中絕大部分問題,Matlab統計工具箱都提供了相應的函數。在學習概率統計時,結合這些函數將使學習變得更加簡單易學。
參考文獻:
[1]周品,趙新芬. MATLAB數理統計分析[M]. 北京: 國防工業出版社,2009.
[2]王正林,劉明. 精通MATLAB7[M]. 北京: 電子工業出版社,2006.
(作者單位:華北電力大學數理系)