遼寧省盤錦實驗中學遼東灣分校 趙盼盼
概率論與數(shù)理統(tǒng)計是研究和解釋隨機現(xiàn)象統(tǒng)計規(guī)律性的一門數(shù)學學科,作為理工科學生必修課程之一,它是一門將理論和實際聯(lián)系在一起的學科,有著很強的理論性和應(yīng)用性。在過去半個世紀中,概率論逐漸發(fā)展成為一個與數(shù)學很多其他分支相互影響的學科。概率統(tǒng)計廣泛應(yīng)用于社會、經(jīng)濟、管理等各個領(lǐng)域。隨著教學手段的日益更新,基于此門課程理論與實踐并重的特點,我們可以利用更多的工具解決學習和教學中遇到的問題。數(shù)學軟件能用來輔助教學,展現(xiàn)數(shù)學的思想和方法,提高教學效率。目前應(yīng)用較多的軟件有Excel,Matlab, Mathematica,Maple,SAS等,雖然它們的運算功能十分強大,但基本都是商業(yè)軟件,價格昂貴。而R語言是免費軟件,且統(tǒng)計功能強大,十分適合輔助教學。
R軟件是一個開放的統(tǒng)計編程環(huán)境,是S語言的一種實現(xiàn)。R軟件是由Auckland 大學的 Robert Gentleman 和 Ross Ihaka 及其他志愿人員開發(fā)的,目前由R核心開發(fā)小組維護。
R不僅是一個完全免費的統(tǒng)計軟件,而且還具有強大的數(shù)據(jù)分析功能,能提供數(shù)據(jù)分處理、統(tǒng)計分析、圖形顯示工具。利用R軟件的內(nèi)嵌統(tǒng)計函數(shù),可以很容易地學習和掌握R軟件的語法,還可以編制自己的函數(shù)來擴展現(xiàn)在的R語言。
目前R語言在國外生物統(tǒng)計、醫(yī)藥統(tǒng)計等統(tǒng)計領(lǐng)域和科研領(lǐng)域中得到了廣泛應(yīng)用,近年來在我國,R語言已受到越來越多的學者的關(guān)注和學習。
例:設(shè)隨機變量的分布列如下所示:
求E(X),D(X)。
在R中輸入如下命令:
> X<-c(-2,0,2)
> p<-c(0.4,0.3,0.3)
> X<-c(-2,0,2)
> p<-c(0.4,0.3,0.3)
> mean<-sum(X*p) #計算期望
> Y<-X^2
> Z<-sum(Y*p)
> sd<-Z-mean^2;mean;sd #計算方差,輸出期望和方差的值
總體是由總體分布來刻畫的。在實際問題中,我們根據(jù)問題本身的專業(yè)知識或以往的經(jīng)驗或用適當?shù)慕y(tǒng)計方法,有時可以判斷總體分布的類型,但是總體分布的參數(shù)還是未知的,需要通過樣本來估計。
下面是用R語言估計參數(shù)的例子:有一大批糖果,現(xiàn)從中隨機取16袋,稱得重量(以g 計)如下:
設(shè)袋裝糖果的重量近似服從正態(tài)分布,試求總體均值的置信水平為0.95的置信區(qū)間。
分析:這里 1-α=0.95,α/2=0.025,n-1=15,t0.025(15)=2.1315,由給出數(shù)據(jù)算得未知時的置信水平為的置信區(qū)間代入數(shù)據(jù)得的置信水平為的置信區(qū)間為
而利用R語言只需要輸入命令:
> x<-c(506,509,500,501,506,509,495,514,519,501,494,497,507,499,511,495)
> t.test(x)
回車得結(jié)果,如下:
在數(shù)理統(tǒng)計分析中,由估計量估計總體的參數(shù)可以獲得總體參數(shù)的無偏估計,但總體參數(shù)始終是不可知的。我們在統(tǒng)計推斷過程中,需要對參數(shù)提出一定的假設(shè),然后對提出的假設(shè)進行假設(shè)檢驗,由統(tǒng)計量推斷總體的參數(shù)。
下面是一個t-檢驗的例子:
下面列出的是某工廠隨機選取的20只部件的裝配時間(min):
分析:這是一個關(guān)于均值的檢驗問題??梢蕴岢鋈缦录僭O(shè):
因為總體方差未知,故采用t-檢驗方法。檢驗統(tǒng)計量為:
利用R語言只需要輸入命令:
> X<-c(9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7)
> t.test(X,alternative="greater",mu=10)
運行后結(jié)果如下:
R在檢驗的同時還給出了區(qū)間估計。另外,在t-檢驗的命令中,參數(shù)alternative 反映了備擇假設(shè)的情況,其取值可以是“two.sided”“l(fā)ess”“greater”。two.sided (默認) 表示雙邊檢驗less表示單邊檢驗greater表示單邊檢驗
通過本文的介紹,讀者對R語言在概率統(tǒng)計中的應(yīng)用有了初步的認識和了解,同時也可以看到R的語法簡單,程序可讀性強。本文敘述的只是R語言的一小部分內(nèi)容,讀者可以通過查看相關(guān)資料進一步掌握R語言。由于R語言是一個自由、免費的軟件,非常適用于教學、科研以及統(tǒng)計分析。目前,利用和掌握好R語言對我國統(tǒng)計事業(yè)的發(fā)展有著很大的推動作用。
【參考文獻】
[1]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2008.
[2]林正炎.概率統(tǒng)計課程改革的若干建議[J].高等教育研究,2001(1):6-7.
[3]林彤. EXCEL在概率論與數(shù)理統(tǒng)計中的應(yīng)用[J].東北電力大學學報,2013,33(6):52-55.
[4]鄧安生.淺談MATLAB在概率統(tǒng)計教學中的應(yīng)用[J].新余高專學報,2009, 14(2):87-89.
[5]薛毅,陳立萍.統(tǒng)計建模與R軟件[M].北京:清華大學出版社,2007.
[6]葉文春.淺談R語言在統(tǒng)計學中的應(yīng)用[J].中共貴州省委黨校學報,2008(4):123-125.