劉廣會 韓瑩瑩
摘 要:本文以大數據時代為背景,基于R軟件分析概率論與數理統計的教學中,探索如何在實踐教學中提高教學質量,充分調動學生積極性的同時,提高了大學生學習知識、運用知識解決實際問題的能力。
關鍵詞:大數據;R軟件;實踐教學
大數據指在一定時間范圍內無法使用常規軟件工具捕捉、管理和處理的數據集合。大數據具有多種數據類型、快速采集速度、龐大的數據量和低數據成本等特點。目前,大數據時代已經到來,政府、企事業單位等機構已經意識到數據是組織機構重要的資產,數據的分析能力成為各個組織核心競爭力。統計部門和高校科研單位要對海量數據進行處理,挖掘數據寶庫,發現潛在規律信息等,為政府部門決策提供理論支持[1]。作為分析數據的一門重要學科,概率論與數理統計在大數據時代顯得尤為重要。在信息快速發展的大數據時代,傳統的概率論與數理統計的教學也面臨這諸多挑戰。
一、概率論與數理統計課程的教學現狀
許多現代高校都把培養應用型人才作為培養目標,但是在課程的設置上還是側重理論基礎。概率論與數理統計是理工科類大學生必修數學理論基礎課程,是學習許多其他專業基礎課的先修課程,對其他專業課學習有重要的影響。但是由于概率論與數理統計課程內容抽象、理論推導復雜、計算量大等特點;對于數學基礎較差的學生,學習更加困難,造成學習倦怠。另外,教師又很難在有限的時間內充分完成教學任務,又能對典型例題進行有效練習。諸多原因造成概率論與數理統計課程的教學質量很不樂觀[2]。隨著教育改革的不斷深入,教育教學理論與觀念不斷更新,現代教育倡導以學生的發展為出發點,在教學過程中將理論知識與實踐相結合,才能使得學生掌握的知識轉化為實際生產力,同時通過實踐教學提高學生分析和解決實際問題的應用能力。在現代信息技術大力推廣的時代,如何讓抽象的數學課程變得直觀、生動、富有樂趣,讓復雜、繁瑣的理論推導過程變得簡單明了,通俗易懂,讓學生從被動的學習變成主動的獲取、探索,是概率論與數理統計課程改革方向和目標。在多媒體教學的基礎上,借助R統計軟件輔助教學成為探索大數據時代概率論與數理統計課程新的教學手段。
二、R軟件在實踐教學中應用案例探究
好的實踐教學效果離不開好的統計軟件。R是一種流行且完全免費的免費開源統計軟件,是統計計算和統計繪圖的絕佳工具。而且在數據挖掘等領域,人大經濟論壇,數學中國論壇、統計之都等論壇匯集了眾多對R軟件有興趣的統計學、數據挖掘的專家和愛好者,共同探討R軟件在統計分析和數據挖掘方面的應用[3]。
下面我們通過實踐案例說明在概率論與數理統計教學中如何使用R軟件進行實踐教學和計算分析。
例1:已知某種材料的抗壓強度 ,現隨機地抽取 10 個試件進行抗壓試驗,測得數據如下:
482 493 457 471 510 446 435 418 394 469
(1)求平均抗壓強度 的置信水平為 95%的置信區間;
(2)若已知 ,求平均抗壓強度 的置信水平為 95%的置信區間;
解析:這是學習區間估計時常見案例,通常教材上的會采用常規理論推導計算不同類型下的區間估計.
下面使用R軟件編程,并調用相關的程序
編程語言:
interval_estimate1<-function(x,sigma=-1,alpha=0.05){
n<-length(x); xb<-mean(x)
if (sigma>=0){
tmp<-sigma/sqrt(n)*qnorm(1-alpha/2); df<-n
}
else{
tmp<-sd(x)/sqrt(n)*qt(1-alpha/2,n-1); df<-n-1
}
data.frame(mean=xb, df=df, a=xb-tmp, b=xb+tmp)
}
編寫程序后,在命令編輯窗口中輸入如下命令:
>? source(“interval_estimate1.R”)
>? X<-c(482,493,457,471,510,446,435,418,394,469)
>? interval_estimate1(X)
mean???? df??????? a???????? b
1 457.5???? 9????? 432.3069?? 482.6931
R軟件會輕松計算出在方差未知的情況下平均抗壓強度的置信水平為 95%的置信區間為。
同樣地,當方差已知的情況下輸入
>? interval_estimate1(X,30)
mean??? df? ??????a???????? b
1 457.5?? 10???? 438.9061?? 476.0939
R軟件會輕松計算出在方差已知的情況下平均抗壓強度的置信水平為 95%的置信區間為。
例2:化肥廠用自動包裝機包裝化肥,每包的質量服從正態分布,其平均質量為100kg,標準差為1.2kg。某日開工后,為了確定這天包裝機工作是否正常,隨機抽取 9 袋化肥,稱得質量如下:
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5.
設方差穩定不變,問這一天包裝機的工作是否正常(取)?
傳統理論推導計算步驟如下:
解:概率論與數理統計常規方法為建立檢驗假設,選取統計量,給定顯著性水平,確定雙側拒絕域,并且計算檢驗的值,確定接受原假設還是拒絕原假設,即可以判斷這一天包裝機的工作正常.
編程語言:
mean.test1<-function(x, mu=0, sigma=-1, side=0){
source(“P_value.R”)
n<-length(x); xb<-mean(x)
if (sigma>=0){
z<-(xb-mu)/(sigma/sqrt(n))
P<-P_value(pnorm, z, side=side)
data.frame(mean=xb, df=n, Z=z, P_value=P)
}
else{
t<-(xb-mu)/(sd(x)/sqrt(n))
P<-P_value(pt, t, paramet=n-1, side=side)
data.frame(mean=xb, df=n-1, T=t, P_value=P)
}
}
> source(“mean.test1.R”)
> X<-c(99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5)
> mean.test1(X, mu=100, side=0)
mean???? df?????????? T???????? P_value
1 99.97778?? 8????? -0.05499613???? 0.9574902
通過R軟件P值為0.9574>0.05, 故接受原假設,可以認為這一天包裝機的工作正常。
三、R軟件在概率論與數理統計教學實踐意義
概率論與數理統計是一門研究隨機現象統計規律的學科,課程本身較為抽象,學生普遍反映面對抽象的概念定義、復雜的計算過程、難以理解的理論推導時往往都會失去學習興趣。如果僅采用傳統的教學模式、方法、手段,不但難以提高學生學習的積極性,教學效果相對也較差。
從前面的幾個教學實例的介紹可見,以R軟件進行輔助教學,一方面,可以讓復雜的計算過程用簡單的幾行程序代碼快速呈現,減輕學生對概率論與數理統計課程的恐懼和反感,提高學生學習的積極性、主動性;另一方面,由于R軟件具有強大的圖形可視化功能,可以借助圖形將計算結果顯示出來,增加結果的直觀性,更有助于對統計結果的合理解釋。在實踐教學過程中,R軟件使得抽象的教學內容變得直觀、生動的同時教學重難點也得突破,教學效果顯著提高。與此同時,在學習概率論與數理統計理論基礎知識的同時,對R軟件有了簡單的了解,增加深入學習R語言的興趣。
總之,將R軟件融入到概率論與數理統計課程的實踐教學中,既有利于教師在有限的時間內把抽象的理論知識轉化為生動、形象的圖形、圖表,使得理論知識具體化了、直觀化了,這樣也激發了學生對數學相關課程產生濃厚的興趣的同時,讓學生掌握、精通一門編程語言,進一步提高學生的分析問題和解決實際問題的能力,為統計建模、數學建模類的實踐能力大賽打下堅實的基礎。
在大數據時代背景下,培養綜合的應用型人才是各高校人才培養目標,而能夠熟練精通掌握一門計算機編程語言又是新時代用人單位對大學生的基本要求,所以把R語言融入到概率論與數理統計的教學實踐中,可以在改善課堂教學效果的同時,讓學生掌握一門實用編程語言,并掌握處理和分析數據的能力,為學校實現培養應用型人才的目標提供有力保障和奠定堅實基礎。
參考文獻
[1] 蔣東興,付小龍.大數據背景下的高校智慧校園的建設探討[J].華東師范大學學報,2015(3):119-131.
[2] 趙為華.R軟件在概率論與數理統計案例教學中應用[J].福建電腦,2018,34(5):171-172.
[3] 李向利,趙紅衛.大數據時代背景下統計學教學模式的改革研究——以桂林電子科技大學為例[J].赤峰學院學報:自然科學版.2016(3):262-263.