999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機數模擬的概率統計教學探索與實踐

2021-07-12 08:35:38張亮亮雷英杰解博麗
科技視界 2021年18期
關鍵詞:課程教學學生

薛 震 王 鵬 張亮亮 雷英杰 解博麗

(中北大學<理學院>,山西 太原 030051)

0 引言

黨的十九屆四中全會將數據作為一種新型生產要素寫入中央文件中,體現了互聯網大數據時代的新特征。概率統計是理工科院校一門重要的基礎理論課程,也是進行大數據處理的入門課程。生成特定分布的隨機數并對其進行可視化分析,可使學生直觀理解概率統計的基本概念與原理,掌握數據處理和統計分析的過程。R語言因其具有免費、易安裝、資源豐富、代碼簡單、擅長數據分析與可視化等優點,非常適合在概率統計課程中進行案例教學和直觀演示[1]。本文結合長期的教學和實踐經驗,探索使用R語言生成隨機數并進行參數估計和假設檢驗的教學研究。

1 隨機數的生成與參數估計

隨機數是一種重要的數據來源,著名的蒙特卡羅方法在模擬任何一個實際過程時都需要用到大量的隨機數。使用計算機產生的隨機數稱為偽隨機數,它們看起來是隨機的數,實際上是通過固定的、可重復計算的方法產生的,具有類似于隨機數的統計特征[2]。使用R語言生成時其代碼簡單,利用函數可快速生成服從二項分布、泊松分布、正態分布等各種常見分布的隨機數[3]。

伯努利大數定律為研究頻率是否穩定于概率的問題,是概率統計中比較重要且難以理解的內容之一。教材在介紹該部分內容時都是直接通過證明給出結論。“穩定”一詞究竟是什么含義?作為理工科學生對“依概率收斂”沒有深刻的認識,往往會與高等數學中數列的收斂方式混為一談。因此,在講授該部分內容時,若能夠結合圖形進行展示,則更能體現伯努利大數定律的本質含義。

在教學中首先使用R語言生成不同數量服從標準正態分布的隨機數,然后繪制這些隨機數對應的頻率直方圖,以及正態分布密度曲線,結果如圖1所示。由圖1可以看出,隨著隨機數個數的增加,直方圖的邊界與標準正態分布密度曲線越來越接近,即隨機數落在每個小區間上的頻率逐漸收斂到它的概率,直觀驗證了伯努利大數定律的科學內涵。

圖1 正態分布隨機數的直方圖與密度曲線

為進一步研究隨機數的數量對收斂過程的影響,可以使用MASS中的fitdistr()函數對前面生成隨機數的兩個參數進行最大似然估計,結果見表1。由表1可以看出,隨著隨機數數量的增加,其期望與方差的最大似然估計會逐漸收斂到理想取值0和1。

表1 正態分布隨機數參數的最大似然估計

通過上述圖表展示和相應R程序的逐步講解,可以讓學生對大數定律和參數的點估計有更加深刻的認知,展示出概率統計的特殊魅力。

需要說明的是,隨機數的隨機生成會導致圖1和表1在每次運行程序后的結果都不相同,實際中有時需要使用相同隨機數來比較不同方法的計算結果,可通過R語言中的set.seed()函數生成可再生的隨機數來解決這一問題。例如,生成8個服從均勻分布的可再生隨機數,程序如下:

運行程序后的結果為:

只要將隨機數種子設置成某個數(上例為123),就可以使得每次運行程序后的結果相同,這樣便于程序的移植和算法的對比分析。

2 基于隨機數模擬的假設檢驗

2.1 參數的假設檢驗

正態分布參數的假設檢驗是教學的重點內容,教材中一般都先給出一組服從正態分布的數據,然后按照假設檢驗的步驟進行示例介紹[4],學生對接受還是拒絕原假設并沒有一個直觀的認識。若通過生成服從正態分布的隨機數再對其進行假設檢驗,不但可以使學生知道自己檢驗的結果是否正確,而且可以克服使用了不服從正態分布的數據而導致錯誤判斷的弊端。

在教學過程中,不妨生成兩組服從正態分布的隨機數,第一組的數量為200、均值為2、方差為25,第二組的數量為300、均值為6、方差為25。由于是在總體參數均未知的條件下檢驗與的均值是否相同,故使用t檢驗;檢驗方差齊性時使用F檢驗,結果見表2。由表2可知,t檢驗的P值<0.05,故拒絕均值之差為0的原假設,據95%的置信區間可得的均值小于的均值;F檢驗的P值>0.05,不能拒絕方差相等的原假設,即認為與的方差相等。

表2 兩個正態總體期望和方差的假設檢驗

通過繪制箱線圖也可以發現與的平均取值差異較大,但它們的離散程度很相似,與使用t檢驗和F檢驗得到的結果一致[5]。

2.2 分布的假設檢驗

分布的假設檢驗是重要的非參數假設檢驗,其中最常見的是正態性檢驗。正態性檢驗的方法有很多,包括使用正態概率圖(Q-Q圖)、Pearson擬合優度卡方檢驗、Kolmogorov-Smirnov(K-S)擬合優度檢驗、Shapiro-Wilk檢驗(W檢驗)等[6]。在概率統計教材中,這方面的內容介紹相對較少,加之每種方法的原理和統計量的計算又非常復雜,學生僅僅通過一兩個例子是很難理解的。但若花大量時間去介紹理論,可能會適得其反。因此,若能通過軟件操作演示,不但可以加強學生對理論的理解,而且可以使學生快速掌握具體的操作方法,實現了“先會做、再理解”的學習過程。

為展示假設檢驗的操作過程,在教學中不妨生成700個均值為75、標準差為16的正態分布隨機數。使用Q-Q圖判別正態性比較直觀,但存在主觀性,為了更精確地判別,可以對該數據分別使用卡方檢驗、K-S檢驗和W檢驗進行判斷,結果見表3。由表3可知,三種方法的P值基本相同,遠>0.05,故應接受原假設,即認為該隨機數服從正態分布,這與生成隨機數時的分布一致,驗證了三種方法的有效性。

表3 隨機數的正態性檢驗

通過R語言生成隨機數再對其進行假設檢驗的教學演示,不但可以使學生有的放矢地學習,而且在課程的課時較少、教學任務繁重、學生思考時間有限的情況下,極大地提高了教學效率。

3 結論與探討

作為數據科學的重要入門課程,概率統計越來越受到人們的重視。傳統的教學方式存在重理論、輕應用,偏概率、輕統計,阻礙了大數據時代發展的客觀需求。為了使學生更好地認識和理解概率統計課程中的抽象概念、理論和方法,筆者在總結實踐教學經驗的基礎上,利用當前熱門的數據分析軟件——R語言,結合隨機數模擬與示例分析,在已知待分析數據分布的條件下,對難以理解的理論和統計方法進行直觀演示,不但可以激發學生的學習興趣,提高他們處理本專業相關數據的能力,而且可以為他們未來學習專業課程奠定基礎,達到了概率統計課程的教學目標和應用型人才的培養目標。

猜你喜歡
課程教學學生
數字圖像處理課程混合式教學改革與探索
微課讓高中數學教學更高效
甘肅教育(2020年14期)2020-09-11 07:57:50
軟件設計與開發實踐課程探索與實踐
計算機教育(2020年5期)2020-07-24 08:53:38
為什么要學習HAA課程?
趕不走的學生
“自我診斷表”在高中數學教學中的應用
東方教育(2017年19期)2017-12-05 15:14:48
對外漢語教學中“想”和“要”的比較
唐山文學(2016年2期)2017-01-15 14:03:59
學生寫話
學生寫的話
跨越式跳高的教學絕招
體育師友(2013年6期)2013-03-11 18:52:18
主站蜘蛛池模板: 亚洲福利视频一区二区| 97在线国产视频| www中文字幕在线观看| 又黄又湿又爽的视频| 毛片免费在线视频| 国产精品三级专区| 国产精品99r8在线观看| 19国产精品麻豆免费观看| 91精品国产91久久久久久三级| 国产极品美女在线观看| 免费一级毛片完整版在线看| 国产小视频在线高清播放| 欧美、日韩、国产综合一区| 国产区网址| 99一级毛片| 国产日韩丝袜一二三区| 在线亚洲精品自拍| AV在线天堂进入| 91丝袜美腿高跟国产极品老师| 精品成人免费自拍视频| 日本中文字幕久久网站| 操操操综合网| 亚洲天堂网站在线| 亚洲国产精品不卡在线| 国产成人精品三级| 2021无码专区人妻系列日韩| 久久精品91麻豆| 精品国产香蕉在线播出| 亚洲第一视频区| 亚洲一级毛片免费看| 国产拍在线| 色婷婷成人| 777午夜精品电影免费看| 成人福利在线视频| 老司国产精品视频91| 伊人成人在线| 在线观看国产精美视频| 日本久久网站| 亚洲福利视频一区二区| 亚洲va精品中文字幕| 午夜国产小视频| 国产情侣一区二区三区| 91久久国产成人免费观看| 亚洲色图综合在线| 成人av手机在线观看| 免费啪啪网址| 亚洲九九视频| 高清色本在线www| 欧美亚洲中文精品三区| 国产色偷丝袜婷婷无码麻豆制服| 国产成人凹凸视频在线| 亚洲国产清纯| 色婷婷亚洲综合五月| 波多野结衣无码中文字幕在线观看一区二区| 国产精品成| 伊人色在线视频| 91午夜福利在线观看| 国产激爽大片在线播放| 婷婷综合在线观看丁香| 四虎亚洲国产成人久久精品| 亚洲综合片| 香蕉精品在线| 国产精品专区第1页| 国产制服丝袜91在线| 久久久久免费精品国产| 午夜国产大片免费观看| a级毛片视频免费观看| 成人av专区精品无码国产| 伊人激情综合网| 亚洲日本一本dvd高清| 欧美亚洲国产一区| 67194在线午夜亚洲| 一级全黄毛片| 真人高潮娇喘嗯啊在线观看| 成人韩免费网站| 美女免费黄网站| 国产av一码二码三码无码| 久久国产精品电影| 欧美亚洲日韩中文| 国产成a人片在线播放| 免费日韩在线视频| 一区二区三区四区日韩|