章志華



摘? 要:《概率統(tǒng)計》是大學(xué)各專業(yè)的通識教育基礎(chǔ)課程,在產(chǎn)品抽樣檢驗、實(shí)驗數(shù)據(jù)分析等領(lǐng)域具有重要的應(yīng)用,因此是大學(xué)生最感興趣的公共數(shù)學(xué)課程之一。但是由于概率統(tǒng)計課程以高等數(shù)學(xué)為基礎(chǔ),對學(xué)生積分學(xué)知識的掌握程度有一定要求,再加上高中數(shù)學(xué)課堂接觸積分概念很少,很少介紹統(tǒng)計推斷原理,因此大二學(xué)生在學(xué)習(xí)該課程過程中會出現(xiàn)很多困難和問題。文章將對學(xué)生學(xué)習(xí)過程中容易混淆的概念進(jìn)行了總結(jié)與分析,并提出教學(xué)改進(jìn)措施。文章的觀點(diǎn)有望給本科概率統(tǒng)計課程學(xué)習(xí)和教學(xué)提供借鑒。
關(guān)鍵詞:概率統(tǒng)計;概念混淆;教學(xué)改進(jìn)
中圖分類號:G642? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號:2096-000X(2019)26-0081-04
Abstract: Probability and Statistics is a foundation course for undergraduates. It can be applied in fields like product sampling inspection, experimental data analysis and so on. Therefore, it is one of the most interesting mathematics courses for students in universities. But there are a lot of difficulties and problems in the process of learning, because the base of probability and statistic is calculus, which requires that the students must have a deep comprehension of calculus. However, the concept of integral is seldom taught in high school math classes, and the principle of statistical inference is never introduced. In this article, the concepts that are easy to be confused in students' learning process are summarized and analyzed. Improvement measures of teaching are proposed, in the hope that the opinions in this article could supply a reference for undergraduates and college teachers.
Keywords: probability and statistics; confusion of concepts; improvement of teaching
大學(xué)公共《概率論與數(shù)理統(tǒng)計》課程一般開設(shè)在二年級,主要包含兩個部分:概率論和數(shù)理統(tǒng)計。《概率論》作為該課程的第一部分內(nèi)容進(jìn)行介紹,也是后繼課程《數(shù)理統(tǒng)計》的基礎(chǔ)。對于數(shù)學(xué)專業(yè)的學(xué)生,部分院校將《概率論與數(shù)理統(tǒng)計》作為兩個課程,并分別開設(shè)在兩個學(xué)期來教授,由此可見《概率論與數(shù)理統(tǒng)計》的重要性和難度。概率論以微積分為基礎(chǔ)工具,研究具有不確定性的隨機(jī)現(xiàn)象的統(tǒng)計規(guī)律性;數(shù)理統(tǒng)計以概率論知識為基礎(chǔ),借助統(tǒng)計推斷原理,利用隨機(jī)試驗對抽樣的總體進(jìn)行估計和推斷,包含參數(shù)估計、假設(shè)檢驗、回歸分析等內(nèi)容,由于課時有限,一般高校開設(shè)的公共概率統(tǒng)計課程中統(tǒng)計部分知識只介紹參數(shù)估計和假設(shè)檢驗兩塊內(nèi)容。概率論和數(shù)理統(tǒng)計已經(jīng)發(fā)展成兩個成熟的學(xué)科,在當(dāng)今的大數(shù)據(jù)背景下具有更廣泛的應(yīng)用,特別是數(shù)理統(tǒng)計可應(yīng)用于地震預(yù)測、產(chǎn)品抽樣檢驗、數(shù)據(jù)分析、決策分析和評價等領(lǐng)域,因此,不僅很多高校的數(shù)學(xué)學(xué)院開設(shè)統(tǒng)計學(xué)專業(yè),甚至部分高校的經(jīng)濟(jì)學(xué)院、管理學(xué)院也開設(shè)統(tǒng)計學(xué)專業(yè)。同時該課程也是考研數(shù)學(xué)的重要組成部分,因此概率統(tǒng)計是最受大學(xué)生青睞的通識教育課程之一。但是由于該課程以《高等數(shù)學(xué)》為基礎(chǔ),對學(xué)生積分部分知識的掌握程度有一定要求,特別是對重積分的知識有一定要求,再加上高中數(shù)學(xué)課堂接觸積分概念很少,很少介紹統(tǒng)計推斷原理,因此大二學(xué)生在學(xué)習(xí)概率統(tǒng)計課程過程中會出現(xiàn)很多困難和問題,這主要體現(xiàn)在平時課堂回答問題和課后作業(yè)常犯的錯誤中。接下來,本文將通過具體的例子對學(xué)生在學(xué)習(xí)過程中容易混淆的概念和常見的記憶性錯誤進(jìn)行總結(jié)與分析,并提出相應(yīng)的改進(jìn)措施,希望可以給學(xué)習(xí)概率統(tǒng)計的大學(xué)生提供有利的幫助,同時給教授該課程的教師提供借鑒。
一、易混淆概念
本節(jié)我們以例題的形式列舉出學(xué)生在學(xué)習(xí)過程中容易混淆的概念,對發(fā)生混淆的原因進(jìn)行追溯和分析,并提出預(yù)防措施。
(一)隨機(jī)事件和集合概念混為一談
例1設(shè)隨機(jī)試驗E的樣本空間為?贅={x|0x2},事件A={x|1/2<x1},B={x|1/4x3/2},求事件。
解:根據(jù)題意,由于隨機(jī)事件是樣本空間的子集,利用集合在數(shù)軸上的表示可得AB=A={x|1/2<x1},由于樣本空間為?贅={x|0x2},因此我們得到={x|1/0x1/2}∪{x|1<x2}。
在本例中學(xué)生經(jīng)常犯如下錯誤:學(xué)生記住了隨機(jī)事件是集合的本質(zhì),但沒有考慮到隨機(jī)事件是樣本空間的子集,依據(jù)中學(xué)的固定思維和方法,先求出A和B的交集,然后想當(dāng)然的認(rèn)為全集是整個實(shí)數(shù)集R,再根據(jù)集合補(bǔ)運(yùn)算,利用數(shù)集在實(shí)數(shù)軸上的表示進(jìn)行計算,得出了錯誤結(jié)果={x|x≤1/2}∪{x|1<x},犯此類錯誤的原因有兩個:一是對樣本空間概念沒有完全接受,沒有意識到它是一個全集;二是對隨機(jī)事件的概念沒有完全接受,總是和漢語詞匯“事件”聯(lián)系,不能將其和子集進(jìn)行對應(yīng)。針對這一錯誤,教師在引入樣本空間和隨機(jī)事件的概念時首先應(yīng)強(qiáng)調(diào)這兩個概念是伴隨隨機(jī)試驗而產(chǎn)生的兩個名字,樣本空間中的“空間”是指一次隨機(jī)試驗的“所有”可能結(jié)果組成的集合,這一結(jié)果可以是一些具體的事物,如拋擲一枚硬幣可能產(chǎn)生“正面,反面”兩種結(jié)果,也可能是一些離散的數(shù)字,如投一枚骰子可能產(chǎn)生“1,2,3,4,5,6”六種結(jié)果,還有可能這些結(jié)果的取值處于某個范圍內(nèi),如北京夏季某天的最低溫度是25攝氏度,最高溫度是37攝氏度,那么要考察每年該天在上午9時20分30秒這一時刻的溫度,這一時刻溫度的取值就是區(qū)間[25,37]內(nèi)的某一個值,因此這時的樣本空間是一個連續(xù)的區(qū)間,該區(qū)間就是一個全“空間”。其次教師要反復(fù)向?qū)W生強(qiáng)調(diào)隨機(jī)事件是樣本空間的子集。最后教師要著重強(qiáng)調(diào)樣本空間和隨機(jī)事件兩者之間是全集與子集的關(guān)系,并且該處的全集是和隨機(jī)試驗對應(yīng)的,隨機(jī)試驗不同對應(yīng)的全集也不同,因此不能將全集和實(shí)數(shù)集混淆。
(二)樣本空間和樣本空間的概率混淆
例2 設(shè)?贅是樣本空間,試用事件A,B,C及其運(yùn)算表示事件“A,B,C不同時發(fā)生”。
解:設(shè)D表示事件“A,B,C不同時發(fā)生”,則D=ABC或D=-ABC。
本例中學(xué)生常犯的錯誤是將D表示為1-ABC,其中學(xué)生將樣本空間這一事件的概率為1與樣本空間?贅混淆。產(chǎn)生該錯誤的原因是因為學(xué)生混淆了逆事件與逆事件概率的計算公式P(A)=P(-A)=1-P(A)在數(shù)學(xué)家柯爾莫哥洛夫引入概率的公理化定義時,樣本空間作為必然事件,即在一定條件下必然發(fā)生的事件,規(guī)定其概率為1,此處的1即百分百,對應(yīng)于包含所有可能結(jié)果的必然事件,這是概率公理化定義的一個必要條件,該條件既符合人們的認(rèn)知,也為后繼概率論的發(fā)展帶來了很多便利,大大簡化了計算。概率的公理化定義給隨機(jī)事件發(fā)生的可能性建立了數(shù)學(xué)模型,將隨機(jī)事件的統(tǒng)計規(guī)律性數(shù)量化。教師在介紹概率定義時可根據(jù)上述概率公理化的意義來說明必然事件對應(yīng)的概率為1的意義,目的是讓學(xué)生更容易接受,同時也可以讓學(xué)生更好的理解逆事件概率計算公式中1的意義,并強(qiáng)調(diào)概率是區(qū)間[0,1]的實(shí)數(shù),因此概率也可以看成是滿足特定條件的集合函數(shù),該函數(shù)的自變量是集合,取值在區(qū)間[0,1]。通過這些輔助說明和解釋,學(xué)生更能體會概率的本質(zhì)是用來刻畫隨機(jī)事件的統(tǒng)計規(guī)律性的,因而能更好的區(qū)分樣本空間以及樣本空間的概率。
(三)概率密度函數(shù)和分布函數(shù)混淆
在一維連續(xù)型隨機(jī)變量教學(xué)過程中,概率密度函數(shù)是重點(diǎn),可通過對概率密度函數(shù)取定積分來求概率。并且一維連續(xù)型隨機(jī)變量的分布函數(shù)和概率密度之間的關(guān)系如下
對F求導(dǎo),利用變上限函數(shù)求導(dǎo)知識,可以得到在f的連續(xù)點(diǎn)x處,有F'(x)=f(x),即分布函數(shù)的導(dǎo)數(shù)是概率密度,概率密度的變上限積分是分布函數(shù),或者說(1)式表示的是隨機(jī)變量X取值小于等于x時的概率,等式(1)所反映的分布函數(shù)和概率密度之間的關(guān)系在幾何上表示為圖1。針對連續(xù)型隨機(jī)變量,雖然分布函數(shù)和概率密度之間的關(guān)系可以用(1)式簡單的概括,但仍有學(xué)生將這兩個概念混淆,以致得到在計算中得到錯誤的結(jié)果,或者計算不夠簡潔。
例3 設(shè)隨機(jī)變量ξ的分布函數(shù)為F(x)=(π+4arctanx)/4π,(-∞<x<+∞)。試求:(1)ξ落在區(qū)間(-1,1)內(nèi)的概率;(2)ξ的概率密度。
解:(1)根據(jù)分布函數(shù)的定義F(x)=P(Xx),以及連續(xù)型隨機(jī)變量在單點(diǎn)處的概率為0,我們可得到P(-1<X<1)=P(-1X1)=F(1)-F(-1)=(arctan1-arctan(-1))/π=1/2。
(2)設(shè)ξ的概率密度為f(x),則有F'(x)=f(x), 因此得f(x)=[(π+4arctanx)/4π]'=1/π(1+x2),-∞<x<+∞。
本例中學(xué)生犯的第一種錯誤解法如下:
解:(1)ξ落在區(qū)間(-1,1)內(nèi)的概率為P(-1<X<1)=P(-1X1)=(π+4arctanx)dx/4π=1。
犯該錯誤的原因是將分布函數(shù)的概念和概率密度函數(shù)的概念混淆,不理解它們的意義。教師在上課時應(yīng)強(qiáng)調(diào)分布函數(shù)指的是概率的分布,要從幾何上認(rèn)識分布函數(shù)和概率密度之間的關(guān)系,該關(guān)系表示如圖1,在圖1中橫軸表示自變量,縱軸表示概率密度f,陰影部分是分布函數(shù)F。同時教師還可以借助物理中線密度與線段質(zhì)量之間的關(guān)系來解釋概率密度與分布函數(shù)之間的關(guān)系,讓學(xué)生能夠更加形象的接受和理解這兩個概念。犯該錯誤的另外一個原因從學(xué)生無法接受離散型隨機(jī)變量的分布函數(shù)向連續(xù)型隨機(jī)變量的分布函數(shù)的過渡,離散型隨機(jī)變量分布函數(shù)F(x)在計算時就是把所有取值小于x的概率做累加,從累加過渡到積分學(xué)生好理解,但是為什么要對概率密度f取積分,學(xué)生卻不能接受,因為離散型隨機(jī)變量不取積分。教師在解釋這一問題時可以借助定積分的幾何意義是曲邊梯形的面積做類比,此處被積函數(shù)就是概率密度,對應(yīng)曲邊梯形面積就是分布函數(shù)。或者教師還可以將概率密度類比為加速度函數(shù),分布函數(shù)類比為速度函數(shù)來做解釋。
本例中學(xué)生的第二種解法如下:
解:(1)先求概率密度f(x),f(x)=F'(x)=[(π+4arctanx)/4π]'=1/π(1+x2),-∞<x<+∞。再利用概率密度和分布函數(shù)之間的關(guān)系得到ξ落在區(qū)間(-1,1)內(nèi)的概率為P(-1<X<1)=P(-1X1)==1/2。
此種解法并沒有錯,但是在學(xué)習(xí)了連續(xù)型隨機(jī)變量之后,學(xué)生往往會非常喜歡用概率密度的積分來計算概率,而淡忘了分布函數(shù)是用概率來定義的這一事實(shí),導(dǎo)致在解此題時多了一個求積分的過程,計算過程繁瑣,有畫蛇添足之感。
(四)兩個事件互斥與相互獨(dú)立混淆
事件的互斥與相互獨(dú)立是概率論中非常重要的兩個不同概念,分別定義如下[1]:
定義1[1] 若A∩B=?覬,則稱事件A與B是互斥的,或稱為互不相容的。
定義2[1] 如果兩個事件A與B滿足
P(AB)=P(A)P(B)? ?(2)
則稱事件A與B是相互獨(dú)立的。
例4 設(shè)A, B是兩個相互獨(dú)立的事件,已知P(A)=0.3, P(A∪B)=0.65,求P(B)。
解:因為A與B相互獨(dú)立,即P(AB)=P(A)P(B)。(3)
再根據(jù)概率的加法公式
P(A∪B)=P(A)+P(B)-P(AB)? ? ? ? ?(4)
將P(A)=0.3,P(A∪B)=0.65代入(3)和(4)式得P(B)=0.5。
本例中學(xué)生常犯的錯誤解法如下:
解:因為A與B相互獨(dú)立,所以A∩B=?覬,因此P(AB)=0。由概率的加法公式P(A∪B)= P(A)+P(B)-P(AB),將P(A)=0.3,P(A∪B)=0.65代入,得P(B)=0.35。
顯然,上述解法中學(xué)生將事件的相互獨(dú)立與互斥混淆。犯此錯誤的原因是學(xué)生沒有注意到相互獨(dú)立的概念是借助于事件的概率來定義的,而互斥的定義是針對事件本身來定義的,兩者有本質(zhì)區(qū)別。教師可通過舉例說明兩個事件互斥和相互獨(dú)立之間沒有必然的聯(lián)系,圖2可以是一個很好的例子。在圖2中,左圖中事件A,B分別對應(yīng)到集合A,B,表現(xiàn)為正方形的左下角和左上角部分,且A,B的概率都是1/2,且AB的概率為1/4,說明A,B相互獨(dú)立,顯然AB不等于空集,即A與B不互斥。在圖2的右圖中,事件A,B分別對應(yīng)到正方形的左下角和右上角,它們的概率都是1/2,因此根據(jù)定義2中的公式(2)可得A與B是相互獨(dú)立的,但AB等于空集,說明A與B不是互斥的。圖2的兩個例子說明:兩個事件互斥與相互獨(dú)立之間沒有必然的聯(lián)系,互斥的事件未必相互獨(dú)立,相互獨(dú)立的事件也未必互斥。
(五)樣本方差和樣本2階中心矩混淆
樣本方差和樣本2階中心矩是數(shù)理統(tǒng)計部分的重要概念,在參數(shù)估計中經(jīng)常用到,它們的具體定義為:設(shè)X1,X2,…,Xn是來自總體X的一個樣本,=(X1+X2+…+Xn)/n是樣本均值,則稱S2=∑(Xi-)2/(n-1)為樣本方差,B2=∑(Xi-)2/n為樣本2階中心矩。這兩個概念學(xué)生很容易混淆,因為只是分母是n-1和n的差別。教師在介紹這兩個概念時一定要聯(lián)系參數(shù)估計的內(nèi)容,樣本方差是總體X方差的無偏估計,因為樣本方差的期望正好等于總體X的方差,即E(S2)=D(X),這也是為什么S2取名為樣本“方差”的原因,但是E(B2)<D(X),并不是總體方差的無偏估計。通過這樣講解,大部分學(xué)生就能記住為什么S2的分母必須是n-1,并能理解它的意義,從而牢牢的記住該定義。
(六)常見記憶性錯誤
1. 方差性質(zhì)記憶錯誤
方差是概率論中最重要的概念之一,它是隨機(jī)變量的一個重要數(shù)字概念,反應(yīng)了隨機(jī)變量取值和均值之間的分散程度。在參數(shù)估計中,當(dāng)由兩個樣本得到的參數(shù)估計都是總體參數(shù)的無偏估計時,需要研究這兩個樣本估計的有效性,此時就需要計算這兩個樣本和均值之間的分散程度,也即比較兩個樣本的方差。因此,方差計算也是參數(shù)估計的一個重要方面。
但方差的計算公式為DX=EX2-[EX]2,不具有線性性,學(xué)生經(jīng)常犯的錯誤是將D(CX)=C2DX記為D(CX)=CDX。為防范這一錯誤的發(fā)生,教師可以在介紹該性質(zhì)時對它加以證明,同時要反復(fù)強(qiáng)調(diào)方差不具有線性性,這是因為方差的計算公式中含有平方項。
針對兩個獨(dú)立的隨機(jī)變量,兩個隨機(jī)變量差的方差是D(X-Y)=D(X)+D(Y),學(xué)生經(jīng)常記成D(X-Y)=D(X)-D(Y)。犯該錯誤的原因有兩個:一是學(xué)生想當(dāng)然的認(rèn)為方差和期望一樣具有線性性,二是學(xué)生沒有明白產(chǎn)生上述相互獨(dú)立隨機(jī)變量方差計算公式的原因。針對一般的隨機(jī)變量:D(X±Y)=D(X)+D(Y)±2E{[X-EX][Y-EY]},當(dāng)X與Y相互獨(dú)立時,上式右邊第三項為0,因此D(X±Y)=D(X)+D(Y)。如果學(xué)生能自如的推導(dǎo)上述公式,那么兩個相互獨(dú)立隨機(jī)變量差的方差公式一般都不會弄錯。
和方差相關(guān)的第三個常見錯誤是認(rèn)為D(C)=C,即認(rèn)為常數(shù)的方差是常數(shù)。犯此錯誤是由于在期望的性質(zhì)中有一條是E(C)=C,學(xué)生將該性質(zhì)照搬到方差上來。教師在教學(xué)中應(yīng)向?qū)W生強(qiáng)調(diào)方差反應(yīng)的是隨機(jī)變量取值和均值之間的偏離程度,如果一個隨機(jī)變量取值恒等于常數(shù),那么該隨機(jī)變量的均值也為該常數(shù),因此沒有偏離,故方差為0。
2. 正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布
正態(tài)分布是一類非常重要的分布,根據(jù)大數(shù)定律和中心極限定理,正態(tài)分布是n個隨機(jī)變量算術(shù)均值的極限分布:棣莫弗-拉普拉斯定理說明正態(tài)分布是二項分布的極限分布;獨(dú)立同分布中心極限定理說明具有相同分布的隨機(jī)變量的極限分布是正態(tài)分布[1-3],因此正態(tài)分布在概率統(tǒng)計中起著舉足輕重的作用。從而,和正態(tài)分布相關(guān)的概率計算問題是概率統(tǒng)計中經(jīng)常面臨的問題。但是,我們知道正態(tài)分布的概率密度函數(shù)的積分不是初等函數(shù),因此如果想利用概率密度的積分求概率是不可能完成的。現(xiàn)在課堂常用的做法是將正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,并通過查表來計算。例如,X是服從N(μ,σ2)的正態(tài)分布,可通過(X-μ)/σ服從標(biāo)準(zhǔn)正態(tài)分布來計算概率。但學(xué)生常犯的錯誤是認(rèn)為(X-μ)/σ2服從標(biāo)準(zhǔn)正態(tài)分布,從而得到了錯誤的結(jié)果,這是因為在正態(tài)分布的數(shù)學(xué)符號中參數(shù)為σ2,學(xué)生直接將其代入。
二、結(jié)束語
結(jié)合自己的教學(xué)經(jīng)驗,本文總結(jié)和分析了學(xué)生在學(xué)習(xí)公共概率論與數(shù)理統(tǒng)計課程過程中經(jīng)常犯的錯誤,主要包括容易混淆的概念和常見記憶錯誤。我們通過例子對概念理解中容易犯的錯誤進(jìn)行陳述,指出常見的記憶錯誤,并針對每個錯誤分析了其中的原因,提出教師在教學(xué)中需要注意的細(xì)節(jié),以及為防范學(xué)生再犯此類錯誤教師在教學(xué)上需要做出的改進(jìn)措施。本文的觀點(diǎn)有望給概率和數(shù)理統(tǒng)計初學(xué)者和高校概率論與數(shù)理統(tǒng)計課程教學(xué)者提供借鑒和參考。
參考文獻(xiàn):
[1]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計第四版[M].北京:高等教育出版社,2008.
[2]上海交通大學(xué)數(shù)學(xué)系.概率論與數(shù)理統(tǒng)計第二版[M].北京:科學(xué)出版社,2007.
[3]朱翼雋.概率論與數(shù)理統(tǒng)計第二版[M].江蘇大學(xué)出版社,2015.
[4]胡嬌鈴.工學(xué)結(jié)合背景下《概率論與數(shù)理統(tǒng)計》教材改革與數(shù)學(xué)模型思想的應(yīng)用[J].高教學(xué)刊.2019(10):119-121.
[5]溫上偉.五年制師范生對概率統(tǒng)計知識理解現(xiàn)狀的調(diào)查研究[D].贛南師范學(xué)院,2015.
[6]馬健.大學(xué)概率統(tǒng)計教學(xué)的新問題及課程內(nèi)容改革[J].長沙大學(xué)學(xué)報,2016(5):114-117.