肖進勝 楊力衡 丁玲 張海劍



摘? 要:假設檢驗是現代概率論與數理統計教學中的重要內容和知識點,而假設檢驗包含建立原假設、構造統計量、計算概率分布、確定臨界值和得出結論等過程。在教學過程中,很多教師都忽視建立原假設這個方面。由于沒有強調原假設設計方法,學生碰到此類問題很容易產生疑惑出錯。實際上,原假設的三個選擇是不可以隨意互換的,需要通過閱讀問題,依據“小概率事件原理”來選擇合適的假設。通過對假設檢驗中單邊檢驗真題案例的教學探討和分析,完成對原假設存在的三個選擇的不同分析,然后對得到的結果進行比較。分析探討在假設檢驗教學中做原假設和備擇假設設計時,需要結合題目要求,按照“小概率事件原理”來設計假設的方案,促進學生對此問題的理解,并且在實際教學應用中取得良好的效果。
關鍵詞:假設檢驗;原假設;備擇假設;數理統計;假設方案
中圖分類號:G642? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2024)08-0117-04
Abstract: Hypothesis testing is an important content and knowledge point in the teaching of probability theory and mathematical statistics, while hypothesis testing includes the null hypothesis, the design and selection of alternative hypotheses. In the teaching process, many teachers have neglected this aspect in teaching. Since there is no emphasis on these choice, students often have doubts when they encounter such problems. In fact, the three choices of the null hypothesis are not freely interchangeable. It is necessary to read the topic and select the appropriate hypothesis based on the principle of small probability events. Through the discussion and analysis of the unilateral test case in the hypothesis test, the different analysis of the three choices of the null hypothesis is completed, and then the obtained results are compared to verify the hypothesis and alternative hypothesis in the hypothesis test. When designing, it is necessary to combine the requirements of the topic and design the hypothetical solution according to the principle of "small probability event", and achieve good results in practical teaching applications.
Keywords: hypothesis test; null hypothesis; alternative hypothesis; mathematical statistics; hypothesis method
隨著社會的發展進步,教育理念、教育方法和培養模式的不斷改進[1-2],新的教學模式與實踐方案,需要與培養“具有國際視野的拔尖創新人才”的指導思想相結合[3],同時探索其他教學評價模式[4],并及時應用于高校的日常教學工作中,以提高高等院校的教學效率和教學質量[5]。概率論與數理統計課程是面向電子信息類學科專業開設的基礎課程,同時也是電子與計算機專業等信息領域學科的專業基礎課程,與語音處理、圖像處理、機器學習及計算機視覺等專業核心課程有著密切的聯系,是其先導課程。在現代概率論與數理統計的課程教學中,參數的假設檢驗是概率論與數理統計中的重要內容。對于同一個假設檢驗問題,選擇兩個不同的原假設進行檢驗時,可能會得出自相矛盾的兩個結論。選擇單邊和雙邊檢驗有時也會得出自相矛盾的結論[6]。在岑成德[7]的《假設檢驗中的難點問題的教學方法》一文中,討論了對單邊假設檢驗的原假設選擇問題。同樣,在衛海英[8]的《對假設檢驗方法應用的思考》一文中也表達了在假設檢驗實際應用中應該注意正確建立零假設和對立假設。在對實際問題做假設檢驗時,什么作為原假設,什么作為備擇假設應由問題本身確定,而不是檢測者的態度或希望[9]。作者認為假設檢驗主要依據的理論是“小概率事件原理”,教學中以相應的“小概率事件”發生的區域作為拒絕域來判斷是否拒絕或接受該假設,就能很好地促進學生對此問題的理解,提高學習的效率和效果。
一? 假設檢驗問題的分析方法研究
在常規的概率論與數理統計教學過程中,對于假設檢驗問題的教學重點在于根據已有數據和參數,如何進行檢驗統計量的選取和統計參數計算方面,套用相關的假設檢驗公式。忽略了原假設設計,即備擇假設的選取問題。而實際教學中發現,假設檢驗中存在一些具體的應用問題,對待檢驗的問題有著不同的文字描述,如“大于”“小于”“不大于”“變多”“變少”“合格”等。而這些不同的文字描述和復雜多樣的應用問題在一起,很容易讓學生產生混淆,并出錯。
假設檢驗問題是不同于參數估計的另一類重要的統計推斷問題。假設檢驗就是根據總體X的信息,檢驗關于總體的某個假設是否正確,決定接受原假設拒絕備擇假設或者拒絕原假設接受備擇假設。原假設就是本身根據問題假設出來的驗證的主體,備擇假設與原假設相反并且和原假設共同構成一個完備事件。
在顯著性水平α條件下,檢驗假設H0:μ=μ0?H1:μ≠μ0中的備擇假設H1表示μ可能大于μ0,也可能小于μ0,稱為雙邊備擇假設,這樣的假設檢驗稱為雙邊假設檢驗。相對的單邊檢驗分為兩種,一種是右邊檢驗形如H0:μ≤μ0?H1:μ>μ0;一種是左邊檢驗形如H0:μ≥μ0?H1:μ<μ0。假設檢驗問題的本質是運用小概率反證法思想。小概率思想是指概率很小P<α(α=0.01或α=0.05等)的事件,在一次試驗中基本上不會發生,也稱為小概率事件原理。這里備擇假設是屬于顯著性水平α下的一個小概率事件。
假設檢驗中,針對需要判斷的問題,進行準確的原假設提出是一個很關鍵的問題。在實際教學應用中,很多學生都很難理解或者只能死記相關的規則,很容易出錯和弄混淆。實際上,我們分析理解了假設檢驗問題的本質,就能很準確地定位假設檢驗問題,進行準確合適的原假設。根據小概率事件原理,概率很小的事件在一次實驗中是幾乎不會發生的,因此我們重點關注“小概率”的地方[10]。可以從如下兩點進行分析。
第一,小概率事件原理中的“小概率”究竟有多小呢?這要根據假設檢驗結論的重要程度和其在實際問題中可能造成結果的嚴重程度來決定。
第二,把其稱作“小概率事件原理”,是因為“概率很小的事件在一次實驗中是幾乎不會發生的”,并沒有說其“絕對不會發生”。
假設檢驗的思想是先提出原假設H0,假設合理的依據就是備擇假設必須是屬于不常發生的“小概率事件”,再用適當的檢驗統計量,通過對統計量的計算和判斷來確定假設成立的可能性大小,通過概率是否落入備擇假設區間來判斷假設是否成立。
通過采用以上方法來分析假設檢驗中的問題,可以排除具體假設檢驗應用問題中各種文字描述的干擾,堅持“小概率事件”的判斷原則,實現準確的原假設和備擇假設的設計,順利地解決假設檢驗問題。
二? 假設檢驗中假設問題的教學設計
在教學設計過程中,為了增強學生對于假設檢驗問題本質是“小概率原理”的認識,除了在講授時重點強調假設檢驗原理和公式,以及常規的解題思路之外。可以設計一些反例或看似矛盾的實例,利用實例來增強學生對該問題的關注度,提升對該問題的理解[11]。下面通過一個具體問題來說明假設檢驗中原假設設計的教學過程。可以先提出如下一個常見的例子。
一位大學校長在網上看到這樣的報道:“這一城市的大學生平均每周玩8小時手機游戲”。他認為他所在的學校,大學生玩手機游戲的時間明顯小于該數字。為此他隨機向他所在學校的30個大學生作了調查,得知平均每周玩手機游戲的時間為7小時,樣本標準差為3小時。問是否可以認為這位校長的看法是對的?設顯著性水平0.01,大學生玩手機游戲的時間服從正態分布。
首先,引導學生進行分析,這個問題其實不難。根據上面問題的描述先得到一些必須的數值:μ0=8,n=30,X=7,S=3,α=0.01.已知大學生每周玩手機游戲的時間服從正態分布,X~N(μ,σ2),對于這類單邊假設檢驗問題,能獲得的原假設只有兩種情況μ≤μ0或μ≥μ0(需要明確的一點,等號必須包含在原假設中)。通過兩種假設設計來分析這個問題的本質。
第一種情況:直接把校長的看法作為假設(這是很多人很容易想到的方法),假設大學生平均每周玩手機游戲的時間明顯小于8小時,可以作如下假設
H0:μ≤μ0=8?H1:μ>μ0。(1)
這里方差σ2未知,需做T檢驗,所以取檢驗統計量
T=~t(n-1)。(2)
在顯著性水平α=0.01的情況下,拒絕域(圖1右邊陰影部分)為
C={T≥tα(n-1)=t0.01(29)≈2.46} 。 (3)
而實際計算統計量T的觀測值可得
T=≈-1.82 。 (4)
顯然T 第二種情況:我們可以反過來,假設大學生平均每周玩手機的時間不明顯小于8小時,所以有 H0:μ≥μ0=8?H1:μ<μ0 。 (5) 可以計算得拒絕域(圖1左邊陰影部分)為 C={T≤-tα(n-1)=-t0.01(29)≈-2.46} 。 (6) 同樣,可以計算出統計量T的觀測值為T≈-1.826,所以T>-tα(n-1),沒有落入拒絕域,不拒絕原假設,即玩手機的時間不小于8小時。 其次,針對兩種不同的假設設計做法,引導學生發現和分析問題。兩種假設的過程都是正確的,但是相反的假設卻都得到了不拒絕原假設的結論。顯然這兩個結果是相互矛盾的,事出反常必有因。提醒并引導學生思考,到底哪個假設是正確的呢?到底校長的看法是對是錯?通過這個例子,通過一系列反問,能激起學生的興趣和求知欲。 然后,引導學生回到假設檢驗問題的本質“小概率事件”。告訴學生假設檢驗的關鍵是尋找問題中的“小概率事件”,明確拒絕域為“小概率事件”。因此,拒絕域應該處在正態分布的兩端區域(如圖1的陰影部分),不包括正態分布的中心區域。根據假設檢驗的定義,強調原假設中的等號成立對應于正態分布圖中的中間峰值(如圖1的中間非陰影部分),是“較大概率”,必須包含在原假設中。仔細觀察圖1的正態分布圖,考慮拒絕域的分布區域,通過“小概率”的區域,來仔細分析原假設的設計問題。其拒絕區域如圖1所示。 上面第一種情況計算的拒絕域是T≥t0.01(29)≈2.46,即圖1中右邊的陰影區域。第二種情況計算的拒絕域是T≤-2.46,即圖1中左邊的陰影區域。兩個陰影部分都是處于正態分布的兩端,都是正態分布概率取值比較小的地方,對應小概率事件,因此都沒有問題。但是實際計算出來的觀測值T≈-1.826落在了中間區域,所以兩個不同的假設才都會得到不拒絕原假設的結論。這又是什么原因呢? 再后,進一步引導學生對假設檢驗問題的本質進行思考和分析。將假設檢驗待檢驗的問題假設和小概率事件合理關聯起來,仔細分析假設檢驗的問題。這里校長的看法是“大學生玩手機游戲的時間明顯小于該數字”。注意到“明顯小于(或小于)”是不同于“不大于”的。“明顯小于(或小于)”對應于圖1中正態分布左邊的陰影部分,即μ<μ0,不包含“等于”,可以看成是小概率事件,只能作備擇假設(拒絕域)。其對立面為“不小于”,即μ≥μ0,包含等于部分,可以作為原假設。相反,“不大于”是“小于或等于”,即μ≤μ0,這里包含“等于”的,就包含圖1中正態分布中間的部分,屬于概率比較大的部分,只能作為原假設,其對應的小概率事件及備擇假設是“大于”,和這個問題中校長考慮的方向并不一致。 最后,根據分析得到結論:第二種方法的假設(μ≥μ0)是對的,結論是“玩手機的時間不小于8小時”。也就是說,雖然統計得到的時間7小時小于8小時,但是還不足以小到在0.01的顯著性水平下,落于圖1左邊的陰影區域(拒絕域)。沒有明顯小于8小時,就是小的程度還不夠,沒有小到“小概率事件”發生。小概率事件沒有發生,即得到校長的看法(假設)是錯的。同時第一種方法的假設(μ≤μ0)是錯誤的,和校長本意(小于,或明顯小于)不符。第一種方法的假設(μ≤μ0)是“小于或等于”。其備擇假設或拒絕域對應的是大于(μ>μ0)。第一種方法的假設,只能判斷“大于”(落于拒絕域)或“不大于”(沒有落于拒絕域)。第一種方法的假設并不能判斷“小于”成立。 因此,假設檢驗拒絕域的設計和判斷的根本是“小概率”事件。假設檢驗中原假設的設計,需要把拒絕域與小概率有機地對應起來,同時考慮具體應用問題的描述,進行合理設置。 為了加深同學對這類問題的印象,我們還可以把問題稍微改一下。其他的條件和參數都不變,只是調查30個學生平均每周玩手機游戲的時間為6.5小時。問是否可以認為這位校長的看法是對的?具體結果和分析可以讓學生自己思考以加深對該問題的理解和判斷。 從這個假設檢驗問題的兩種原假設的分析來看,對于單變量的假設檢驗的原假設形式有三種。但是對于相應的假設檢驗問題分析來說,三種假設是不能隨意設計的。需要引導同學了解在單邊檢驗建立原假設和備擇假設的時候要注意假設檢驗問題的要求。在假設檢驗問題分析過程中需要注意一個原則,就是“小概率事件”原理,在設計假設檢驗的時候將小概率事件的發生設置在拒絕域。 大于,多于或高于等代表“>”,不大于,不多于或不高于等代表“≤”。 小于,少于或低于等代表“<”,不大于,不多于或不高于等代表“≥”。 在分析假設檢驗應用問題時,需要根據具體問題分析,設計正確的假設。備擇假設及拒絕域是“小概率事件”,因此,拒絕域是正態分布的兩端區域,而不是包括正態分布的中心區域。這里有等號的一邊是大概率事件,放在原假設中,其他的是小概率事件,而假設檢驗就是利用“小概率事件”來拒絕原假設。 通過把以上實際生活中類似的假設檢驗例子,巧妙地設計和融合到教學過程中,可以引導學生對這類問題的思考和問題本質的理解。利用看似矛盾的兩種分析方法,引起學生的注意和興趣,引導學生積極思考,積極討論,最終理解問題,得到問題的深入分析和徹底理解。這類方法通過多年的教學實踐,取得了明顯的效果。學生對這類問題的理解和分析效果有了明顯提升。 三? 結束語 概率論與數理統計課程是面向電子信息類學科專業開設的基礎課程,也是語音處理、圖像處理、機器學習及計算機視覺等專業核心課程的先導課程。本文以現代概率論與數理統計課程為研究對象,通過探索“假設檢驗”原理新的教學方法,改變以往的傳統教學思路,引導學生采用新的思維方式來分析問題、解決問題。總的來說,對于假設檢驗中單邊檢驗的原假設和備擇假設的設計,應該根據問題的要求,引導學生思考如何依據“小概率事件原理”來設置假設,促進學生對問題本質的理解。在假設檢驗問題的求解過程中也要指導學生,不要盲目帶入公式,而是要注重理論和題目應用的結合,加強個人對問題的思考。同時本文也通過對問題的分析,讓學生學習和理解了關于假設的設計方法,其是可以應用于雙邊檢驗和兩個正態總體假設檢驗問題的。通過以上分析問題和解決問題的思路引導,為學生進一步學習和應用專業知識打下良好的思維基礎;此外,也通過新方法新思維的引入,進一步提高了教師的教學和科研能力,在課程教學改革方向激發更多的新思潮。在后續的教學和教研工作中,將會利用計算機網絡、信息技術和多媒體技術,創建該課程的教學網站,發布更多的教學資源,增加教學和學習的互動功能,打造成符合現代教學方式和多模態學習方式的精品教學網站。 參考文獻: [1] 伍春香,王麗娜,杜瑞穎,等.基礎學科拔尖人才培養模式探索與實踐[J].計算機教育,2018(7):135-138. [2] 劉丹.計算機專業本科生創新能力培養模式研究[J].計算機教育,2019(3):62-65. [3] 劉樹波,王麗娜,伍春香,等.計算機學科拔尖創新人才國際視野培養[J].計算機教育,2018(3):120-123. [4] 肖進勝,蔡紅濤,許賢澤,等.案例驅動的工程隨機數學課程教學探索[J].軟件,2017(12):1-4. [5] 羅羨華.關于隨機事件獨立性的教學探討[J].教育教學論壇,2017(14):85-87. [6] 郭寶才,孫利榮.關于假設檢驗中的幾個問題的探討[J].統計與決策,2010(6):10-11. [7] 岑成德.假設檢驗中的難點問題的教學方法[J].課程教育研究,2014(13):209. [8] 衛海英.對假設檢驗方法應用的思考[J].北京統計,2001(6):34-35. [9] 郭建新,許軍保.假設檢驗教學中一個問題的探討[J].蘭州交通大學學報,2015,34(2):131-133. [10] 許賢澤,肖進勝,張燕革,等.工程隨機數學基礎[M].武漢:武漢大學出版社,2018:8. [11] 張海劍,夏桂松,余磊,等.面向人工智能的數字信號處理課程案例設計[J].高教學刊,2022,8(28):86-89. 基金項目:教育部第二批產學合作協同育人項目“面向人工智能的電子信息類嵌入式系統課程改革”(202102001026);湖北省教育廳科學研究計劃項目“惡劣天氣條件下智能駕駛視覺感知增強技術研究”(B2021261);武漢大學本科教育質量建設綜合改革項目“學風傳承特色的嵌入式系統設計課程思政案例建設”(202205601) 第一作者簡介:肖進勝(1975-),男,漢族,湖北武漢人,博士,副教授,CCF高級會員。研究方向為計算機視覺,圖像處理與分析。 *通信作者:丁玲(1979-),男,漢族,湖北咸寧人,博士,副教授。研究方向為人工智能,計算機視覺,圖像處理與分析。