摘"要:"假設(shè)檢驗(yàn)在統(tǒng)計(jì)推斷中有著重要的地位,但許多學(xué)生很難理解該知識(shí)點(diǎn),特別是原假設(shè)的建立。當(dāng)檢驗(yàn)統(tǒng)計(jì)量落在區(qū)間時(shí),選擇兩個(gè)不同的原假設(shè)進(jìn)行檢驗(yàn),會(huì)得出自相矛盾的結(jié)論。本文基于小概率事件原理和假設(shè)檢驗(yàn)的目的,進(jìn)行了教學(xué)探討,指出把人們普遍認(rèn)為的觀點(diǎn)、原有的觀點(diǎn)、權(quán)威資料記錄的情況作為原假設(shè),與普遍認(rèn)為的觀點(diǎn)不同、信息不匹配的情況作為備擇假設(shè)。同時(shí)結(jié)合具體案例,運(yùn)用R語言產(chǎn)生已知分布的隨機(jī)數(shù)進(jìn)行驗(yàn)證,結(jié)果表明這種原假設(shè)建立方法是正確的。
關(guān)鍵詞:"假設(shè)檢驗(yàn);小概率事件;原假設(shè);隨機(jī)模擬
2023年教育部等五部門印發(fā)了《普通高等教育學(xué)科專業(yè)設(shè)置調(diào)整優(yōu)化改革方案》的通知,提出了“四新”學(xué)科建設(shè),加強(qiáng)基礎(chǔ)學(xué)科專業(yè)建設(shè),建強(qiáng)數(shù)理化生等基礎(chǔ)理科學(xué)科專業(yè)[1]。概率論與數(shù)理統(tǒng)計(jì)作為高校理工科專業(yè)一門重要的數(shù)學(xué)類基礎(chǔ)必修課程,在處理實(shí)際問題中有著廣泛的應(yīng)用,也是同學(xué)們后續(xù)專業(yè)課學(xué)習(xí)的基礎(chǔ)課程,具有重要的作用。假設(shè)檢驗(yàn)是概率論與數(shù)理統(tǒng)計(jì)的核心內(nèi)容,是根據(jù)樣本對(duì)總體情況進(jìn)行統(tǒng)計(jì)推斷的有效統(tǒng)計(jì)工具。但在授課過程中發(fā)現(xiàn)許多同學(xué)對(duì)假設(shè)檢驗(yàn)無法深入掌握,流于表面,只是按照書本上的步驟進(jìn)行分析。在傳統(tǒng)的教學(xué)模式中,教師是直接傳授假設(shè)檢驗(yàn)的理論知識(shí)、解題步驟和幾道習(xí)題,但由于假設(shè)檢驗(yàn)這部分概念多,理論性強(qiáng),比較抽象,這樣的傳授模式比較枯燥,教學(xué)效果比較差,學(xué)生們往往無法深入理解假設(shè)檢驗(yàn),無法體會(huì)其核心內(nèi)容,只會(huì)生搬硬套。特別是在進(jìn)行單邊假設(shè)檢驗(yàn)時(shí),原假設(shè)和備擇假設(shè)的建立問題,大部分同學(xué)都是根據(jù)題目的提問來建立的,但在處理實(shí)際問題時(shí),沒有預(yù)定的提問,又該如何建立原假設(shè)和備擇假設(shè)呢?顯然同學(xué)們這樣建立原假設(shè)和備擇假設(shè)的方法不合適。
對(duì)于該問題,已有多位學(xué)者進(jìn)行了探討。2005年韓兆洲等[2]在《假設(shè)檢驗(yàn)的一個(gè)常見誤區(qū)》中提出假設(shè)的原則應(yīng)該是把希望驗(yàn)證得到的結(jié)論放在備擇假設(shè)的位置上;2006年張凌翔[3]在《對(duì)假設(shè)檢驗(yàn)中幾個(gè)問題的思考》中指出原假設(shè)和備擇假設(shè)的地位是不對(duì)等的,原假設(shè)始終是受到質(zhì)疑的,同時(shí)也是受到保護(hù)的,只有找到足夠充分的證據(jù)才可以推翻它,而備擇假設(shè)才是研究者真正想得到的結(jié)論;2010年詹曉琳[4]在《顯著性假設(shè)檢驗(yàn)中原假設(shè)的建立》中提出根據(jù)研究問題的目的,將需要被保護(hù)的結(jié)論作為原假設(shè)的“保護(hù)原則”和把希望否定的作為原假設(shè)的“拒絕原則”;2015年郭建新等[5]在《假設(shè)檢驗(yàn)教學(xué)中一個(gè)問題的探討》中指出在有實(shí)際意義的檢測(cè)中,原假設(shè)與備擇假設(shè)的選取,與檢測(cè)者的態(tài)度或希望無關(guān),具有一定客觀性,一般它們不能互換;2024年肖進(jìn)勝等[6]在《現(xiàn)代數(shù)理統(tǒng)計(jì)中假設(shè)檢驗(yàn)的教學(xué)探討》中提出需要結(jié)合題目要求,按照“小概率事件原理”來設(shè)計(jì)假設(shè)的方案。
本文從假設(shè)檢驗(yàn)的核心思想和檢驗(yàn)?zāi)康慕嵌瘸霭l(fā),給出建立原假設(shè)和備擇假設(shè)的教學(xué)新思路,并以具體例子和用隨機(jī)模擬方法進(jìn)行驗(yàn)證,更加直觀。
假設(shè)檢驗(yàn)方法[7]是在總體的分布已知、參數(shù)不確定時(shí),通過事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷原假設(shè)是否成立,采用邏輯上的反證法,依據(jù)統(tǒng)計(jì)上的小概率原理進(jìn)行判斷,具體可以分為參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn),在概率論與數(shù)理統(tǒng)計(jì)中講述的是參數(shù)假設(shè)檢驗(yàn)。總的來說,假設(shè)檢驗(yàn)的核心思想是小概率事件原理。
假設(shè)檢驗(yàn)方法起源于“女士品茶”的典故[8],該典故最早出現(xiàn)在統(tǒng)計(jì)學(xué)家Fisher的著作《thenbsp;design"of"experiment》中,講述的是在英國(guó)的一個(gè)下午,一群學(xué)者在一塊喝下午茶,其中一位女士說她具有一種鑒別奶茶配置方法的特別能力,是先倒奶再倒茶,還是先倒茶再倒奶,對(duì)此人們認(rèn)為女士在胡言亂語,其中一位學(xué)者提出我們可以來進(jìn)行試驗(yàn),讓這位女士品嘗10杯已經(jīng)調(diào)制過的奶茶,通過女士回答的正確率來判別她是否具有這種特殊能力。當(dāng)這位女士不具有這種特殊能力,完全靠猜的話,一杯奶茶猜對(duì)的概率是0.5,2杯就是0.25,那么10杯都猜對(duì)的概率就是,概率非常小。在人們普遍的觀念——女士不具有判別奶茶配方能力的假設(shè)條件下,女士連續(xù)10杯說對(duì)奶茶配方的概率很小,是一個(gè)小概率事件,在一次試驗(yàn)中小概率事件幾乎不可能發(fā)生,現(xiàn)在小概率事件發(fā)生了,產(chǎn)生矛盾了,所以反推出“原先的假設(shè)——女士不具有這種特殊能力”不成立。這個(gè)分析的過程就是假設(shè)檢驗(yàn)的過程,其基本思想是在一次隨機(jī)試驗(yàn)中小概率事件幾乎不能發(fā)生,如果發(fā)生,則拒絕原假設(shè)。
在現(xiàn)實(shí)問題中,人們進(jìn)行假設(shè)檢驗(yàn)的目的是當(dāng)所收集到的樣本數(shù)據(jù)信息和原有的資料信息存在差異時(shí),希望通過假設(shè)檢驗(yàn)方法判別這種差異是隨機(jī)誤差還是系統(tǒng)誤差。
2"原假設(shè)和備擇假設(shè)的建立
在進(jìn)行均值的單邊假設(shè)檢驗(yàn)時(shí),當(dāng)檢驗(yàn)統(tǒng)計(jì)量落在區(qū)間,在原假設(shè),備擇假設(shè)下,檢驗(yàn)統(tǒng)計(jì)量未落在拒絕域,無法拒絕原假設(shè),認(rèn)為;但在原假設(shè),備擇假設(shè)下,檢驗(yàn)統(tǒng)計(jì)
量未落在拒絕域,同樣無法拒絕原假設(shè),認(rèn)為",如下圖。同樣的數(shù)據(jù),在不同的原假設(shè)條件下,檢驗(yàn)結(jié)果截然不同,其原因在于原假設(shè)的建立不合理,因此建立一個(gè)正確的原假設(shè)對(duì)現(xiàn)實(shí)問題的統(tǒng)計(jì)推斷至關(guān)重要。
分析可知,在進(jìn)行具體問題處理時(shí),所收集到的樣本數(shù)據(jù)和原有的資料信息匹配情況無非兩種:相同和不同。相同時(shí),顯然無需檢驗(yàn);不同時(shí),假設(shè)的建立有兩個(gè)方案,方案一(原有的資料信息作為原假設(shè)、樣本數(shù)據(jù)情況作為備擇假設(shè))和方案二(樣本數(shù)據(jù)情況作為原假設(shè)、原有的資料信息作為備擇假設(shè))。第二個(gè)方案中,在樣本數(shù)據(jù)情況作為原假設(shè)的條件下,產(chǎn)生該類樣本數(shù)據(jù)是必然的,顯然第二個(gè)設(shè)計(jì)方案不合理。
因此,基于小概率事件原理和假設(shè)檢驗(yàn)的目的,在講授建立原假設(shè)和備擇假設(shè)的知識(shí)時(shí),應(yīng)該跟學(xué)生指出把人們普遍認(rèn)為的觀點(diǎn)、原有的觀點(diǎn)、權(quán)威資料記錄的情況作為原假設(shè)[7],比如說“女士品茶”的典故中把人們普遍的觀
念——女士不具有判別奶茶配方能力作為原假設(shè);出現(xiàn)與人們普遍認(rèn)為的觀點(diǎn)不同、信息不匹配的情況作為備擇假設(shè),比如說這位女士說對(duì)奶茶配方,具有判別奶茶配方的能力。在原假設(shè)條件下,產(chǎn)生該樣本數(shù)據(jù)的概率很小,是小概率事件,在一次試驗(yàn)中幾乎不可能發(fā)生,但現(xiàn)在發(fā)生了,出現(xiàn)了矛盾,則有理由說明原有的假設(shè)是不成立的,所收集到的樣本數(shù)據(jù)信息和原有的資料信息存在的差異是系統(tǒng)誤差。由于在相同的備擇假設(shè)下,原假設(shè)是簡(jiǎn)單原假設(shè)還是復(fù)雜原假設(shè),最后的結(jié)論一樣,故權(quán)威資料記錄的情況時(shí),原假設(shè)統(tǒng)一用簡(jiǎn)單原假設(shè)[8]。不同樣本數(shù)據(jù)情況下,假設(shè)的建立情況如下表:
3"案例分析
下面運(yùn)用上文的假設(shè)的建立方案一進(jìn)行案例分析。
案例:根據(jù)以往數(shù)據(jù)可知某年級(jí)學(xué)生的成績(jī)服從正態(tài)分布,在某次數(shù)學(xué)統(tǒng)考中,隨機(jī)抽取了36位考生的成績(jī),
算得平均成績(jī)?yōu)?66.5。問在顯著性水平0.05條件下,是否可以認(rèn)為這次考試全體學(xué)生平均水平下降?
分析:簡(jiǎn)單隨機(jī)抽取的樣本均值為66.5,與以往數(shù)據(jù)的均值70存在差異,要討論的就是這種差距是隨機(jī)誤差還是系統(tǒng)誤差。上文所述的假設(shè)的建立方案一,進(jìn)行假設(shè)檢驗(yàn)。由于在相同的備擇假設(shè)下,原假設(shè)是簡(jiǎn)單原假設(shè)還是復(fù)雜原假設(shè),最后的結(jié)論一樣,故這里統(tǒng)一用簡(jiǎn)單原假設(shè)[8]。
4"隨機(jī)模擬驗(yàn)證
隨機(jī)模擬方法又稱蒙特卡洛方法,它的基本思想是先建立一個(gè)概率模型,然后對(duì)該模型進(jìn)行隨機(jī)抽樣,并計(jì)算所求參數(shù)的統(tǒng)計(jì)特征,最后給出所求解的近似值。隨機(jī)模擬方法是基于概率論理論的數(shù)值方法,與數(shù)學(xué)中確定的數(shù)值方法有所不同,通過從已知總體中隨機(jī)抽取一部分樣本來進(jìn)行統(tǒng)計(jì)分析[9]。
本文將隨機(jī)模擬方法和假設(shè)檢驗(yàn)方法相結(jié)合,通過產(chǎn)生已知分布的偽隨機(jī)數(shù),進(jìn)行假設(shè)檢驗(yàn),使得整個(gè)統(tǒng)計(jì)推斷過程可視化,直觀地給學(xué)生展示了假設(shè)檢驗(yàn)的整個(gè)過程,有利于學(xué)生掌握假設(shè)檢驗(yàn)的理論知識(shí)。又因?yàn)镽語言是開源的統(tǒng)計(jì)軟件,操作簡(jiǎn)單,所以下面用R軟件產(chǎn)生分布已知的偽隨機(jī)數(shù)[10-11],對(duì)本文的原假設(shè)的設(shè)計(jì)方案一進(jìn)行驗(yàn)證,這里引用茆詩(shī)松《概率論與數(shù)理統(tǒng)計(jì)》教材中的案例作為背景。
案例:某廠生產(chǎn)的合金強(qiáng)度服從正態(tài)分布,其中的設(shè)計(jì)值為不低于110(Pa)。為保證質(zhì)量,現(xiàn)對(duì)該廠某天的生產(chǎn)情況做檢查,以判斷生產(chǎn)是否正常進(jìn)行,即該合金的平均強(qiáng)度不低于110(Pa)"。
驗(yàn)證過程:設(shè)定隨機(jī)種子為44,用R軟件隨機(jī)生成10個(gè)服從正態(tài)分布的偽隨機(jī)數(shù),其檢驗(yàn)統(tǒng)計(jì)量落在模糊區(qū)間上,下面用本文的假設(shè)設(shè)計(jì)方案一進(jìn)行假設(shè)檢驗(yàn),驗(yàn)證其準(zhǔn)確性。
計(jì)算可知這10個(gè)隨機(jī)數(shù)的平均數(shù)為108.4677,小于值110.5,與原有的資料信息(的設(shè)計(jì)值為不低于110)不同,需要進(jìn)行假設(shè)檢驗(yàn)。原假設(shè)為原有的資料信息(不低于110),備擇假設(shè)H1為樣本數(shù)據(jù)情況(小于110)。檢驗(yàn)統(tǒng)計(jì)量,未落在拒絕域里面,無法拒絕原假設(shè),即認(rèn)為該日合金強(qiáng)度θ不低于110,樣本數(shù)據(jù)小于110屬于隨機(jī)誤差。檢驗(yàn)結(jié)果和偽隨機(jī)數(shù)服從的正態(tài)分布事實(shí)一致,因此驗(yàn)證了本文提出的原假設(shè)和備擇假設(shè)設(shè)計(jì)方案一的正確性。
5"結(jié)論
傳統(tǒng)教學(xué)中,教師往往忽略原假設(shè)的建立原則,從而造成學(xué)生在建立原假設(shè)問題上沒有一個(gè)清晰的標(biāo)準(zhǔn),很容易疑惑出錯(cuò)。本文基于小概率事件原理和假設(shè)檢驗(yàn)的目的,提出在講授假設(shè)檢驗(yàn)內(nèi)容時(shí),應(yīng)傳授學(xué)生把“人們普遍認(rèn)為的觀點(diǎn)、原有的觀點(diǎn)、權(quán)威資料記錄的情況”作為原假設(shè),“與普遍認(rèn)為的觀點(diǎn)不同、信息不匹配的樣本情況”,作為備擇假設(shè)。
通過對(duì)原有的教學(xué)方法進(jìn)行改進(jìn),結(jié)合具體的案例,將假設(shè)建立的方案一步驟化。不僅可以避免傳統(tǒng)教學(xué)中老師單方面、填鴨式教學(xué),學(xué)生枯燥學(xué)習(xí)的情況,案例教學(xué)法可以充分激發(fā)學(xué)生學(xué)習(xí)的興趣,引導(dǎo)學(xué)生自主思考問題,提高學(xué)習(xí)主觀能動(dòng)性,還可以在解決具體問題的過程中,加深學(xué)生對(duì)假設(shè)檢驗(yàn)內(nèi)容的理解,提高運(yùn)用理論解決實(shí)際問題的能力,學(xué)以致用。
同時(shí),運(yùn)用統(tǒng)計(jì)軟件R語言進(jìn)行隨機(jī)模擬,產(chǎn)生已知分布的隨機(jī)數(shù),對(duì)假設(shè)建立的方案一進(jìn)行驗(yàn)證,以現(xiàn)代計(jì)算機(jī)技術(shù)直觀地演示了假設(shè)檢驗(yàn)的過程。改變了傳統(tǒng)理論推導(dǎo)、抽象講解的教學(xué)模式,能很好地活躍課堂教學(xué)氣氛,提高學(xué)生處理數(shù)據(jù)的能力,使學(xué)生更好地理解假設(shè)檢驗(yàn)部分的抽象概念,達(dá)到了概率論與數(shù)理統(tǒng)計(jì)課程的教學(xué)目標(biāo)和應(yīng)用型人才的培養(yǎng)目標(biāo)。
參考文獻(xiàn):
[1]教育部等五部門.關(guān)于印發(fā)《普通高等教育學(xué)科專業(yè)設(shè)置調(diào)整優(yōu)化改革方案》的通知[EB/OL].(2023-03-02)[2024-06-10].http://www.moe.gov.cn/srcsite/A08/s7056/202304/t20230404_1054230.html.
[2]韓兆洲,魏章進(jìn).假設(shè)檢驗(yàn)的一個(gè)常見誤區(qū)[J].統(tǒng)計(jì)與信息論壇,2005(01):9-11.
[3]張凌翔.對(duì)假設(shè)檢驗(yàn)中幾個(gè)問題的思考:兼與韓兆洲、魏章進(jìn)商榷[J].統(tǒng)計(jì)與決策,2006(06):32-34.
[4]詹曉琳,沈薇薇.顯著性假設(shè)檢驗(yàn)中原假設(shè)的建立[J].上海第二工業(yè)大學(xué)學(xué)報(bào),2010,27(02):156-159.
[5]郭建新,許軍保.假設(shè)檢驗(yàn)教學(xué)中一個(gè)問題的探討[J].蘭州交通大學(xué)學(xué)報(bào),2015,34(02):131-133.
[6]肖進(jìn)勝,楊力衡,丁玲,等.現(xiàn)代數(shù)理統(tǒng)計(jì)中假設(shè)檢驗(yàn)的教學(xué)探討[J].高教學(xué)刊,2024,10(08):117-120.
[7]賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].8版.北京:中國(guó)人民出版社,2021.
[8]茆詩(shī)松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].3版.北京:高等教育出版社,2019.
[9]金暢."蒙特卡洛方法中隨機(jī)數(shù)發(fā)生器和隨機(jī)抽樣方法的研究[D].大連:大連理工大學(xué),2006.
[10]薛英花,呂述望,郭圣權(quán).隨機(jī)數(shù)發(fā)生器分析及其在安全信息系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)工程,2003(03):42-44.
[11]薛震,孫玉林.R語言統(tǒng)計(jì)分析與機(jī)器學(xué)習(xí)[M].北京:中國(guó)水利水電出版社,2020.
作者簡(jiǎn)介:朱蓉仁(1994—"),女,漢族,安徽黃山人,碩士研究生,助教,研究方向:數(shù)理統(tǒng)計(jì)。