甘大旺(特級教師)
在各個版本最新的高中數學教材中,統計內容的份量均再一次增加,但相應的學法研究、復習輔導并沒有隨之“升溫”.因此,本文就高中概率統計的一個知識點“獨立性檢驗”進行詮釋,例談其在高考備考中的應用.
獨立性檢驗是統計學中兩種卡方檢驗之一,高中數學中獨立性檢驗的第一步是依題意完善或作出2×2列聯表,如表1所示.

表1
其中,x1,x2是一類變量X的兩個互斥狀態,y1,y2是另一類變量Y的兩個互斥狀態,a,b,c,d是分別具有狀態x1與y1,x1與y2,x2與y1,x2與y2的樣本頻數,且都要求頻數均不小于5.

詮釋2改變列聯表中第2行與第3行的位置、第2列與第3列的位置,都不會改變隨機變量K2值的大小,如下列3種變換(如圖1),也分別滿足

圖1
(cb-da)2=(ad-bc)2,
(bc-ad)2=(ad-bc)2,
(da-cb)2=(ad-bc)2.
高中獨立性檢驗的第三步是根據下列統計學上的概率臨界值表,間接判定兩類變量“X與Y有關系”的可信程度(如表2).

表2
詮釋3因為獨立性檢驗的基本思想類似于反證法,所以直接用所算K2值對比表2中臨界值k就可查找兩類變量“X與Y有關系”出錯的至多概率,從而“X與Y有關系”判斷正確的至少概率(把握性)是1-P(K2>k).
詮釋4借助概率臨界值表,可以逆向延伸和理解K2 例1為了考察某種藥物預防疾病的效果,進行動物試驗,得到如表3所示的藥物效果與動物試驗的列聯表. 表3 由以上數據給出以下結論:① 能在犯錯誤的概率不超過0.05的前提下認為藥物有效;② 不能在犯錯誤的概率不超過0.025的前提下認為藥物有效;③ 能在犯錯誤的概率不超過0.010的前提下認為藥物有效;④ 不能在犯錯誤的概率不超過0.005的前提下認為藥物有效. 其中,正確結論的個數是________. 解析 根據列聯表,計算得 查概率臨界值表知,結論①成立的充分條件是K2≥3.841,所以結論①正確;結論②成立的充分條件是K2<5.024,所以結論②錯誤;結論③成立的充分條件是K2≥6.635,所以結論③錯誤;結論④成立的充分條件是K2<7.879,所以結論④正確. 綜上所述,正確結論的個數是2. 點評 查閱獨立性檢驗的概率臨界值表時,要貼近實際問題,看準、看懂、用準“有關”或“無關”“出錯誤”或“有把握”“至少”或“至多”等關鍵詞. 例2某共享單車經營企業欲向某市投放單車,為制定經營策略,該企業在已經投放單車的乙市分兩組進行隨機調研,針對15至45歲的人群,按比例隨機抽取300份問卷,統計結果見表4. 表4 (1)從統計數據可直接得出“是否經常使用共享單車與年齡界限(記作m歲)有關”的結論,在用獨立性檢驗的方法說明該結論正確時,為使犯錯誤的概率盡量小,年齡m應該取25還是35?請說明理由. (2)對于(1)中所取的年齡界限m的值,大約有多少把握認為“經常使用共享單車與年齡達到m歲有關”? 解析 (1)取m=25,整理數據繪制列聯表(如表5所示). 表5 再取m=35,整理數據繪制列聯表(如表6所示). 表6 點評 對于兩類分類變量X與Y的2×2列聯表,相應算出的K2越大(小),判定“X與Y有關”的出錯概率就越小(大),即認為“X與Y有關”的把握性就越大(小). 練習1如果兩個分類變量X與Y的2×2列聯表如表7所示. 表7 對于同一樣本,以下數據說明X與Y有關系的可能性最大的一組是( );可能性最小的一組是( ). A.a=45,b=15 B.a=40,c=20 C.a=35,c=25 D.a=30,c=30 練習2某工廠兩個車間的工人在一次技術比賽中的成績,可以繪制成列聯表(如表8). 表8 于是,推斷“比賽成績與車間有關系”錯誤的概率屬于區間( ). A. (0.3, 0.4) B. (0.4, 0.5) C. (0.5, 0.6) D. (0.6, 0.7) 練習4某制造企業有25周歲以上(含25周歲)職工300名,25周歲以下職工200名.為調查職工的日平均生產量是否與年齡有關,現從中分層抽取了100名職工,先統計了他們某月的日平均生產件數,然后按員工年齡在“25周歲以上(含25周歲)”和“25周歲以下”分為兩組,再將兩組職工的日平均生產件數分成5組分別進行統計,得到如圖2所示的頻率分布直方圖.企業授予日平均生產件數至少80件的職工為“生產能手”. 圖2 (1)繪制職工類別(“生產能手”與“非生產能手”)與年齡的2×2列聯表; (2)試問:有多大的把握認為“生產能手與所在的年齡組有關”? 提示:(1)“25周歲以上”年齡組有60人,“25周歲以下”年齡組有40人,再對照兩個頻率分布直方圖,繪制2×2列聯表,如表9所示. 表92 備考舉例








3 備考練習








