何本勝
一、教學目標
1.知識與技能:通過對典型案例的探究了解獨立性檢驗的基本思想,會對兩個分類變量進行獨立性檢驗,明確獨立性檢驗的基本步驟,能利用獨立性檢驗的基本思想來解決實際問題.
2.過程與方法:通過探究“吸煙是否與患肺癌有關系”引出對分類變量是否有關的獨立性檢驗問題.通過列聯表、等高條形圖直觀感覺到吸煙和患肺癌可能相關,這一直覺來自于對數據的初步處理.我們需要知道通過樣本數據有多大把握認為兩個分類變量有關,具體過程是讓學生在直觀感受的基礎上深入分析處理數據,提高數據分析和處理的能力.
3.情感、態度與價值觀:讓學生通過本節課的學習認識到數學與實際生活是緊密相連的,學會直觀和客觀、粗略和精確地評估兩個分類變量是否相關.培養學生處理實際問題的能力,提高學生自我思考的能力,讓學生體驗到統計方法的作用,體驗到統計方法的科學性和嚴謹性.
二、教學重、難點
重點:獨立性檢驗的基本思想及進行獨立性檢驗的基本步驟.
難點:獨立性檢驗的基本思想;隨機變量提出的背景和理論基礎.
三、教學方法
以層層設問的方式引導學生逐步了解獨立性檢驗的理論基礎和基本應用;結合講授法幫助學生掌握本節課的內容和思想方法;用分組合作的方式引導學生對本節內容進行總結,全面提升學生的思想認識.
四、教學過程設計
1.創設情境,提出問題
PPT出示題為“韓國肺癌患者敗訴 狀告煙草公司賠償無果”“煙民患肺癌去世 煙草公司被判236億美元天價賠償”的新聞(具體內容略).
問題1:韓國煙草公司反駁的理由是什么?
問題2:應從哪幾方面數據研究吸煙與患肺癌的關系?
設計意圖:通過現實中的具體案例激發學生的好奇心,為引入本節課內容——分類變量獨立性檢驗“吸煙與患肺癌是否有關”做好準備,通過引導學生回答問題引出分類變量、2×2列聯表等概念.
2.啟發引導,探究新知
為研究吸煙是否對患肺癌有影響,某腫瘤研究所隨機地調查了9 965人.
問題1:觀察統計表格具有怎樣的結構特點,核心數據在哪?
1.分類變量——變量的不同“值”表示個體所屬的不同類別,這樣的變量稱為分類變量
2.列聯表——像上表這樣列出的兩個分類變量的頻數表稱為列聯表.在高中階段我們只研究2×2列聯表.
設計意圖:引導學生從數學的角度觀察研究對象,自然生成本節課所要學習的新的概念:分類變量和2×2列聯表.
問題2:從表格中還能得到其他信息嗎?
在不吸煙者中患肺癌的比重是 ;在吸煙者中患肺癌的比重是 .
得出結論:吸煙者患肺癌的可能性大.
相對于表格,圖像能更直觀地看出差異.
等高條形圖:
在這個等高條形圖中,兩者之間的比重有明顯差異,所以吸煙與患肺癌很可能是有關的.
問題3:上述結論是否可靠?或者說我們有多大可能性認為它們有關?這在數學里屬于什么問題?
概率問題.
對所研究問題的數學表述:
“吸煙”記為事件A,“患肺癌”記為事件B,“吸煙與患肺癌有關”即事件A與事件B有關.
問題的反面是:事件A與事件B相互獨立.
問題4:怎么判斷事件A與事件B相互獨立?
P(AB)=P(A)·P(B)
設計意圖:通過對統計表數據的初步處理和對等高條形圖的直接觀察,讓學生感受吸煙與是否患肺癌之間的聯系,在學生充分了解列聯表的數據信息后,引導學生運用概率知識分析吸煙與患肺癌是否有關,由感性的直觀分析過渡到理性的精確分析.
問題5:驗證兩事件是否無關,沒有概率如何處理?
以頻率來代替概率.
將“吸煙”記為事件A, “患肺癌”記為事件B.
P(AB)= P(A)= P(B)=
P(AB)≠P(A)·P(B)
左右兩邊不等,如果相差不多意味兩事件無關的可能性比較大,若相差較多意味著兩事件相關的可能性較大.不等式左邊是實際值,右邊是無關的前提下的理論值,從而得到一個研究兩事件相關的思路:通過研究樣本數據在無關的前提下對應的理論值和實際值的差異的大小來判斷兩個分類變量是否相關.
讓問題由特殊到一般,把表中數字用字母代替,得到如下用字母表示的列聯表:
在假設兩分類變量無關的前提下估算理論值和實際值的差異,由此估計吸煙且患肺癌人數約為 ,同理吸煙且不患病的人數約為 ,不吸煙且患病的人數約為 ,不吸煙且不患病的人數約為 .
問題6:如何表示實際和理論的差異?
類比回歸分析中表示殘差的方式,可以采用平方和形式.
問題7:如何求出樣本容量對差異的影響?
可以通過比例形式衡量偏差,回避容量對差異的影響.
為了使不同樣本容量的數據有統一的評判標準,基于上面的分析,在統計學中構造一個隨機變量K2=,其中n=a+b+c+d,為樣本容量.
在成立的前提下,即“吸煙與患肺癌沒有關系”,K2應該很小.
計算得到的觀測值為:
k=≈56.632
卡方的觀測值越大,兩變量相關的可能性就越大,大與小需要看臨界值.
臨界值表:
設計意圖:假設兩個分類變量無關,學生可以通過所學的概率公式對吸煙與患肺癌之間的關系在概率層面作出判斷,符合學生的認知規律,可以提高學生的思維能力,體現了特殊到一般的思維方法.通過分析總結差異產生的原因,類比回歸分析中殘差的處理思路,引導學生建立體現理論和實際差異的統計量卡方的表達式,突破了難點.解讀臨界值表,為獨立性檢驗做好準備.
假設H0:吸煙與患肺癌沒有關系.
K2的觀測值為
k=≈56.632
根據臨界值表可知,(K2≥6.635)≈0.01,
而56.632遠大于6.635,所以有理由判斷H0不成立,即有99%的把握認為吸煙與患肺癌有關系.
獨立性檢驗定義:這種利用隨機變量來判斷“兩個分類變量有關系”的方法,稱為兩個分類變量的獨立性檢驗.
判斷步驟:(1)提出假設H0:兩個分類變量沒有關系;(2)根據2×2列聯表與公式計算K2的觀測值k;(3)查對臨界值,作出判斷.
問題8:獨立性檢驗的原理和反證法的區別和聯系.
設計意圖:將獨立性檢驗與反證法對比,加深學生對獨立性檢驗思想方法的認識,同時幫助學生建立新舊知識的聯系,合理建構思維體系.
3.鞏固新知,強化訓練
問題1:在現實生活中,有人說禿頂與患心臟病有關,我們如何辨析真假?
問題2:如果想調查禿頂與患心臟病是否相關,需要從哪幾個方面調查數據?
例1:在某醫療機構通過調查得到如下數據:
利用獨立性檢驗法判斷有多大程度認為禿頂與患心臟病有關.
設計意圖:通過鞏固練習強化學生自覺利用統計知識解決現實生活中的問題的習慣,提升學生自我思考能力.
4.總結提升
總結本節所學內容、獨立性檢驗的步驟、獨立性檢驗的思想方法.
5.板書設計(略)