王麗
“獨立性檢驗的基本思想及其初步應用”是人教版普通高中課程標準實驗教科書《數學》A版(選修)2-3第一章第二節的內容.作為高中教材課改新增內容,本課涉及數據的收集、數據的處理等統計學的基本知識,雖教學時間不長(1-2課時),但由于貼近實際生活,在高中數學中的地位不可小覷.本課內容在近幾年各省新課標高考試卷中屢屢出現,多為解答題形式.
下面呈現三篇“獨立性檢驗的基本思想及其初步應用”教學設計及對比評價,供讀者研究或參考.
一、教學背景與內容分析
本節內容是統計知識的進一步應用,并與課本前面提到的事件的獨立性一節關系緊密,此外還涉及到與“反證法”類似的思想,建立在統計思想、假設檢驗思想(小概率事件在一次試驗中幾乎不可能發生)的基礎之上.通常按照如下步驟對數據進行處理:明確問題→確定犯錯誤概率的上界α及K2的臨界值K0→收集數據→整理數據→制列聯表→計算統計量的觀測值→比較觀測值與臨界值并給出結論.
二、教學目標分析
知識與技能: 通過對典型案例的探究了解獨立性檢驗(只要求2×2列聯表)的基本思想、方法及初步應用;了解隨機變量K2的含義,并能通過K2的值對兩個分類變量進行分析;
過程與方法:借助對實際案例的探究設計解決方案,經歷案例分析的過程,體驗在解決實際問題時假設檢驗思想的合理性,提高數據分析能力;
情感、態度與價值觀:體驗數學與現實生活的聯系,增進質疑、探索的勇氣和自信,感受探究的樂趣,積累進行統計活動的經驗.
三、教學重點、難點
重點:了解獨立性檢驗的基本思想及實施步驟.
難點:(1)了解獨立性檢驗的基本思想;(2)了解隨機變量K2的含義,能通過K2的值對兩個分類變量進行分析.
四、教學策略與方法
以“問題”的形式層層設疑;用已經學過的回歸分析和設置的案例為引,循序漸進地引導學生探究;多媒體輔助教學.
五、教學問題診斷分析
1. K2的結構比較奇怪,出現得比較突然,學生可能會提出疑問.對這個問題的處理,要利用好前面對“比例”和兩個分類變量“獨立”的分析. K2的具體構造過程比較復雜,無法在課堂上具體推導,可以當做課后學習內容.課堂上只定性指出K2是一個連續性隨機變量,服從另一個常見的連續性隨機變量的分布——K2分布.統計學家給出的臨界值表也是依據積分的方法給出的概率值,與之前學過的正態分布類似.
2. 對獨立性檢驗的基本思想的理解要和反證法做一個對比,可以讓學生通過完成表格(印在學案上)對二者的基本思想做比較并加以區別.
3.為什么在表達結論的時候要出現“在犯錯誤的概率不超過XX的前提下”?原因在于獨立性檢驗的過程中存在一個小小的漏洞,就是假設“在一次實驗中,小概率事件不發生”,而事實上小概率事件是可能發生的(用反證法可以推出,如果始終不發生,就是不可能事件了),而正是因為這一點點漏洞,導致獨立性檢驗的結果可能是錯誤的,但是犯錯誤的概率不會太大,我們就把犯錯誤的最大概率等同于小概率事件發生的概率了.
六、教學設計
(一)引入新課
以“吸煙有害健康,勸吸煙者戒煙”為引子,幫助學生快速進入問題情境.
探究:吸煙與是否患肺癌有關系嗎?請設計一個調查方案.
問題1:怎樣判斷兩個變量是否有關系?
由定量變量、分類變量,定量變量—回歸分析,分類變量—獨立性檢驗引出調查思路.
設計意圖:引導學生在解決問題的過程中理解獨立性檢驗的基本思想,讓學生主動思考、積極參與、互相指導、互相學習.
問題2:判斷吸煙與是否患肺癌的獨立性需要哪幾項數據?
設計意圖:引出列聯表以及列聯表的定義,強調高中數學只研究2×2列聯表.
(二)案例探究
調查報告1:某同學共調查了15個人,不吸煙的13人中沒有人患肺癌,吸煙的2人中有1人患肺癌.
設計意圖:通過對吸煙者的質疑指出:樣本容量越大與總體的近似程度越高,在實際問題的研究中通常要求每一組數據都不小于5.
調查報告2:為研究吸煙是否對患肺癌有影響,某腫瘤研究所隨機地調查了9 965人.
列聯表是分類變量的匯總統計表(頻數表),一般將每個分類變量只取兩個值的列聯表稱為列聯表 .
問題3:觀察此列聯表,你能從中獲取吸煙與患肺癌有關系的信息嗎?
通過比重粗略判定兩者有關,再由圖形(等高條形圖、三維柱形圖、二維條形圖)直觀展示,粗略判定兩個分類變量有關.
設計意圖:引導學生借助已學知識對兩個分類變量是否有關進行探究,不同的思路會得出不同的探究結果.
問題4:若用字母代替表格中的數據,在吸煙與患肺癌沒有關系這一前提下,a,b,c,d應該滿足什么關系式呢?
ad≈bc
從兩方面進行分析:(學生分組進行驗證)
(1)吸煙者中患肺癌的比重和不吸煙者患肺癌的比重的比較;
(2)事件的相互獨立性P(AB)=P(A)P(B)得出.
因此│ad-bc│越小,說明關系越弱;│ad-bc│越大,說明關系越強.
質疑:“大”的標準是什么?這種判斷太粗糙了,抽樣調查可靠嗎?
設計意圖:讓學生通過自主探究獲得粗略判斷“是否有關”的方法,通過吸煙者的質疑突出強調進行獨立性檢驗的必要性.
為了使不同樣本容量的數據有統一的評判標準,基于上述分析,我們構造一個隨機變量K2=■,其中n=a+b+c+d,為樣本容量.
問題5:根據以上分析,若“吸煙與患肺癌無關”,則K2應該——(填“大”或“小”).由公式計算得到K2的觀測值k為56.632,它應該和誰比大???
問題6:56.632遠遠大于6.635,這樣的情況下,你認為H0成立嗎?
問題7:你認為“吸煙與患肺癌有關系”這種判斷會犯錯誤嗎?犯錯誤的概率是多少?
設計意圖:一是使學生意識到犯錯誤概率是進行獨立性檢驗中不可缺少的數據,缺了它將來就沒有了參照的標準;二是讓學生了解獨立性檢驗中因為有“認為小概率事件不可能發生”的觀點而存在漏洞,從而存在犯錯誤的風險.我們認為犯錯誤的概率不會超過小概率事件的發生概率,因此在結論中會這樣描述:“在犯錯誤的概率不超過XX的前提下,我們認為XXX.”
實際上借助于隨機變量K2的觀測值k,建立了一個判斷H0 是否成立的規則:如果K≥6.635,就判斷H0不成立,即吸煙與患肺癌有關系;否則就判斷H0成立,即吸煙與患肺癌沒有關系,也稱“在樣本數據中沒有發現足夠證據說明兩者有關系” .在該規則下,把結論“成立”錯判成“不成立”的概率不會超過P(K2≥6.635)≈0.01,即有99%把握認為H0 不成立(強調99%的含義).
獨立性檢驗的定義:這種利用隨機變量K2來判斷“兩個分類變量是否有關系”的方法,稱為兩個分類變量的獨立性檢驗.
(三)歸納提升
問題8:能否認為在推斷錯誤的概率不超過0.001的前提下得出“有關”的結論?k到底應該和誰比大小呢?
在成立的條件下有:
設計意圖:讓學生熟悉理解獨立性檢驗的基本思想和K2的不同臨界值的作用;解讀臨界值表,強調根據實際問題需要確定容許推斷“兩個分類變量有關系”犯錯誤概率的上界,然后查表確定臨界值K.
總結并板書獨立性檢驗的一般步驟:
第一步:收集數據得到列聯表,提出假設H0:兩個分類變量無關;
第二步:利用卡方公式計算隨機變量K2的觀測值k;
第三步:查臨界值表得出結論.:如果k≥k0,就判斷“X與Y有關系”,這種判斷犯錯誤的概率不超過P(K2≥k0),否則,就認為在犯錯誤的概率不超過P(K2≥k0)的前提下不能推斷“X與Y有關系”,或者在樣本數據中沒有發現足夠證據支持結論“X與Y有關系”.
(四)理論對比
設計意圖:使學生了解歸納獨立性檢驗的一般步驟,對比體會反證法原理與獨立性檢驗原理,幫助學生更好地理解獨立性檢驗思想.
(五)習題演練(略)
(六)直擊高考(略)
(七)課堂小結
(八)課后思考
1.K2是如何構造出來的?
2.定義W=││,如何用W構造一個判斷“X和Y有關系” 的新規則?