筅華中師范大學數學與統計學學院 劉曉燕 徐章韜
作為數學教育研究數據處理的卡方分析法
筅華中師范大學數學與統計學學院劉曉燕徐章韜
定量取向的實證教育、心理研究所處理的數據層次較低,大多是一些定類、定序變量,這些數據有時候也稱作質性數據.數據處理的精要之一是依據變量的不同特點而選用不同的處理方法,否則不僅得不到有益的結論,還誤導了人們的認識.在數學教育研究中,人們常常會遇到各種分類變量,分類變量的不同取值表示個體所屬的不同類別.例如,性別變量,其取值為男和女,表示按性別劃分,研究對象的群體可分為兩類;又如,對于某一事物的態度,其取值可以為喜歡、不喜歡,表示按態度劃分,研究對象的群體可分為兩類.在實證取向的數學研究中,我們常常關心兩個分類變量之間是否有關系,即兩個因素變量之間是彼此相關還是相互獨立.如,學生對數學的態度是否與性別有關是一個常見的教育問題,顯然不能用個案來說明問題.男生中有喜歡數學的,也有不喜歡數學的;女生的情況亦然.于是,人們發展了針對分類變量的卡方分析法,以檢驗分類變量與分類變量之間是否存在相關關系.
卡方分析法充分體現了比較分析法的精神,可以從多方面理解.
1.尊重生活經驗,從頻次看卡方
各種統計方法得到的結論或者其之所以合理,如果能得到經驗層次的支持,就容易得到理解.兩個人關系密切的話,其來往必定密切.老死不相往來,久不往來走動,親戚也會成路人.統計分類變量的頻次及其在全體中所占的比例,是研究分類變量之間是否存在關系的突破口.
例如,學生對數學的態度是否與性別有關,也就是這兩個分類變量的獨立性檢驗問題.性別變量x有男x1和女x2兩種取值,態度變量y有喜歡y1和不喜歡y2兩種取值,為了研究x是否與y有關,其關鍵在于尋找合適的統計量.我們設想一下,如果態度與性別無關,那么無論是喜歡數學的,還是不喜歡數學的,是分不出性別上的差異的.先把數據進行分類,得到按兩個分類變量進行交叉分類的頻數分配表,即2×2的列聯表(見表1).

表1 性別與態度的2×2列聯表
其中n+1=n11+n21,n+2=n12+n22,n1+=n11+n12,n2+=n21+n22,n=n11+ n21+n12+n22.
如果性別與態度無關,那么男生中喜歡數學的比例應該與女生中喜歡數學的比例差不多,即,化簡得n11n22-n12n21≈0;換言之,如果性別與態度無關,那么男生中不喜歡數學的比例應該與女生中不喜歡數學的比例差不多,即化簡得n11n22-n12n21≈0.因此|n11n22-n12n21|越小,說明性別與態度之間的關系越弱;|n11n22-n12n21|越大,說明性別與態度之間的關系越強.
2.理論思考,從概率看卡方
基于上述分析,為了使不同樣本容量的數據有統一的評判標準,可以通過各個變量的頻次及其在全體中所占的比例來構造一個隨機變量對其進行檢驗.從獨立性的角度進行分析,當性別x與態度y無關時,即事件x與事件y獨立,這時有P(x1y1)=P(x1)P(y1),P(x1y2)=P(x1)P(y2),
P(x2y1)=P(x2)P(y1),P(x2y2)=P(x2)P(y2)成立.
因為事件的概率都可用相應的頻率來估計,如P(x1),
P(y1)的估計值分別為的估計值為很接近,即的值應該很小.上述四個式子應同時成立,左右兩端估計值之差應很接近,故也應該比較小,上式化簡得到χ2=,這就是卡方統計量的表達式.[1]
從這個統計量可以看出,|n11n22-n12n21|越小,χ2越小,即性別與態度之間關系越弱,|n11n22-n12n21|越大,χ2越大,即性別與態度之間關系越強,符合最初的分析.最后將χ2值與研究所得的臨界值進行比較,進而得出性別對于數學態度是否有影響.上述是二分變量與二分變量間的獨立性檢驗問題,并得到相應的2×2列聯表的χ2值計算公式.
還可以從另一個角度進行分析.不妨把表中的數據看作理論頻次,那么就有進行一下數學處理有,這個式子表明,如果變量間是相對獨立的,那么變量的條件分布和邊緣分布是相同的.這時可以得到.對下一行也可以進行同樣的分析,得到類似的式子.當分類變量x可以分作c類,分別為x1,x2,…,xc;分類變量y可以分為r類,分別為y1,y2,…,yr.為了研究x分類是否與y分類有關,對r×c列聯表用上述原理和方法可以得到通)表示.變形得到.所以如果列聯表中的變量是獨立的,則pij=pi*p*j.這樣為什么要研究條件就看得很清楚了.
由于pi*和p*j是對于總體而言,一般都是未知的,可以利用樣本數據對其進行估計,得到.若變量間是相互獨立的,則pij與很接近,也就是說npij與很接近.令Eij=npij表示表中各個變量的期望頻次,那么實際的頻次nij與期望頻次的值Eij很接近,這時我們構造統計量x2=(分子取平方是為了取其絕對差值,分母Eij是為了平衡Eij數值本身的大小).[2]實際頻次與期望頻次之間的差值越小,說明分類變量越接近獨立,這是構建χ2統計量基本想法.把χ2值與臨界值比較,就能得到兩個分類變量究竟是彼此相關,還是相互獨立.
很明顯,2×2列聯表是r×c列聯表的特例,那么它們通過分析得出的χ2統計量是否一致呢?在r×c列聯表中,令r=2,c=2時,根據前面的分析,可分別得到E11,E12,E21, E22的值,將其代入χ2=統計量中,也能得到特例公式
各種檢驗的精髓在于構造統計量.這種構造統計量的方法從理論分析入手,重視局部信息與整體信息之間的關系,同時又兼顧了經驗直觀.
卡方分析法的精致之處還在于基于小概率事件,運用比較法確定何為大,何為小.指定一個臨界值k0,如果卡方的值大于這個值,就謂之為大,兩個變量之間有關系;反之,則謂之為小,兩個變量之間沒有關系.細細品味起來,這有點極限定義中“ε-σ”語言的味道.“ε-σ”語言中,ε、σ辨證相依才能說明問題.然而,這種大小依據的制定合不合理,要根據小概率原理來確定.在卡方分析中,把“兩個分類變量沒有關系”錯誤地判斷為“兩個分類變量有關系”,這是一個不能容許事件,應該是一個小概率事件.確定這個事件發生概率的上界,然后確定相應的臨界值.概率上界不同,相應的臨界值也不一樣,兩者之間是一種依存關系.
從上面的分析中可以看到,卡方分析法是判斷兩個分類變量之間是否相互獨立的非常有效的方法.它尊重了生活經驗,同時也得到了理論分析的支持.卡方分析法的思路非常精致,不同于在方差分析中通過對真實值與測量值之間的誤差進行分析,得到分類變量與定距變量之間的相關性.[3]在卡方分析中,要判斷兩個變量是否獨立,不妨先假設這兩個變量獨立,進行理論上的分析,得到一系列理論值.然后,以這些理論值為參照點,看實際值與理論值的絕對差距占理論值比例如何,從直觀而言,如果兩者很接近,在一定的條件下,就可以認為兩者沒有差別,即兩個變量是相互獨立的.這也符合物理測量經驗.測量一個物體的長度,測量值T1和理論值T之間總會產生誤差e,故有T1=T+e,如果測量是有效的,應有E(T1)=E(T),σ(T)=σ(T1),而且的值也不應太大.這也正是正態分布所要揭示的道理之一.事實上,正態分布可以看作是卡方分布的疊加.這樣教材中關于分布的兩塊內容之間的內在關聯性就找到了.
除了進行獨立性檢驗之外,卡方分析法還可以根據樣本數據對未知總體與某一假設或理論進行擬合度檢驗,即推斷總體的分布.如,實際分布與正態分布的擬合度檢驗是檢驗來自總體的樣本是否服從正態分布,或者說兩者是否存在顯著差異.如要判斷某次考試學生的成績是否符合正態分布,就可用卡方檢驗.首先假設數學成績服從正態分布,并求出各組的理論頻次,代入公式確定自由度和顯著性水平后進行查表,得出的值與χ2值進行比較,從而接受或拒絕原假設,判斷學生的考試成績的頻數分布是否屬于正態分布,從而得出一些教學上的建議和思考.
卡方檢驗法對數據的要求不高,能夠對定類或定序的變量進行假設檢驗;定比或定距數據如果視作定類數據,也可應用卡方檢驗法,所以卡方檢驗法在教育研究中的應用比其他檢驗法更為廣泛.因此,要充分利用卡方檢驗法對教育研究中的數據進行合理的分析.
1.中學數學教材實驗研究組.普通高中課程標準實驗教科書數學(選修1-2)[M].北京:人民教育出版社,2007.
2.盧淑華.社會統計學[M].北京:北京大學出版社,2009.
3.徐章韜,趙弘.作為數學教育研究數據處理的方差[J].中學數學(上),2016(2).Z