張嬌霞 賈云濤
摘 要:本文主要通過R軟件對數學建模中常見的定性數據中的四格表進行獨立性檢驗,Fisher精確檢驗等相關分析。
關鍵詞:四格表;獨立性檢驗;Fisher精確檢驗
數學建模中除了定量數據,定性數據也是經常會遇到的一種數據類型,比如人的性別,民族,對某項服務的評價等級優,良,中,差等。四格表中的數據都是定性數據,是最簡單的二維列聯表。本文主要通過使用R軟件對四格表進行獨立性檢驗,Fisher精確檢驗等相關分析。
一、四格表的獨立性檢驗
案例背景:吸煙的惡果之所以會引起人們嚴重的關切,最早是由于對肺癌患者吸煙情況的觀察。1927年英國醫生泰勒哥德博士說,他所看到的肺癌患者幾乎都是吸煙的。隨著很多醫生關于肺癌患者吸煙情況報導資料的不斷積累,人們越來越感到有必要對吸煙惡果問題進行科學研究。現選擇63個肺癌病例和43個與肺癌患者年齡、性別和其他屬性相類似的健康人(健康人稱為對照組),調查這些人的吸煙情況,得到下表:
根據以上得到的p值,我們均得到拒絕原假設的結論,并且在有方向的Fisher精確檢驗中,我們得到了在總體中肺癌患者吸煙比例比健康人的吸煙比例要高的結論。
參考文獻:
[1]王靜龍,梁小筠,王黎明.屬性數據分析.北京:高等教育出版社,2013.7.
[2]張堯庭.定性資料的統計分析.南寧:廣西師范大學出版社,1991.
[3]Robert I.Kabacoff.R in Action Data Analysis and Graphics with R.(中譯本:R語言實戰.高濤,肖楠,陳鋼譯.北京:人民郵電出版社,2014.1)