楊雯婷
摘要:非參數統計方法研究的出發點是假定研究總體的理論分布是未知的,是一個待檢驗的假設,可以減少實際應用中對假設條件的依賴,不受樣本分布形式限制。本文通過研究正常肝核糖核酸(RNA)對癌細胞的生物作用,以對照組(生理鹽水)、水層RNA組和酚層RNA組此3種不同處理方法誘導肝癌細胞的果糖二磷酸酯(FDP酶)活力為樣本,運用非參數統計方法對其進行實證分析。
關鍵詞:非參數統計分析;多樣本;尺度參數檢驗;位置參數檢驗
一、研究背景
當今經濟研究領域,運用傳統的參數統計進行實證分析非常廣泛。然而,在現實生活中,傳統參數統計方法對總體分布的假定常常難以滿足,比如數據并非來自所假定的分布,或者數據根本不是來自一個總體,又或者數據因為種種原因被嚴重污染等。這樣,假定總體分布的情況下進行推斷的做法就可能產生錯誤的結論,影響決策。為此,人們希望在不假定總體分布的情況下,盡量從數據本身來獲得所需要的信息,這就是非參數統計的宗旨。
二、實證分析
以小白鼠為對象研究正常肝核糖核酸(RNA)對癌細胞的生物作用,試驗分別為對照組(生理鹽水),水層RNA組和酚層RNA組,分別用此3種不同處理方法誘導肝癌細胞的果糖二磷酸酯(FDP酶)活力,數據如表1所示.
3種不同處理的誘導結果
處理方法 誘導結果
對照組 2.79 2.69 3.11 3.47 1.77 2.44 2.83 2.52
水層RNA組 3.83 3.15 4.70 3.97 2.03 2.87 3.65 5.09
酚層RNA組 5.41 3.47 4.92 4.07 2.18 3.13 3.77 4.26
從上表可以看出,對照組的誘導的平均FDP酶活力最小,水層RNA組次之,酚層RNA組的最大。因此可以初步認為,3種誘導作用的效果有顯著差異。
(二)、正態性檢驗
對樣本做假設檢驗則首先必須知道總體服從的分布,本文針對3個總體分別進行正態性檢驗,原假設為H0:樣本所來自的總體分布服從正態分布,備擇假設為H1:樣本所來自的總體分布不服從正態分布。具體檢驗結果如下:
顯然,通過Kolmogorov-Smirnov檢驗可知,在給定的顯著性水平0.05的條件之下,在3個總體所得P值均小于α,故拒絕原假設,可以認為出這3個總體均不服從正態分布。且從現階段所知的分布來看,無法斷定其到底屬于何種分布,故采用非參數方法對該問題進行統計分析。
(三)、尺度參數檢驗
本文中尺度參數的檢驗采取Mood檢驗。原假設X和Y同分布,即H0:b=1,備擇假設H1:b≠1。通過R軟件檢驗結果如下:
Z檢驗統計量的值 P值
對照組與水層RNA組 -1.3956 0.1628
對照組與酚層RNA組 -1.4349 0.1513
水層RNA組與酚層RNA組 -0.41 0.6818
表4
結果顯示,對于分布函數形狀的檢驗,在給定的顯著性水平0.05的條件之下,對照組與水層RNA組、對照組與酚層RNA組和水層RNA組與酚層RNA組的尺度參數檢驗均全部通過,接受原假設。即3個總體的分布函數(以及密度函數)的形狀完全相同,若有不同僅有可能的是位置參數不同。
(四)、位置參數檢驗
1、Kruskal-Wallis檢驗
由于本文樣本為3個獨立同分布的總體,因此對于位置參數的檢驗采取Kruskal-Wallis檢驗。根據題意有,原假設H0:試驗中3種誘導作用的效果無顯著差異,備擇假設H1:試驗中3種誘導作用的效果有顯著差異。結果顯示p=0.01895,故在給定的顯著性水平α=0.05條件之下,拒絕原假設。
2、Wilcoxon秩和檢驗
為了進一步檢驗3中誘導作用中產生顯著性差異的是哪一種,本文對其進行兩兩的Wilcoxon秩和檢驗。其中,原假設H0:試驗中某兩種誘導作用的效果無顯著差異,備擇假設H1:試驗中某兩種誘導作用的效果有顯著差異。通過R軟件編程檢驗,結果如表5所示。
W秩和檢驗統計量的值 P值
對照組與水層RNA組 10 0.02067
對照組與酚層RNA組 8.5 0.01564
水層RNA組與酚層RNA組 27 0.6454
表5
結果顯示,在給定的顯著性水平0.05的條件之下,對照組與水層RNA組、對照組與酚層RNA組的位置參數檢驗沒有通過,因此拒絕原假設,認為對照組與水層RNA組、對照組與酚層RNA組的誘導作用效果有顯著性差異。但是水層RNA組與酚層RNA組的Wilcoxon檢驗結果顯示,在給定的顯著性水平0.05的條件之下,不能拒絕原假設,即沒有證據表明水層RNA組與酚層RNA組的誘導作用效果之間存在顯著性差異。
三、結論
通過本文可以看出,在生物醫學領域,非參數統計具有非常廣泛的應用前景。非參數統計方法不僅可以像參數統計方法一樣用于處理定距、定比數據,更適合處理定類、定序數據。參數方法對數據要求較多,而非參數統計方法則不同,研究的出發點是假定研究總體的理論分布是未知的,是一個待檢驗的假設,實際應用中這種問題是非常普遍的。非參數統計方法減少了實際應用中對假設條件的依賴,進而使得對多樣本問題的研究更加客觀,不受樣本分布形式限制的,應用范圍、發生模型錯誤的可能性較小,有較大的穩定性,同時方法簡便易行,直觀性強,易于接受和理解。此外,在本文的實證研究中,所有檢驗均為應用R軟件編程運算,因此 R 軟件具有實現比較非參數統計分析的強大功能。