999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

如何用 SAS 軟件正確分析生物醫學科研資料XIV.用 SAS 軟件實現具有一個重復測量的單因素設計定量資料的統計分析

2011-06-08 10:31:28王琪胡良平
中國醫藥生物技術 2011年4期
關鍵詞:測量模型設計

王琪,胡良平

1 重復測量設計的概念及應用場合

重復測量設計是在不同條件下,從同一受試對象上重復獲得某指標觀測值的一種試驗設計類型。這里所說的“在不同條件下”,通常是指“時間因素”取不同水平,有時指受試者身上的幾個“對稱部位”或具有可比性的不同部位,有時也指“時間因素”和“對稱部位”的各種水平組合。如果“不同條件”僅與一個因素有關,就叫做“具有一個重復測量的M因素設計”;如果“不同條件”與兩個因素的水平組合有關,就叫做“具有兩個重復測量的M因素設計”。這里的M因素指試驗中涉及到的全部試驗因素的個數,包括與重復測量有關的試驗因素。與重復測量無關的因素被稱為試驗分組因素,即受試對象被完全隨機地分配到這些因素的水平組合所形成的各小組中去。

在某項研究中,若專業上需要了解隨時間推移或部位改變時,定量觀測指標的動態變化情況時,就需要運用此設計。

2 具有一個重復測量的單因素設計定量資料的SAS 實現

【例 1】某課題組研究益髓生血顆粒治療_SEA/ααCS基因型患者血紅蛋白 H(hemoglobin H,HbH)病的臨床療效,選取 13 名_SEA/ααCS基因型 HbH 患者,給以益髓生血顆粒治療,療程為3 個月。分別記錄患者治療前、服藥 1 個月、服藥 2 個月及服藥 3 個月時血紅蛋白的含量,結果見表1。請對資料進行合適的統計分析。

表1 13 例 HbH 患者服藥前后血紅蛋白含量變化

對數據結構的分析與 SAS 實現:對每一位患者來說,在 4 個時間點上分別被測量血紅蛋白含量,說明“觀測時間”是一個重復測量的因素,且所有患者均接受同一種治療方法——服用益髓生血顆粒,因而這是具有一個重復測量的單因素設計定量資料。直接采用隨機區組設計定量資料方差分析處理此數據是不妥的,因為用隨機區組設計定量資料方差分析處理具有一個重復測量的單因素設計定量資料有特殊的前提條件——球對稱條件。當球對稱條件滿足時,采用隨機區組設計定量資料方差分析處理與采用具有一個重復測量的單因素設計定量資料方差分析處理的結果一致;當球對稱條件不滿足時,若采用隨機區組設計定量資料方差分析來處理,與采用具有一個重復測量的單因素設計定量資料方差分析時未校正的結果一致,當然會增大犯 I 類錯誤的概率。應先檢查資料是否滿足球對稱條件,若滿足,可采用隨機區組設計定量資料方差分析;若不滿足,可采用與此設計對應的混合效應模型處理。

94.98 102.33 98.86 102.31 91.41 98.79 95.46 98.66 78.75 86.22 83.38 85.70 83.13 90.58 87.56 90.19 71.20 78.73 76.18 77.98 87.28 94.69 91.51 94.43 65.01 72.58 70.27 71.64 66.93 74.49 72.11 73.61 103.31 110.61 106.81 110.84 80.87 88.32 85.40 87.87 71.97 79.49 76.91 78.77 65.20 72.77 70.46 71.84 79.16 86.63 83.77 86.12

程序說明:SAS 程序中第1 步為建立數據集,patient代表“患者編號”,m0、m1、m2、m3 分別代表治療前、服藥 1 個月、服藥 2 個月、服藥 3 個月4 個時間點獲得的觀測指標“血紅蛋白含量”的值。第2 步是調用 GLM 過程進行具有一個重復測量的單因素設計定量資料一元方差分析和多元方差分析,其中 model 語句“/”后的 nouni 用來指明不要將 m0、m1、m2、m3 看成 4 個相互獨立的結果變量進行方差分析,repeated 語句用來指定與重復測量有關的因素及其水平數,并對資料進行一元方差分析和多元方差分析。在進行一元方差分析時,必須對協方差陣進行球對稱性檢驗,這只需在 repeated 語句“/”后加上 printe 即可,選項 summary 可輸出方差分析表。第3 步為調整數據集,將原本單獨成列的 m0、m1、m2、m3 轉換成變量 month 的4 個水平,并將其取值全部賦給變量 y,后面幾步均針對此新產生的數據集 a 進行分析。第4 步對新數據集 a 進行隨機區組設計定量資料的方差分析。第5、6、7、8、9 步分別調用 MIXED 過程,采用 VC、CS、UN、AR(1)、SP(POW)五種協方差結構模型對資料進行方差分析。其中,SP(POW)模型在使用時要求將“repeated/type = sp(pow)(c-list)”語句中“c-list”替換成重復測量因素的名稱,但此重復測量因素應為數值型變量。本例中,重復測量因素為觀測時間,其包含 4 個水平(0、1、2、3),屬數值型變量,故可選用 SP(POW)模型。若某重復測量因素為定性變量(如部位等)或雖可視作定量變量但水平數較少(如 ≤ 3)時,是不適宜選用此模型的。此外,在使用 SP(POW)模型時,定量的重復測量因素在賦值時應以其真實水平代入。

SAS 輸出結果與結果解釋:

Sphericity tests

The GLM procedure repeated measures analysis of variance univariate tests of hypotheses for within subject effects

Greenhouse-Geisser epsilon 0.3334 Huynh-Feldt epsilon 0.3334

這是輸出結果的第一部分,是第一個 GLM 過程產生的具有一個重復測量的單因素設計定量資料一元方差分析的結果。首先給出的是對協方差陣進行球對稱性檢驗的結果,由P< 0.0001 可知,此資料不滿足球對稱性條件,因而在查看方差分析結果時,應查看校正后的P值。本資料采用 Greenhouse-Geisser 法和 Huynh-Feldt 法校正后的P值均小于 0.0001,說明各時間點上測得的 HbH 患者血紅蛋白含量均值之間的差異存在統計學意義。當協方差矩陣滿足球對稱性要求時,(Epsilon)(對P值進行校正的系數)等于 1,越大,說明協方差矩陣越接近球對稱性。Huynh-Feldt 法校正的ε? 取值可能大于 1,當> 1 時,取= 1。

MANOVA test criteria and exact F statistics for the hypothesis of no month effect

這是輸出結果的第二部分,是第一個 GLM 過程產生的具有一個重復測量的單因素設計定量資料多元方差分析的結果。分別給出了 Wilks' Lambda、Pillai's Trace、Hotelling-Lawley Trace、Roy's Greatest Root 四個檢驗統計量,它們都是從離均差平方和矩陣的特征根推導出來的,都是特征根的函數,彼此密切相關。當結果變量的第一個即最大特征根完全解釋了所有變異時,四個統計量對應的F值相等,并精確服從F分布。否則,這四個統計量所對應的F值不相等且只是近似服從F分布。在多元方差分析中,通常用 Wilks' Lambda 進行統計學推斷。由上述結果可知:P< 0.0001,所以各時間點上測得的 HbH 患者血紅蛋白含量均值之間的差異具有統計學意義。

The GLM procedure repeated measures analysis of variance analysis of variance of contrast variables month_N represents the contrast between the nth level of month and the last

這是輸出結果的第三部分,是第一個 GLM 過程產生的各時間點與最后一個時間點患者血紅蛋白含量兩兩比較的結果。可見,各時間點與第4 個時間點上患者血紅蛋白平均含量之間的差異均有統計學意義。當然,repeated 語句默認的是各時間點與最后一個時間點進行比較。其實,在此語句中,可設置以某個組作為對照組,其他各組與之進行比較。如本資料,欲比較各時間點與第1 個時間點上血紅蛋白平均含量之間的差異有無統計學意義,將“repeated month 4(0 1 2 3)/summary printe;”改為“repeated month 4(0 1 2 3)contrast(1)/summary printe;”即可,即添加 contrast 選項,并在其后的括號內規定何為對照組。

?

R-Square Coeff Var Root MSE yMean 0.999406 0.408029 0.345574 84.69365

Source DF Type III SS Mean square F value PR> F Patient 12 6777.885931 564.823828 4729.66 < .0001 Month 3 454.188898 151.396299 1267.75 < .0001

這是輸出結果的第四部分,是第二個 GLM 過程產生的隨機區組設計定量資料一元方差分析的結果。由方差分析結果可以看出:F= 1267.75,P< 0.0001,說明不同時間點上測得的 HbH 患者血紅蛋白平均含量之間的差異具有統計學意義。這個方差分析的結果與具有一個重復測量的單因素設計定量資料一元方差分析結果一致,這是因為資料雖然不滿足球對稱性條件但F值 >>F臨界值,即采用具有一個重復測量的單因素設計定量資料一元方差分析和隨機區組設計定量資料一元方差分析處理單因素重復測量設計定量資料結果一致的兩種情況之一。

Fit statistics

Type 3 tests of fixed effects

這是采用 VC(方差分量型)協方差結構模型進行混合效應模型分析的輸出結果。

Fit statistics

Type 3 tests of fixed effects

這是采用 CS(復合對稱型)協方差結構模型進行混合效應模型分析的輸出結果。

Iteration history

Iteration Evaluations –2 Res Log like Criterion 6 0 –210.88040371 0.00000214 7 0 –210.88040371 0.00000214 8 0 –210.88040371 0.00000214 9 0 –210.88040371 0.00000214 10 0 –210.88040371 0.00000214 11 0 –210.88040371 0.00000214

WARNING: Did not converge.

這是采用 UN(無結構型模型)協方差結構模型進行混合效應模型分析的輸出結果。

Fit statistics

Type 3 tests of fixed effects

這是采用 AR(1)(一階自回歸型)協方差結構模型進行混合效應模型分析的輸出結果。

Fit statistics

Type 3 tests of fixed effects

這是采用 SP(POW)(空間冪相關型)協方差結構模型進行混合效應模型分析的輸出結果。

以上是采用 MIXED 過程進行混合效應模型分析的結果。這里給出了模型的擬合信息和固定效應假設檢驗的結果。通常關注的是固定效應假設檢驗的結果,但從上面的結果中可以看出,采用不同的協方差結構模型得出的固定效應假設檢驗的結果是不完全相同的,其中 GLM 過程計算出來的結果與 CS 協方差結構模型(采用 REML 即約束最大似然估計法)得出的結果是相同的,它是次簡單的模型。那么,采用這 5 種協方差結構模型計算所得的結果中應以哪個結果為準呢?這就是模型選擇的問題了。

通常情況下,可以 Akaike 的信息準則 AIC 值或Schwarz 的信息準則 BIC(或稱 SBC)值來選擇協方差結構模型。AIC 值和 BIC 值越小,協方差結構模型擬合給定資料越好;若兩個協方差結構模型擬合的 AIC 值和 BIC值接近,還可參考 –2LogL(–2 Res Log Likelihood)的數值,小者為優。若兩個協方差結構模型分別包含q+v和q個參數時,可用這兩個 –2 倍的對數似然函數值構造出似然比統計量,采用χ2檢驗進行推斷,見下面的公式。若似然比統計量對應的P值大于設定的顯著性水平,則兩個協方差結構模型對資料的擬合效果之間的差異無統計學意義,此時可選擇參數個數較少的那個協方差結構模型。若似然比統計量對應的P值小于設定的顯著性水平,則兩個協方差結構模型對資料的擬合效果之間的差異有統計學意義,此時應選擇參數較多的那個協方差結構模型。

現將本資料輸出結果的模型擬合信息部分的主要內容匯總在表2 中,以利于比較。

表2 用 5 種類型的協方差結構模型擬合本資料的擬合效果比較

由上面的結果可知:采用 UN (無結構型模型)協方差結構模型擬合本資料,其迭代并沒有收斂,擬合效果不好。對比其他四種協方差結構模型的擬合情況,可以看出采用CS協方差結構模型擬合本資料效果較好,因為評價擬合效果的三個準則中這個模型對應的值較小。所以此時應以采用CS 協方差結構模型進行混合模型分析的輸出結果為準,其中F= 1267.75,P< 0.0001。說明不同時間點上測得的 HbH患者血紅蛋白平均含量之間的差異存在統計學意義。欲得出各時間點上 HbH 患者血紅蛋白含量均值之間兩兩比較的結果,可將原程序中所有過程步刪除,在第二個 DATA 步后換上以下過程步:

其中,“ddfm = sat”說明采用 Satterthwaite 近似的方法來計算分母的自由度,從而得到一個更加準確的近似F值。但是,此法計算的結果有時會與 glm 過程計算的結果有所不同。

程序運行后,得結果如下:

Least squares means

Differences of least squares means

這是各時間點上 HbH 患者血紅蛋白含量均值之間兩兩比較的結果,首先給出了各時間點 HbH 患者血紅蛋白含量均值與 0 比較的檢驗結果,沒有太大實際意義。后面給出了兩兩比較的結果,month 和 _month 列中的 0、1、2、3 分別代表時間的 4 個水平,即治療前、服藥 1 個月、服藥 2 個月、服藥 3 個月。讀者可查看最后兩列給出的兩兩比較的結果,可發現這 4 個時間點上 HbH 患者血紅蛋白含量均值之間的差異均有統計學意義,說明 4 個時間點上HbH 患者血紅蛋白平均含量各不相同。

[1]Hu LP.Application of statistical triple-type theory in the experiment design.Beijing: People’s Military Medical Press, 2006:107-120.(in Chinese)胡良平.統計學三型理論在實驗設計中的應用.北京: 人民軍醫出版社, 2006:107-120.

[2]Hu LP.Scientific research design and statistical analysis of cardiovascular disease.Beijing: People’s Military Medical Press,2010:93-111.(in Chinese)胡良平.心血管病科研設計與統計分析.北京: 人民軍醫出版社,2010:93-111.

猜你喜歡
測量模型設計
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
把握四個“三” 測量變簡單
滑動摩擦力的測量和計算
瞞天過海——仿生設計萌到家
藝術啟蒙(2018年7期)2018-08-23 09:14:18
滑動摩擦力的測量與計算
設計秀
海峽姐妹(2017年7期)2017-07-31 19:08:17
有種設計叫而專
Coco薇(2017年5期)2017-06-05 08:53:16
3D打印中的模型分割與打包
主站蜘蛛池模板: 69精品在线观看| 中文字幕一区二区人妻电影| 精品一区二区三区自慰喷水| 国产一区二区三区视频| 人妻丰满熟妇av五码区| 亚洲AV无码不卡无码| www成人国产在线观看网站| 亚洲清纯自偷自拍另类专区| yjizz视频最新网站在线| 国产成人精品亚洲77美色| 四虎永久在线精品国产免费| 在线视频97| 亚洲综合狠狠| 欧美性猛交一区二区三区| 久久精品国产在热久久2019| 中文字幕 91| 在线观看av永久| 精品三级网站| 国产原创自拍不卡第一页| 国内精品伊人久久久久7777人| 免费a级毛片视频| 99偷拍视频精品一区二区| 另类欧美日韩| 性欧美久久| 中文字幕在线免费看| 四虎国产在线观看| 欧美成人午夜在线全部免费| 无码免费的亚洲视频| 老司国产精品视频91| 欧美三级不卡在线观看视频| 欧美综合成人| 青青热久免费精品视频6| 国产毛片久久国产| 第一页亚洲| 777国产精品永久免费观看| 国产主播一区二区三区| 呦视频在线一区二区三区| 91精品综合| 亚洲熟女中文字幕男人总站| 国产精品亚洲综合久久小说| 国产在线观看一区二区三区| 久久久久国产精品免费免费不卡| 精品自拍视频在线观看| 一区二区影院| 色噜噜在线观看| 91精选国产大片| 国产女人在线| 久久综合伊人77777| 在线国产91| 国产毛片基地| 欧美无专区| 在线va视频| 国产第一页第二页| 国产黑丝视频在线观看| 精品无码人妻一区二区| 久久国产成人精品国产成人亚洲| 九九久久精品免费观看| 夜精品a一区二区三区| 国产91无毒不卡在线观看| 亚洲国语自产一区第二页| 亚洲美女一级毛片| 18禁高潮出水呻吟娇喘蜜芽| 亚洲一区二区视频在线观看| 日韩在线欧美在线| 伊人久久综在合线亚洲2019| 国产在线视频欧美亚综合| 依依成人精品无v国产| 77777亚洲午夜久久多人| A级毛片无码久久精品免费| www.av男人.com| 韩日午夜在线资源一区二区| 成人午夜免费观看| 青草精品视频| a级毛片免费播放| 欧美黄网站免费观看| 人妻少妇久久久久久97人妻| 国产流白浆视频| 国产精品极品美女自在线网站| 亚洲成人黄色网址| 18黑白丝水手服自慰喷水网站| 国产一二视频| 99精品在线视频观看|