999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

二項分類logistic回歸的基本原理和關鍵問題

2016-05-12 06:59:35劉彬彬王琦琦于石成胡躍華么鴻雁孫謹芳譚云洪
中國防癆雜志 2016年8期
關鍵詞:耐藥分類分析

劉彬彬 王琦琦 于石成 胡躍華 么鴻雁 孫謹芳 譚云洪

?

·流行病學與統計學方法·

二項分類logistic回歸的基本原理和關鍵問題

劉彬彬 王琦琦 于石成 胡躍華 么鴻雁 孫謹芳 譚云洪

二項分類logistic回歸是醫學研究中常用的方法,優勢比及其95%可信區間是logistic回歸分析最重要的參數值,直接反映了自變量作用的大小和方向。而樣本含量、自變量篩選、變量賦值和結果解釋則是進行logistic 回歸分析的關鍵問題,決定了回歸分析是否能得到相對最佳的回歸模型而準確反映自變量的影響作用,作者將就上述問題進行闡述。

回歸分析; Logistic模型; 比值比

logistic回歸是醫學研究中常見的統計分析方法,可用于疾病危險因素分析、藥物劑量反應研究、臨床試驗評價、疾病預后因素分析等諸多領域。當研究二分類觀察結果與一組影響因素之間的關系時,如觀察結果為是否患病、是否感染、是否死亡、是否復發等,最常用的多元統計學分析方法即為二項分類logistic回歸分析。

logistic回歸屬于概率型非線性回歸[1],其最常用的模型參數是利用回歸系數計算的優勢比(odds ratio,OR),該值反映了在剔除其他自變量的影響作用之后,自變量Xi對陽性結果發生的影響作用。ORi=1表示Xi對陽性結果的發生無作用,ORi>1表示Xi的暴露會導致陽性結果的發生率增加,ORi<1表示Xi的暴露會導致陽性結果的發生率降低。

在二項分類logistic回歸的分析過程中,需要注意以下幾個關鍵問題,以保證獲得基于已有數據資源的最佳回歸模型:

1. 樣本含量的判斷:logistic回歸的所有統計推斷要求保證足夠的樣本量[2]。隨著模型中自變量個數的增加,自變量各水平的交叉組合數呈幾何級數增加,樣本量不足會影響模型的穩定性,出現異常的參數估計值[3]。1998年,Hsieh等[4]提出了logistic回歸的樣本含量計算公式。但logistic回歸分析是在結果分析時應用的數據分析方法,醫學研究中還是應綜合考慮研究類型(包括橫斷面研究、病例-對照研究、隊列研究等)和設計方法(包括抽樣、分層、配對等)等因素來計算樣本含量。在進行logistic回歸分析時,可根據以下條件評估樣本含量對模型適用性和穩定性的影響:(1)病例組和對照組應至少各有30~50例,模型中自變量的個數越多,需要的樣本例數也相應越多[2];(2)各個自變量亞組的樣本含量應大于自變量總數的20倍[3];(3)陽性結局(結果變量為二分類)發生率小于50%時,每一個自變量至少需要10例具有陽性結局的樣本[3]。

如表1所示,利用logistic回歸分析肺結核患者耐藥情況的影響因素。納入肺結核患者200例,其中64例耐藥(病例組),136例敏感(對照組),滿足上述條件1;考慮納入性別和學歷2個自變量進入分析,各個亞組的樣本量均大于40,滿足上述條件2;陽性結局(耐藥)發生率為32%(64/200×100%),各個亞組耐藥者例數均大于20(性別和學歷2個自變量),滿足上述條件3。綜上,可認為利用該數據滿足logistic回歸的樣本量要求,可建立較穩定的模型。

表1 肺結核患者耐藥情況分析的分組信息(例)

2. 自變量的選擇:為了使所建立的logistic回歸模型比較穩定和便于解釋,自變量的選擇非常重要,應盡可能將對結局變量影響大的自變量選入模型中,將作用不顯著的自變量排除在外[2]。

首先,應結合專業知識和研究目的評估自變量的重要性,選擇可能會影響結果的因素作為分析變量。其次,根據卡方檢驗進行單因素分析,選擇有統計學意義的變量納入回歸模型(也可使用“單因素logistic回歸分析”,其作用等價于卡方檢驗[5])。

單因素分析結果具有統計學意義的k個自變量中最終納入哪些變量進入回歸模型,是logistic回歸分析最關鍵的步驟。全局擇優法是對自變量各種不同組合所建立的回歸方程進行比較,從中挑出一個“最優”的回歸方程[2]。在實際應用中最常使用的是逐步選擇法,在統計分析軟件中的應用也最方便,包括前進法、后退法和逐步回歸法3種[2]。

此外,還可根據變量的專業意義和研究目的構建模型,按照研究關注的主要影響因素、常見的混雜因素(如性別、年齡)、對觀察結果作用明確的影響因素(如吸煙對肺癌的作用)、證據力度較弱的影響因素和可能但尚無證據支持的影響因素的順利依次加入,并利用回歸模型的評價指標[3][包括皮爾遜χ2、偏差(deviance)、Homser-Lemeshow 統計量(H-L統計量,即擬合優度指標)、赤池信息準則(Akaike information criterion,AIC)和施瓦茨準則(Schwarz criterion,SC)、廣義確定系數R2]判斷當前模型是否已滿足研究要求。

3.自變量的賦值:在進行logistic回歸分析時,自變量的賦值是一個關鍵的環節。不同的變量賦值形式,可能導致回歸模型參數的符號、大小和含義發生變化[2]。自變量包括分類變量、等級變量和連續變量,變量賦值形式各有不同。

分類變量,例如職業、學歷、血型等,在數據整理時通常整理為數值型變量,即用1,2,3,…k,k表示k個不同的種類。這里的數值實際上只是分類的一個代碼,無大小關系,所以需要將取值范圍為k的分類變量,轉化成k-1個啞變量納入回歸模型[3]。

等級變量,如人體血清反應強度分-、±、+、++、+++、++++六級,藥物治療的效果包括治愈、顯效、好轉、無效四級,可以以連續變量的形式進入logistic回歸模型,得到自變量每改變1個等級時的OR值。但這樣處理的前提條件是自變量的等級分組與應變量的改變情況呈線性關系,其效應呈等比例改變[3]。如果該前提不滿足,則只能將等級變量作為分類變量,通過設置啞變量進行分析。

連續變量,如年齡、血壓、白細胞計數等,在數據整理時一般以原始觀察值記錄,如將連續變量直接帶入logistic回歸,則OR值表示自變量每改變1個單位,陽性結果的發生情況較之前水平的改變倍數。但這種情況有時在專業上比較難理解,比如年齡,OR值表示每增加1歲時的改變情況,不一定具有臨床意義[3]。此時應將變量按值大小分成幾組,按等級變量的處理辦法,直接納入或化作k-1個啞變量納入模型。

4. 啞變量的應用:設置啞變量必須先選取一個參照水平,表2是以“水平1”為參照,得到表示其他2個水平的啞變量D1和D2。其中D1=1表示學歷分組為高中,D1=0表示學歷分組為非高中,D2含義類似(大學及以上)。當D1和D2均等于0時,表示學歷分組為初中及以下(參照水平)。

表2 啞變量的設置方法

啞變量反映了同一個多分類變量不同水平的影響作用,是一個整體變量。因此,logistic回歸模型對啞變量應該遵循同進同出的原則[3]。即當同一個多分類變量生成的一組啞變量中,如果其中有至少1個啞變量進入了回歸模型,此時就不能按照逐步選擇法將該組中其他無統計學意義的啞變量剔除,而應該采用強制進入的處理方式,將該組啞變量全部納入模型。以表3為例,由學歷生成的2個啞變量,按照0.05的檢驗水準,高中(D1)有統計學意義,大學及以上(D2)尚未觀察到有統計學意義,但這2個啞變量都應該納入回歸模型。

表3 logistic回歸分析的結果

Variables in the Equation

圖1 SPSS軟件進行logistic回歸分析的主要結果項目

啞變量的參數表示的是一個多分類變量的各個水平與參照水平相比,對觀察結果的影響作用。此作用的大小和方向會因為選擇的參照不同而改變,因此需要根據研究目的和專業背景選擇合適的參照組。表2是以最低學歷為參照水平,分析其他2個學歷相比于最低學歷各自的影響作用。假設在進行某種特殊疾病的發病風險分析時,基于專業知識可以初步認為該疾病在低學歷和高學歷時都可能高發,同時研究也希望對兩個學歷水平的影響作用大小進行評估,此時就可考慮選擇高中組為參照水平,計算低學歷(初中及以下)和高學歷(大學及以上)相對于參照水平的OR值。

5. 應變量的賦值:應變量的賦值也是影響研究結果的關鍵問題之一。當觀察結果為二分類變量時,一般陽性結果賦值為1,陰性結果賦值為0,所得OR值大于1為危險因素,小于1為保護因素。但實際上這其中包含了陽性結果是不利結局的假設,如患病、死亡、復發。當陽性結果是有利結局時,如治愈、主動求醫,自變量的性質則會得到恰恰相反的結論。需要注意的是,在利用SAS軟件進行logistic回歸分析時,系統默認計算的是較小值與較大值比較的風險,與上述分析習慣剛好相反,在賦值時應做相應改變[3]。

在結果報告時,不鼓勵直接將圖1的軟件分析結果直接復制納入,需要將表頭轉換成標準的參數名稱或符號,并標明變量的亞組信息(表3)。如前所述,OR值及其95%可信區間是logistic回歸分析中最常用的參數,當篇幅有限時可以其為主要內容進行報告。

表3展示了以下結果:性別和學歷對結核病患者耐藥情況有影響。相對于女性,男性是耐藥的危險因素,OR值為7.732(95%CI:1.589~37.615)。相對于初中及以下組,高中學歷是耐藥的危險因素,OR值為5.139(95%CI:1.215~21.737);相對于初中及以下組,尚不能認為大學及以上學歷對結核病患者耐藥有影響。

綜上,醫學研究常用logistic回歸分析觀察結果與影響因素間的關系,變量賦值、自變量選擇和結果解釋都是logistic回歸分析成功與否的重要影響因素。需要強調的是,不能盲目開展logistic回歸分析,需要結合專業知識,在明確研究目的的基礎上,依據科學的數學原理對數據進行分析,實事求是地解釋,才能得到相對最佳的回歸模型,獲得準確而又有實際意義的結果。

[1] 方積乾.衛生統計學. 7版.北京: 人民衛生出版社, 2012.

[2] 孫振球, 徐勇勇. 醫學統計學. 4版.北京: 人民衛生出版社, 2014.

[3] 馮國雙, 劉德平. 醫學研究中的logistic回歸分析及SAS實現. 2版.北京: 北京大學醫學出版社, 2015.

[4] Hsieh FY, Bloch DA, Larsen MD. A simple method of sample size calculation for linear and logistic regression. Stat Med, 1998, 17(14):1623-1634.

[5] 李錫太, 葉臨湘, 施侶元, 等. 肺結核復發危險因素logistic回歸分析. 中華流行病學雜志, 2004, 25(8): 658-660.

[6] 宇傳華. SPSS與統計分析. 2版.北京: 電子工業出版社, 2012.

(本文編輯:李敬文)

Principle and key steps of binary logistic regression

LIUBin-bin*,WANGQi-qi,YUShi-cheng,HUYue-hua,YAOHong-yan,SUNJin-fang,TANYun-hong.

*DepartmentofLaboratory,Hu’nanInstituteforTuberculosisControl,Hu’nanChestHospital,Changsha410013,China

s:SUNJin-fang,Email:sunjf@chinacdc.cn;TANYun-hong,Email:tanyunhong@163.com

Binary logistic regression analysis is frequently used in medical researches, odds ratio (OR) and 95% confidence index, which can directly measure the effect of independent variable on the responsing variables, which are the most important indicators of logistic regression analysis. Sample size, variable selection, variable assignment and result interpretation are the key steps to construct an optimal model, which can reflect the influence of explanatory variables correctly, and they will be discussed especially in this thesis.

Regression analysis; Logistic models; Odds ratio

10.3969/j.issn.1000-6621.2016.08.002

中國疾病預防控制中心青年科研基金課題(2015A204、2016A201)

410013 長沙,湖南省結核病防治所 湖南省胸科醫院檢驗科(劉彬彬、譚云洪);中國疾病預防控制中心流行病學辦公室(王琦琦、于石成、胡躍華、么鴻雁、孫謹芳)

孫謹芳,Email: sunjf@chinacdc.cn;譚云洪,Email:tanyunhong@163.com

2016-07-05)

猜你喜歡
耐藥分類分析
如何判斷靶向治療耐藥
保健醫苑(2022年5期)2022-06-10 07:46:38
miR-181a在卵巢癌細胞中對順鉑的耐藥作用
分類算一算
隱蔽失效適航要求符合性驗證分析
分類討論求坐標
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
數據分析中的分類討論
教你一招:數的分類
電力系統及其自動化發展趨勢分析
PDCA循環法在多重耐藥菌感染監控中的應用
主站蜘蛛池模板: 999国产精品| 性色生活片在线观看| 最新国产成人剧情在线播放| 亚洲全网成人资源在线观看| 国产一级无码不卡视频| 日韩最新中文字幕| 国产丰满成熟女性性满足视频| 少妇露出福利视频| 亚洲AV电影不卡在线观看| 无码中字出轨中文人妻中文中| 波多野结衣一二三| 毛片免费网址| 91成人免费观看在线观看| 国产综合欧美| 国产又色又爽又黄| 欧美在线精品一区二区三区| 国产精品无码久久久久AV| 超薄丝袜足j国产在线视频| 欧美亚洲第一页| 尤物精品国产福利网站| 亚洲综合在线网| 色综合天天视频在线观看| 国产成人夜色91| 亚洲中文字幕无码爆乳| 一级爱做片免费观看久久| 高清大学生毛片一级| 97人妻精品专区久久久久| 又爽又大又黄a级毛片在线视频| 不卡的在线视频免费观看| 国产午夜无码专区喷水| 国产在线精品网址你懂的| 伊人久久大线影院首页| 欧类av怡春院| 无码免费的亚洲视频| 国产精品久久久久久影院| 青青极品在线| 国产亚洲精品97AA片在线播放| 成人无码区免费视频网站蜜臀| 91久久国产综合精品女同我| 九色综合伊人久久富二代| 无码免费视频| 国产精品美女自慰喷水| 精品欧美日韩国产日漫一区不卡| 五月激情婷婷综合| 天天综合亚洲| 996免费视频国产在线播放| 男女精品视频| 99久久人妻精品免费二区| 成年人国产网站| 精品无码一区二区三区电影| 视频在线观看一区二区| 青青草国产在线视频| 九色91在线视频| 成人小视频在线观看免费| 99精品视频在线观看免费播放| 国产SUV精品一区二区| a欧美在线| 亚洲视频免| 成人a免费α片在线视频网站| 一级一级一片免费| 成人免费一区二区三区| 欧美精品伊人久久| 精品视频在线观看你懂的一区| 亚洲毛片一级带毛片基地| 久久精品国产在热久久2019| 波多野结衣在线se| 欧洲成人免费视频| 午夜爽爽视频| 欧美亚洲国产精品第一页| 国产91无码福利在线 | 日本免费a视频| 国产精品一线天| 亚洲AⅤ综合在线欧美一区| 亚洲天堂精品在线| 一级毛片免费观看久| 国产黄色视频综合| 91无码人妻精品一区| 国产精品色婷婷在线观看| 国产综合精品一区二区| 五月婷婷丁香色| 精品在线免费播放| 精品人妻系列无码专区久久|