顧丹彤 林燧恒
(復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)教研室 上海 200032)
哮喘是最為常見的兒童慢性呼吸系統(tǒng)疾病,其癥狀主要為喘息、胸悶、咳嗽等。哮喘發(fā)病率逐年升高,已經(jīng)成為全球最大的公共衛(wèi)生健康問題之一[1]。20年來,在美國城市兒童哮喘的防治方面并無突破,目前仍無可以治愈哮喘的治療方案。更好地了解哮喘的危險因素,并及早提供預(yù)防方案,已成為控制兒童哮喘的當務(wù)之急[2]。
為了調(diào)查與哮喘癥狀相關(guān)的潛在危險因素,美國城市合作哮喘研究(National Cooperative Inner City Asthma Study,NCICAS)團隊在1993年對診斷為哮喘且居住于市中心貧困地區(qū)的1 376名兒童進行了9個月的隨訪,并于基線、3、6和9個月重復(fù)測量了4次,研究的主要結(jié)局變量之一是患兒在過去2周內(nèi)氣喘的天數(shù),取值范圍是0~14的整數(shù)。NCICAS是第一個大型的美國城市兒童哮喘病研究,之后的針對美國城市哮喘兒童的研究多是基于此研究結(jié)果來設(shè)計干預(yù)或集中探討某方面的因素,所包含的危險因素較這個原始數(shù)據(jù)反而相對較少。由于NCICAS收集到的縱向數(shù)據(jù)在0值和14值處出現(xiàn)大量堆積,用傳統(tǒng)的廣義線性模型進行建模可能會導(dǎo)致估計偏倚,并影響對危險因素的估計。
事件發(fā)生數(shù)中含有大量的零值或其他某一數(shù)值時,由于計數(shù)資料中某個值過多,且取相同的值時反映的情況不同,常常會導(dǎo)致計數(shù)資料的變異度較大,這類現(xiàn)象被稱為計數(shù)資料的膨脹[3]。這種離散數(shù)據(jù)的特殊性使其無法用一般的泊松、二項或負二項分布等計數(shù)模型來進行預(yù)測。……