黃 濤 王雪樵 高紅英 溫永順 李德棟 尹漢明 李夢軍 王 劍
(井岡山大學醫學院,江西 吉安 343000)
冠心病(CHD)是供應心臟血液的血管發生狹窄,導致心肌缺血缺氧疾病,是導致心源性猝死的重要原因。我國冠心病的發病率呈逐年上升趨勢〔1〕。CHD目前尚缺乏可靠的治療方法,如何對CHD盡早發現和預警是亟待解決的問題。本研究旨在對影響CHD發生的主要因素進行整合,形成CHD的數量化預測模型,以期能對冠心病進行及時的預警預測,以便盡早采取針對性的措施,降低發病風險。
1.1 研究對象 從不同等級醫院中選取2011年1月至2012年6月新發的 CHD住院患者228例,所有患者均符合WHO1997年制定的CHD診斷標準,并經冠狀動脈造影證實。納入標準:①符合上述診斷標準;②既往無冠狀動脈介入治療或冠狀動脈搭橋術的患者。排除標準:①有嚴重感染患者;②有嚴重肝腎功能損害者;③有惡性腫瘤或全身系統免疫系統疾病者。從CHD患者所在醫院的體檢中心獲取健康對照者500例,選取標準為不患任何器質性疾病。以上研究對象按2∶1隨機分組后,得到訓練樣本478例(CHD患者148例,健康者330例),考核樣本250例(CHD患者80例,健康者170例)。
1.2 研究方法 在文獻評閱以往有關CHD危險因素的流行病學調研結果及系統評價結果的基礎上,編制調查表,采用現場方式同步采集CHD患者及健康對照者的相關信息,內容包括人口學、既往史、臨床及實驗室檢查結果等。分析前將資料按1∶2隨機分為考核樣本和訓練樣本兩個部分。其中的訓練樣本用作進行病例對照研究,以訓練樣本用作病例對照研究資料,以其中的CHD患者為病例組,健康者為對照組,以是否CHD為因變量(有定義為1;無定義為0),各研究因素為自變量(若自變量為無序多分類變量,則以其中某項分類為參照形成若干個啞變量),分別作Logistic回歸分析,選入變量的概率標準為0.05,剃除標準為0.10。結果表明,以篩選擬用于建模的CHD主要危險因素,隨后對篩出的危險因素采用Bayes逐步判別分析法,構建出CHD發病預測模型,以訓練樣本和考核樣本分別對模型的預測效果進行驗證。
1.3 質量控制 ①項目實施前,對課題組成員統一培訓,以便在疾病診斷、研究對象選擇、信息的收集等方面規范和統一;②正式收集資料前進行預調查,根據預調查中發現的問題,及時對調查表及研究方案作適當修正;③資料的收集均由有三年以上工作經驗的心血管科醫生完成,調查過程中嚴格掌握診斷、納入及排除標準;④如實規范填寫調查表中的各項內容:血壓記錄入院6 h內首次測量值,實驗室檢查記錄入院72 h內首次結果;如果發生1次以上CHD,記錄首次CHD數據;為保證數據的真實無誤,每周由研究小組對每份調查表進行復核。
1.4 統計學方法 采用SPSS16.0軟件進行Logistic回歸分析和Bayes逐步判別分析。
2.1 CHD危險因素篩選 年齡、性別、心腦血管病史、勞累、牛奶豆漿、蔬菜水果、脾氣急、高血壓史、糖尿病史、腹圍、高密度脂蛋白、載脂蛋白B、空腹血糖、腰臀比、總膽固醇、載脂蛋白A1與CHD之間存在統計學關聯(P<0.05),見表1。
2.2 CHD預測模型 腹圍、高血壓史、腰臀比、載脂蛋白B、年齡、總膽固醇、載脂蛋白A1、牛奶豆漿、蔬菜水果共9個因素進入了判別模型。即預測CHD的數量化方程Y1=0.520×年齡+10.103×是否蔬菜水果+3.178×是否牛奶豆漿-3.413×是否高血壓史+1.108×腹圍-0.005×載脂蛋白 B+281.908×腰臀比+2.436×總膽固醇-0.447×載脂蛋白 A1-209.434;預測健康者的方程 Y0=0.409×年齡+7.749×是否蔬菜水果+5.365×是否牛奶豆漿-8.334×是否高血壓史+0.962×腹圍-0.000 015 43×載脂蛋白 B+258.286×腰臀比+3.778×總膽固醇-4.803×載脂蛋白 A1-169.811。
根據以上方程,將預測對象的各因素賦值代入方程,若Y1>Y0,則判為CHD者,否則判為健康者。

表1 冠心病危險因素的單變量Logistic回歸分析結果
2.3 模型預測效果驗證評價 為了解模型的預測效果,分別采用訓練樣本和考核樣本對模型進行驗證,并計算靈敏度、特異度、符合率、陽性似然比、陰性似然比、陽性預測值、陰性預測值,以便對模型預測的真實性、收益等進行評估。
2.3.1 訓練樣本驗證結果 采用交互驗證法將訓練樣本的各因素賦值回代預測判別模型,結果148例CHD患者中有140例正確判為CHD,8例誤判為健康者;330例健康者中有318例判別正確,12例誤判。預測的靈敏度為94.6%,特異度96.4%,約登指數91.0%,符合率95.8%,陽性似然比26.01,陰性似然比 0.056,陽性預測值 92.1%,陰性預測值 97.5%。
2.3.2 考核樣本驗證結果 考核樣本未參與預測模型的構建,將考核樣本原始數據代入預測模型能更好地驗證模型預測結果的穩定性及外推效果。本考核樣本的驗證結果顯示,80名CHD患者中有72例正確判為CHD,8例誤判為健康者;170例健康者中有166例判別正確,4例誤判。預測的靈敏度為90.0%,特異度 97.6%,約登指數 87.6%,符合率 95.2%,陽性似然比38.25,陰性似然比0.102,陽性預測值94.7%,陰性預測值 95.4%。
對于CHD的預測,以往國內外采用最多的是Framingham風險評分(FRS),用于評估人體今后10年發生冠心病的風險概率〔2〕。但該法過程繁瑣,加之不同國家和地區冠心病的流行病學特點、危險因素水平有著較大差異,簡單照搬使用會帶來很大偏差。如劉靜等〔3〕研究了FRS對于中國人群的應用價值,包含了中國11個省的3萬多35~64歲的個體,進行了為期10年的隨訪,觀察心肌梗死和冠狀動脈事件死亡率的情況,結果發現,FRS評分過高地預測了觀察終點事件的發生率(高估了5倍),因此FRS評分系統并不適合直接應用于中國人群。
CHD是多因素綜合作用的結果〔1,4〕。本研究提示,有多達16個因素同CHD存在關聯,各因素對于CHD的關聯強度及關聯方向也有很大差異。如能對影響CHD發生的眾多因素進行整合,形成有預測價值的多變量數學模型,無疑對于CHD的早期預警預測有著重要價值。判別分析是依據多元觀測指標判斷個體歸屬類別的統計方法,是實現數量化評價及診斷建模的有效工具〔5〕。
從入選的因素來看,除了年齡是后天無法控制的因素以外,高血壓、腹圍、腰臀比、載脂蛋白B、總膽固醇、載脂蛋白A1、牛奶豆漿、蔬菜水果均與膳食營養、行為生活方式密不可分,都可通過后天科學合理的飲食及行為習慣加以控制或消除。因此,對以上因素進行合理的監控和預警將有利于更有效地降低CHD的發生風險。此外,這些因素指標均只需常規性檢查和詢問即可獲取,不會造成任何健康傷害,故本預測模型可望在包括基層醫院在內的各級醫院的實際應用中,有較好的可操作性和實用性。
本研究采用訓練樣本和考核樣本分別對預測模型進行交叉驗證,目的在于充分了解模型的預測效果及預測結果的穩定性。從驗證的結果來看,預測的靈敏度、特異度、符合率、陽性預測值和陰性預測值均達90%以上,陽性似然比和陰性似然比理想,且訓練樣本和考核樣本的驗證結果差別較小,這表明本研究模型對于CHD預測的真實性及收益均很理想。
1 孔靈芝,胡盛壽.中國心血管病報告〔M〕.北京:中國大百科全書出版社,2008:8-10.
2 Conroy RM,Pyorala K,Fitzgerald AP,et al.On behalf of the SCORE pro-ject.Estimation of ten-year risk of fatal cardiovascular disease in Europe:the SCORE project〔J〕.Eur Heart J,2003;24(11):987-1003.
3 劉 靜,趙 冬,王 薇,等.中國多省市心血管病危險因素隊列研究與美國弗萊明翰心臟研究結果的比較〔J〕.中華心血管病雜志,2004;32(2):167-72.
4 Srinath RK,Katan MB.Diet,nutrition and the prevention of hypertension and cardiovascular diseases〔J〕.Public Health Nutr,2009;7(1A):167-253.
5 孫振球.醫學統計學〔M〕.第3版.北京:人民衛生出版社,2010:421-3.