朱碧云 王 妮 黃艷群 喬伯文 李 博 陳 卉
(首都醫科大學附屬北京地壇醫院 北京 100015) (首都醫科大學生物醫學工程學院 北京 100069) (北京市石景山區衛生信息中心 北京 100043) (首都醫科大學生物醫學工程學院 北京 100069)
高血壓是臨床中比較常見的一種心血管病癥[1],其病程長且無法治愈,對人們的健康有著極大的影響。流行病學調查發現近些年來高血壓發病率逐年上升[2],給患者及社會帶來了巨大的經濟負擔。有研究表明一些慢性病常常相互伴隨發生,如高血壓、肥胖、糖尿病、血脂異常等[3-5],而且患者的性別、年齡、婚姻狀況等人口學因素[6-7]以及吸煙、飲酒、鍛煉、飲食等生活習慣[2,8]都對慢性病的發生有一定影響。因此對高血壓患者的共患病現象和其他潛在關聯因素進行分析將對高血壓的預防和治療有借鑒意義。
關聯規則挖掘是一種數據挖掘技術[9],用于探索事物之間的關聯性,目前已被用于中醫中藥、臨床醫學、流行病學等方面的研究,如發現腦卒中危險因素[10]、住院跌倒患者的防范[11]、患者就診規律挖掘[12]、慢性阻塞性肺疾病的協同疾病[13]、兒童安全用藥[14]、中醫藥處方配伍規律[15]等。本研究利用北京市石景山區社區公衛系統數據集,通過關聯規則挖掘,探討高血壓與糖尿病、冠心病之間的關聯性及關聯強度,分析其他潛在關聯因素,研究高血壓患者的共患病現象,提供有效防治建議。
為2018年北京市石景山區社區公衛系統數據集,其中包括人口學數據(性別、年齡、婚姻狀況等)、生活習慣(鍛煉、飲酒、吸煙、飲食等)、家族史、慢性病患病情況(糖尿病、冠心病、腦卒中)、生活條件(飲用水、燃料類型、廚房排風設施等)等106個指標。為了減化計算并盡可能挖掘出有效的關聯規則,本研究從中提取性別、年齡(>60歲定義為老年人)、婚姻狀況、身高、體重、是否患高血壓、是否患糖尿病、是否患冠心病、是否患腦卒中、父親有無高血壓、母親有無高血壓、鍛煉(經常鍛煉、鍛煉無規律、不鍛煉)、飲酒(經常飲酒、飲酒無規律、不飲酒)、吸煙(經常吸煙、已戒煙、不吸煙)、睡眠(睡眠困難、入睡困難、早醒、夢游、嗜睡等)、飲食習慣(偏咸、偏甜、偏油、嗜熱食、素食、辛辣等)共16個指標。此外根據身高和體重計算體重指數BMI,參考世界衛生組織的標準,將BMI>24 kg/m2定義為肥胖。

將原始數據導入Access軟件,提取所有高血壓患者的相應分析指標作為研究內容建立數據集并進行數據清理。采用Python(https://www.python. org/)數據挖掘軟件進行Apriori算法分析,挖掘支持度>10%、置信度>5%的規則并定義提升度>1的規則為強關聯規則。采用Gephi(https://gephi.org/)軟件繪制關聯規則的網狀圖,以節點表示特征,用節點間連線的粗細直觀地展示特征間關聯性的強弱。
從總數據集中共確定73 894名高血壓患者,年齡為67.5±12.0歲。所有高血壓患者中,55 649人(75.3%)至少合并冠心病或糖尿病之一。其中32 992人(44.6%)合并冠心病,28 427人(38.5%)合并糖尿病,16 185人(21.9%)則同時合并這兩種慢病。男性高血壓患者合并冠心病和糖尿病的發生率(42.7%和38.4%)高于女性(38.9%和35.8%,P值均<0.001),老年患者(49.8%和39.8%)高于非老年患者(38.0%和36.7%,P值均<0.001),見表1。

表1 高血壓合并冠心病、糖尿病患者的性別、年齡分布(n[%])
表2列出了有1個或兩個條件(先導)的部分強關聯規則(提升度分別>1和1.25)。從第1條規則可知高血壓患者同時合并冠心病和糖尿病的概率是21.9%;在所有合并冠心病的患者中有將近一半(49.1%)的人還患有糖尿病;高血壓患者合并冠心病使其合并糖尿病的風險增加30%。此外年齡、飲食習慣和鍛煉情況都與糖尿病有關聯性。

表2 高血壓合并糖尿病的關聯規則挖掘結果
表3列出了包含有1個或兩個條件(先導)的部分強關聯規則(提升度分別>1或1.25)。結果顯示高血壓合并糖尿病的患者其冠心病的發生率達56.9%,而合并糖尿病且有睡眠障礙使冠心病的發生風險提高到60.4%。此外年齡、家族史、飲食習慣和鍛煉情況都與冠心病有關聯性。表2和表3列出的強關聯規則中所有單一先導規則的關聯網絡,見圖1。可見高血壓患者合并糖尿病與合并冠心病間有很強的關聯性,飲食偏咸、鍛煉不規律與兩種慢病都有關聯,老年高血壓患者常常伴隨發生糖尿病與冠心病。

表3 高血壓合并冠心病的關聯規則挖掘結果

圖1 關聯規則分析網絡
注:圖中線的粗細與規則提升度成比例

冠心病是目前世界范圍內最首要的疾病死亡原因[20]。高血壓是冠心病發生的重要危險因素,控制高血壓不僅是預防冠心病的關鍵,也是減輕心血管疾病所造成的沉重經濟負擔和保證患者生命及生活質量的關鍵[21]。臨床和流行病研究顯示中老年人高血壓伴糖尿病與冠心病存在密切聯系,冠心病的發生率顯著提高[22-23]。本研究發現伴糖尿病使高血壓患者合并冠心病的可能性增加12.3%,與其他研究結果一致。高血壓合并糖尿病的患者冠狀動脈病變程度更重,臨床預后差[24],因此積極治療高血壓和糖尿病將有利于冠心病的防治。本研究人群中睡眠障礙導致高血壓伴糖尿病患者發生冠心病的可能性增加3.5%。其他研究揭示睡眠與高血壓、糖尿病和冠心病的發病都具有一定的關聯性,睡眠時間過短或過度睡眠均會提升高血壓、糖尿病和冠心病的發病率[25]。高鹽飲食可進一步導致高血壓合并糖尿病患者發生不良心血管事件[24],與本研究發現的飲食偏咸會導致高血壓伴糖尿病患者發生冠心病的風險增加(從56.9%提高到58.6%)一致。此外年齡一直以來都是重大慢性疾病的危險因素,高血壓伴冠心病的老年患者的糖尿病患病率提高了1.8%,高血壓伴糖尿病老年患者的冠心病患病率提高了3.1%,社區高血壓管理的重點仍將放在中老年人群上。
本研究利用數據挖掘技術中的關聯規則挖掘方法,基于社區居民健康檔案數據,對近74 000名社區高血壓患者合并慢病及其影響因素進行分析。研究結果提示社區慢病管理中應倡導健康生活方式(如高質量睡眠、適當鍛煉、低鹽飲食、控制體重),定期監測高血壓、糖尿病、冠心病的發生和變化,避免共患病的出現。通過關聯規則挖掘,全面分析高血壓患者合并其他慢性病的關聯因素,使得相關疾病的預防和干預更具有針對性,同時也能提高慢病管理效率。