孟小暄,張永媚,王昕宇,于鎮婕,沈悅好,禹 璽,李艷娥,王 嵐*
1.天津醫科大學護理學院,天津 300070;2.天津醫科大學基礎醫學院;3.天津醫科大學總醫院;4.天津市第一中心醫院
慢性阻塞性肺疾病(COPD)是一種進行性全身炎癥性疾病,且最主要的功能特點是不可逆的氣流受限,導致病人不僅肺功能持續下降,還出現合并癥增多、免疫力降低、日常活動能力下降等問題,進而引發多種功能障礙[1]。COPD 病人的功能障礙給醫療衛生系統帶來沉重的疾病負擔,并直接影響病人的生存質量[2]。功能狀態被定義為個體為實現日常生活需求而進行的活動水平,包括身體、心理、社會、精神、智力和角色。其表現水平與個人性質、結構和條件的期望水平相對應[3]。《國際功能、殘疾和健康分類》(International Classification of Functioning,Disability and Health,ICF)作為一種有效評估功能狀態和殘疾分類的工具,可將個體功能狀態視為健康狀況與背景因素的相互作用與復雜關聯,是從整體水平對COPD 病人的功能狀態進行細致、具體評估的有效方法。本研究應用簡明版ICF-COPD核心集[4]對COPD 病人的功能障礙進行多角度的綜合評估,應用隨機森林算法篩選重要影響因素,聯合多因素Logistic 回歸分析進一步挖掘影響因素,為后續從功能水平加強COPD 防控提供依據。
采用便利抽樣法,選取2020 年6 月—2021 年3 月天津市3 所三級甲等醫院住院或門診就診的COPD 病人作為研究對象,進行多中心問卷調查。納入標準:符合慢性阻塞性肺疾病全球倡議(GOLD)[5]診斷標準的病人;簽署知情同意書。排除標準:患有心腦血管、肝腎等嚴重疾病而導致身體功能受限的病人;無法對問卷上的問題作出回答者。根據Kendell 粗糙工作準則[6]進行樣本量估計,回歸分析樣本量可為自變量個數的5~10 倍,本研究共有22 個自變量,考慮10%的脫落率,計算所需樣本量為121~242 例。使用隨機森林算法時,將80%的病人設為訓練組,20%的病人設為驗證組。本研究已獲得相關倫理委員會批準(批準號:TMUhMEC2020028),病人均已獲得知情同意,自愿參與本研究。本研究已在中國臨床實驗注冊中心完成注冊(注冊編號:ChiCTR2000040723)。
1.2.1 研究工具
1.2.1.1 一般資料調查表
一般資料調查表包括社會人口學資料、生理因素、行為因素3 個方面,共納入16 個變量。其中社會人口學資料包括性別、年齡、體質指數(BMI)、婚姻狀況、居住方式、文化水平、經濟狀況、健康保險和家族史;生理因素包括COPD 分期(分為急性加重期與穩定期)、GOLD 分級[5]、近1 年急性加重次數、合并癥情況;行為因素包括吸煙指數(吸煙指數=每天吸煙支數×吸煙年數)、是否用藥、是否使用家庭氧療。
1.2.1.2 疾病相關量表
1)COPD 疾 病 評 定 量 表(COPD Assessment Test,CAT):綜合評估COPD 病人疾病癥狀及對生活的影響,由咳嗽、咳痰、胸悶、睡眠、精力、活動耐受力、外出信心和對家庭日常活動影響8 項指標組成,每項指標評分為0~5分,總分為0~40分,分值越高代表影響程度越嚴重。總分≥10 分為影響較重,<10 分為影響較輕[7]。2)改良版呼吸困難問卷(Modified Medical Research Council,mMRC):主要用于評估COPD 病人呼吸困難的程度,分為0~4 級,0 級或1 級為呼吸困難癥狀輕,2 級及以上為呼吸困難癥狀較重[5]。
1.2.1.3 簡明版ICF-COPD 核心集
該評價工具由團隊前期研究開發,共包含身心功能、身體結構、活動與參與以及環境4 個維度,其中身心功能、身體結構以及活動與參與維度評分0~4 級,“沒有障礙”計0 分,“完全障礙”計4 分;環境維度分為雙向評分,本研究將其賦值為有利計0 分,無利計1 分。所有維度中,8 代表“未特指”,9 代表“不適用”,在統計過程中將其視為0 處理。前3 個維度得分越高代表功能障礙情況越嚴重。該量表經過前期測評,內部一致性信度較好,內容效度較高[4]。本研究主要使用身心功能、身體結構、活動與參與3 個維度評分計算總分(滿分56 分),對COPD 病人功能障礙進行評價。參照既往ICF 評估病人功能障礙情況的研究,將環境維度作為自變量進行分析[8]。
1.2.2 調查方法
由多名調查員經過培訓后進入醫院進行調查。按照納入標準與排除標準篩選病人,對其說明調查目的及方法,并簽署知情同意書。采用統一的指導語,讓病人進行面對面填寫,對于不能自行填寫的部分,由調查員逐條提問并代為填寫,提問過程中注意避免提示或誘導。填好后當場收回檢查,對于缺漏項目及時確定及補充。共發放問卷230 份,回收有效問卷214 份,回收有效率為93.04%。
1.2.3 統計學方法
采用SPSS 26.0軟件進行數據統計分析。定性資料采用率(%)表示,比較采用χ2檢驗。采用Python 3.9.0實現隨機森林模型構建以及變量重要性解析。采用網格搜索的方式對隨機森林進行優化,主要對決策樹數量、生成最佳森林時最大特征數、樹分裂的最小個數、隨機森林樹的最大深度、對特征的評價標準以及葉子節點最少樣本數6 個隨機森林算法中的重要參數進行調優。部分依賴圖(partial dependence plot,PDP)能夠展現1 個或2 個特征變量對模型預測結果影響的函數關系。本研究使用其對連續變量進行進一步可視化解析。并通過Python 中的SHAP(Shapley additive explanation)解釋隨機森林輸出的變量重要性。將隨機森林算法篩選出的重要變量納入多因素Logistic 回歸分析,使用方差膨脹系數(variance inflation factor,VIF)檢驗變量間是否具有多重共線性,再根據Logistic 建模結果分析COPD 病人功能障礙的影響因素。使用受試者工作特征(ROC)曲線下面積(AUC)、靈敏度和特異度對構建的預測模型進行評價。
本研究共納入COPD病人214例,男159例(74.3%),女55 例(25.7%);簡明版ICF-COPD 核心集在身心功能、身體結構和活動與參與3 個維度的總分為(15.13±8.36)分,使用中位數對總分進行分組,高分組107 例(50%),低分組107 例(50%)。單因素分析顯示,共有11 個變量差異有統計學意義(P<0.05),見表1。

表1 影響簡明版ICF-COPD 核心集得分的單因素分析 單位:例
將11 個變量放入隨機森林進行分析,并將篩選的重要變量納入Logistic 回歸分析。在隨機森林中,使用80%的數據作為訓練集,20%作為測試集,根據網格搜索對參數進行調優,見表2。通過參數調優后模型擬合效果有所提升,AUC 值從0.64 提升至0.91,訓練出最優質的模型來解析影響因素的權重及作用方式。賦值方式,CAT 得分:<10 分=0,≥10 分=1;近1年急性加重:無=0,有=1;e110 個人消費用的用品或物質:有利=0,無利=1;e225 氣候:有利=0,無利=1;GOLD 分級(GOLD):Ⅰ級=1,Ⅱ級=2,Ⅲ級=3,Ⅳ級=4;合并癥:無=0,有=1;性別:男=0,女=1;年齡:≤65歲=0,>65 歲=1;家庭氧療:是=0;否=1;mMRC:低分組=0;高分組=1;COPD 分期:穩定期=0;急性加重期=1。

表2 COPD 病人功能障礙隨機森林模型參數調優最優范圍及最優值
對隨機森林進行SHAP 分析后,使用堆疊的條形圖對變量的重要性進行比較,見圖1。生成最優隨機森林時最大特征數為6,分別為CAT 得分、近1 年有無急性加重、e110“個人消費用的用品或物質”、e225“氣候”、有無合并癥和GOLD 分級。使用部分依賴圖解析連續變量GOLD 分級對COPD 病人功能障礙隨機森林模型的作用,見圖2,結果顯示,GOLD 分級越高,COPD 病人嚴重功能障礙的可能性在不斷上升。

圖1 COPD 病人功能障礙隨機森林模型變量條形堆疊圖

圖2 COPD 病人功能障礙隨機森林模型中GOLD 分級的可視化分析
對隨機森林算法篩選出的6 個變量進行多重共線性檢驗,所有變量的VIF 值均小于5,不存在多重共線性。將6 個變量進入多因素Logistic 回歸,共有5 個影響因素(考慮到GOLD 分級對COPD 病人的重要影響,故在模型中亦納入)構成模型,見表3。該模型ROC 曲線下面積為0.803,靈敏度為74.5%,特異度為76.6%,Hosmer-Lemeshow 擬合優度檢驗顯示,χ2=14.725,P=0.065,說明模型可接受,效果良好。見圖3。

圖3 ROC 曲線

表3 COPD 病人功能障礙影響因素的多因素Logistic 回歸分析
本研究使用簡明版ICF-COPD 核心集評價病人功能障礙得分為(15.13±8.36)分(總分56 分),樣本整體功能障礙水平處于中等偏低的程度,與既往研究結果[9-10]類似,因本研究樣本來源于多所醫院,并且包括住院病人與門診就診病人,滿足較高的樣本多樣性要求。結果表明,疾病嚴重程度越高,功能障礙表現得越嚴 重(GOLD 分 級,OR=1.474),而 既 往 研 究 表 明COPD 病人的生活狀態與ICF 反映出的功能障礙密切相關,所以,深入探究COPD 病人功能障礙的影響因素[11],以找到合適的切入點控制功能障礙的進展尤為重要。
對于多維、復雜的醫學數據,如何篩選重要特征深入探究影響因素,并使后續的干預措施更具有針對性,是一個值得深思的問題。目前對于傳統的統計學方法與新出現的機器學習之間的優劣性一直被諸多醫學科研工作者廣泛關注。與既往研究不同的是,本研究先通過隨機森林算法篩選重要影響因素,再使用Logistic回歸解析變量的作用程度與方向。隨機森林作為機器學習的一種,由于其不易受變量共線性影響、運行穩健、不存在過擬合等優勢,已廣泛應用于醫學研究中[12]。它可將各自變量對于因變量預測的重要性進行展示,有數據降維、預先篩選特征的作用,其生成的重要性評價排序結果可為后續臨床決策提供參考依據[13]。本研究使用網格搜索對隨機森林的參數進行調優,使模型AUC 值從0.64 升高到0.91,從而得到生成森林的最大特征數為6 個變量,進而篩選出重要的影響因素。而Logistic 回歸分析可以解析模型中變量的作用程度與方向,能彌補隨機森林算法中只能得出變量權重,不能知曉作用方向的缺陷。二者結合可使影響因素的分析更加深入、全面。
3.3.1 CAT 評分
研究結果顯示,CAT 得分(≥10 分)較高的病人,功能障礙程度越嚴重。既往研究指出,功能障礙不僅局限于器官功能,還包括體現病人參與日常生活中活動能力的社會功能[14]。CAT 條目間的相互關聯增強了其對于功能障礙的敏感性,如睡眠不足會導致病人日常活動功能下降、機體免疫功能與精神狀態均會受到負面影響[15]。無論是在隨機森林算法的結果中還是在Logistic 回歸分析中,CAT 評分與功能障礙的關聯強度均居首位,并且CAT 評分是GOLD 指南推薦的評估COPD 病人生活狀態的適用工具,因此本研究建議將其作為ICF-COPD 的參考標準,以減小評定者間差異,從而使功能障礙程度的層次劃分更有依據。
3.3.2 物品利用障礙
當COPD 病人物品利用有障礙時,會增加其功能障礙的風險,與既往研究結果[16]相同。“個人消費用的用品或物質”具有障礙是指當病人在購買或利用食物或藥品有障礙。首先,藥品利用障礙可以體現在無效用藥上,相關研究結果表明,僅有27.8%的COPD 病人在長期用藥過程中可以正確使用吸入劑[17],而錯誤的使用方式與COPD 臨床結局惡化顯著相關[18]。病人使用吸入劑的方法不正確,導致無效用藥的發生,進一步加重病人的功能障礙。其次,COPD 吸入劑價格較高、購藥取藥困難也會使藥品利用障礙發生率較高[19]。不良的用藥情況會使病人急性加重次數增多、肺功能下降以及出現更多不可逆性的損害,導致其功能障礙進一步加重。
3.3.3 合并癥與反復的急性加重
本研究表明,近1 年有急性加重史的病人,其功能障礙較高的可能性是沒有急性加重史病人的2.347倍,與一項多中心研究結論[20]一致。而當COPD 病人同時合并其他疾病時會導致功能障礙的危險增加。COPD 急性加重的主要原因是感染、空氣污染、氣候以及合并癥等原因[21]。并且由于COPD 病人全身炎癥屬性,也導致其容易合并多種并發癥[22]。合并癥與急性加重都因為增加了COPD 病人的疾病復雜程度,進而增加了其功能障礙程度。病人每次急性加重都與身體活動、骨骼肌功能、運動耐量和健康相關生活質量的顯著降低有關,導致肺功能乃至其他器官功能不可逆的損傷[23]。并且,較為嚴重的急性加重經歷往往會成為病人恐懼外出、社交活動減少、家庭參與感降低的主要原因[24],也會進一步導致病人社會參與功能障礙愈發嚴重。合并癥的產生也會導致一系列的癥狀負擔以及治療的復雜化,使得呼吸困難程度和衰弱程度增加、運動能力以及生活質量下降[25]。這些都將直接導致COPD 病人功能障礙加重,因此,加強對COPD 病人合并癥的管理,以及預防和控制急性加重的出現顯得尤為重要。
3.3.4 GOLD 分級對預測COPD 病人功能障礙的可視化分析
本研究采用PDP 圖對隨機森林模型中的GOLD分級進行可視化分析,發現隨著GOLD 分級的升高,COPD 病人功能障礙的可能性升高,且1~2 級、3~4級間功能障礙的可能性增長較為明顯。與Huang 等[26]的研究結論相同,認為COPD 功能障礙程度與GOLD分級呈正相關。GOLD1 級的COPD 病人癥狀相對較輕,而當嚴重程度變為GOLD 2 級時癥狀負擔明顯升高,對活動的信心與耐受度都大幅受限[27];GOLD 4 級與3 級病人相比,更易出現慢性炎癥感染[28]、肌肉減少癥[29]以及胃腸道癥狀[30],進而使功能障礙更為嚴重。隨著GOLD 分級的上升,病人的運動能力會下降而癥狀負擔會升高,較差的肺功能與呼吸困難會進一步加重心臟負荷,這些均會對病人的日常活動造成較大影響[31-32]。綜上所述,在管理COPD 病人時,GOLD 1 級病人的干預措施需集中在疾病認知方面,提高其積極鍛煉的依從性;對GOLD 3 級的病人應提高自我管理效能,采取有效措施避免急性加重,防止功能障礙進一步加重。
本研究依據簡明版ICF-COPD 核心集對病人整體功能障礙情況進行評估,通過構建隨機森林模型和Logistic 回歸分析,對病人功能障礙情況進行預測模型的構建與影響因素的解析。當疾病情況較差及對生活的影響較大(CAT 評分≥10 分)、藥物獲取或有效利用存在障礙、具有合并癥、近1 年有急性加重史和GOLD分級較高時,COPD 病人功能障礙更嚴重。提示在COPD 功能障礙預防與控制中,要重點從上述影響因素入手,進行干預及控制,降低病人癥狀對生活質量的影響,建立有效的取藥就醫通道,降低病人合并癥及COPD 急性加重的發生率,減緩病人肺功能下降速度。目前對于COPD 病人功能障礙關注相對較少,后續研究可從病人健康功能出發,綜合評估影響因素的重要性,為COPD 病人的管理及康復制定更為全面、個性化的干預措施。