張曉豐 華文娟 王同
肺癌的發病率僅次于乳腺癌[1],中晚期肺癌5年總生存率約5%,而Ia期則為80%以上,因此,早期診斷尤為重要[2]。影像學表現為直徑≤3cm的局灶性、類圓形、密度增高的實性或亞實性肺部陰影被稱為肺結節[3],其中約有5%左右最終發展為肺癌[4]。低劑量CT用于肺癌早期篩查可以顯著降低肺癌死亡率[3,5],但如何確定篩查對象非常重要[6],國內外指南、專家共識均對肺癌早期篩查人群做出推薦[3,7]。但是,自新型冠狀病毒爆發以來,意外發現了很多肺結節和肺癌的患者[8]。這說明我們對于肺癌早期篩查對象的選擇仍需進一步探討。目前,肺結節可能風險因素的研究結果還是有較明顯差異[9-10]。本研究旨在探討現階段本地健康人群中肺結節的可能風險因素,并以此構建列線圖風險預測模型。
篩選安徽醫科大學第二附屬醫院健康管理中心2022年11月至2022年12月所有行胸部CT檢查的體檢人群共7310人,去除不能配合和/或不愿配合問詢的人員后共入組3631人。納入標準:①年齡≥18歲;②精神正常,認知清晰,可配合完成問詢。排除標準:①明確診斷惡性腫瘤患者;②有嚴重心肝腎等疾病。③妊娠期或哺乳期者。將所有患者按7:3的比例隨機分為建模組和驗證組,分別為建模組2544人,驗證組1087人。本研究內容受試者均知情同意,已通過安徽醫科大學第二附屬醫院倫理委員會審批(YX2023-048)。
從安徽醫科大學第二附屬醫院健康管理系統中獲取人口統計學數據和胸部CT結果及各種檢驗結果。補充問詢采集吸煙史、運動情況、職業、學歷等信息。
采用SPSS 23.0進行數據分析。本研究中連續變量均為非正態分布,用中位數(四分位數)表示,分類變量用頻數(n)和百分比(%)表示。連續變量的組間差異采用非參數檢驗。分類變量的比較采用卡方檢驗。用多因素Logistic回歸模型分析危險因素,列線圖和DCA分別采用R(4.1.2)中的rms程序包和rmda程序包。用受試者工作特征(ROC)曲線和校準曲線及曲線下面積(AUC)評價模型。用Hosmer-Lemeshow擬合優度檢驗和決策曲線分析(DCA)檢驗模型,P<0.05為具有統計學意義。
建模組人數共2544人。肺結節陰性組1396人,占建模組總人數的54.9%。肺結節陽性組1148人,占建模組總人數的45.1%。
肺結節陰性組與肺結節陽性組之間,年齡、年齡≥38歲、吸煙或經常被動吸煙、近3年精神壓力大、暴露職業(建筑及裝修、廚師、有污染的工廠等)、高血壓、癌胚抗原升高(>5.00 ng/mL)、白細胞計數、淋巴細胞計數、血小板計數、紅細胞計數、嗜酸性粒細胞計數、白蛋白、白球比例A/G、天冬氨酸氨基轉移酶、低密度脂蛋白、空腹血糖、尿素氮、血尿酸均有統計學差異(P均<0.05)(表1,2)。

表1 肺結節陰性組和肺結節陽性組一般資料比較[n(%)/M(P25,P75)]

表2 肺結節陰性組和肺結節陽性組實驗室指標的比較[n(%)/M(P25,P75)]
將上述P<0.05的各項指標納入多因素Logistic回歸模型分析,結果顯示年齡≥38歲、吸煙或經常被動吸煙、近3年精神壓力大、暴露職業(建筑及裝修、廚師、有污染的工廠等)、癌胚抗原升高均為肺結節陽性的風險因素(P<0.05)(表3)。

表3 多因素Logistic回歸分析
在多因素Logistic回歸結果的基礎上,建立列線圖預測模型,對各風險因素賦分(圖1)。

圖1 肺結節風險預測模型列線圖
建模組(內部)和驗證組(外部)的ROC曲線下面積(AUC)分別為0.787和0.779,靈敏度為0.659,特異度為0.763,該模型診斷效能良好(圖2)。Hosmer-Lemeshow檢驗顯示,模型的擬合曲線與建模組(內部)和驗證組(外部)的理想曲線間均無統計學差異,擬合優度良好(P=0.961,P=0.451)(圖3),該模型預測肺結節陽性的概率與實際發生概率一致性較好。DCA顯示,該模型在較大的閾值內均有較高的獲益性,此模型有臨床意義(圖4)。

圖2 肺結節預測模型ROC曲線

圖3 肺結節預測模型擬合優度檢驗

圖4 肺結節預測模型決策曲線分析
關于肺結節篩查的對象選擇,國內外均有指南或專家共識推薦。但是隨著新的臨床研究結果的公布[11],指南推薦也相應有所調整[5],說明目前的推薦仍然不能十分精準地篩選目標人群,前文提到的新冠肺炎期間意外發現了較多肺部結節和早期肺癌的病人也說明了這一點。而且對于不同風險模型價值的研究,結果也并不一致[12-13]。
本研究共納入建模組2544人,檢出肺結節陽性共1148人,陽性占比45.1%。國內外指南及專家共識常見的風險因素均納入了研究[3,7],包含性別、年齡、吸煙情況、飲酒情況、職業暴露、家族史等,并且加入了近3年的心理壓力狀態、運動鍛煉情況及常見的基礎檢驗指標。結果提示,年齡≥38歲、吸煙或經常被動吸煙、近3年精神壓力大、暴露職業(建筑及裝修、廚師、有污染的工廠等)、癌胚抗原升高為肺結節陽性的風險因素。本研究的一個不足之處是沒有對吸煙程度、年齡、職業等風險因素做深度的分層分析,主要是為了簡化列線圖模型,提高臨床使用的簡易性和便捷性。國內有其他的臨床研究對特定的風險因素進行分層研究可供參考,季明等的研究就發現教師人群相較于非教師人群的肺結節檢出率更高[14]。另外,國內的肺結節診治專家共識建議篩查對象的年齡是≥40歲[3],本研究嘗試選擇了35~40歲之間的各年齡作為組別進行分組,最終發現≥38歲的模型統計學效能最高。本研究發現,近3年的精神壓力大更容易檢出肺結節,與王偉紅[10]等人的研究結果是一致的,后期還需要更多不同地區的臨床研究來驗證結論。吸煙或被動吸煙、暴露職業已被多項研究證實與肺結節陽性有關[6,9-11],并且被國內外指南和專家共識推薦作為篩查因素[3,7]。本研究中癌胚抗原升高的個別病人,考慮有早期肺癌的風險,已根據情況做進一步的處理或隨訪。而專家共識中推薦篩查的風險因素包括有肺癌家族史和有肺部慢性基礎疾病[3],本研究的結果提示肺結節陰性組和陽性組間并沒有統計學差異(P=0.120,P=0.115)。但是對照兩組的檢出率,肺結節陰性組和肺結節陽性組三級親屬有肺癌病史的比例分別為19.7%和22.2%;肺結節陰性組和肺結節陽性組有慢性肺部疾病(慢性阻塞性肺病、肺結核、間質性肺炎)的比例分別為4.2%和5.6%。考慮兩組間無統計學差異可能和樣本量有關,后期可以增加樣本量進一步研究。
研究中利用列線圖建立的肺結節陽性風險預測模型,操作簡便,對于臨床使用有實際意義。利用ROC曲線和AUC、Hosmer-Lemeshow檢驗和DCA經過內部和外部驗證,結果顯示該模型預測效能、擬合優度和臨床意義均較理想。但是由于本研究為單中心研究,外部驗證使用的是本中心的數據集,所以其廣泛的適用性還需要進一步的研究驗證。
本研究實際上有2個目的,其中一個是為了建立肺結節風險的列線圖模型,給臨床確定篩查對象提供幫助。另一個是為了下一步的良惡性肺結節研究入組研究對象。目前的良惡性肺結節風險因素臨床研究,其研究對象主要是手術病人。但這樣有一個很大的問題是選擇性偏倚,入組的基本上都是傾向于肺癌可能的病人。而前瞻性的隊列研究則可以排除該偏倚,其結果更有價值。但是考慮到肺癌的發病率和病程,需要的樣本量非常大,這一研究將需要漫長的時間和不小的人力成本,希望有更多的同道能參與進來。