999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于健康體檢數據的結直腸息肉風險預測模型的構建與評估

2024-02-20 04:56:42李姣艷陳靜鋒王佑翔丁素英
鄭州大學學報(醫學版) 2024年1期
關鍵詞:模型研究

李姣艷,陳靜鋒,閆 肅,王佑翔,丁素英

1)鄭州大學公共衛生學院流行病學教研室 鄭州 450001 2)鄭州大學第一附屬醫院健康管理中心 鄭州 450052 3)河南省疾病預防控制中心傳染病預防控制所 鄭州 450016

有研究[1]報道,2020年全球結直腸癌(colorectal cancer,CRC)新發病例超過190萬,占全球腫瘤病例的10%;死亡病例93.5萬,占全球腫瘤相關死亡總數的9.4%。有數據[2]顯示我國CRC發病率已居所有惡性腫瘤的第2位,死亡率居第4位。河南省城市男性CRC中標發病率于2010~2018年呈上升趨勢,總體發病率隨年齡增加而升高[3],因此有必要積極推動CRC的預防控制工作。CRC主要有腺瘤-癌癥途徑、鋸齒狀病變途徑、炎癥途徑3個致癌途徑[4],其中60%~70%散發的CRC通過腺瘤-癌癥途徑,15%~30%由鋸齒狀病變致癌途徑[5],有不到2%的CRC通過炎癥相關致癌途徑發展而來。

結直腸息肉是CRC的必經階段,但是發展成CRC需要5~10 a的時間,這為早期診斷和臨床干預提供了很大的空間[4],且早期篩查、早診、早治可以有效降低CRC的死亡率,改善預后[5]。結腸鏡檢查是早期診斷CRC或結直腸息肉最有效的手段之一[6],但結腸鏡是一種侵入性檢查,需要嚴格的腸道準備,而且有穿孔、出血等風險,導致人群的依從性和參與率較低[7];因此,識別結直腸息肉的影響因素,建立結直腸息肉的預測模型尤為必要。近年來一些研究[8-9]表明,結直腸息肉的發生與性別、年齡、種族、飲食、生活行為習慣、腸道微生物、代謝綜合征、家族史等因素相關,但仍然存在爭議,且對常規體檢項目的研究相對較少。本研究基于健康體檢數據構建結直腸息肉預測模型,以期為篩查CRC高危人群提供支持。

1 對象與方法

1.1 研究對象數據來源于2016年11月至2021年10月在鄭州大學第一附屬醫院健康管理中心進行健康體檢的人群,選取其中同時進行結腸鏡檢查和血常規、生化指標檢測者。參照結直腸息肉診斷標準《胃腸道腺瘤和良性上皮性息肉的病理診斷共識》[10],分為息肉組和無息肉組。排除標準:①研究對象基本資料不全或腸道準備不充分者。②既往有炎癥性腸病、結腸黑變病、CRC等消化道疾病者。③嚴重心腦血管疾病、肝腎疾病、惡性腫瘤者等。本研究經鄭州大學第一附屬醫院醫學倫理委員會批準(2018-KY-56)。

1.2 數據收集收集研究對象的體檢數據,包括一般人口學特征和實驗室生化檢查指標共22個:性別、年齡、腰圍(waist circumference,WC)、收縮壓(systolic pressure,SBP)、舒張壓(diastolic pressure,DBP)、BMI、中性粒細胞絕對值(neutrophil,NEU)、淋巴細胞絕對值(lymphocyte,LYM)、總蛋白(total protein,TP)、白蛋白(albumin,ALB)、球蛋白(globulin,GLOB)、尿素(blood urea,BU)、腎小球濾過率(glomerular filtration rate,GFR)、總膽固醇(total cholestero,TC)、甘油三酯(triglyceride,TG)、高密度脂蛋白(high density lipoprotein cholesterol,HDL-C)、低密度脂蛋白(low density lipoprotein cholesterol,LDL-C)、空腹葡萄糖(fasting blood-glucose,FBG)、白球比(albumin/globulin ratio,AGR)、中性粒細胞淋巴細胞絕對值比值(neutrophil to lymphocyte ratio,NLR)、TG/HDL、甘油三酯葡萄糖指數(TyG),TyG=ln[TG(mg/dL)×FBG(mg/dL)/2]。

1.3 統計學處理采用SPSS 25.0與R 4.2.1進行數據分析。連續變量根據是否符合正態分布分別應用t檢驗或秩和檢驗,分類變量應用χ2檢驗進行組間比較。通過最小絕對收縮選擇算子(LASSO)回歸進行特征變量的篩選和復雜度調整,應用十折交叉驗證獲得最優的懲罰系數(λ),得到該模型最優的變量和變量系數。變量篩選后,將數據集按7∶3的隨機分組方式分為訓練集與測試集,在訓練集中分別構建梯度提升(categorical boosting,Catboost)、支持向量機(support vector machine,SVM)、Logistic回歸 (LR)預測模型,應用χ2檢驗比較3種模型的準確率,并進一步通過凈重新分類指數(net reclassification index,NRI)、綜合判別改善指數(integrated discrimination improvement,IDI)、ROC曲線下面積(area under curve,AUC)評估模型的預測性能,并對納入變量的重要性進行評估。檢驗水準α=0.05。

2 結果

2.1 結直腸息肉組和無息肉組的人口學特征和實驗室生化檢查項目比較本研究共納入4 997人,其中息肉組2 462人,無息肉組2 535人。息肉組的年齡、SBP、DBP、BMI、WC、NEU、LYM、BU、AGR、TC、TG、TG/HDL、FBG、TyG高于無息肉組,GFR、TP、ALB、GLOB、HDL-C低于無息肉組,差異均有統計學意義(P<0.05)。詳見表1。

表1 結直腸息肉組和無息肉組的人口學特征和實驗室生化檢查項目比較

2.2 特征變量的篩選結果對除性別外的數據進行處理后,使用LASSO 回歸篩選變量,建模和交叉驗證結果見圖1。選擇最小誤差一個方差以內的最大λ(0.031 2)為最佳λ,得到由性別、年齡、WC、BU、TP、GFR、TyG等7項特征變量組成的最簡單模型(特征變量之間不存在共線性),系數分別為0.526、0.036、0.008、0.021、-0.004、-0.009和0.121。

A:預測變量的LASSO系數路徑圖;B:LASSO正則化路徑圖(交叉驗證曲線);圖B中的兩條虛線從左至右分別表示兩個特殊的λ值,λmin=0.000 9和λ1se=0.031 2。前者為所有的λ值中誤差最低的值;后者為最小誤差一個方差范圍內得到最簡單模型的值(即λ1se給出的是一個具備優良性能且自變量個數最少的模型)。

2.3 風險預測模型的構建及評價結果按7∶3隨機分成兩組(訓練集3 499人,測試集1 498人,兩集間結直腸息肉構成比差異無統計學意義,χ2<0.001,P=0.997),分別構建預測結直腸息肉發生的Catboost、SVM、LR模型。對3種預測模型的準確率進行χ2檢驗,結果顯示差異有統計學意義(χ2=22.613,P<0.001),成對比較后Catboost、SVM模型的準確率顯著高于LR模型(P<0.05)。進一步采用NRI、IDI、ROC曲線評估3種模型的預測性能,結果分別見圖2、表2。

上:訓練集;下:測試集。

表2 3種模型的NRI與IDI比較

由圖2可知,在訓練集和測試集中SVM和Catboost模型的AUC均優于LR(訓練集中SVMvsLR:Z=15.609,P<0.001;CatboostvsLR:Z=15.136,P<0.001。測試集中SVMvsLR:Z=8.434,P<0.001;CatboostvsLR:Z=10.503,P<0.001),而SVM和Catboost模型訓練集差異有統計學意義(Z=3.703,P<0.001),測試集無統計學意義(Z=0.994,P=0.320)。表2結果表明SVM模型與LR、Catboost模型相比,對結直腸息肉發生的預測能力均更優(P<0.05)。

2.4 影響因素重要性排序結果見圖3。SVM模型中納入因素對結直腸息肉發生的重要性評估,從大到小依次為年齡、WC、GFR、TyG、性別、BU、TP;年齡的重要性最大,其次是WC。

圖3 SVM模型中預測變量的重要性排序

3 討論

CRC是威脅生命健康的主要癌癥之一,國家癌癥中心最新數據顯示,2016年我國CRC新增病例約40.8萬,占全部惡性腫瘤發病的10.04%,高于2015年的38.76萬例(9.87%);死亡病例19.56萬例,占全部惡性腫瘤死亡的8.10%,高于2015年的18.71萬例(8.01%)[2,11]。CRC篩查和早診早治是降低死亡率、減輕社會負擔的有效措施[6]。作為CRC的癌前病變,發現結直腸息肉發病的影響因素對預防CRC的發生有重要意義。

周海萍等[8]對8 660例正常受檢者進行橫斷面調查,發現男性、高齡、肥胖是結直腸腺瘤發生的危險因素;40~50歲人群有較高的結直腸腺瘤檢出率。魏鑼沛等[12]采用身高、體重、BMI、WC及腰圍身高比等多種身體測量指標探討肥胖與CRC的發病關系,發現WC和腰圍身高比與CRC表現出了較強的關聯。在本研究中WC被納入結直腸息肉預測模型的構建而不是BMI,且重要性居第2,得出了類似的結果。楊翡翠[13]研究結果表明2型糖尿病患者發生結直腸息肉及息肉惡變的風險升高。血脂水平異常也可影響結直腸息肉的發生[14]。可能的機制為高糖及血脂異常等代謝異常使得胰島素抵抗和胰島素樣生長因子(insulin like growth factor,IGF)水平增加,促進結直腸上皮細胞的增殖,同時抑制凋亡,促進腺瘤的發生;高TG水平可引發炎癥反應,上調轉化生長因子和IGF的表達,誘發氧化應激反應,導致DNA損傷;另外還可改變膽汁酸的分泌、循環激素、腫瘤細胞能量供應等[15-16]。目前對GFR、BU、TP與腸道腫瘤的研究較少,一些研究[17]表明胃腸道腫瘤與腎損害有一定的相關性,可能的機制為慢性腎臟疾病會增加促炎細胞因子的產生,從而通過炎癥介質誘導基因突變、適應性反應、抗凋亡和環境變化促進腫瘤的發生[18]。

選擇合理的指標是構建預測模型的關鍵。目前有一些關于結直腸息肉的風險預測模型研究[19-20],但預測性能各不一致。馮心怡[19]通過健康體檢數據建立預測模型,將年齡、性別、WC、嗜酸性粒細胞計數和LHR(LDL-C/HDL-C)納入模型,訓練集AUC(95%CI)為0.678(0.649~0.708),驗證集AUC(95%CI)為0.679(0.639~0.729)。本研究基于常規體檢數據構建Catboost、SVM、LR預測模型,在測試集中SVM與Catboost模型的AUC大于LR模型,NRI和IDI分析結果顯示SVM模型相較于Catboost和LR模型預測效能更優(NRI和IDI均>0)。

本研究的局限性:①這是一項單中心研究,可能會導致選擇偏倚,使得模型的擴展性存在局限。②缺乏一些流行病學及生活方式的資料,如家族史、吸煙史、飲酒史、飲食情況等,可能會影響研究的結果。③該研究為橫斷面研究,僅能提供病因線索,無法進行更深層次的研究,主要是由于腸鏡檢查的大眾接受度仍然較低,很難獲得研究對象的連續資料。

綜上,基于常規的體檢項目中性別、年齡、WC、BU、TP、GFR、TyG等7項指標構建的SVM預測結直腸息肉風險模型具備良好的預測價值,可能會幫助特定人群更早地發現CRC,以改善預后。

猜你喜歡
模型研究
一半模型
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲另类色| 亚洲国产日韩在线观看| 中文字幕有乳无码| 亚洲精品免费网站| 色综合网址| 99久久国产自偷自偷免费一区| 日韩黄色在线| AV老司机AV天堂| 男女猛烈无遮挡午夜视频| 亚洲中文字幕久久精品无码一区| …亚洲 欧洲 另类 春色| 日本www在线视频| 久久国产高潮流白浆免费观看| 国产福利大秀91| 91亚洲国产视频| 国产午夜在线观看视频| 色综合五月| 国产视频大全| 亚洲精品你懂的| 91在线精品免费免费播放| 人妻无码一区二区视频| 亚洲天堂网在线观看视频| 国产成人免费视频精品一区二区| 91精品视频网站| 国产在线观看一区精品| 久久久久久国产精品mv| 国产91九色在线播放| 久久久久青草大香线综合精品| 婷婷综合在线观看丁香| 丰满的熟女一区二区三区l| 午夜国产在线观看| 91精品啪在线观看国产91| 日本欧美视频在线观看| 久久伊人色| 亚洲人在线| 青青青视频91在线 | 99热这里只有精品久久免费| 色婷婷成人| 久久五月视频| 日韩精品一区二区深田咏美| 永久在线精品免费视频观看| 久久综合伊人77777| 久久精品无码中文字幕| 都市激情亚洲综合久久| 日本成人在线不卡视频| 伊人久久青草青青综合| 日韩精品成人网页视频在线| 亚洲综合第一区| 久久综合色天堂av| 欧美不卡视频一区发布| 国产福利免费观看| 福利一区三区| 制服丝袜国产精品| 亚洲 欧美 偷自乱 图片| 亚洲久悠悠色悠在线播放| 狠狠综合久久| 亚洲欧美日韩色图| 日韩精品一区二区三区中文无码| 黄色网在线| 91精品专区国产盗摄| 青青操视频在线| 欧美人人干| 97se亚洲| 亚洲欧美日韩精品专区| 99视频在线精品免费观看6| 久久久久国产精品嫩草影院| 国产精品第一区| 亚洲香蕉伊综合在人在线| av一区二区三区高清久久| 在线国产毛片手机小视频| 97国产在线视频| 在线国产毛片手机小视频| 欧美一级高清免费a| 四虎永久在线精品国产免费| 国产成熟女人性满足视频| 一级做a爰片久久毛片毛片| 国产一级片网址| 亚卅精品无码久久毛片乌克兰| 污网站在线观看视频| 蜜桃视频一区| 日韩在线成年视频人网站观看| 亚洲黄色片免费看|