999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于metaPRS與APOEε4優化輕度認知障礙遺傳風險統計建模策略的應用研究

2023-12-31 00:00:00李梓盟王榮陳帥趙彩麗王曉聰溫雅璐劉龍
中國全科醫學 2023年25期

【摘要】 背景 輕度認知障礙(MCI)是干預和延緩癡呆進展的重要階段,既往研究發現MCI與遺傳因素存在緊密關聯,且載脂蛋白E(APOE)ε4是醫學界公認的MCI重要風險等位基因。由于缺少MCI的全基因組關聯研究(GWAS)匯總數據,當前普遍以阿爾茨海默病(AD)的GWAS匯總數據作為Base數據集來計算MCI的多基因風險評分(PRS),致使MCI的PRS遺傳風險預測效果并不理想。目的 本研究以多基因遺傳風險綜合評分(metaPRS)與APOEε4作為重要預測因子,從廣義線性模型與機器學習角度,探索并優化MCI的遺傳風險統計建模策略。方法 計算MCI的12個亞表型PRS,并利用彈性網狀Logistic回歸模型將其整合為MCI的metaPRS。利用年齡矯正的APOEε4效應量計算APOEε4加權總和(SCOREAPOE)。以metaPRS、SCOREAPOE及基本人口學信息(年齡、性別、受教育程度)構建不同的預測因子納入策略,以XGBoost、GBM、Logistic回歸及Lasso回歸作為統計建模方法,采用AUC及F-measure評價MCI遺傳風險統計建模的預測效果。結果 metaPRS與SCOREAPOE對于MCI的遺傳風險有較高的預測價值,納入metaPRS、SCOREAPOE及基本人口學信息(年齡、性別、受教育程度)后,各個統計建模方法的預測效果為:XGBoost(AUC=0.69,F-measure=0.88),GBM(AUC=0.76,F-measure=0.87),Logistic回歸(AUC=0.77,F-measure=0.89),Lasso回歸(AUC=0.76,F-measure=0.92)。結論 在樣本量為325(lt;500)的情況下,以metaPRS、SCOREAPOE 與基本人口學信息為預測因子,以Lasso回歸為統計建模方法的MCI遺傳風險預測效果最好。本研究為MCI等復雜疾病的遺傳風險統計建模提供了新的思路與視角。

【關鍵詞】 輕度認知障礙;多基因風險評分;多基因遺傳風險綜合評分;載脂蛋白Eε4;遺傳風險預測;統計建模優化

【中圖分類號】 R 741 【文獻標識碼】 A DOI:10.12114/j.issn.1007-9572.2022.0756

【引用本文】 李梓盟,王榮,陳帥,等. 基于metaPRS與APOEε4優化輕度認知障礙遺傳風險統計建模策略的應用研究[J].中國全科醫學,2023,26(25):3104-3111. DOI:10.12114/j.issn.1007-9572.2022.0756. [www.chinagp.net]

【Abstract】 Background Mild cognitive impairment(MCI) is an important stage to intervene and delay the progression of dementia,and it has been shown closely associated with genetic factors,among which apolipoprotein E(APOE) ε4 is recognized as an important risk allele of MCI in the medical field. Due to the lack of Genome-Wide Association Study(GWAS) summary data of MCI,it is common to use the GWAS summary data of Alzheimer's disease(AD) as the base dataset to calculate the polygenic risk score(PRS) of MCI,resulting in suboptimal PRS genetic risk prediction for MCI. Objective To explore the and optimize the statistical modeling strategy of genetic risk in MCI from the perspective of generalized linear model and machine learning,using meta-polygenic risk score(metaPRS) and APOEε4 as important predictors. Methods PRS for the 12 MCI-related traits were calculated and integrated into metaPRS for MCI by elastic-net Logistic regression model. SCOREAPOE was calculated by weighting the APOEε4 effect size with age correction. XGBoost,GBM,Logistic regression and Lasso regression were used as statistical modeling methods to verify the inclusion strategies of different predictors based on metaPRS,SCOREAPOE and basic demographic information(age,gender,education level). AUC and F-measure were used to evaluate the predictive effect of statistical modeling of genetic risk of MCI. Results metaPRS and SCOREAPOE have high predictive value for the genetic risk of MCI. After including metaPRS,SCOREAPOE and basic demographic information(age,gender,education level),the predictive effect of each statistical modeling method is XGBoost(AUC=0.69,F-measure=0.88),GBM(AUC=0.76,F-measure=0.87),Logistic regression(AUC=0.77,F-measure=0.89),and Lasso regression(AUC=0.76,F-measure=0.92). Conclusion When the sample size is 325(less than 500),the Lasso regression model constructed by including metaPRS,SCOREAPOE and basic demographic information(age,gender,education level) as predictors has the best effect on MCI genetic risk prediction,providing a new idea and perspective for statistical modeling of genetic risk of complex diseases such as MCI.

【Key words】 Mild cognitive impairment;Polygenic risk score;MetaPRS;APOEε4;Genetic risk prediction;Statistical modeling optimization

輕度認知障礙(mild cognitive impairment,MCI)是干預和延緩癡呆進展的重要階段[1]。研究發現,MCI是遺傳與環境因素共同作用的結果,且載脂蛋白E(apolipoprotein E,APOE)ε4與MCI高度相關[2]。多基因風險評分(polygenic risk score,PRS)是常用的復雜疾病遺傳風險預測方法。由于MCI特殊的疾病狀態,鮮有關于MCI的國際公開全基因組關聯研究(Genome-Wide Association Study,GWAS)匯總數據。目前普遍以阿爾茨海默病(Alzheimer's disease,AD)的GWAS匯總數據作為Base數據集用于MCI的PRS計算,導致MCI遺傳風險的預測效果并不理想,關于MCI的遺傳風險預測模型受試者工作特征曲線下面積(AUC)普遍徘徊在0.58~0.68[3]。ABRAHAM等[4]提出了多基因遺傳風險綜合評分(meta-polygenic risk score,metaPRS),其通過有效整合該疾病的多個亞表型PRS來進一步提高遺傳風險的預測精度,且metaPRS已在缺血性腦卒中、抑郁癥和冠心病等疾病中得到很好應用。此外,相關研究表明,基本人口學信息(年齡、性別、受教育程

度)[5]和APOEε4加權總和(SCOREAPOE)[6]對MCI具有較高的預測價值,值得進一步探索。

MCI遺傳風險統計建模方法主要包括廣義線性模型(generalized linear model,GLM)和機器學習(machine learning,ML)兩類。復雜疾病遺傳風險預測統計建模通常需滿足兩個基本特性:一方面該模型可以處理非正態分布的表型,另一方面能夠解決預測因子之間可能存在的復雜函數關系問題。GLM中的Lasso回歸是一種使用L1正則化的線性回歸,與Logistic回歸相比更具稀疏性,能夠篩選重要的預測因子,且模型可解釋性強。與GLM相比,ML中的XGBoost(eXtreme Gradient Boosting)和GBM(Gradient Boosting Machine)則是通過訓練多個弱監督模型后將其組合成為更穩健的強監督模型,更適用于捕捉變量間復雜的函數關系,但多數ML算法的內部結構并不透明,在可解釋性方面劣于GLM。

本研究以metaPRS、SCOREAPOE與基本人口學信息作為MCI遺傳風險統計建模的預測因子,特別是考慮到以上預測因子間可能存在的復雜函數關系及復雜的表型數據特征,從GLM和ML角度,以XGBoost、GBM、Logistic回歸及Lasso回歸作為統計建模方法,探索并優化MCI遺傳風險統計建模策略,為MCI等復雜疾病的高危人群識別、早期預防與干預及精準醫學研究提供新的視角和科學依據。

1 資料與方法

1.1 數據來源 MCI遺傳風險預測研究所需的基本人口學信息和基因組學數據來自英國生物數據庫(United Kingdom Biobank,UKB)與阿爾茨海默病神經成像計劃(Alzheimer's Disease Neuroimaging Initiative,ADNI)。UKB是一個大型前瞻性隊列研究及生物醫學數據庫,主要收集了認知功能測試、血壓、身體測量、血液檢查、基因測序、全身影像(如腦部MRI與心臟MRI)和隨訪等多方面的數據。ADNI是一項大規模的隊列研究,主要收集了受試者的人口統計學變量(如年齡、性別、受教育程度)、腦部影像學數據、生物學標志物和基因測序數據。

本研究主要集中于腦結構成像表型,不僅準確選取了4種主要的大腦組織結構〔白質體積(White matter)、灰質體積(Grey matter)、腦脊液體積(Cerebrospinal fluid,CSF)和總腦體積(Total brain)〕,還納入了既往研究表明與MCI相關的腦結構成像表型〔白質高信號體積(White matter hyperintensities,WMH)、蒼白球體積(Pallidum)、尾狀核體積(Caudate)、海馬體體積(Hippocampus)、杏仁核體積(Amygdala)、伏隔核體積(Accumbens)、殼核體積(Putamen)和丘腦體積(Thalamus)〕[7-8]。

1.2 質量控制 由于UKB數據庫納入人群均為白人,為控制人口結構可能帶來的混雜,經過主成分分析(見附錄材料1~3,http://cstr.cn/31253.11.sciencedb.j00150.00009),本研究只保留了ADNI數據庫中的非西班牙裔白種人,使得本研究使用的ADNI與UKB數據庫在人口結構上相似。采用PLINK 1.9去除個體缺失率gt;10%的人群,去除基因型缺失率gt;10%的單核苷酸多態性(single nucleotide polymorphisms,SNPs)。數據質量得到控制后,根據物理位置提取UKB與ADNI數據庫共同的SNPs。最終UKB數據庫得到488 371個個體,694 020個SNPs,以此對各亞表型進行GWAS研究獲得所需的GWAS匯總數據;ADNI數據庫得到325個個體,694 020個SNPs。

1.3 研究方法 本研究從研究設計上分為3個階段:(1)在ADNI數據集中,計算MCI的12個亞表型PRS;(2)基于彈性網狀Logistic回歸模型整合12個亞表型PRS,并計算MCI的metaPRS;(3)通過10折交叉驗證對不同預測因子納入策略及不同預測方法性能進行驗證(圖1)。

1.3.1 全基因組關聯研究 GWAS將SNPs位點與性狀進行群體水平的統計學分析,識別和描述SNPs與疾病進展或疾病結局之間的關聯[9]。GWAS的研究結果主要通過Quantile-Quantle(Q-Q)圖和曼哈頓圖進行可視化,曼哈頓圖表示SNPs的顯著性水平,Q-Q圖表示在SNPs水平上檢驗統計量的期望和分布之間的關系,λ-統計量評估是否有必要納入主成分控制群體分層[9]。

1.3.2 metaPRS的構建 (1)使用PRS的經典構建方法C+T(clumping and threshold)計算各個亞表型PRS,PRS為每個SNPs的風險等位基因的個數乘以其各自的效應量,構建公式為PRSi=∑mj=1βjXij,i是第i個個體,j是第j個SNP,β是GWAS匯總數據的效應值,Xij是第i個個體第j個SNP風險等位基因的個數。(2)在ADNI數據庫(n=325)中隨機抽出30%的個體,采用彈性網狀Logistic回歸模型整合12個亞表型PRS,在最終模型中獲得每個亞表型PRS的系數(β1……βk)作為權重[4,10]以構建metaPRS的預測模型。(3)利用βsnp_i=β1/σ1×αj1+……+βk/σk×αjk將亞表型PRS水平的權重轉換為SNPs水平的權重,其中,σ1……σk是訓練集中每個亞表型PRS的標準差,αj1……αjk是第i個SNP的等位基因對應于每個亞表型的效應值,如果第k個評分中未包含某個SNP,則該SNP的效應值大小αjk設為0。(4)根據公式metaPRS=∑βsnp_i ×Ni計算metaPRS,其中,βsnp_i是第i個SNP的效應值,Ni是個體所攜帶第i個SNP的效應等位基因數目。

1.3.3 預測因子納入策略 本研究的預測因子納入策略基于基本人口學信息和遺傳信息進行構建,由于在APOEε4的連鎖不平衡區域中rs429358是最顯著的位點,所以選擇rs429358代表APOEε4[11]。且APOEε4的等位基因頻率隨著年齡的變化而變化[12],所以本研究選擇通過βAPOEε4=lnOR計算以年齡矯正的APOEε4效應量(個體年齡≤60歲,βAPOEε4=0.542;60歲lt;個體年齡≤70歲,βAPOEε4=0.419;70歲lt;個體年齡≤80歲,βAPOEε4=0.577;個體年齡gt;80歲,βAPOEε4=0.425[13]),并單獨計算APOEε4的加權總和[6],其公式為SCOREAPOE-i=βXi,其中,i是第i個個體,β是APOEε4的效應量,Xi是第i個個體rs429358風險等位基因的個數。本研究的預測因子納入策略見表1。

1.3.4 統計建模方法 (1)XGBoost算法是CHEN等[14]提出的基于集成學習的ML算法。XGBoost的基本思想是利用函數的二階導數信息來訓練樹模型,并把樹模型復雜度作為正則化項加到目標函數中,使學習到的模型泛化能力更高。其目標函數為L(φ)=∑il(i ,yi) +∑kΩ(fk),損失函數為l(i ,yi),正則化項為Ω(f)=γΤ+1/2λ‖ω‖2,其中,Τ代表葉子節點的個數,ω表示葉子節點的分數。正則化項表示樹的復雜度的函數,值越小,則復雜度越低,泛化能力越強。

(2)GBM是ML中常用算法,該算法由大量簡單的決策樹集合而成,利用迭代多棵決策樹不斷學習殘差,減小損失函數的值來調整模型,具有較高的可解釋性[15]。GBM在沒有先驗數據結構的情況下,可以對表型及其預測因子之間的關系建模,被認為是一種泛化能力較強的算法。GBM可以表示為一組加性回歸模型:y*=1μ+∑Mm=1?hm(y*;X)+e。其中,y*是表型,X是預測因子,e是殘差,?用于控制每次迭代時從殘差中減去的方差,從而在模型數量和預測因子相關性之間進行權衡。實際上,較小的?需要組合更多的模型,以在訓練集中達到相同的錯誤率,且會在驗證集上產生更好的預測性能。

(3)Logistic回歸是預測結局變量為二分類變量時最為常用的統計模型,其通用形式如下:Logit(P)=Log[P/(1-P)]=a+b1x1+……+bmxm。其中,x1……xm為預測因子,b1……bm為m個預測因子的回歸系數。Logistic回歸表達式經過簡單變換,可得預測事件的概率P,表達式為P=[exp(a+b1x1+……+bmxm)]/[1+exp(a+b1x1+……+bmxm)]。

(4)Lasso回歸由TIBSHIRANI[16]于1997年提出,旨在構建性能最佳的懲罰線性模型。在Lasso回歸中較大的懲罰會導致一些預測因子的回歸系數接近零,回歸系數變為零的預測因子會被從模型中刪除。Lasso回歸具有較強的稀疏回歸系數向量的能力,可為模型選擇有用的特征,具有更高的模型性能。

1.4 統計學方法 所有統計學分析均通過R 4.1.0軟件完成。計數資料以頻數和百分比表示,計量資料以(x-±s)表示。XGBoost、GBM、Logistic回歸和Lasso回歸分別采用XGBoost包、gbm包、stats包和glmnet包。所有預測模型采用10折交叉驗證方法驗證預測性能,評價指標采用F1分數(F-measure)與AUC。F-measure 是常用于評價二分類模型的信度指標,其數值越大,表示模型對于精確率和召回率的平衡效果越好且分類模型信度越高。

2 結果

2.1 研究對象基本信息 MCI個體平均年齡(70.7±7.0)歲,正常認知個體平均年齡(74.3±5.7)歲;MCI個體APOEε4等位基因頻率為45.8%,正常認知個體APOEε4等位基因頻率為27.9%,見表2。

2.2 全基因組關聯研究 參閱以往相關研究[17-18],本研究選擇了Bonferroni顯著水平(Plt;5×10-8)和Bonferroni閾值水平(Plt;5×10-6)用于判斷多個亞表型GWAS匯總數據是否為有研究價值的SNPs。本研究計算了12個亞表型的λ-統計量且其都接近于1,這說明群體分層得到了適當的調整,見圖2。Amygdala、Caudate、CSF、Pallidum、Putamen及WMH表型存在達到Bonferroni顯著水平Plt;5×10-8(第一條水平線)的SNPs,這些SNPs位點所在的基因是AD的候選基因[19]。Accumbens、Grey matter、Hippocampus、Thalamus、Total brain及White matter表型在Plt;5×10-6(第二條水平線)的閾值水平上存在許多顯著相關的SNPs。

2.3 metaPRS的構建 計算各預測因子之間的Pearson相關系數,如圖3所示,各預測因子之間存在不同程度的相關性,如PRSHippocampus和metaPRS(r=-0.6)、PRSWMH和metaPRS(r=0.5)、PRSPallidum和metaPRS(r=-0.5)、PRSCSF和PRSAccumbens(r=-0.4)、PRSCSF和PRSTotal brain(r=-0.4)、PRSTotal brain和PRSGrey mattter(r=-0.4)及PRSAccumbens和PRSThalamus(r=0.4)。

2.4 不同預測因子納入策略的驗證 A組對策略一與策略二(相較于策略一,策略二加入了SCOREAPOE)進行比較,B組對策略三與策略四(相較于策略三,策略四加入了SCOREAPOE)進行比較,結果顯示加入SCOREAPOE策略的趨勢明顯高于未加入SCOREAPOE策略,說明APOEε4預測MCI的作用得到了驗證。C組對策略二與策略四(相較于策略二,策略四加入了metaPRS)進行比較,在4種統計建模方法上策略四的趨勢高于策略二,即基于metaPRS優化的預測因子納入策略優于基于12種亞表型的PRS的預測因子納入策略,見圖4。

2.5 統計建模效果的評價 總體來說,Lasso回歸的預測性能高于其他3種統計建模方法。A組中,不同預測因子納入策略下Lasso 回歸的F-measure高于其他3種統計建模方法;在策略四(metaPRS和SCOREAPOE)中,不同統計建模方法的F-measure分別為:XGBoost(F-measure=0.88),GBM(F-measure=0.87),Logistic 回歸(F-measure=0.89),Lasso 回歸(F-measure=0.92)。B組中,在策略四上不同統計建模方法的AUC離散程度大體一致,其中位數分別為:XGBoost(AUC=0.69),GBM(AUC=0.76),Logistic 回歸(AUC=0.77),Lasso 回歸(AUC=0.76),見圖5。

3 討論

本研究以12個亞表型的PRS、metaPRS、SCOREAPOE及基本人口學信息作為MCI統計建模的預測因子,以XGBoost、GBM、Logistic回歸及Lasso回歸作為MCI統計建模的方法,探索并構建了適用于MCI遺傳風險預測的統計建模策略。特別是,研究發現,metaPRS與SCOREAPOE對于MCI的遺傳風險具有較高預測價值,且在樣本量不高(lt;500)的情況下,Lasso回歸是MCI遺傳風險統計建模比較理想的方法。

研究發現,對APOEε4效應量進行年齡矯正后加權算分并作為預測因子納入預測模型會明顯提高MCI的預測分類效果,這說明SCOREAPOE對預測MCI具有重要意義。已有研究表明在人群中APOEε4的等位基因頻率會隨著年齡的增長而下降,且APOEε4效應量受年齡影響[12],本研究再次驗證利用經過年齡矯正的APOEε4效應量并加權算分作為獨立預測因子納入預測模型的合理性與科學性。本研究還發現,基于metaPRS的預測因子納入策略優于基于12個亞表型PRS的預測因子納入策略及既往對于MCI的預測策略,且基于metaPRS和SCOREAPOE的預測因子納入策略優于其他3種預測因子納入策略。既往對于MCI的預測都是通過AD的GWAS匯總數據構建的PRS實現的,使用AUC評估預測效果為0.58~0.68[3]。這是因為既往的GWAS匯總數據是關于AD的二分類變量,而本研究是選取與MCI相關的12個腦成像表型,合理整合有相關性的12個亞表型PRS構建metaPRS,并選用了XGBoost、GBM、Logistic回歸及Lasso回歸進行分析比較,最終得到性能高的模型。因此,在未來MCI遺傳風險預測的研究中,可以更多地關注相關預測因子的挖掘及整合預測因子方法的開發。雖然MCI的預測模型尚未達到臨床診斷所需的水平,但與之前的研究相比,本研究取得了積極進展。

本研究綜合F-measure與AUC兩個評價指標,結果顯示Lasso回歸的預測效果最好。一方面,在策略一(MCI的12個亞表型)和策略二(MCI的12個亞表型和SCOREAPOE)中,Lasso回歸優于其他3種統計建模方法,主要是 Lasso回歸具有更強的稀疏回歸系數向量的能力,懲罰線性回歸更適用于基于有相關性的多個亞表型構建遺傳風險預測模型。另一方面,在策略三(metaPRS)和策略四(metaPRS和SCOREAPOE)中,XGBoost劣于其他3種統計建模方法,原因可能是本研究的樣本量較小,XGBoost相比于Lasso回歸需要更大的樣本量才能體現其性能優勢。CHRISTODOULOU等[20]開展了一項綜述研究,匯集了75項研究的數據,其樣本量中位數為1 250(樣本量范圍為72~3 994 872),最終發現相比于Logistic回歸,ML在預測結果上沒有明顯優勢。相關研究也表明,在多種ML方法(樸素貝葉斯、XGBoost、支持向量機等)中,XGBoost的性能最佳,但其預測效果非常依賴于樣本量大小,在樣本量lt;500的情況下,與其他ML方法相比沒有明顯優勢[21]。

由于本研究訓練集樣本量不夠大,可能會影響研究結果的泛化能力,且本研究的基因組學數據是來自UKB和ADNI兩個數據庫交叉合并的共同物理位置SNPs,可能會遺失與MCI相關的遺傳信息。因此,建議未來在開展基因測序工作時考慮一些罕見變異的測量。此外,本研究僅采用了4種統計建模方法,未來可進一步探索其他可能提高MCI遺傳風險預測精度的方法,并考慮構建全新的統計模型。

綜上,以metaPRS、SCOREAPOE與基本人口學信息(年齡、性別和受教育程度)作為預測因子,以Lasso回歸作為MCI遺傳風險統計建模方法的統計建模策略取得了較理想的預測效果,有助于為MCI精準醫療及早期干預提供科學依據,具有一定的臨床應用價值。必要情況下,將MCI的遺傳風險預測作為健康體檢項目或者相關門診的常規篩查項目,可以很大程度上提高MCI的檢出率,進而實現MCI的早期干預,有效降低家庭及社會的疾病負擔。

數據可用性聲明:支撐本研究的科學數據已在中國科學院數據銀行ScienceDB公開發布,訪問地址為http://cstr.cn/31253.11.sciencedb.j00150.00009,DOI:10.57760/sciencedb.j00150.00009,CSTR:31253.11.sciencedb.j00150.00009。

作者貢獻:李梓盟負責提出研究選題方向、對文章進行可行性分析、對結果進行解釋分析、論文撰寫與修訂;王榮、陳帥、趙彩麗負責文獻/資料收集、翻譯與整理;王曉聰負責搜集數據;溫雅璐、劉龍負責核心督導,對文章整體負責;所有作者確認了論文的最終稿。

本文無利益沖突。

參考文獻

ANDERSON N D. State of the science on mild cognitive impairment(MCI)[J]. CNS Spectrums,2019,24(1):78-87.

LUO Y,TAN L,THERRIAULT J,et al. The role of apolipoprotein E ε4 in early and late mild cognitive impairment[J]. European Neurology,2021,84(6):472-480.

LEONENKO G,SHOAI M,BELLOU E,et al. Genetic risk for Alzheimer disease is distinct from genetic risk for amyloid deposition[J]. Annals of Neurology,2019,86(3):427-435.

ABRAHAM G,MALIK R,YONOVA-DOING E,et al. Genomic risk SCORE offers predictive performance comparable to clinical risk factors for ischaemic stroke[J]. Nature Communications,2019,10(1):1-10.

RITCHIE K. Mild cognitive impairment:an epidemiological perspective[J]. Dialogues Clin Neurosci,2004,6(4):401-408.

LEONENKO G,BAKER E,STEVENSON-HOARE J,et al. Identifying individuals with high risk of Alzheimer's disease using polygenic risk SCOREs[J]. Nat Commun,2021,12(1):4506.

VAN DEN BERG E,GEERLINGS M I,BIESSELS G J,et al. White matter hyperintensities and cognition in mild cognitive impairment and Alzheimer's disease:a domain-specific meta-analysis[J]. Journal of Alzheimer's Disease,2018,63(2):515-527.

ZACKOVá L,JáNI M,BRáZDIL M,et al. Cognitive impairment and depression:meta-analysis of structural magnetic resonance imaging studies[J]. Neuroimage Clin,2021,32:102830.

REED E,NUNEZ S,KULP D,et al. A guide to genome-wide association analysis and post-analytic interrogation[J]. Statistics in Medicine,2015,34(28):3769-3792. DOI:10.1002/sim.6605.

牛曉歌. 基于大型前瞻性隊列構建和評價中國人群腦卒中多基因遺傳風險評分[D]. 北京:北京協和醫學院,2021.

ANDREWS S J,FULTON-HOWARD B,GOATE A. Interpretation of risk loci from genome-wide association studies of Alzheimer's disease[J]. Lancet Neurology,2020,19(4):326-335.

BELLOU E,BAKER E,LEONENKO G,et al. Age-dependent effect of APOE and polygenic component on Alzheimer's disease[J]. Neurobiology of Aging,2020,93:69-77.

BONHAM L W,GEIER E G,FAN C C,et al. Age-dependent effects of APOE epsilon4 in preclinical Alzheimer's disease[J]. Ann Clin Transl Neurol,2016,3(9):668-677.

CHEN T,GUESTRIN C. XGBoost:A scalable tree boosting system. KDD'16: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,August 2016:785-794[Z]. 2016

EATON J E,VESTERHUS M,MCCAULEY B M,et al. Primary sclerosing cholangitis risk estimate tool(PREsTo) predicts outcomes of the disease:a derivation and validation study using machine learning[J]. Hepatology,2020,71(1):214-224.

TIBSHIRANI R. The lasso method for variable selection in the Cox model[J]. Statistics in Medicine,1997,16(4):385-395.

DUDBRIDGE F,GUSNANTO A. Estimation of significance thresholds for genomewide association scans[J]. Genetic Epidemiology,2008,32(3):227-234.

EDMONDSON A C,BRAUND P S,STYLIANOU I M,et al. Dense genotyping of candidate gene loci identifies variants associated with high-density lipoprotein cholesterol[J]. Circ Cardiovasc Genet,2011,4(2):145-155.

LI J,LU Q,WEN Y. Multi-kernel linear mixed model with adaptive lasso for prediction analysis on high-dimensional multi-omics data[J]. Bioinformatics,2020,36(6):1785-1794.

CHRISTODOULOU E,MA J,COLLINS G S,et al. A systematic review shows no performance benefit of machine learning over logistic regression for clinical prediction models[J]. Journal of Clinical Epidemiology,2019,110:12-22.

RáCZ A,BAJUSZ D,HéBERGER K. Effect of dataset size and train/test split ratios in QSAR/QSPR multiclass classification[J]. Molecules,2021,26(4):1111.

(收稿日期:2022-11-16;修回日期:2023-04-10)

(本文編輯:張亞麗)

主站蜘蛛池模板: 人妻精品全国免费视频| 99视频只有精品| 国产91丝袜在线播放动漫| 22sihu国产精品视频影视资讯| 亚洲日韩Av中文字幕无码| 国产香蕉在线视频| 亚洲欧美精品在线| 国产精品播放| 亚洲AV免费一区二区三区| 国产精品亚洲综合久久小说| 久久人搡人人玩人妻精品一| 欧美日韩va| 亚洲第一天堂无码专区| 免费国产好深啊好涨好硬视频| 欧美一级专区免费大片| 亚洲欧洲日韩国产综合在线二区| 中文字幕亚洲乱码熟女1区2区| 亚洲成网777777国产精品| 国产精品美女网站| 99re在线观看视频| 97色婷婷成人综合在线观看| 国产在线观看一区精品| 最新国产你懂的在线网址| 久久亚洲高清国产| 日韩国产精品无码一区二区三区| 天堂在线www网亚洲| 亚洲国产精品日韩av专区| Aⅴ无码专区在线观看| 国产在线欧美| 香蕉视频在线精品| 思思99热精品在线| 久久综合色视频| 亚洲色婷婷一区二区| 国产91在线|日本| 亚洲an第二区国产精品| 3p叠罗汉国产精品久久| 9丨情侣偷在线精品国产| 青青青视频91在线 | 亚洲欧美一区二区三区蜜芽| 色网站在线视频| 精久久久久无码区中文字幕| 黄色网址免费在线| 欧美69视频在线| 亚洲国产精品无码AV| 日本人妻丰满熟妇区| 色视频国产| 亚洲精品片911| 手机在线免费不卡一区二| 久热re国产手机在线观看| 国产草草影院18成年视频| 久久这里只有精品66| 欧美福利在线观看| 亚洲av无码牛牛影视在线二区| 国产综合亚洲欧洲区精品无码| 亚洲成人77777| 久久国产精品嫖妓| 午夜丁香婷婷| 亚洲性一区| 国产午夜看片| 日韩欧美网址| 毛片免费试看| 国产精品片在线观看手机版| 久久情精品国产品免费| 欧美成人午夜影院| 欧美狠狠干| 国产女主播一区| 日韩精品免费在线视频| 三上悠亚在线精品二区| 青青青亚洲精品国产| 国产原创自拍不卡第一页| 波多野结衣中文字幕一区二区| 欧美精品亚洲二区| 黄片在线永久| 国产成年无码AⅤ片在线| 日本午夜影院| 亚洲无线视频| a在线亚洲男人的天堂试看| 国产精品大尺度尺度视频| 免费aa毛片| 国产精品一线天| 国产亚洲精久久久久久久91| 国产精品毛片在线直播完整版|