李淑娟,柯妍,劉旭東,賀茜,徐遙琴,田宇佳,盧冠軍,馬娟,朱澈,汪樂新,
作者單位:1.750004 寧夏回族自治區銀川市,寧夏醫科大學總醫院急診科 2.750003 寧夏回族自治區銀川市第一人民醫院全科醫學科 3.750004 寧夏回族自治區銀川市,寧夏醫科大學總醫院心胸外科 4.750004 寧夏回族自治區銀川市,寧夏醫科大學 5.750001 寧夏回族自治區銀川市婦幼保健院兒科
急性心肌梗死(acute myocardial infarction,AMI)指動脈內壁斑塊導致流向心臟的血液減少甚至中斷,進而使心肌細胞發生缺血缺氧性損傷[1]。但心肌細胞是永久性細胞,其損傷后一般不能再生[2],故早期篩查AMI高風險人群具有重要的現實意義。近年來生物信息學技術在疾病診斷和預測方面應用廣泛,而基因代謝組學作為生物信息學技術,其主要探究基因與疾病的關系[3-4]。目前,基于基因代謝組學探究肝癌、胃癌等核心基因的文獻較多[5-6],但應用該技術篩選AMI核心基因的報道較少。機器學習是基于數據構建的計算模型。本研究旨在通過生物信息學技術和機器學習算法篩選AMI核心基因并進行驗證,現報道如下。
本實驗時間為2021—2022年。
1.2.1 數據來源
從美國國立生物技術信息中心(National Center for Biotechnology Information,NCBI)的高通量基因表達(Gene Expression Omnibus,GEO)數據庫(https://www.ncbi.nlm.nih.gov/geo/)下載與AMI相關的3個mRNA基因芯片數據集(GSE34198、GSE66360和GSE83500),其中GSE66360〔非AMI患者20例(對照組),AMI患者17例(AMI組)〕和GSE83500〔健康對照者46例(對照組),AMI患者49例(AMI組)〕為測試集,GSE34198〔健康對照者46例(對照組),AMI患者49例(AMI組)〕為驗證集。
1.2.2 篩選差異表達基因
運用R 4.2.0軟件中的“limma包”,以|log2FC|>1、P<0.05為標準,篩選GSE66360和GSE83500中差異表達基因。
1.2.3 GO功能富集分析、KEGG通路富集分析
應用差異表達基因數據軟件對差異表達基因進行GO功能富集分析,分析其主要富集的生物過程(biological process,BP)、細胞成分(cellular component,CC)、分子功能(molecular function,MF);通過Metascape官網(https://metascape.org)對差異表達基因進行KEGG通路富集分析。
使用LASSO回歸方法縮小差異表達基因的范圍,然后使用支持向量機-遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)方法在差異表達基因中尋找特征基因,取兩種機器學習算法的交集,即為核心基因。
比較測試集中AMI組和對照組核心基因表達水平,繪制ROC曲線以評估核心基因表達水平對測試集、驗證集受試者發生AMI的預測價值,AUC為0.5~1.0,其值越大提示核心基因表達水平對AMI的預測價值越高。
1.5.1 實驗細胞
大鼠心肌細胞株H9C2購自武漢普諾賽生物科技有限公司。
1.5.2 主要實驗試劑與儀器
胎牛血清(Gibco,美國),DMEM 培養基(Gibco,美國),總RNA提取試劑盒(Axygen,美國),PrimeScript? RT reagent Kit(Takara,日本),TB Green? Premix Ex Taq? Ⅱ(Takara,日本),IL1R2、NR4A2、TREM1引物〔生工生物工程(上海)股份有限公司〕;微量臺式離心機(5810R)(Eppendorf,德國),熒光定量PCR儀(Applied Biosystems)(德國耶拿分析儀器股份公司),厭氧培養袋及厭氧產氣包(AnaeroPack-Anaero)(三菱公司,日本)。
1.5.3 細胞培養
采用含10%胎牛血清的DMEM培養液培養心肌細胞,將其置于37 ℃、95% O2、5% CO2培養箱中培養,當細胞匯合度達80%左右時進行傳代。
1.5.4 構建衰老心肌細胞模型及分組
采用D-半乳糖8 mg/ml刺激第2代心肌細胞9 d以制備衰老心肌細胞。將衰老心肌細胞按5×106個的數量接種到25T培養瓶中,然后隨機將其分為正常氧組和缺氧/復氧組,其中正常氧組心肌細胞常規培養;缺氧/復氧組心肌細胞缺氧3 h后復氧2 h,以制備AMI細胞模型。
1.5.5 qPCR法檢測IL1R2、NR4A2、TREM1 mRNA相對表達量
在25T培養瓶中收集正常氧組和缺氧/復氧組心肌細胞,按照總RNA提取試劑盒說明書提取細胞總RNA,將RNA反轉錄成cDNA,采用2-ΔΔCt法計算IL1R2、NR4A2、TREM1 mRNA相對表達量。基因引物序列和產物長度見表1,擴增條件見表2。實驗獨立重復9次。

表1 基因引物序列和產物長度Table 1 Gene primer sequence and product length

表2 基因引物擴增條件Table 2 Gene primer amplification conditions
采用GraphPad Prism 6.0統計學軟件進行數據處理。計量資料以(±s)表示,兩組間比較采用成組t檢驗。以P<0.05為差異有統計學意義。
從GSE66360和GSE83500中篩選出145個AMI差異表達基因,其中上調差異表達基因125個、下調差異表達基因20個,見圖1。

圖1 差異表達基因的火山圖Figure 1 Volcano map of differentially expressed genes
GO功能富集分析結果顯示,差異表達基因主要涉及的BP為細菌的防御反應、中性粒細胞趨化性、粒細胞趨化性、中性粒細胞遷移、粒細胞遷移、骨髓白細胞遷移、白細胞趨化性、細胞對白介素1的反應、白介素1介導的信號通路;主要涉及的CC為三級顆粒、特殊顆粒、分泌顆粒管腔、細胞質小泡腔、富含纖維膠凝蛋白1的顆粒膜、特殊顆粒管腔、三級顆粒膜、液泡管腔;主要涉及的MF為碳水化合物的結合物、免疫受體活性、晚期糖基化終末產物受體結合物、IgG結合物、病毒顆粒結合物、細胞核糖皮質激素受體結合物、肽聚糖溶血活性、核視黃醇X受體結合物、低聚糖結合物、調理素結合物。
KEGG通路富集分析結果顯示,差異表達基因主要涉及的信號通路為天然免疫反應應答、吞噬細胞殺傷的正性調節的信號通路。
在差異表達基因中,通過LASSO回歸分析篩選出10個特征基因,見圖2;通過SVM-RFE方法篩選出10個特征基因,見圖3;取交集得到9個核心基因,分別為NFIL3、IL1R2、NR4A2、IRAK3、VCAN、CCL20、TREM1、LYZ、ITLN1,見圖4。

圖2 差異表達基因的LASSO回歸分析結果Figure 2 LASSO regression analysis results of differentially expressed genes

圖3 差異表達基因的SVM-RFE方法分析結果Figure 3 SVM-RFE method analysis results of differentially expressed genes

圖4 差異表達基因的韋恩圖Figure 4 Venn diagram of differentially expressed genes
在測試集中,AMI組僅IL1R2、NR4A2、TREM1表達水平高于對照組,差異有統計學意義(P<0.05),見圖5。ROC曲線分析結果顯示,IL1R2、NR4A2、TREM1 表達水平預測測試集受試者發生A M I 的AUC分別為0.648〔95%CI(0.534~0.756)〕、0.623〔95%CI(0.511~0.728)〕、0.622〔95%CI(0.502~0.730)〕,見圖6;IL1R2、NR4A2、TREM1 表達水平預測驗證集受試者發生A M I 的AUC分別為0.834〔95%CI(0.761~0.898)〕、0.866〔95%CI(0.802~0.923)〕、0.808〔95%CI(0.729~0.880)〕,見圖7。

圖5 測試集中對照組與AMI組IL1R2、NR4A2、TREM1表達水平比較的箱式圖Figure 5 Box plot of comparison of IL1R2,NR4A2 and TREM1 expression levels between the control group and the AMI group

圖6 IL1R2、NR4A2、TREM1表達水平預測測試集受試者發生AMI的ROC曲線Figure 6 ROC curve of IL1R2,NR4A2 and TREM1 expression levels in predicting AMI in subjects in test set

圖7 IL1R2、NR4A2、TREM1表達水平預測驗證集受試者發生AMI的ROC曲線Figure 7 ROC curve of IL1R2,NR4A2 and TREM1 expression levels in predicting AMI in subjects in validation set
缺氧/復氧組心肌細胞IL1R2、NR4A2、TREM1 mRNA相對表達量高于正常氧組,差異有統計學意義(P<0.05),見表3。
表3 正常氧組與缺氧/復氧組心肌細胞IL1R2、NR4A2、TREM1 mRNA相對表達量比較(±s,n=9)Table 3 Comparison of relative expression levels of IL1R2,NR4A2 and TREM1 mRNA between normal oxygen group and hypoxia/reoxygenation group

表3 正常氧組與缺氧/復氧組心肌細胞IL1R2、NR4A2、TREM1 mRNA相對表達量比較(±s,n=9)Table 3 Comparison of relative expression levels of IL1R2,NR4A2 and TREM1 mRNA between normal oxygen group and hypoxia/reoxygenation group
組別IL1R2NR4A2TREM1正常氧組0.187±0.0430.127±0.0440.424±0.279缺氧/復氧組0.245±0.0290.257±0.0292.784±2.639 t值3.3157.3742.668 P值0.004<0.0010.028
AMI發病迅速且具有較高的死亡率[7-8]。目前,冠狀動脈造影是診斷AMI的“金標準”,但其屬于有創檢查,故尋找AMI非創傷性診斷方法具有臨床價值。本研究通過生物信息學技術和機器學習算法篩選出9個AMI核心基因,且在測試集中,AMI組僅IL1R2、NR4A2、TREM1表達水平高于對照組;ROC曲線分析結果顯示,IL1R2、NR4A2、TREM1表達水平預測測試集受試者發生AMI的AUC分別為0.648、0.623、0.622,三者預測驗證集受試者發生AMI的AUC分別為0.834、0.866、0.808;且缺氧/復氧組心肌細胞IL1R2、NR4A2、TREM1 mRNA相對表達量高于正常氧組,提示IL1R2、NR4A2、TREM1是AMI核心基因。
RONG 等[9]研究表明,IL1R2 基因多態性(rs11674595、rs4851527、rs2072472和rs3218977)可能與中國漢族人群骨質疏松癥的發病有關,但其在AMI中的作用有待深入挖掘。NR4A2屬于核受體4A亞家族,其編碼類固醇甲狀腺激素類維生素A受體,是核受體轉錄因子,而核受體轉錄因子在哺乳動物神經元發育、炎癥、記憶形成等方面具有調節作用。研究表明,NR4A2基因突變與癲癇發作、神經發育異常和機體發育異常有關[10-13]。KARKI等[14]研究表明,NR4A2在膠質母細胞瘤中是促癌基因,且其在心血管應激反應中具有重要作用。ASHRAF等[15]研究表明,在成年哺乳動物心臟,特別是在心肌細胞中,在β-腎上腺素能刺激下NR4A2表達明顯上調,其特異性過表達導致終末分化的心肌細胞重新進入細胞周期和DNA復制增加,但不導致心肌細胞分裂。TREM1是髓樣細胞觸發性受體家族成員,屬于免疫球蛋白超家族受體,其主要功能是識別外源性抗原和毒性物質,從而調節炎癥反應[16]。LIU等[17]研究表明,TREM1放大了腦源性和腸源性免疫原性成分的促炎反應,在TREM1上表達的觸發受體可在多種心血管疾病中驅動炎癥反應。VANDESTIENNE等[18]研究表明,TREM1可參與腹主動脈瘤的病理生理過程。KIMMOUN等[19]研究表明,TREM1與心源性休克患者90 d死亡率和各種器官損傷有關,但其在AMI中的具體分子機制尚不清楚。
綜上所述,IL1R2、NR4A2、TREM1是AMI核心基因,三者有望成為AMI潛在的生物標志物。但本研究仍存在一定局限性:(1)無法闡明IL1R、NR4A2、TREM1導致AMI的具體機制;(2)無法明確IL1R、NR4A2、TREM1是否與其他組學有關,如代謝組學、蛋白組學等。
作者貢獻:李淑娟進行文章的構思與設計,負責撰寫、修訂論文;柯妍進行研究的實施與可行性分析;劉旭東、賀茜、徐遙琴進行數據收集、整理、分析;田宇佳、盧冠軍、馬娟、朱澈進行結果分析與解釋;汪樂新負責文章的質量控制及審校,并對文章整體負責、監督管理。
本文無利益沖突。