孫語新,龔曉娟,郝秀麗,田雨馨,陳藝銘,張寶,閻春霞
1.西安交通大學醫學部法醫學院,陜西 西安 710061;2.國家衛生健康委員會法醫學重點實驗室 西安交通大學,陜西 西安 710061;3.中國西部科技創新港 西安交通大學生物證據研究院,陜西 西安 712000
嬰兒猝死綜合征(sudden infant death syndrome,SIDS)是指小于1 歲的嬰兒突發的、意外的在睡眠中發生的死亡,通過尸體檢驗、毒物分析、現場勘驗以及對死亡環境、臨床病史的詳細調查,仍無法解釋其原因[1]。約90%的SIDS 發生在6 月齡及以下的嬰兒[2],在2~4 月齡時發生率最高。在發達國家,SIDS 的發生率約為0.5‰~2.5‰[3],在我國SIDS 約占嬰兒總死亡率的11.9%[4]。有研究[5-8]顯示,心律失常、腦干的神經化學異常、感染等可能參與SIDS 的發生。但迄今為止,SIDS 的致病機制仍不明確,是目前法醫鑒定實踐面臨的難點問題之一。
三重風險模型是SIDS的主要病因模型,該模型提出,SIDS由3個因素共同導致,即脆弱的嬰兒進入關鍵發育期并受外源性應激因素影響容易發生猝死[9]。研究[5,10-12]表明,遺傳因素是導致嬰兒脆弱性的內在因素,包括導致長QT 間期綜合征(long QT syndrome,LQTS)的基因突變、白細胞介素-10(interleukin-10,IL-10)的基因多態性。而在環境危險因素方面,嬰兒感染與SIDS的關系也被廣泛關注。SIDS的年齡分布與母源抗體水平在新生兒出生后逐漸下降有關聯[13]。有調查[13-14]發現,很多SIDS病例死亡前有感染現象,尸體檢驗時微生物檢測呈陽性,提示感染和炎癥反應可能對SIDS產生影響,但仍未發現與SIDS相關的特異性微生物。細菌毒素假說認為,在母源抗體降低、自身免疫系統未發育成熟之前,嬰兒上呼吸道內的微生物及其所產生的毒素可能會導致炎癥因子風暴,從而引起中毒性休克或敗血性休克導致死亡[15]。
嬰兒感染性猝死(infectious sudden death in infancy,ISDI)與SIDS 均屬于嬰兒人群中突然的、意外的猝死,但是ISDI 直接死因明確,為病原體感染所致,而SIDS 直接死因不明確。為了探究SIDS 與ISDI是否存在共同的基因表達調控機制,尋找SIDS 發生的免疫炎癥機制和精準診斷的分子標記,以便在醫療糾紛、家庭暴力、殺嬰、虐待嬰幼兒等案件中精準鑒別SIDS 與ISDI,本研究通過生物信息學分析,對美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)公共數據平臺GSE70422 和GSE136992 數據集中的mRNA 表達數據進行聯合分析,篩選SIDS 和ISDI 死者不同組織樣本中共同的差異表達mRNA,利用基因本體論(gene ontology,GO)和京都基因和基因組數據庫(Kyoto Encyclopedia of Genes and Genomes,KEGG)對共同的差異表達mRNA進行富集分析,并確定蛋白質-蛋白質相互作用(proteinprotein interaction,PPI)網絡中的hub 基因。
從NCBI 的GEO 數據庫(https://www.ncbi.nlm.nih.gov/geo/)中下載mRNA數據集GSE70422和GSE136992。GSE70422 數據集包括15 例SIDS 和15 例對照(意外事故、分娩并發癥等)死者的腦、心臟和肝組織,其中SIDS 和對照死者均經過系統尸體解剖明確死因,年齡相匹配。使用全基因組基因表達芯片DASL HT(美國Illumina 公司)測定mRNA 表達。GSE136992 數據集包括14 例ISDI 和14 例對照(非急性感染性死亡)死者的腦、心臟和肝組織,其中ISDI 病例在死亡前沒有嚴重的器質性疾病史;該數據集中ISDI 和對照死者均經過系統尸體解剖明確死因,年齡相匹配。使用全基因組基因表達芯片DASL HT 測定mRNA 表達。兩個數據集均已使用R 4.1.0 軟件Bioconductor 包進行背景校正和分位數標準化處理,且兩個數據集的數據分析均表明種族和年齡對基因的差異表達沒有影響[16-17],樣本詳細信息見表1。

表1 GSE70422 和GSE136992 數據集的樣本統計Tab.1 Statistics of the samples in GSE70422 and GSE136992 database (例)
對GSE70422 和GSE136992 數據集進行數據處理。使用R 4.1.0 軟件將GPL14951 平臺探針ID 轉化為基因符號,對同一個基因的多個探針取表達量均值最高的探針。對數據進行log2轉換,檢查并刪除缺失值過多的基因和樣本。將數據按照腦、心臟、肝組織分成3 組,分別對不同組織的基因表達量用R 軟件limma 包進行差異表達分析[18],篩選出3 個組織的差異基因,篩選條件:差異倍數(fold change,FC)取以2為底的對數(log2FC)的絕對值大于1、P值小于0.05。最后使用R 軟件ggplot2 包繪制火山圖。
對于同一個組織,將SIDS 差異基因(GSE70422數據集)與ISDI 差異基因(GSE136992 數據集)取交集,將P的閾值設置為0.01,獲得每個組織的共同差異基因,按差異基因來源組織、在SIDS 組的P值大小進行排序。
GO 數據庫將基因功能分成生物過程(biological process)、分子功能(molecular function)和細胞組分(cellular component)3 個部分。為了解析共同差異基因的功能和信號通路,利用R 軟件clusterProfiler、org.Hs.eg.db 和ggplot2 包以及enrichgo 和enrichKEGG 函數對共同差異基因進行GO 和KEGG 富集分析[19],并繪制條形圖與表格。
STRING(https://www.string-db.org/)是分析已知和預測蛋白質相互作用的數據庫。對于同一組織,將SIDS 和ISDI 組共同差異基因導入STRING 數據庫[20],以互作評分大于0.75 構建PPI 網絡。使用Cytoscape 3.8.2 軟件(https://cytoscape.org/)中cytoHubba 插件的Betweenness、Closeness、Degree、EPC、MNC 5 種拓撲分析算法計算共同差異基因的得分,并取交集。
數據集中沒有檢查到缺失值過多的基因和樣本。與對照病例相比,SIDS 病例的腦組織中有200 個差異基因,心臟組織中有1 058 個差異基因,肝組織中有597個差異基因;ISDI病例的腦組織中有339個差異基因,心臟組織中有798 個差異基因,肝組織中有469 個差異基因。SIDS 病例和ISDI 病例不同組織中差異基因的火山圖見圖1,上調和下調情況見表2。

圖1 SIDS 和ISDI病例腦、心臟和肝組織中差異基因的火山圖Fig.1 Volcano map of differentially expressed genes in SIDS and ISDI samples of brain,heart and liver tissue

表2 SIDS 和ISDI病例不同組織中差異基因的數量統計Tab.2 Statistics of the differentially expressed genes in SIDS and ISDI in different tissues(個)
通過重疊分析,SIDS 和ISDI 病例3 個組織中共有207 個共同差異基因,其中腦組織中22 個、心臟組織中126 個、肝組織中59 個。在207 個共同差異基因中進一步選取P值均小于0.01 的共同差異基因,得到19 個顯著差異表達的基因(表3)。其中星形肌動蛋白1(astrotactin 1,ASTN1)在SIDS 和ISDI 病例中差異表達的P值均低于0.001。

表3 SIDS 和ISDI病例中的共同差異基因Tab.3 The common differentially expressed genes in SIDS and ISDI
為了探究SIDS 與ISDI 發生過程是否存在相同的機制,對得到的207 個共同差異基因進行PPI 網絡構建。結果顯示,腦組織的共同差異基因中沒有顯著的交互關系;心臟組織的共同差異基因中共有109 個節點和14 條連線(圖2 中僅顯示有交互關系的節點);肝組織的共同差異基因中共有54 個節點和2 條連線,交互關系并不顯著。

圖2 心臟組織中共同差異基因的PPI網絡圖Fig.2 PPI network of common differentially expressed genes in the heart tissue
此外,由于心臟組織中的共同差異基因在PPI 網絡中相互作用顯著,本研究采取5 種拓撲算法分析這些共同差異基因的PPI 網絡,計算出得分排名前5 位的hub 基因(表4)。將5 種算法的結果取交集后獲得同時參與SIDS 和ISDI 的3 個關鍵基因,即RHOA、整合素亞單 位α1(integrin subunit alpha 1,ITGA1)和H2B 簇狀組蛋白5(H2B clustered histone 5,H2BC5)。

表4 5 種拓撲分析算法計算得到的排名前5 位的hub 基因Tab.4 Top 5 hub genes by five topology analysis algorithms
對上述SIDS 和ISDI 病例的207 個共同差異基因進行GO 和KEGG 富集分析。
GO 分析結果(圖3)顯示:在心臟組織中,生物過程主要富集在對霉酚酸的反應和后腎發育,共同差異基因p21 活化激酶2(p21 activated kinase 2,PAK2)、纖維連接蛋白1(fibronectin 1,FN1)和Ras同源基因家族成員A(ras homolog family member A,RHOA)主要參與軸突發生的調節;細胞組分主要富集在頂端連接復合體和核周質;分子功能主要富集在蛋白酪氨酸激酶激活劑活性中。在肝組織中,細胞組分主要富集在次級顆粒與三級顆粒;分子功能主要富集在激酶調節活性。在腦組織中無顯著富集結果。

圖3 SIDS 和ISDI病例心臟組織和肝組織中共同差異基因的GO 富集分析Fig.3 GO enrichment analysis of differentially expressed genes of heart and liver tissue both in SIDS and ISDI groups
KEGG 結果顯示:在心臟組織中,通路主要涉及肌動蛋白細胞骨架的調節(P=9.5×10-5)和黏著斑(P=4.7×10-4)。在肝組織和腦組織中無顯著富集結果。
在SIDS 發生機制不明晰、感染與SIDS 關系密切的背景下,探究免疫功能相關蛋白在SIDS 致病過程中的作用至關重要。越來越多的證據[21-23]表明,炎癥和免疫影響心肌細胞的電生理特性,可能參與調節先天性LQTS的臨床表型,也是獲得性LQTS的潛在病因。此外,有研究[24]發現,免疫調節基因多態性導致細胞因子循環水平上調或下調,可能會破壞正常和過渡細胞功能與免疫反應之間的平衡,從而導致嬰兒容易受到細胞因子風暴的影響。據報道,IL-10基因啟動子多態性與SIDS 的發生顯著相關[25],SIDS 腦脊液中IL-6水平與死于腦膜炎和敗血癥的嬰兒腦脊液中高水平的IL-6(大于100 pg/mL)相當[26],在SIDS 中發現炎癥相關基因的顯著差異表達[16]。以上研究提示,免疫相關基因的表達變化合并感染,可能會誘發SIDS。
本研究結果表明,心臟組織中ASTN1、H2A簇狀組蛋白6(H2A clustered histone 6,H2AC6)和神經軟骨素(neurochondrin,NCDN)基因表達在SIDS 和ISDI 病例均顯著下調。肝組織中,Krüppel樣因子4(Krüppellike factor 4,KLF4)基因表達在SIDS 和ISDI 病例均顯著下調。ASTN1 是一種神經細胞黏附分子,在神經母細胞的遷移中發揮作用[27]。神經發育的關鍵期與SIDS 發生高峰期時間重合,提示神經發育異??赡軈⑴cSIDS 的發生。同時,在非中樞神經系統疾病的患者中也發現有ASTN1基因突變,研究顯示,ASTN1降低了肝癌細胞的遷移和侵襲能力,其表達與B 細胞、巨噬細胞和中性粒細胞在原發性肝癌中的浸潤水平呈負相關[28],且影響小細胞肺癌的進程[29]。這些研究提示ASTN1 不僅在中樞神經發育過程中發揮重要作用,還與細胞增殖、免疫防御相關。本研究發現,ASTN1基因表達量在SIDS 和ISDI 病例的心臟組織中顯著下調(P<0.001),而在肝和腦組織中表達差異均無統計學意義,提示ASTN1 在心臟中的功能值得進一步研究。H2AC6 是真核細胞中負責核小體結構的4 個核心組蛋白之一,研究[30]發現,H2AC6表達與冠心病相關,也與空腹血糖、收縮壓、舒張壓等6 個心血管代謝特征相關[31]。NCDN 是一種胞質蛋白,在神經生長、谷氨酸受體信號轉導和突觸可塑性中發揮重要作用[32]。NCDN會在缺血性腦卒中患者的血液樣本中差異表達[33],其變異可引發癲癇[26]。此外,NCDN 還與自身免疫相關聯,NCDN 通過限制中性粒細胞對細菌感染的清除作用抑制小鼠對肺炎球菌感染的先天免疫[34];NCDN 被鑒定為自身免疫性小腦變性中的神經元靶抗原[35],其抗體的產生與自身免疫性小腦性共濟失調相關[36]。KLF4 是一種含鋅指的轉錄因子,調節多種細胞過程,如細胞生長、增殖和分化。多項研究表明,KLF4 在調節炎癥的過程中發揮作用[37],被認為是細胞抗病毒反應的負調節因子[38],并調控細胞因子IL-6[39]、IL-1β 和IL-10[40-41]的表達。此外,KLF4 還通過結合蛋白在多種血管疾病中產生影響[42]。
其余共有的差異表達基因與SIDS 或ISDI 的關聯還不明晰。共同差異基因集中在心臟組織,提示心臟功能基因表達失調是引起猝死的重要機制。在法醫學實踐中,發病1 h 內死亡者多為心臟性猝死,一項對490 例1~35 歲心臟性猝死者的研究[43]發現,心臟性猝死最常見的原因是冠狀動脈疾?。ㄕ?4%)和遺傳性心肌?。ㄕ?6%)。而免疫功能發育不完全可能是SIDS的深層原因,最終關聯到心臟,表現出心功能的失常。
KEGG 富集分析結果表明,在SIDS 和ISDI 病例心臟組織中,共同差異基因參與的通路主要涉及肌動蛋白細胞骨架的調節和黏著斑。肌動蛋白細胞骨架影響細胞的遷移、收縮和吞噬作用[44]。黏著斑是細胞的定位點,細胞黏附對免疫細胞外滲、遷移及炎癥等防御反應至關重要。GO 結果顯示,在心臟組織中,生物過程主要富集在對霉酚酸的反應和后腎發育通路中。霉酚酸是一種應用廣泛的免疫抑制劑,在臨床上具有抗免疫排斥反應、抗腫瘤與抗病毒的應用價值,可選擇性地阻斷淋巴細胞的增殖,抑制抗原呈遞細胞的活性,從而抑制B 淋巴細胞向記憶細胞與漿細胞轉化,并且降低細胞因子分泌[45]。肝組織中,細胞組分富集在次級顆粒和三級顆粒中,兩者主要存在于中性粒細胞的分泌顆粒[46]。綜上,共同差異基因富集在免疫與炎癥反應相關的通路中,表明SIDS 與ISDI 病例在免疫相關基因表達缺陷方面存在共同之處。
本研究結果表明,心臟組織中共有3 個hub 基因(RHOA、ITGA1、H2BC5)參與SIDS 與ISDI。RHOA屬于小GTP 酶,是Ras 同源家族成員;RHOA 蛋白能促進肌動蛋白細胞骨架的重組并調節細胞的形狀、附著和運動,通過調控微絲重組參與細胞增殖、遷移和凋亡等過程,在信號轉導級聯中起分子開關的作用[47]。RHOA 所在的信號通路與充血性心力衰竭、動脈粥樣硬化和急性缺血性腦卒中等心血管疾病相關[48]。RHOA 還是調節免疫細胞分化和功能的關鍵因子[49]。ITGA1 作為整合素的組成部分,通過控制細胞與細胞外基質的黏附影響發育、免疫、炎癥等調節[50]。多項研究[51-52]表明,ITGA1 與自身免疫性疾病、動脈粥樣硬化和腫瘤的發展有關。H2BC5 是組成染色質的核小體結構的基本蛋白分子。這3 個hub 基因和免疫與炎癥反應相關,進一步驗證了免疫功能在SIDS 中的作用。
綜上,本研究通過生物信息學方法篩選出了SIDS與ISDI猝死者腦、心臟和肝組織中差異表達的mRNA,發現了ASTN1、H2AC6和NCDN等共同差異基因;經功能和通路分析發現,共同差異基因富集在肌動蛋白細胞骨架的調節、黏著斑和免疫反應等相關的信號通路;構建PPI 網絡,確定了RHOA、ITGA1和H2BC5共3 個在互作網絡中有高連接度的基因。上述結果表明,SIDS 與ISDI 可能存在某些共同的調控機制,這些發現有望為嬰兒猝死的法醫學鑒定提供分子標志物參考。