王琳琳,鄧志敏,周林燕,楊靜,趙玉林,李龍飛*,程艷香*
(1.武漢大學人民醫院婦產科,武漢 430060;2.深圳中山泌尿外科醫院生殖中心,深圳市圍著床期生殖免疫重點實驗室,深圳中山生殖與遺傳研究所,深圳 518045)
近年來隨著社會發展帶來的生活方式的改變、工作壓力的增大以及女性生育年齡的上升等因素,我國不孕不育患者的數量逐年增加。不孕不育已成為影響人類發展與健康的全球性醫學和社會學問題,嚴重干擾患者身心健康和家庭幸福,同時也給社會穩定和醫療衛生等諸多方面帶來嚴峻挑戰[1]。復發性流產是常見的妊娠并發癥,定義為發生于孕20周前、連續2次或2次以上的自然流產,其發病率占育齡女性的1%~5%[2]。復發性流產的病因極其復雜,除染色體異常外,生殖道解剖因素、感染性疾病、內分泌紊亂、自身免疫疾病、高凝傾向、心理及環境因素等均有可能導致流產的發生[3]。然而,仍有近半數復發性流產患者病因不明[4]。本文擬結合多組學技術及生物信息學手段探討復發性流產的可能機制,為臨床診療提供新思路。
在NCBI(National center for biotechnology)的公共GEO數據庫(https://www.ncbi.nlm.nih.gov/)中檢索含有人源復發性流產早孕期絨毛樣本信息的數據芯片,下載可用數據集(GSE43256、GSE73025、GSE22490)作為分析對象。GSE43256芯片信息:Illumina Human Methylation27 BeadChip,平臺是GPL8490,該芯片中包含10例復發性流產早孕期絨毛組織和10例正常早孕期絨毛組織的甲基化數據;GSE73025芯片信息:Exiqon miRCURY LNA microRNA array,平臺是GPL20917,包含5例復發性流產和5例健康女性早孕期絨毛組織的miRNA表達數據;GSE22490芯片信息:Affymetrix Human Genome U133 Plus 2.0 Array,平臺是GPL570,包含4例復發性流產早孕期胎盤組織和6例健康女性胎盤組織的mRNA表達數據。
1.關鍵基因的篩選:通過R包(GEOquery、limma、dplyr、tidyverse)對原始數據進行校對、數據ID轉換及分析。不同數據集采用不同的|log2FC|進行篩選,主要是考慮在獲取足夠數量數據的同時,盡量讓|log2FC|保持較高的值。GSE43256篩選的標準為|log2FC|>0.1[5-6],GSE73025篩選的標準為|log2FC|>1.5,GSE22490篩選的標準為|log2FC|>0.5,全部數據為調準后P<0.05。GSE73025篩選獲得的差異miRNA經miRWalk(http://mirwalk. umm.uni-heidelberg.de/)、miRDB(http://www. mirdb.org/)和Diana Tools(http://diana.imis.athena-innovation.gr/DianaTools/index.php)網站,進行目標mRNA的配對,并取3個網站數據的交集,得到GSE73025數據集關鍵的mRNA信息。最后,GSE43256、GSE73025和GSE22490的差異分子取交集(Vennny 2.1.0)[5,7-8],得到GRB2相關銜接蛋白2(GRB2-related adapter protein 2,GRAP2)。
2.關鍵基因的qPCR驗證:為了驗證目的基因的表達水平,本研究納入2018—2021年于深圳中山泌尿外科醫院生殖中心就診的21例早孕期自然流產女性,其中包括3例復發性流產患者及18例早孕期健康妊娠但由于個人原因選擇行人流手術的患者(患者夫妻雙方及胎兒均染色體正常)。采集蛻膜及絨毛組織,提取組織總RNA(Qiagen RNeasy Plus Mini Kit,Qiagen,德國),采用逆轉錄試劑盒逆轉錄成cDNA并進行定量分析(PrimeScript RT Reagent Kit,Takara,日本;Luna Universal qPCR Master Mix,NEB,美國)。actin前向引物:5′-GCCTTTGCCGATCCGC-3′;actin反向引物:5′-GCCGTAGCCGTTGTCG-3′。GRAP2前向引物:5′-GGCCGCCTGCACAACA-3′;GRAP2反向引物:5′-GAAGAGTTTATCGGGTCATGGG-3′。數據以actin作為內參,進行相對表達量的計算,并進行3次重復實驗。
3.關鍵基因的信息獲取:通過Human protein atlas(https://www.proteinatlas.org/)和GeneCards(https://www.genecards.org/)獲取GRAP2的組織、細胞表達水平及亞細胞定位。通過String(https://string-db.org/)獲取GRAP2前10的互作蛋白。通過UCSC(http://genome.ucsc.edu/cgi-bin/hgGateway)獲取GRAP2的基本信息,包括基因ID、轉錄本信息、蛋白ID等,并通過GeneCards獲取GRAP2的突變信息,進一步采用SnapGene(版本4.1.9)和DOG(版本2.0)軟件,分別繪制GRAP2外顯子序列及蛋白二級結構;蛋白三級結構經PDB(https://www.rcsb.org/)獲得。
4.基因突變對轉錄本及蛋白結構的影響:采用varSEAK(https://varseak.bio/)和Mutation Taster(https://www.mutationtaster.org/)分別預測GeneCards中獲得的GRAP2基因突變位點對轉錄本剪切、蛋白結構的影響,及是否造成疾病。varSEAK中對轉錄本剪切的預測等級,分為1~5,等級越高,代表影響轉錄本剪切的概率越高。Mutation Taster中對蛋白結構的影響:PhyloP值介于-15~6之間,越高越保守,越高對蛋白的影響越大;Phast Cons值介于0~1之間,越高越保守,越高對蛋白的影響越大。
在NCBI數據庫中,按照“Recurrent miscarriage + Homo sapiens + Series”的條目搜索后得到14個GSE數據集,剔除非復發性流產、復發性流產合并其他疾病、非絨毛組織、非早孕期標本、原始數據不全等數據,得到可用數據集3個(GSE43256、GSE73025、GSE22490)(圖1A)。在|log2FC|>0.1且調整后P<0.05的條件下,從數據集GSE43256中共得到1 690個DNA甲基化差異表達基因。|log2FC|>1.5且調整后P<0.05的條件下,GSE73025得到48個差異表達的miRNA,進一步通過miRWalk、miRDB和Diana Tools得到差異表達miRNA的互作mRNA,取交集得到1 828個關鍵mRNA。|log2FC|>0.5且調整后P<0.05的條件下,GSE22490得到110個差異表達mRNA。將上述3個數據集取交集后得到關鍵分子GRAP2(圖1B、C)。
Human protein atlas的數據顯示,在蛋白層面,GRAP2主要表達于胎盤組織及免疫細胞富集的器官,包括扁桃體、淋巴結、脾臟等(圖2A);在母胎界面,GRAP2具體表達于絨毛(圖2B)和蛻膜(圖2C),并且在內膜組織(圖2D)中也有表達;在RNA層面,GRAP2除了高表達于免疫細胞富集的器官,還在血液淋巴細胞中也有豐富的表達,特別是T細胞(圖2E)。有趣的是,在胎盤組織中,GRAP2主要表達于纖維細胞及巨噬細胞(圖2F)。
組學原始數據顯示,復發性流產患者絨毛組織中GRAP2存在高甲基化現象,且靶miRNA表達水平升高。胎盤組織含有絨毛組織及蛻膜組織,組學數據顯示復發性流產患者胎盤組織GRAP2的表達水平升高。本研究qPCR數據顯示,與正常對照組相比,自然流產患者蛻膜組織顯著高表達GRAP2(P=0.034 6),復發性流產患者蛻膜組織的GRAP2表達水平亦有升高的趨勢,但無統計學差異(P>0.05);與正常對照組相比,復發性流產患者絨毛的GRAP2表達水平有下降的趨勢,但無統計學差異(P>0.05),相反,自然流產患者絨毛的GRAP2表達水平顯著升高(P=0.002 3)(圖2G、H)。
A:原始GEO數據集的獲取;B、C:GRAP2的獲取。
GRAP2的亞細胞結構定位數據顯示,GRAP2在細胞核和細胞質中均有高表達(圖3A、B)。
String的數據顯示,GRAP2前10的互作蛋白包括跟T細胞免疫功能相關的分子,如LCP2、LAT、ZAP70、CD28、FYB和CD4,還包括與細胞生長、遷移、信號轉導相關的分子,如PLCG1、SHC1、MAP4K1和CBL(圖4、表1)。與GRAP2相關的主要通路(表2)也主要集中在跟T細胞免疫調節相關的通路(T cell receptor signaling pathway、TCR signaling、ICos-ICosL pathway in T-helper cell和CD28 co-stimulation)及與細胞增殖分化、血管新生相關的通路(RET signaling)。
UCSC的數據顯示,GRAP2的轉錄本NM_004810(ENST00000344138.9)總的外顯子為8個,編碼外顯子為7個(圖5A)。GeneCards的突變位點數據,有4個落在外顯子區域(圖5B),分別是:c.834G>A(p.Ala278=)、c.739G>A(p.Gly247Ser)、c.466C>T(p.Arg156Trp)和c.801C>G(p.Leu267=)。其中,c.834G>A(p.Ala278=)位于蛋白結構域SH3中(圖5C)。GRAP2的蛋白三級結構見圖5D。
varSEAK和Mutation Taster的數據顯示,GRAP2的上述突變不會影響轉錄本的剪切(圖6),但c.834G>A(p.Ala278=)、c.466C>T(p.Arg156Trp)和c.801C>G(p.Leu267=)很可能會引起蛋白結構改變,并導致疾病的發生(表3)。
A:GRAP2在不同組織中的蛋白表達水平;B~D:GRAP2在絨毛組織、蛻膜組織及內膜組織中的定位表達;E:GRAP2在不同組織及血液細胞中的RNA表達水平;F:GRAP2在胎盤細胞中的RNA表達水平;G:GRAP2在正常蛻膜組織(NP-D)、自然流產蛻膜組織(SM-D)及復發性流產蛻膜組織(RM-D)中的RNA表達水平;H:GRAP2在正常絨毛組織(NP-F)、自然流產絨毛組織(SM-F)及復發性流產絨毛組織(RM-F)中的RNA表達水平。A~F:數據來源Human Protein Atlas。
A:數據來源GeneCards(大數據預測模式圖);B:數據來源Human Protein Atlas(免疫熒光實驗;3種腫瘤細胞系分別為:A-431、HEL和U-251-MG)。
圖4 GRAP2蛋白互作網絡
表1 GRAP2互作蛋白的功能介紹
表2 GRAP2蛋白主要相關通路
A:GRAP2基因及蛋白信息表;B:GRAP2外顯子展示及相應的突變位點(采用SnapGene軟件繪制);C:GRAP2蛋白二級結構及突變位點展示(采用DOG軟件繪制);D:GRAP2蛋白三級結構展示(數據來源PDB)。
圖6 GRAP2基因突變對轉錄本剪切的影響(varSEAK網站預測結果)
表3 GRAP2基因突變對蛋白結構的影響及對疾病的預測(Mutation Taster網站預測結果)
本研究通過NCBI數據庫,檢索得到與復發性流產早孕期絨毛標本相關的3個GSE數據集,通過生物信息學分析篩選到關鍵分子GRAP2。GRAP2調控細胞的增殖分化,介導腫瘤的發生發展過程[9],并且GRAP2作為一種銜接蛋白,參與白細胞特異性蛋白質酪氨酸激酶信號傳導[10],介導免疫細胞包括T、B、NK細胞等的免疫應答[11]。GRAP2包含一個SH2結構域,兩側是SH3結構域[12],該蛋白質通過其SH3結構域與其他蛋白質相互作用。因此,c.834G>A(p.Ala278=)位于蛋白結構域SH3中,該突變對蛋白結構及功能影響的可能性較高。但是,GRAP2的突變位點(c.466C>T(p.Arg156Trp)和c.801C>G(p.Leu267=))即使不在蛋白質結構域中,也可能影響蛋白結構,導致疾病的發生;并且即使GRAP2的突變位點不影響轉錄本的剪切位點,但由于翻譯過程中氨基酸的改變,也會導致蛋白結構發生改變,最終影響疾病的發生發展。GRAP2基因突變對疾病的影響,提示GRAP2在生命過程中發揮的重要作用。
GRAP2的表達水平與其甲基化水平呈負相關[13]。GRAP2在復發性流產女性的絨毛組織中呈現高甲基化水平,且其上游miRNA(miR-4667-3p)高表達,均提示其在復發性流產患者絨毛中低表達。我們的PCR數據也顯示,GRAP2基因在復發性流產患者的絨毛中有表達下降的趨勢,而自然流產組GRAP2表達顯著上升,可能是自然流產與復發性流產的疾病差異導致的。此外,組學數據中復發性流產患者胎盤組織GRAP2的表達水平升高,提示蛻膜組織可能高表達GRAP2,我們的數據也顯示GRAP2在自然流產及復發性流產患者的蛻膜中均有升高的趨勢。GRAP2與復發性流產相關的研究鮮見報道,但在其他領域,有報道顯示,子癇前期患者與正常妊娠女性相比,產后血液中GRAP2高甲基化,并且與T細胞免疫紊亂相關[14]。孕期高NO2暴露也被報道與產后新生兒血液中GRAP2高甲基化水平相關[15]。Lin等[16]的報道顯示,妊娠期糖尿病小鼠的后代心臟組織中GRAP2低表達,并且與T細胞功能紊亂相關。原發性免疫血小板減少癥患者外周血Treg細胞中miR-4667-3p表達上調[17]。GRAP2在血液中主要表達于T細胞,并且其許多生物學功能也與T細胞的免疫應答相關。但是,GRAP2在母胎界面主要表達于纖維細胞及巨噬細胞,這可能與GRAP2在細胞生長、遷移、信號轉導等方面發揮作用相關,同時也提示GRAP2可能通過調控絨毛組織中巨噬細胞的免疫功能來發揮作用。
本研究提示,早孕期絨毛組織中GRAP2基因的高甲基化水平或者其上游miR-4667-3p的上調,均可能下調絨毛GRAP2的表達,并且蛻膜組織中GRAP2的異常高表達,均可能干擾免疫應答或抑制胎兒細胞的增殖、分化、遷移等過程,導致復發性流產的發生。另外,GRAP2基因的突變可能通過影響蛋白的結構與功能,進而導致疾病的發生。GRAP2有望作為復發性流產診療的潛在靶點,但相關機制有待開展深入的分子生物學實驗來驗證。