任建宇,司艷梅,劉 欣,楊樹法△
1.首都醫(yī)科大學(xué)附屬北京婦產(chǎn)醫(yī)院產(chǎn)前診斷中心,北京 100026;2.首都醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院醫(yī)學(xué)遺傳學(xué)與發(fā)育生物學(xué)系,北京 100069
出生缺陷是胎兒出生前發(fā)生的身體結(jié)構(gòu)、功能或代謝異常,嚴(yán)重影響患兒和患兒家庭的生活質(zhì)量,產(chǎn)前診斷是預(yù)防出生缺陷的主要手段。染色體微陣列分析技術(shù)、全基因組測序及全外顯子測序等分子生物學(xué)技術(shù)在產(chǎn)前診斷中的應(yīng)用,極大地提高了致病性變異檢出率,同時也檢出大量可疑致病性、不確定性、可疑良性的基因組結(jié)構(gòu)性變異[1-3]。如何獲取更多胎兒發(fā)育信息,結(jié)合B超等影像學(xué)檢查,綜合判斷胎兒發(fā)育情況,對胎兒做出合理的診治,成為產(chǎn)前診斷中亟待解決的問題。羊水是產(chǎn)前診斷的主要標(biāo)本,羊水上清液通常作為醫(yī)療廢物處理。研究發(fā)現(xiàn)羊水上清液中包含各種游離RNA,并且羊水游離RNA比羊水脫落細胞中RNA有代表性,更能反映胎兒全身的發(fā)育狀態(tài)[4-5]。胎兒發(fā)育異常能夠影響羊水游離RNA中的基因表達,羊水游離RNA基因變化與器官組織發(fā)育異常密切相關(guān)[6]。本研究通過對比分析發(fā)育異常胎兒和正常胎兒羊水游離RNA的芯片檢測結(jié)果,獲取差異表達基因,進而分析這些差異表達基因的組織表達特點,以期發(fā)現(xiàn)能夠反映胎兒發(fā)育異常的組織特異性基因。
1.1一般資料 以唐氏綜合征(DS)及愛德華綜合征(ES)胎兒作為系統(tǒng)發(fā)育異常的研究對象。從GEO數(shù)據(jù)庫中下載GSE16176[7]和GSE25634[8]芯片檢測數(shù)據(jù)。GSE16176中包括7例正常胎兒和7例DS胎兒;GSE25634包括6例正常胎兒和5例ES胎兒。所用的芯片為Affymetrix Human Genome U133 Plus 2.0 Array。
1.2方法
1.2.1組織特異性基因的篩選 正常組織的基因表達量數(shù)據(jù)來源于Human Protein Atlas數(shù)據(jù)庫[9],下載基因表達數(shù)據(jù)表(https://www.proteinatlas.org/download/rna_tissue_consensus.tsv.zip)到本地。編寫R腳本統(tǒng)計該數(shù)據(jù)表所涵蓋的組織類型及所包括的基因種類,生成不同器官來源的組織列表。按照組織特異性基因的定義篩選神經(jīng)相關(guān)組織的特異性基因。組織特異性基因定義:基因在某個組織中的表達量,高于該基因在所有組織中表達量均值的8倍以上,則該基因為這個組織的特異性表達基因。
1.2.2差異表達基因的篩選 對芯片結(jié)果進行背景校正、歸一化,獲取基因表達量數(shù)據(jù)。利用limma程序包對異常胎兒和正常胎兒的芯片檢測結(jié)果進行差異表達分析,獲取胎兒發(fā)育異常時發(fā)生變化的差異表達基因。以表達量變化倍數(shù)的log2轉(zhuǎn)化值(logFC)>0.5和P<0.05作為閾值篩選差異表達基因。
1.2.3組織特異性差異表達基因的表達特性分析 取組織特異性基因集及差異性基因集得交集,獲取組織特異性差異表達基因。統(tǒng)計組織特異性差異表達基因在正常胎兒羊水游離RNA中的變異系數(shù)(CV)值和均值,同時計算芯片檢測基因在正常胎兒羊水游離RNA中的CV值和均值。
1.3統(tǒng)計學(xué)處理 數(shù)據(jù)的分析和處理借助R語言完成。使用olgio程序包讀取芯片原始結(jié)果,并對結(jié)果進行背景校正、歸一化。差異基因的篩選使用limma程序包,通過t檢驗完成,根據(jù)設(shè)定閾值篩選差異有統(tǒng)計學(xué)意義的差異表達基因。CV值為基因在正常胎兒表達量的標(biāo)準(zhǔn)差除以均值乘以100%得到。
2.1組織特異性基因的篩選 在組織表達量數(shù)據(jù)表中記錄了62種組織的19 651個基因的表達量。62種組織涵蓋了神經(jīng)系統(tǒng)、免疫和血液系統(tǒng)、生殖系統(tǒng)、腺體、泌尿系統(tǒng)及消化道等人體的幾乎所有組織,見表1。以基因表達量高于所有組織中表達量均值的8倍以上作為組織特異性基因的篩選標(biāo)準(zhǔn),共篩選到7 548個基因。

表1 各系統(tǒng)中包含的組織
2.2DS和ES差異表達的組織特異性基因 將DS與正常胎兒的羊水游離RNA中基因表達量進行比較,共發(fā)現(xiàn)717個差異表達基因,差異表達基因的火山圖見圖1A。將ES與正常胎兒進行比較,共發(fā)現(xiàn)1 038個差異基因,差異基因的火山圖見圖1B。將DS差異基因、ES差異基因及組織特異性基因進行比較發(fā)現(xiàn),71個基因為DS與ES共同差異基因,9個基因既是DS與ES共同差異基因又是組織特異性基因,見圖1C。

注:A、B分別表示DS胎兒(A)、ES胎兒(B)與正常胎兒羊水游離RNA中差異表達基因的火山圖,縱軸代表limma程序包基因差異分析P值經(jīng)-log10轉(zhuǎn)化得到的值,灰色點代表logFC>0.5和P<0.05的差異表達基因;C為DS差異基因、ES差異基因及組織特異性基因比較的維恩圖,Specific gene代表組織特應(yīng)性基因集合,DS代表DS胎兒與正常胎兒差異表達基因集,ES代表ES胎兒與正常胎兒差異表達基因集。
2.3組織特異性差異表達基因 將正常胎兒的標(biāo)本,進行背景校正和歸一化,不同芯片的檢測值的中位數(shù)以及上下四分位數(shù)值基本一致,所有芯片的結(jié)果具有可比性。統(tǒng)計分析13例正常胎兒標(biāo)本的芯片檢測結(jié)果,所有檢測基因的相對表達量均值為3.11,CV為19.90%。9個組織特異性差異表達基因(DOK7、ARHGEF39、FAM111B、CCHCR1、R3HDML、WNK3、FIBCD1、SMIM10L2B及SMIM10L2A)中,5個基因(CCHCR1、FAM111B、FIBCD1、ARHGEF39及SMIM10L2B)的表達量高于芯片所有檢測基因的平均表達量并低于所有檢測基因的CV,3個基因(DOK7、WNK3及R3HDML)的表達量低于芯片所有檢測基因的平均表達量并低于所有檢測基因的CV,見圖2。在組織表達數(shù)據(jù)庫中,9個組織特異性差異表達基因特異對應(yīng)的特異表達組織包括大腦皮質(zhì)、海馬、睪丸、小腸、十二指腸、腎上腺、心肌、骨骼肌、甲狀腺、睪丸及附睪等。基因在這些組織的表達量,高于基因在所有組織中表達量均值的8倍以上。

注:垂直虛線為基因游離RNA水平在正常胎兒羊水標(biāo)本中的平均值;橫向虛線為所有檢測變異系數(shù)。
羊水游離RNA的變化受到胎兒狀態(tài)的影響,孕期內(nèi)胎兒是一個變化的過程;這種變化包括正常的胎兒發(fā)育和異常發(fā)育[5-6,10-11]。區(qū)分是胎兒正常生長還是病理性發(fā)育導(dǎo)致的羊水游離RNA中基因的變化,是其臨床應(yīng)用的根本。孕中期是行羊水穿刺檢測的主要階段,也是能夠獲取羊水上清液的主要階段。分析這一階段羊水游離RNA中基因變化特點,將是利用羊水游離RNA進行產(chǎn)前診斷的基礎(chǔ)。利用每個基因在孕中期的CV可以對該基因在孕中期的表達穩(wěn)定性進行有效的區(qū)分。通過對篩選到的9個組織特異性差異表達基因的CV分析發(fā)現(xiàn),8個基因的CV均低于基因整體的CV的中位數(shù),結(jié)果表明,這些基因在孕中期具有較好的穩(wěn)定性,較少受到了胎兒正常發(fā)育的影響。
羊水游離RNA來源于胎兒細胞的凋亡或死亡,凋亡細胞釋放的RNA可以通過胎兒血液經(jīng)由腎臟排泄入羊水。皮膚也是RNA進入羊水的重要途徑,研究表明,在孕20周前胎兒皮膚尚未角質(zhì)化,胎兒和羊水間可以通過皮膚進行物質(zhì)雙向交換[12]。作為能夠反映胎兒發(fā)育狀態(tài)的基因,其在羊水游離RNA中應(yīng)具備一定的表達量,許多研究通過制訂篩選閾值來篩選羊水游離RNA中“表達的”基因[13],另外,還有利用芯片進行自身判定的方法[14]。本研究將篩選到的組織特異性差異表達基因與芯片所有基因的均值進行比較,結(jié)果表明,5個基因的表達量在平均表達量之上。通過對基因在孕中期CV和平均表達量進行分析,CCHCR1、FAM111B、FIBCD1、ARHGEF39及SMIM10L2B的游離RNA在羊水中具有可靠的水平,同時在孕中期表達穩(wěn)定,具備作為特異性組織差異基因的條件。
篩選到的組織性特異性差異表達基因涉及大腦、睪丸、甲狀腺、心肌、骨骼肌及消化道等多個器官組織,這些組織在ES和DS患兒中存在不同程度的發(fā)育異常[15]。CCHCR1在睪丸高表達,定位于細胞質(zhì)、細胞核、線粒體或中心體等,可以調(diào)節(jié)細胞的各種功能,是精子生成和雄性配子發(fā)育過程中的重要分子[16-17],結(jié)果表明,CCHCR1在DS和ES患兒中的表達水平變化與患兒生殖功能障礙密切相關(guān)。DOK7的突變與先天性肌無力綜合征密切相關(guān)[18];肌張力異常是ES和DS患兒共同癥狀,這也解釋了DOK7游離RNA在羊水中的異常表達。表明研究中篩選到的組織特異性差異表達基因的功能與DS和ES的臨床癥狀存在較好的相關(guān)性。
基因的特異表達類型與目前研究不一致的情況,例如,F(xiàn)IBCD1在Human Protein Atlas數(shù)據(jù)庫中是海馬組織特異性基因,而目前關(guān)于神經(jīng)系統(tǒng)中FIBCD1的研究較少,現(xiàn)有文獻表明FIBCD1可以位于胃腸道上皮細胞,參與皮膚及胃腸黏膜的固有免疫,與肝癌的預(yù)后密切相關(guān)[19-20]。ARHGEF39在Human Protein Atlas數(shù)據(jù)庫中是甲狀腺的組織特異性基因,但目前對該基因的研究集中在肺癌與肝癌領(lǐng)域[21-22]。出現(xiàn)這種現(xiàn)象的可能原因與胚胎發(fā)育中的基因表達與成年人存在差異有關(guān),也可能與基因研究歷史短有關(guān)。由于發(fā)育中的人類胚胎組織難以獲取,缺少胎兒發(fā)育過程中的組織表達數(shù)據(jù)集,研究中多采用成人的組織表達數(shù)據(jù)集替代[23]。
本研究利用基因在組織中的表達量對變異基因進行解釋,發(fā)現(xiàn)了與組織異常發(fā)育密切相關(guān)的組織特異性基因,為利用羊水游離RNA判定胎兒發(fā)育異常提供了思路。