陳文標,黃建溶,彭武建,林小聰,戴勇
(1.暨南大學第二臨床學院/深圳市人民醫院臨床醫學研究中心,廣東深圳518020;2.深圳市第三人民醫院腎臟內科,廣東深圳518112;3.廣東醫學院生物化學研究所,廣東湛江524023)
基于誘導多能干細胞的Alport綜合征差異性表達小核糖核酸的生物信息學分析
陳文標1,黃建溶1,彭武建2,林小聰3,戴勇1
(1.暨南大學第二臨床學院/深圳市人民醫院臨床醫學研究中心,廣東深圳518020;2.深圳市第三人民醫院腎臟內科,廣東深圳518112;3.廣東醫學院生物化學研究所,廣東湛江524023)
目的尋找Alport綜合征患者(AS)與健康對照者(NC)差異性表達小核糖核酸(microRNAs)。分析差異性表達microRNAs的生物信息學特點。方法收集AS與NC組的尿液,從尿液中分離尿腎臟管細胞,將尿腎臟管細胞誘導分化成多能干細胞(iPSCs)。運用高通量測序找出2組之間差異性表達的microRNAs,用于預測特異性靶基因。靶基因可進行gene ontology(GO)富集與Kyoto encyclopedia of genes and genomes(KEGG)通路信號分析。確定差異性表達的microRNAs靶基因的主要富集位點與通路信號條目。結果在2組樣本中發現30個microRNAs具有差異性表達,包括19個上調與11個下調。差異性表達microRNAs靶基因GO富集主要聚集在細胞分子、細胞組成與細胞生物學過程。嘌呤代謝通路與絲裂原激活的蛋白激酶是主要的KEGG信號傳導通路。結論差異性表達microRNAs靶基因的生物信息學可能在AS發病機制中起重要作用,可作為潛在靶點用于AS病因的深入研究。
Alport綜合征;小核糖核酸;GO富集;KEGG通路
Alport綜合征(alport syndrome,AS)是一種遺傳性基底膜病,可伴有眼、耳改變。其基本病因是編碼基底膜上的重要組分Ⅳ型膠原各條α鏈的基因(C0L4A3~A5)發生突變[1]。AS按照其遺傳方式可分為性連鎖顯性遺傳(X?linked AS,XLAS)、常染色體隱性遺傳與常染色體顯性遺傳[2,3]。其病理改變主要是基底膜的不規則增厚、變薄、分層、斷裂,并以此作為診斷AS的病理標志物[4]。AS患者大部分在20歲左右即進入腎臟衰竭階段,需要進行腎臟移植等替代治療[5]。小核糖核酸(microRNA)是一類長度為21 nt的內源性非編碼小RNA,在植物與動物中發揮重要的調控作用。它能誘導降解或者抑制轉錄后的信使RNA,影響蛋白質表達豐度,從而使一些功能蛋白的表達受到影響[6]。戴勇等[7]首次運用microRNA在基因層面上對狼瘡性腎炎相關疾病進行研究并發現microRNA?223可作為診斷狼瘡性腎炎的標志物。后來,國外學者對各種腎臟疾病進行了大量的microRNA的研究,都取得了實質性的進展[8]。本研究擬在發現30個差異性表達microRNAs的前期研究基礎上,對這些差異性表達的mciroRNAs進行靶基因的預測,然后運用相關的軟件對靶基因行基因富集(gene ontology,GO)與基因通路生物信息學分析(Kyoto encyclopedia of genes and genomes patway,KEGG pathway),旨在發現各種生物功能在AS發病機制中的作用情況及主要發病機制的信號傳導通路,探討AS腎臟組織差異性表達microRNAs的生物信息與AS發病的關系。
1.1 研究對象
選擇就診于深圳市人民醫院、經過病理學檢查與免疫電子顯微鏡檢查確診的AS患者10例,作為AS組;另選擇經常規體格檢查確認無相關疾病的健康者10例,作為正常對照(NC)組。AS患者在深圳市人民醫院診斷為AS之前,未接受過任何治療。分別收集其尿液200 mL,分離獲取尿腎臟管細胞,并將尿腎臟管細胞成功誘導為多能干細胞(induced pluripotent stem cells,iPSCs)[9](由中國科學院生物與健康研究院的裴瑞卿教授領銜的團隊完成),具體的方法與步驟參考系統性紅斑狼瘡患者尿腎臟管細胞誘導成iPSCs的方法[10]。成功誘導的iPSCs用于microRNAs測序及差異性表達microRNAs的生物信息學分析。
1.2 方法
1.2.1 標本處理,RNA數據處理與注釋及RNA數據庫的建立:采用Trizol試劑盒(Invitrogen公司,美國)提取RNA。根據所測得RNA濃度,20例RNA樣品分別以AS與NC為組單位等量混合。總RNA經過RT?PCR擴增后制成RNA數據庫。然后運用Illumi?na Hiseq 2000測序儀(華大基因公司,深圳)進行深度測序。對經過深度測序得到的RNA片段進行清潔處理后得到干凈序列RNA。對干凈序列RNA長度分布、基因組比對、重復序列比對、小RNA分類注釋等一系列信息進行分析[11]。
1.2.2 兩樣本microRNA表達差異比較:首先將兩樣品microRNA表達量歸一化到同一數量級,歸一化表達量=microRNA表達量/樣本總表達量×106,如果microRNA表達量為0,就把數量值更改為0.01;如果兩樣本microRNA表達量都<1,則不能用于下一步的倍比值分析。使用Audic and Claverie test統計學方法比較兩樣本microRNA表達差異性。具體方法為引用倍比值(log2Ratio)與P值,倍比值= log2(AS歸一化表達量/NC歸一化表達量),若兩樣本間倍比值≥2且P值≤0.01,則認為microRNA在兩樣本差異性表達顯著[12]。
1.2.3 GO富集與KEGG通路生物信息分析:首先運用TargetScan(http://www.targetscan.org/)軟件預測差異性表達microRNAs的靶基因,然后用DAVID(http://david.abcc.ncifcrf.gov/)注釋數據庫對其進行GO與KEGG相關生物信息分析。GO富集主要有3個分類,分別描述基因的分子功能(molecular func?tion)、細胞的組成(cellular component)和生物學過程(biological process)。具體的方法是將靶基因向GO數據庫(http://www.geneontology.org/)的各個項目映射,計算映射到每個項目的靶基因總數,然后應用超幾何檢驗,找出與整個參考基因背景相比,靶基因中顯著富集的GO條目。與GO分析一樣,KEGG的通路分析針對的也是靶基因,靶基因向KEGG數據庫(http://www.genome.jp/kegg/pathway.ht?ml)映射,通路顯著富集以KEGG中通路為單位,應用超幾何檢驗,找出與整個參考基因相比較靶基因顯著富集的通路。在計算GO富集與KEGG通路超幾何檢驗時,引入P值。當P值≤0.05,可以確定靶基因顯著富集GO功能條目及主要KEGG信號通路。
2.1 兩樣本microRNAs的差異性表達
結果顯示:共有30個microRNAs顯著差異性表達,其中包括19個表達上調與11個表達下調。在表達上調microRNAs中,has?miR?3117?3P的倍比值約為7,最具有顯著差異性表達;在表達下調的mi?croRNAs中,has?miR?544b的倍比值約為-9,最具有顯著差異性表達,見表1。差異性表達microRNAs的散點分布圖如圖1所示:大部分microRNAs在AS與NC之間,表達是基本相等的(equally?expressed),只有小部分的microRNAs具有顯著差異性表達。說明這些具有顯著差異性表達microRNAs的特異性很高。
2.2 GO富集與KEGG通路
GO富集主要有3個分類,包括生物學過程、細胞組成、分子功能,見圖2。在生物學過程條目中,靶基因被分為23個條目,其中靶基因主要富集在細胞過程、代謝過程、生物調節3個條目中。在細胞組成中,靶基因被分為17個條目,其中靶基因主要富集在細胞、細胞部位、細胞器官3個條目中。在分子功能中,靶基因被分為15個條目,其中靶基因主要富集在分子組成、催化作用、分子轉導作用。檢測結果顯示:共有50個具有意義的KEGG信號通路條目,表2所示為靶基因主要聚集的20個通路條目。其中嘌呤代謝通路(purine metabolism)與促分裂素原活化蛋白激酶(mitogen?activatedproteinkinase,MAPK)信號通路是靶基因最主要的聚集通路,分別有7.35%與3.33%靶基因分別聚集于此。嘌呤代謝通路的網絡分析圖見圖3,紅色標志的方框是差異性表達microRNAs的靶基因。

表1 AS組與NC組microRNAs的差異性表達Tab.1 Differentially expressed microRNAs in the AS and NC libraries

圖1 差異性表達microRNAs的散點圖Fig.1 Differential expression scatter plot

圖2 差異性表達microRNAs靶基因的GO富集分類Fig.2 GO annotation and analysis of microRNAs showed differential expression between the two libraries

表2 差異性表達microRNAs靶基因主要聚集的20個KEGG通路條目Tab.2 KEGG analysis showed the differentially expressed microRNAs of 20 pathways in the AS and NC libraries
在過去30年間,高通量測序技術為研究基因的表達、染色體的分布、細胞信號傳導、蛋白質修飾等表觀遺傳學提供了一個平臺,是DNA發展的一個里程碑,為現代生命科學提供了前所未有的機遇[13]。本研究在前期的研究基礎上,運用高通量測序技術找到AS患者30個差異性表達的microRNAs,對這30個差異性表達的microRNAs預測靶基因,同時對靶基因進行GO富集與KEGG通路的生物信息學分析。旨在找到靶基因的主要富集位點與主要的信號傳導通路,從而探尋深入研究AS發病機制的切入點。本研究所使用的實驗標本有別于傳統的全血、骨髓、組織等,是來源于腎臟組織尿腎臟管細胞分化成的iPSCs細胞,發現的差異性表達microRNAs特異性更高,有利于更精確地找到AS相關的致病mi?croRNAs。Pfaff等[14]認為microRNAs在監控iPSCs的自我更新與多潛能分化中發揮著重要的作用。因此,本研究在找到差異性表達microRNAs的基礎上,對差異性microRNAs的靶基因進行生物信息學分析,為更深入研究AS的病因提供新的思路與方向。

圖3 嘌呤代謝KEGG通路信號圖Fig.3 Differentially expressed genes in the AS and NC libraries were found in MAPK signaling KEGG pathway
本研究結果發現:大部分的靶基因主要富集在細胞、細胞部位、細胞生物學過程,提示在GO富集的3個分類中,大部分的靶基因與細胞功能有關。Steenhard等[15]發現過度表達的系膜整合蛋白α3是AS的特征性標志物,這些標志物可以影響腎小球基底膜內皮細胞、足細胞的形態、黏附和信號傳導。Abrahamson等[16]發現在缺乏α3~4的AS大鼠中,腎小球內皮細胞與足細胞可以在AS大鼠的不同階段合成不同的黏連蛋白。AS腎小球基底膜的內皮細胞與足細胞的改變是AS主要的病理特征。本研究結果發現大部分的靶基因與細胞功能有關,因此猜測本研究發現的細胞功能是否特指腎小球基底膜的內皮細胞與足細胞,仍需進一步探討。
KEGG通路的分析結果發現靶基因主要聚集在嘌呤代謝通路。但是,目前AS與嘌呤代謝紊亂有關的報道還很少見。嘌呤代謝紊亂可以引起高尿酸血癥與痛風,而AS患者在臨床上卻少見高尿酸血癥與痛風表現。但是長期的嘌呤代謝紊亂與腎小球纖維化與腎小球率過濾下降有密切聯系。長期的高尿酸血癥是腎功能減退與腎衰竭發展的一個重要指標[17]。MAPK通路活性可以作為腎臟疾病的潛在機制。研究表明,對MAPK通路的適當抑制有益于腎臟疾病的恢復[18]。本研究結果表明,在AS患者的KEGG信號通路中,靶基因大部分聚集于MAPK通路與嘌呤代謝通路,為今后在MAPK方向進一步研究AS發病機制提供了依據。
綜上所述,本研究運用高通量測序技術找到來源于iPSCs的30個差異性表達microRNAs,對差異性表達microRNAs進行GO富集與KEGG通路生物信息學分析,發現AS具有特異性的靶基因富集位點與信號通路生物信息學作用位點。為更加深入研究AS發病機制提供了新的理論與方法。當然,本研究尚處于初級階段,所發現的特異性生物信息新位點仍需要進一步深入研究探討,以期能真正揭開AS病因,找到用于AS的診斷與治療的真正靶點。
[1]Kashtan CE.Alport syndrome.An inherited disorder of renal,ocu?lar,and cochlear basement membranes[J].Medicine(Baltimore),1999,78(5):338-360.
[2]Mohammad M,Nanra R,Colville D,et al.A female with X?linked Alport syndrome and compound heterozygous COL4A5 mutations[J].Pediatr Nephrol,2014,29(3):481-485.
[3]Deltas C,Pierides A,Voskarides K.Molecular genetics of familial hematuric diseases[J].Nephrol Dial Transplant,2013,28(12):2946-2960.
[4]Storey H,Savige J,Sivakumar V,et al.COL4A3/COL4A4 mutations and features in individuals with autosomal recessive alport syndrome[J].J Am Soc Nephrol,2013,24(12):1945-1954.
[5]Hertz JM.Alport syndrome.Molecular genetic aspects[J].Dan Med Bull,2009,56(3):105-152.
[6]Minoche AE,Dohm JC,Himmelbauer H.Evaluation of genomic high?throughput sequencing data generated on Illumina HiSeq and ge?nome analyzer systems[J].Genome Biol,2011,12(11):R112.
[7]He J,Xu Y,Koya D,et al.Role of the endothelial?to?mesenchymal transition in renal fibrosis of chronic kidney disease[J].Clin Exp Nephrol,2013,17(4):488-497.
[8]Konta T,Ichikawa K,Suzuki K,et al.A microarray analysis of uri?nary microRNAs in renal diseases[J].Clin Exp Nephrol,2013 Nov 6.[Epub ahead of print]
[9]Zhou T,Benda C,Duzinger S,et al.Generation of induced pluripo?tent stem cells from urine[J].J Am Soc Nephrol,2011,22(7):1221-1228.
[10]Chen Y,Luo R,Xu Y,et al.Generation of systemic lupus erythema?tosus?specific induced pluripotent stem cells from urine[J].Rheu?matol Int,2013,33(8):2127-2134.
[11]Tan K,Chen J,Li W,et al.Genome?wide analysis of microRNAs expression profiling in patients with primary IgA nephropathy[J]. Genome,2013,56(3):161-169.
[12]Audic S,Claverie JM.The significance of digital gene expression profiles[J].Genome Res,1997,7(10):986-995.
[13]Leggett RM,Ramirez?Gonzalez RH,Clavijo BJ,et al.Sequencing quality assessment tools to enable data?driven informatics for high throughput genomics[J].Front Genet,2013,4:288.
[14]Pfaff N,Moritz T,Thum T,et al.miRNAs involved in the genera?tion,maintenance,and differentiation of pluripotent cells[J].J Mol Med(Berl),2012,90(7):747-752.
[15]Steenhard BM,Vanacore R,Friedman D,et al.Upregulated expres?sion of integrin alpha1 in mesangial cells and integrin alpha3 and vimentin in podocytes of Col4a3?null(Alport)mice[J].PLoS One,2012,7(12):e50745.
[16]Abrahamson DR,Prettyman AC,Robert B,et al.Laminin?1 reex?pression in Alport mouse glomerular basement membranes[J]. Kidney Int,2003,63(3):826-834.
[17]Kang DH,Nakagawa T.Uric acid and chronic renal disease:possi?ble implication of hyperuricemia on progression of renal disease[J].Semin Nephrol,2005,25(1):43-49.
[18]Pengal R,Guess AJ,Agrawal S,et al.Inhibition of the protein ki?nase MK?2 protects podocytes from nephrotic syndrome?related in?jury[J].Am J Physiol Renal Physiol,2011,301(3):F509-F519.
(編輯 王又冬)
Bioinformatic Analysis of microRNA Expression for Alport Syndrome Based on iPSCs
CHEN Wen?biao1,HUANG Jian?rong1,PENG Wu?jian2,LIN Xiao?cong3,DAI Yong1
(1.Department of Clinical Medical Research Center,Shenzhen People’s Hospital,Second Clinical Medical College of Jinan University,Shenzhen 518020,China;2. Nephrology Department,The Third People’s Hospital of Shenzhen,Shenzhen 518112,China;3.Institute of Biochemistry and Molecular Biology,Guangdong Medical College,Zhanjiang 524023,China)
ObjectiveTo investigate the different expression microRNAs between Alport syndrome(AS)and healthy control(NC),and analyze the signal pathway base on these different expressed microRNAs.MethodsUrine from AS patients and NC were collected to separate the renal tu?bular cells.The renal tubular cells were induced into induced pluripotent stem cells(iPSCs).The different expression microRNAs were found by means of high?throughput illumina technology.The target genes of these different expressed microRNAs were subjected to gene ontology(GO)and kyoto encyclopedia of genes and genomes(KEGG)pathways analysis.Finally,the significant GO enrichment and key KEGG pathways were veri?fied in order to find out the specific part.ResultsThirty microRNAs were found to be significantly different expressed include nineteen were up?reg?ulated and eleven were down?regulated.Gene target predictions for the microRNAs revealed the high ranking GO enrichment were implicated cell molecular,cell part and cellular process.The puine metabolism pathways and mitogen activated protein kinase(MAPK)signaling pathway were en?riched by the largest number of target genes.ConclusionThe significantly different expression of microRNAs and their target genes were involved in the pathogenesis of AS,which could be potential targets for the further study of the cause of AS.
Alport syndrome;microRNAs;gene ontology enrichment;KEGG pathways
R394?33
A
0258-4646(2014)07-0625-06
深圳市衛生局科技項目(201202139)
陳文標(1986-),男,住院醫師,碩士研究生.
戴勇,E-mail:daiyong2222@gmail.com
2014-04-08
網絡出版時間: