王玲玲,謝守軍,李爽,鄭華川,任春麗,曹秀艷
(1.承德醫學院附屬醫院檢驗科,河北 承德 067000;2.承德醫學院附屬醫院中心實驗室,河北 承德 067000;3.承德醫學院附屬醫院產科,河北 承德 067000;4.承德市雙灤區人民醫院檢驗科,河北 承德 067000)
妊娠期糖尿病(gestational diabetes mellitus,GDM)是指妊娠期間出現的糖代謝障礙,病因包括環境、遺傳等多種因素[1-2]。隨著肥胖、超重人口和高齡孕婦的增加,GDM患病率逐年遞增,已達9.3%~19.7%[3]。研究[4]顯示,GDM嚴重危害母嬰的健康,增加孕婦高血壓、感染、流產、早產、胎兒發育滯后等風險。GDM發病主要與妊娠期的胰島素分泌不足或作用缺陷相關,但發病機制尚未明確。已有學者[5]發現,脂聯素、性激素結合蛋白、血管生成素樣蛋白8、CD59分子、血清纖維蛋白凝膠素3、血清糖化纖連蛋白等多種分子與GDM相關。但是,目前關于GDM生物標志物相互作用的網絡和機制還不明確。
生物信息學是運用計算機技術和數學思維,同時結合生物學工具來挖掘和闡明各種數據庫中隱藏的潛在生物學意義[6]。隨著學科的發展和技術的進步,生物信息學可為GDM的研究提供新的思路。迄今為止,尚未見COL4A1、P4HA2與GDM的相關報道。本研究利用生物信息學分析和驗證GDM的關鍵基因,明確GDM的發病機制,進而完善GDM生物標志物網絡,為GDM的早期診斷和治療提供新的策略。
利用基因表達圖譜(Gene Expression Omnibus,GEO)數據庫(https://www.ncbi.nlm.nih.gov/geo/)檢索,關鍵詞為“gestational diabetes mellitus”。篩選條件為“Homo sapiens”“Expression profiling by array”。選擇數據集GSE49524(GSE49524數據集基于GPL7020平臺,包括3例GDM患者和3例健康妊娠對照的臍靜脈內皮細胞基因表達信息)為分析數據集,數據集GSE103552(GSE103552數據集基于GPL6244平臺,包括21例GDM患者和16健康妊娠對照的胎盤內皮細胞基因表達信息)為關鍵基因驗證數據集。
選擇數據集GSE49524,利用在線分析工具GEOR2對GDM樣本和健康妊娠樣本進行分組和差異表達基因篩選。以|logFC|>1且P<0.05為閾值,利用R軟件(3.6.3)獲得差異表達基因。
在仙桃學術網站(https://www.xiantao.love/products)運用R軟件(3.6.3版本)、R語言clusterProfiler(3.14.3版本)和org.Hs.eg.db包(3.10.0版本),在調整后的P<0.05和q<0.2條件下進行GO和KEGG富集分析。
利用STRING數據庫(https://www.cn.string-db.org/),將差異表達基因輸入STRING網站分析工具中,限制“minimum required interaction score”為“high confidence(0.7)”,篩選PPI網絡,利用Cytoscape軟件(3.7.0版本)繪制PPI網絡。利用Cytoscape軟件中“MCODE”程序,限制條件為“Degree Cutoff=2”“Node Score Cutoff=0.2”“K-Core=2”“Max.Depth=100”,評分最高的5個基因為關鍵基因。
1.5.1 數據庫驗證:選擇GEO數據庫中GSE103552基因芯片數據集進行關鍵基因表達情況的驗證。
1.5.2 實時PCR和ELISA法檢測:選取PPI網絡篩選的關鍵基因,且驗證數據集也顯著上調的差異表達基因COL4A1和P4HA2作為驗證對象。
1.5.2.1 臨床資料及分組 選取2018年1月至2021年1月承德醫學院附屬醫院產科住院的GDM孕婦(GDM組)和健康妊娠孕婦(對照組)各50例。納入標準:GDM組均符合GDM的診斷標準[7],患者基本資料齊全。排除標準:妊娠前有糖尿病或者其他急、慢性疾病。本研究獲得承德醫學院附屬醫院倫理委員會批準,所有患者均知情同意并署知情同意書。2組患者年齡、孕次、產次等指標比較差異無統計學意義(均P>0.05),見表1。

表1 GDM組和對照組患者基本臨床指標比較Tab.1 Comparison of the basic clinical data between the GDM and control groups
1.5.2.2 實時PCR檢測COL4A1和P4HA2mRNA表達 采集2組孕婦的外周靜脈血,收集受試者外周血單個核細胞,-80 ℃保存備用。使用RNA提取試劑盒(中實基因科技有限公司)、cDNA合成擴增試劑盒(天根生化科技有限公司)和實時熒光定量PCR儀(Roche480)完成mRNA檢測。實驗條件:預變性95℃ 15 min,40個循環,95 ℃ 10 s,60 ℃ 20 s,72 ℃ 30 s。利用2-ΔΔCt法計算。PrimerBank(https://www.pga.mgh.harvard.edu/primerbank/)在線設計引物,由北京博邁德基因技術有限公司合成,引物序列見表2。

表2 引物序列Tab.2 Primer sequences
1.5.2.3 ELISA法檢測COL4A1和P4HA2蛋白表達 采集2組孕婦的外周靜脈血,收集受試者血清,-80 ℃保存備用;使用COL4A1 ELISA試劑盒(武漢楚銳科藥業科技有限公司)、P4HA2 ELISA試劑盒(武漢菲恩生物科技有限公司)和酶標儀(美國Thermo Fisher Scientific公司)檢測血清中COL4A1和P4HA2的水平。
利用SPSS 25.0軟件進行數據分析,符合正態分布的計量資料以表示;2組比較采用t檢驗;非正態分布的計量資料以M(P25~P75)表示,組間比較采用Mann-WhitneyU檢驗,P<0.05為差異有統計學意義。
結果顯示,共獲得GDM差異表達基因99個,其中表達上調69個,表達下調30個,見表3、4。

表3 上調的差異表達基因Tab.3 Up-regulated differentially expression genes
KEEG通路富集顯示,差異表達基因參與的信號通路主要包括AGE-RAGE信號通路、TGF-β信號通路和蛋白質消化吸收等信號通路。GO功能分析結果顯示,在分子功能上,差異表達基因在血小板衍生生長因子活性、細胞外基質組織結構的抗張性和細胞外基質結構成分等功能上顯著富集;在細胞成分上,差異表達基因主要分布在膠原三聚體復合物、內質網腔和細胞外基質中;在生物學過程中,差異表達基因主要參與腎臟系統的發育、細胞外基質組織和細胞外結構組織等生物學過程。見圖1。

圖1 差異表達基因的GO和KEGG富集分析Fig.1 GO and KEGG analysis of differential expression gene
通過STRING和Cytoscape軟件,將評分>4.5的Module構建99個差異表達基因PPI網絡,在cytoHubba插件中選擇Top5 nodes ranked by degree,獲得5個關鍵基因,分別為:COL4A1、P4HA2、COL1A1、COL3A1和COL5A2,見圖2。

圖2 關鍵基因PPI網絡Fig.2 PPI network of hub genes
結果顯示,在GSE103552基因芯片數據集中,與對照組比較,GDM組COL4A1和P4HA2表達顯著上調(均P<0.05),而COL1A1、COL3A1和COL5A2表達2組差異沒有統計學意義(均P>0.05),見圖3。

圖3 GSE103552數據集中GDM組與對照組關鍵基因表達比較Fig.3 Expression levels of hub genes between the GDM and control groups in GSE103552 datasets
結果顯示,與對照組比較,GDM組COL4A1、P4HA2的mRNA和蛋白表達顯著增高,差異均有統計學意義(均P<0.05),見表5。

表4 下調的差異表達基因Tab.4 Down-regulated differentially expression genes

表5 GDM組與對照組COL4A1、P4HA2的mRNA和蛋白表達比較Tab.5 Comparison of mRNA and protein expression of COL4A1 and P4HA2 between the GDM group and control group
COL4A1的編碼基因位于染色體13q34,全長158 199 bp,共有52個外顯子,它是人體多種組織結構的重要組成部分,在Ⅳ型膠原蛋白的合成過程中發揮重要作用[8]。有研究[9]發現COL4A1基因與糖尿病的發展有顯著相關性;CUROVIC等[10]研究表明COL4A1與糖尿病視網膜病變的發生有關,但是并沒有證明其參與了疾病的進一步惡化。另外,研究[11-13]發現COL4A1與肝細胞癌、胃癌和膠質瘤等惡性腫瘤的進展也相關。脊椎動物的脯氨酸4-羥化酶有3個α同工酶,分別是P4HA1、P4HA2、P4HA3[14]。P4HA2是細胞外基質重構的膠原修飾酶成員之一,有研究[15-16]發現P4HA2可以通過膠原依賴的PI3K/AKT信號通路促進上皮-間質轉化和膠質瘤惡性轉化;也可以通過調節膠原蛋白沉積促進乳腺癌進展和轉移。還有研究[17]報道P4HA2與常染色體顯性近視相關。
本研究基于GEO數據庫中的GSE49524數據集,對3例GDM患者和3例健康妊娠對照的臍靜脈內皮細胞基因表達信息進行分析,共篩選出差異表達基因99個,其中表達上調69個,表達下調30個。應用STRIN和Cytoscape軟件構建了PPI網絡,共獲得COL4A1、P4HA2、COL1A1、COL3A1和COL5A25個關鍵基因。對5個關鍵基因驗證的結果顯示,與對照組比較,COL4A1和P4HA2表達顯著上調(均P<0.05),表明COL4A1和P4HA2可能參與了GDM的發生過程,與以往研究結果一致。
為了進一步研究GDM發病的可能機制,本研究GO和KEGG富集分析結果顯示,差異表達基因在細胞外基質組織結構的抗張性、細胞外基質結構成分、膠原三聚體復合物、細胞外基質組織和細胞外結構組織等部分富集。細胞外基質是由結構蛋白、蛋白聚糖、生長因子/細胞因子和酶等組成的三維網絡,主要成分是膠原蛋白,形成生物活性支架,為細胞提供結構和生化支持。目前已發現的膠原蛋白有28種,其中Ⅳ型膠原蛋白是細胞基底膜的重要組成部分,廣泛分布于全身各處;細胞外基質中膠原蛋白的調控可以作為疾病治療的靶點[18]。GDM是妊娠期常見的病癥之一,世界衛生組織已經將其列為糖尿病的獨立類型,其發病機制與糖尿病有許多相似之處。研究[19]顯示,在糖尿病發生和發展過程中,細胞外基質蛋白表達發生變化,導致細胞外基質網絡的結構改變以及細胞-細胞外基質和細胞-細胞相互作用的改變。隨后,這些變化導致糖尿病相關并發癥(腎病、視網膜病變和糖尿病心肌病)的發生。關于糖尿病相關心臟細胞外基質表達的研究[19]表明,糖尿病相關心臟病和非糖尿病相關心臟病2組患者心臟中Ⅰ型、Ⅲ型和Ⅵ型膠原蛋白的含量均增加;但2組間僅Ⅲ型膠原表達有顯著差異,未檢測到Ⅳ和Ⅴ膠原蛋白的增加;糖尿病誘導的細胞外基質重構也可能影響心肌病、動脈粥樣硬化、頸動脈疾病和間質纖維化的發展。在糖尿病心肌病中,過量的膠原沉積,尤其是Ⅰ、Ⅲ和Ⅳ型膠原沉積,會導致左心室功能受損[19]。四氧嘧啶誘導的大鼠糖尿病模型研究[19]顯示,與Ⅰ型膠原和Ⅳ型膠原以及其他細胞外基質蛋白比較,Ⅵ型膠原蛋白顯著增加。因此推測COL4A1和P4HA2等差異表達基因可能通過細胞外基質相關通路在GDM的疾病發展過程中發揮作用。
綜上所述,本研究利用生物信息學分析和驗證了GDM的關鍵基因,分別為COL4A1、P4HA2、COL1A1、COL3A1和COL5A2。其中COL4A1和P4HA2上調可能促進了GDM的發生。COL4A1和P4HA2可能是GDM的潛在生物學標志物,本研究為GDM的診斷及個性化治療提供一定理論支持。由于本研究的樣本量相對較小,可能存在一定的局限性,所以研究結果尚需擴大樣本量進行臨床實驗驗證。