薛雨非,師帥,柳祖波,余蔓妮
(金華市人民醫院生殖中心,金華 321000)
大約10%~15%的育齡夫婦罹患不孕不育,其中男性不育約占35%~50%[1]。男性不育與性功能障礙、精索靜脈曲張、生殖系統感染、內分泌、梗阻性無精子癥(OA)、非梗阻性無精子癥(NOA)等密切相關[2]。NOA在男性中的發病率約為1%,占不育男性的10%~15%,是男性不育最為重要的病因之一[3]。NOA研究較多的包括染色體異常、Y染色體微缺失和表觀遺傳學等,但大約70%的NOA原因仍然是未知的。NOA患者睪丸的病理特征是沒有或很少生精細胞,但10%的患者通過手術可以發現生精細胞,并通過輔助生殖技術可能獲得生育[4]。
精子發生依賴于睪丸細胞微環境的穩定,睪丸的微環境改變可能會影響生育能力[5]。目前我們對睪丸細胞微環境的了解有限,微環境細胞的異質性,以及在分子水平上NOA患者與正常可生育人群之間細胞類型的差異知之甚少,這都影響我們對NOA發病機制的理解。單細胞RNA測序的快速發展使我們能夠更好研究睪丸的單個細胞群。以往的大多數研究都針對生殖細胞群本身,較少研究睪丸的微環境體細胞群[6]。最近一項關于青春期人類睪丸單細胞轉錄組的研究揭示了睪丸體細胞的發育變化[7];另一項單細胞轉錄組的研究揭示了睪丸支持細胞在NOA中的關鍵作用。尚未見有關睪丸間質細胞群和NOA的關聯性研究[8]。
為探討睪丸間質細胞群在NOA患者睪丸精子發生障礙中的作用,本文通過整合分析GEO數據庫的多個單細胞測序數據,鑒定出在NOA患者中占比較高的細胞,然后分析這類細胞在NOA患者和正常可生育人群之間的差異表達基因,緊接著對差異表達基因進行GO和KEGG分析,最后通過差異表達基因構建PPI網絡和鑒定出核心基因。本研究結果有助于探討睪丸細胞微環境對精子發生的作用和潛在的NOA發病新機制,為后續NOA細胞微環境研究和核心基因功能研究奠定基礎。
GEO(http://www.ncbi.nlm.nih.gov/geo)是一個全球免費的公共基因組數據庫,包含豐富的基因表達數據和單細胞測序數據。本次研究的基因表達轉錄組數據來源于GSE149512數據集,選取無生精障礙的人群為正常組,NOA患者為NOA組。
1.單細胞測序數據的細胞聚類和注釋以及差異表達基因的篩選:運用R軟件(版本4.02)中的Seurat包(版本4.0)整合分析GSE149512的數集,經過一系列的數據過濾、質控、歸一化、主成份分析,并采用非線性降維UMAP的方法進行細胞聚類分析。通過Find All Markers函數,獲取細胞聚類的Marker基因,并查詢Human Cell Landscape(HPL)數據庫進行細胞注釋,并繪制差異表達基因的可視化熱圖。
2.差異表達基因的GO功能富集和KEGG通路分析:運用Cytoscape軟件(3.6.1版)的ClueGO和CluePedia插件對差異表達基因的進行GO功能富集和KEGG通路分析。
3.蛋白-蛋白互作(PPI)網絡的構建和關鍵基因的鑒定:通過String數據庫(http://string-db.org),構建差異表達基因的PPI網絡,并且把互作綜合評分定為大于等于0.4;隨后,將String分析后的數據導入Cytoscape軟件,再次可視化PPI網絡;然后,運用CytoHubba插件中的5種運算方法(Degree、DMNC、EPC、MCC、MNC)識別PPI網絡中的核心基因;選取75個核心基因(每種算法中前15個核心基因)繪制韋恩圖。
整合GSE149512數據集,最終形成1個由39 392個細胞、40 210個基因、31個聚類細胞構成的數據集(圖1A)。其中,NOA組有17 415個細胞,正常組有21 977個細胞,聚類細胞的分布情況見圖2B。通過Find All Markers函數識別出聚類細胞的Marker基因,結合HPL數據庫,31個聚類細胞鑒定為10種類型睪丸細胞(圖1C)。NOA組的細胞主要由體細胞構成,其睪丸間質細胞占比最高,為44.4%(7 736/17 415)(圖1D、E)。
睪丸間質細胞主要由5個聚類細胞(聚類0、3、5、15、22)和11 284個細胞構成,其中NOA組的睪丸間質細胞主要由聚類0和聚類3細胞構成(圖2A、B)。接著,提取數據集的睪丸間質細胞繼續分類,經過質控、標準化,降維后出現10個睪丸間質細胞聚類(圖2C),并顯示出NOA組和正常組中的睪丸間質細胞有顯著差異(圖2D、E)。我們進一步通過條件為P<0.01、avg LogFC>1的過濾方式,分析兩組睪丸間質細胞的差異表達基因情況,總共得到145個差異表達基因:與正常組相比較,NOA組上調的基因82個,下調的基因63個。熱圖顯示30個差異顯著的基因(圖2F)。
A:整合數據中的睪丸間質細胞的分布;B:兩組間睪丸間質細胞的分布;C:再聚類后的睪丸間質細胞的分布;D:兩組間細胞聚類的分布;E:兩組間睪丸間質細胞的差異;F:熱圖。圖2 睪丸間質細胞在NOA和正常人群中的差異表達基因分析
為了探究睪丸間質細胞在正常人群和NOA人群的差異,我們對差異表達基因進行了GO和KEGG富集分析。GO富集分析結果顯示,在生物學過程方面,睪丸間質細胞發揮作用較多,且在免疫抗原提呈功能方面也發揮著重要作用;在細胞組分方面,主要在細胞膜、胞質和核糖體中發揮作用;在分子功能方面,主要發揮細胞周期蛋白激酶的調控、核苷核酸的鏈接等作用。KEGG通路分析結果顯示,主要通過病毒感染,炎癥細胞因子等通路發揮顯著作用(圖3)。
A:生物學過程分析結果;B:細胞組分分析結果;C:分子功能分析結果;D:KEGG通路分析結果。圖3 差異表達基因的GO和KEGG分析
我們將這些差異表達基因映射到STRING數據庫中構建PPI網絡,然后,將這些交互網絡數據重新導入到Cytoscape軟件中,最終構成了158個點和2 132條邊的PPI網絡(圖4A);我們通過CytoHubba插件中的5種分類算法,獲取每種算法Top 15的核心基因(圖4B~F);最后,整合這些基因,在3種算法以上重疊出現的基因有以下 10個:RPS2、RPS3、RPS9、RPS11、RPS12、RPS27A、RPL7、RPL8、RPL37、UBA52,這10個基因被認為是核心基因(表1、圖4 G),這些基因基本屬于核糖體蛋白類基因,其中RPS11基因在4種算法中均有出現。
表1 10個核心基因的信息匯總列表
A:PPI網絡圖(紫色圓圈基因是候選關鍵基因);B:依據Degree算法遴選出的前15基因;C:依據DMNC算法遴選出的前15基因;D:依據EPC算法遴選出的前15基因;E:依據MCC算法遴選出的前15基因;F:依據MNC算法遴選出的前15基因;G:韋恩圖。圖4 PPI網絡的構建和核心基因的鑒定
睪丸體細胞微環境對生殖細胞的作用,就像土壤對種子發芽的作用一樣,為精子發生提供必要的支持和營養成分[19]。盡管越來越多的證據表明人類睪丸體細胞群具有高度異質性,但是我們對睪丸微環境內穩態的認識仍很有限,影響了對男性不育的理解[20]。在我們國內的相關研究中,生育障礙的男性大約23.5%是由于染色體異常和Y染色體微缺失造成的,大部分的NOA患者存在病因未明的現狀[21]。但是大部分患者診斷為NOA時,已經到了育齡階段,很少在青春期能診斷明確,因此關鍵差異表達基因有潛力為NOA的早期診斷提供有力的手段。
睪丸體細胞群包括間質細胞、肌樣細胞、巨噬細胞和支持細胞,構成睪丸的細胞微環境或生態位,在正常精子發生過程中起重要作用[22]。睪丸間質細胞是睪丸間質的重要組成部分[23-24],通過分泌雄性激素參與調控精子發生,并可以通過影響白介素1α、轉化生長因子β(TGFβ)、抑制素、胰島素樣生長因子1(IGF1)、胰島素樣肽3(INSL3)、雌激素和甲狀腺激素等生長因子和類固醇激素發揮關鍵作用[25-26]。睪丸間質細胞發育不良和不發育為睪丸間質細胞先天性發育不良和不發育,不能合成與分泌睪酮,致使生殖管道與外生殖道女性化,已被認為是男性假兩性畸形的原因之一。成年型的睪丸間質細胞不發育亦被描述,其發病率尚不清。睪丸間質細胞功能受損可導致雄激素分泌異常,并影響性別分化、性腺發育和精子發生。我們研究發現,GSE149512資料庫中關于睪丸間質細胞的數據占比非常高(44.4%),間接證明了其在精子發生中的重要性。
分析NOA和正常人群睪丸間質細胞間共有145個差異表達基因,其中上調的基因82個、下調的基因63個。GO富集分析結果顯示,這些差異表達基因主要在細胞質的核糖體中發揮細胞周期蛋白激酶的調控、核苷核酸的鏈接等分子功能。KEGG通路分析顯示,主要富集在炎癥細胞因子等通路。隨后繼續使用差異表達基因構建PPI網絡,整合5種算法的前15個基因,最終獲取到10個核心基因,這10個基因主要是核糖體蛋白相關的基因。核糖體是高度復雜的翻譯機器,已被證明在調節蛋白質合成方面具有異質性,其主要通過共翻譯方式調控男性生殖細胞特異性蛋白的折疊,這些蛋白對精子的形成至關重要。在我們的研究中,RPS11出現的頻次最高,預示著RPS11可能通過睪丸間質細胞影響精子的發生。RPS11是核糖體小亞基40S的組成部分,屬于核糖體蛋白S17p家族,由RPS11基因所編碼,主要存在于真核生物中[27]。該基因與小核糖核酸基因U35B共同轉錄,后者位于第3內含子中。正如編碼核糖體蛋白的基因所特有的那樣,這個基因有多個加工過的假基因,分散在整個基因組中。其相關機制是肽鏈延長和CAP帽結合形成復合物后激活mRNA,并隨后與43S結合發揮其作用。目前鮮見報道RPS11和男性不育之間的相關性研究,Bansal等[28]研究表明,與正常對照組比較,弱精子癥組的RPS11顯著降低,無精子癥組顯著升高。本文結果與上述結果一致,并精準提示,RPS11基因的差異表達主要體現在睪丸間質細胞。
本文的不足主要是只分析了NOA組比例最高的睪丸間質細胞,未能全面分析睪丸體細胞,此外通過生物信息學鑒定的核心基因亦未通過實驗驗證。后期我們將針對這些不足,更加全面的分析NOA和正常人群在不同睪丸體細胞的差異表達基因,及其相關功能驗證。