劉格良,張皓旻,王毅興,遲小華,陳浩然,陳熙勐,張鈞棟,李卓陽,智 鵬,,楊 波,葉 芳,盧學春*
2019年12月開始,中國湖北省武漢市開始陸續出現多例不明原因的肺炎患者,感染者最常見的臨床癥狀表現為發燒、咳嗽、頭疼、肌肉酸痛等,重癥和危重癥患者可出現急性呼吸窘迫綜合征、造血系統抑制、急性腎損傷和急性心臟損傷等多器官損傷,胸部影像學顯示雙肺浸潤性炎癥改變[1-2]。經中國有關部門確認,這是一種由新型冠狀病毒(SARS-CoV-2)引起的傳染性疾病[3]。根據一系列臨床研究發現,盡管COVID-19總體病死率較嚴重急性呼吸綜合征(SARS)、中東呼吸綜合征(MERS)低,但患者一旦發展為重癥或危重癥,短期內病情進展迅速,往往累及兩個或兩個以上的器官損傷,最終多器官衰竭導致死亡。然而遺憾的是,現階段臨床針對COVID-19的治療策略以器官功能支持和預防并發癥為主,缺乏特異性抗病毒藥物,僅有部分患者能夠獲益,對于重癥危重癥患者缺乏有效治療措施。而在以往研究中,已證實亞硒酸鈉不僅是有效的病毒抑制劑[4-5],還具有調節人體免疫平衡,抗炎癥和多器官保護的作用[6],猜測其針對COVID-19可能具有潛在的治療作用。因此,本課題組通過分析亞硒酸鈉對全基因組表達譜的影響,結合表觀精準治療預測平臺(EpiMed)的預測結果,探索亞硒酸鈉多器官保護作用及其針對COVID-19的潛在治療作用。
1.1 數據來源 本研究數據來源于GEO數據庫,該數據庫提供了大量可供研究人員免費獲取的基因表達數據[7]。以“Sodium selenite”為關鍵詞進行檢索,以全基因組表達芯片數據或轉錄組測序數據、有對照組、每組至少3個生物學重復以及實驗設計思路清晰為標準篩選數據。
1.2 實驗設計 本研究所使用的數據集均為經過GEO數據庫預處理后的轉錄組表達譜矩陣。根據數據來源實驗描述以及各樣本類型,將數據類型設定為對照組與實驗組,即:連續1 d、3 d和5 d向大鼠經口服填喂2 mg/kg亞硒酸鈉的實驗組與連續1 d、3 d和5 d向大鼠經口服填喂水的對照組。進行差異分析并進行后續的分析研究。
1.3 方法
1.3.1 數據預處理、標準化與差異表達基因的篩選 在Bioconductor(http://www.bioconductor.org/)網站下載生物信息分析的R語言程序包[8]。利用Bioconductor中的Impute程序包KNN算法補全表達譜缺失值[9]。同時利用Bioconductor中的GEOquery程序包下載與實驗數據集相匹配的平臺注釋文件GPL5425[10],并使用R語言編寫代碼將探針對應到基因上。如果多個探針對應一個基因,則采用所有探針表達值的平均值代表這個基因的表達值。得到兩組數據集的表達譜用于后續分析。隨后利用Bioconductor中的Limma程序包篩選差異表達基因。首先使用P<0.05初步篩選差異表達基因,隨后利用Bonferroni算法矯正假發現率(FDR)的原始P值并計算倍數變化(FC)[11]。本研究中,差異表達基因的篩選標準為FDR<0.05,|Log2FC|>1。差異結果保存用于后續分析。
1.3.2 篩選顯著性基因與人類同源基因轉換 利用上述分析得到的差異表達基因,采用R語言中的RRA算法篩選差異表達基因中的顯著性基因。RRA方法主要是對不同數據集獲得的基因進行排序。如果1個基因在所有實驗中表達倍數越高,且P值越小,則其越顯著[12]。
篩選得到顯著性基因后,利用Bioconductor中的biomaRt程序包[13],分別獲取人與大鼠的注釋信息,并進行人類同源基因轉換。
1.3.3 構建顯著性差異表達基因的蛋白質相互作用調控網絡 利用STRING v11.0(https://string-db.org/)開源數據庫構建蛋白質互作(Protein-protein interaction,PPI)網絡[14]。為了更好地理解重要基因的相互作用,使用STRING數據庫預測其編碼蛋白PPI網絡,本研究使用的可靠性閾值為>0.4。Cytoscape軟件(https://cytoscape.org/)用于構建PPI網絡,每個節點代表基因、蛋白質或其他分子,節點之間的連線代表生物分子之間的相互作用[15]。PPI網絡可用于識別亞硒酸鈉調控的顯著基因編碼的蛋白質之間的相互作用和通路關系。核心節點,即具有重要生物功能的蛋白質通過計算蛋白質之間的連線數以及每個節點與特定節點有無直接連接來確定,并給出排名。本研究使用Cytoscape軟件中的CytoHubba插件篩選核心節點,結果輸出前10名基因[16]。
1.3.4 富集分析 利用Bioconductor中的ClusterProfiler程序包[17]進行基因本體學(GO)[18]和京都基因與基因組百科全書(KEGG)通路富集[19]分析。本研究對出現在PPI網絡中的顯著性差異表達基因進行聚類,聚類結果以P<0.05為閾值進行篩選,最后利用R語言對結果進行可視化展示。
1.3.5 疾病關聯分析與藥物關聯分析 本研究團隊前期基于“系統生物學”和“比較功能基因組學”理論設計了“整合多組學分析”算法,并以此為基礎建立了涵蓋所有疾病、中藥、化合物的人體功能基因組學數據的表觀精準治療預測平臺(Epigenomic Precision Medicine Prediction Platform,EpiMed)[20-23]。疾病關聯分析則是利用EpiMed對亞硒酸鈉進行多組學疾病關聯分析,以關聯強度<-0.1且P<0.05為閾值,篩選亞硒酸鈉可能具有潛在治療作用的疾病與相應的分子治療靶點。藥物關聯分析則是以關聯強度的絕對值>0.1且P<0.05為閾值,篩選可能與亞硒酸鈉具有相似治療作用或不良藥物相互作用的藥物。
2.1 數據來源 在GEO數據庫以“Sodium selenite”為關鍵詞進行檢索,共得到205條Series,經過逐一篩選,發現GSE59913數據集內不僅含有正常大鼠在亞硒酸鈉影響下的全基因組表達譜數據,并且設置有相應的對照組,能滿足本課題的研究需求。本研究使用的數據具體樣本描述見表1。

表1 數據具體樣本基本描述
2.2 差異表達基因分析 用藥1 d、3 d、5 d的3組數據分別篩選出差異表達基因288、152、186個。其中上調表達的基因分別為162、81、95個,下調表達的基因分別為126、71、91個(圖1A、圖1B、圖1C)。利用RRA算法對兩組差異結果綜合統計得到376個顯著性基因,其中178個基因表達上調,198個基因表達下調,部分顯著性基因結果見圖1D。利用R語言進行人類同源基因轉換,最終獲得人類同源基因273個。

圖1 差異表達基因分析與樣本顯著性基因注:A:用藥1 d的差異表達基因;B:用藥3 d的差異表達基因;C:用藥5 d的差異表達基因;D:RRA算法篩選的部分顯著性基因結果。FDR<0.05,|Log2FC|>1
2.3 顯著性基因蛋白質相互作用調控網絡構建 用STRING開源數據庫對顯著性基因進行PPI網絡構建,其中有221個蛋白出現在PPI網絡中,顯示出與其他蛋白的相互作用關系(圖2A)。依據基因連線數目篩選核心基因(hub gene),統計結果圖形化展示見圖2B。

圖2 蛋白質相互作用網絡與關鍵基因注:A.蛋白質相互作用網絡;B.利用MCC插件根據蛋白質相互作用網絡的拓撲結構篩選出的關鍵基因
2.4 蛋白質互作網絡中出現的顯著性基因的富集分析 對273個顯著性基因進行富集分析,GO分析結果顯示,這些基因的富集情況分為生物學進程、細胞成分、分子功能3種類型(圖3)。其中,在生物學進程方面,這些基因大多與血管生成、激素分泌與運輸、氧化應激反應、細胞凋亡信號有關。在細胞成分方面,大多影響細胞質的功能。在分子功能方面,大多與氧化還原酶活性、轉運酶活性、血紅素活動有關。

圖3 基因本體(GO)富集結果注:橫坐標為GO ID編號,縱坐標表示每個GO中被富集的基因數量
KEGG通路富集分析顯示,273個顯著性基因多富集在免疫反應、細胞生命周期調節、心功能調節、造血功能調節、病毒感染性疾病相關通路(圖4),其中C8B、C9、EGR1、IL1β、NCAM1等基因主要富集在朊病毒病相關信號通路(圖5A);CSNK1d、PRKAA1、ARNTL等基因主要富集在心臟功能調節相關信號通路(圖5B);AKR1B10、GGH、GPHN等基因主要富集在葉酸生物合成信號通路(圖5C);CDK2、PCK1、PRKAA1、SMAD4、CDKN2B、EGFR、GRM1、MAPK9等基因主要富集在FoxO信號通路(圖5D);D3D、IL5、DLL3、FOS、PPP3CA、ATF2、CCL2、IL1β、MAPK9、SELE等基因主要富集在免疫調節相關通路(圖5E)。

圖4 京都基因與基因組百科全書(KEGG)通路富集結果注:橫坐標表示每個通路中富集的基因數量,縱坐標表示通路名稱,P<0.05

圖5 京都基因與基因組百科全書通路圖展示注:A.朊病毒病信號通路;B.晝夜節律信號通路;C.葉酸生物合成信號通路;D.叉頭框信號通路;E.免疫調節相關信號通路
2.5 疾病關聯分析與藥物關聯分析 利用EpiMed進行多組學疾病關聯分析,本研究發現,亞硒酸鈉可能通過相應分子治療靶點針對多發性退行性關節炎、流行性感冒、社區獲得性肺炎、呼吸道合胞體病毒感染、SARS等疾病具有潛在治療作用,見表2。在藥物關聯分析方面,本研究發現,亞硒酸鈉與奈韋拉平、西多福韋、虎杖、白頭翁等藥物呈正相關,提示亞硒酸鈉可能與這些藥物聯用具有協同作用(表3);而與索拉非尼、卡那霉素、景天等藥物呈負相關,則提示與這些藥物的不良相互作用(表4)。

表2 亞硒酸鈉可能具有潛在治療作用的部分疾病及相應的分子治療靶點

表3 EpiMed平臺關于亞硒酸鈉的藥物關聯分析預測結果(正相關)

表4 EpiMed平臺關于亞硒酸鈉的藥物關聯分析預測結果(負相關)
COVID-19是一種新發傳染病,病原為SARS-CoV-2,人群普遍易感。已有研究證實,SARS-CoV-2屬β冠狀病毒,與SARS-CoV核苷酸同源性高達85%,且其體內結合蛋白與SARS-CoV相同,均為血管緊張素轉換酶2(Angiotensin-converting enzyme 2,ACE2)。綜合現有研究發現,COVID-19重癥患者最常同時受累的器官和系統包括:肺、心臟、消化道、腎臟、肝臟、中樞神經系統和造血系統,臨床救治難度極大,死亡率高達61.5%[24]。通過THE HUMAN PROTEIN ATLAS(https://www.proteinatlas.org/)查詢發現,ACE2在上述多個人體器官組織中均表達豐富,且已有大量相關研究證實[24-27]。除此之外,通過對COVID-19患者尸檢發現,患者的肺組織除了有免疫細胞浸潤外,還存在肺細胞脫落和肺透明膜形成。肺泡腔內存在多核合胞細胞,表現出病毒性細胞病變[28]。并且日本腦炎病毒(Japanese encephalitis virus,JEV)、柯薩奇病毒(Coxsackie virus)等RNA病毒直接導致細胞凋亡在Mukherjee等[29]的研究中已被證實。據此推測,ACE2作為SARS-CoV-2進入人體細胞的特異性受體,在全身多個組織器官表達豐富,重癥患者由于病毒載量高,SARS-Cov-2在全身多個器官激活凋亡信號通路,人體內多臟器受損更加顯著,最終致使患者多臟器功能衰竭死亡[30],且成昊等[31]研究同樣認為SARS-CoV-2感染靶器官的關鍵點在于ACE2在人體的分布和表達情況,進而從腎素-血管緊張素系統角度討論了COVID-19患者的多器官保護治療策略。因此,我們認為,針對COVID-19患者,不僅要進行充分有效的抗病毒、抗炎癥治療,還應注重人體多臟器的保護,盡量減少和避免患者向重癥、危重癥發展。盡管磷酸氯喹、阿比多爾、洛匹那韋/利托那韋、瑞德西韋、利巴韋林、干擾素等藥物目前已在臨床上試用,但其療效有待于更大規模的臨床試驗進一步證實。
亞硒酸鈉是目前應用最普遍的硒強化劑,具有抗腫瘤、抗炎癥、調節細胞生命周期的作用[32]。在以往研究中證實亞硒酸鈉能夠抑制乙型肝炎病毒(Hepatitis B virus,HBV)、埃博拉病毒(Ebola virus)的轉錄和復制,從而有效起到抗病毒的作用[33]。除此之外,Reinhart等[34]研究發現,患者血漿內硒的含量與組織的損傷、感染和多器官功能衰竭高度相關。并且已有研究證實,亞硒酸鈉對肝臟、腎臟、睪丸、心臟以及造血系統等人體多組織器官具有保護作用。
本研究旨在通過分析亞硒酸鈉對全基因組表達譜的影響,結合表觀精準治療平臺(EpiMed)分析結果,探索其多器官保護作用以及對COVID-19潛在治療作用機制。研究發現,亞硒酸鈉對人體全基因組影響復雜,進一步的蛋白質相互作用網絡顯示,EGFR、FOS、CCL2、IL-1β、CXCL12、MMP2、ADRB2、SMAD4、JAK2、PPARA這10個關鍵基因在網絡中具有重要地位。Yi等[35]研究已證實,CCL2、IL-1β作為促炎細胞因子參與呼吸道炎癥。Gandhi等[36]研究指出,MicroRNA-141可以下調PPARA表達來降低HBV啟動子活性,從而抑制病毒復制。其余關鍵基因大多也與免疫調節、細胞周期調控、炎癥反應相關[37-44]。在本研究中,認為亞硒酸鈉治療COVID-19可能與這些關鍵基因的調控密不可分。一方面,亞硒酸鈉可能通過下調EGFR、CCL2、IL-1β、MMP2、FOS、ADRB2等基因的表達,降低患者血清炎性細胞因子表達水平,抑制病理性血管的生成、免疫細胞的大量增殖以及調控趨化因子濃度梯度,防止大量免疫細胞向肺部的趨化;另一方面亞硒酸鈉可能通過上調CXCL12、SMAD4、JAK2、PPARA等基因的表達,降低IL-5、IL-6和IL-13等細胞因子表達水平,阻斷特定的上皮細胞對炎癥信號的應答,抵抗炎癥發生。還可以分泌調節性T細胞,激活下游轉錄生長因子,在抑制病毒復制的同時,發揮器官保護和修復作用。
在信號通路方面,本研究發現,亞硒酸鈉的作用不僅限于抗病毒,如:亞硒酸鈉可以抑制硫醇/二硫鍵交換反應,特別是在蛋白質二硫鍵異構酶(PDI)催化病毒糖蛋白附著到宿主細胞膜過程中發生的一系列交換反應,從而阻止病毒進入宿主細胞,發揮抗病毒作用[33];亞硒酸鈉還可能激活PI3K/Akt信號通路,不僅可以誘導樹突狀細胞產生干擾素,還可以抑制巨噬細胞凋亡,從而有效殺死未進入細胞的病毒體,吞噬被病毒感染和凋亡的細胞,有效降低病毒載量[45]。除此之外,推斷亞硒酸鈉還可以通過調控Th1、Th2及Th17細胞分化通路、TNF信號通路和PPAR信號通路發揮人體免疫調節的作用,降低人體內多種細胞炎癥因子水平,起到治療慢性呼吸道炎癥的作用[46]。亞硒酸鈉的攝入不僅可以抑制這些促炎通路,控制患者體內細胞因子和趨化因子的表達,降低人體內活性氧類(Reactive oxygen species,ROS)水平,還可以通過激活PPAR信號通路誘導巨噬細胞向有抗炎作用的M2表型分化,從而有效抑制炎癥反應[47-48]。
與此同時,亞硒酸鈉還可能具有多器官保護作用,如亞硒酸鈉調控晝夜節律通路,抑制Bmal1的表達,而Per、Cry分別被Ckk/6和AMPK磷酸化激活,在細胞質中積累,從而穩固心肌細胞生物鐘的負反饋環,降低心功能障礙的風險,在以往研究中已被證實[49]。亞硒酸鈉還可以激活葉酸生物合成信號通路,加速四氫葉酸(Tetrahydrofolic acid,THF)的合成,以激活后續復雜的酶促反應網絡,幫助患者恢復正常造血功能,在以往研究中已被證實[50-51]。此外,武紅平等[52]研究發現,FoxO信號通路,下游的抗凋亡蛋白BCL2L1在抵抗流感病毒感染誘導的宿主細胞凋亡方面發揮重要作用。張磊等[53]發現,通過激活FoxO信號通路,可以抑制慢性腎衰竭中的慢性腎間質纖維化和氧化應激反應,起到器官保護作用。據此可以進一步推測,亞硒酸鈉可以調控FoxO信號通路介導抗凋亡和抗炎反應,抑制細胞的異常衰老死亡,抵抗病毒誘導的細胞凋亡而導致的器官損傷,發揮多器官保護作用。
在疾病關聯方面,利用本課題組前期建立的表觀精準治療預測平臺(EpiMed)分析發現,亞硒酸鈉針對多發性退行性關節炎、流行性感冒、社區獲得性肺炎、SARS、呼吸道合胞體病毒感染等疾病具有潛在治療作用。值得注意的是,這些疾病的臨床病理特征與COVID-19較為相似,且EpiMed預測出的治療靶點如FOS、CCL2、CXCL12、EGR1、IL-1β、C9、SELE、IL-5等不僅出現在關鍵基因中,而且還在上述提及的信號通路中發揮重要作用。這間接提示亞硒酸鈉可能通過這些分子靶點調控抗病毒、免疫及細胞周期相關通路,調節人體免疫反應,提高免疫耐受,抑制炎癥反應,阻止人體多臟器受損,發揮對COVID-19的潛在治療作用。在藥物關聯分析方面,奈韋拉平、泛昔洛韋、西多福韋、利巴韋林、氯喹、白頭翁、虎杖、冬青等一系列藥物與亞硒酸鈉呈正相關,提示這些藥物可能與亞硒酸鈉具有相似的治療作用。而索拉非尼、拉貝洛爾、卡那霉素、薯蕷、景天等一系列藥物與亞硒酸鈉呈負相關,提示這些藥物可能與亞硒酸鈉之間存在不良藥物相互作用,聯合用藥需謹慎,以上推斷有待進一步研究證實。
綜上所述,本研究通過亞硒酸鈉影響下的全基因組進行分析,初步探究了亞硒酸鈉作用于人體的分子機制,發現亞硒酸鈉可以調控多個分子靶點和信號通路,發揮其調控細胞周期、抗炎癥、抗病毒、調節人體全局免疫環境和人體多器官保護的作用。結合表觀精準治療預測平臺(EpiMed)的分析結果,從而推測亞硒酸鈉可能通過相同機制對COVID-19具有潛在治療作用,對于亞硒酸鈉應用于臨床治療COVID-19具有一定的指導意義。