陳慧珍,楊健康



【摘要】 目的 研究新型冠狀病毒(SARS-CoV-2)侵染所需宿主基因TMPRSS2、CTSL、PIKFYVE、TPCN2的重要功能變異在全世界不同人群間的分布差異。
方法 使用GTEx數據庫,在新型冠狀病毒的主要侵染器官肺中分析TMPRSS2、CTSL、PIKFYVE、TPCN2基因的eQTL位點。使用1 k GP(千人基因組計劃)數據庫,系統分析上述4個基因的錯義變異在世界不同人群間的分布差異,并使用PolyPhen-2和SIFT軟件預測錯義突變導致的氨基酸替代是否影響蛋白功能。
結果 在肺中發現了4個q值小于0.05的eQTL位點,分別為TMPRSS2基因的rs35074065、CTSL基因的rs2378757、PIKFYVE基因的rs12475932、TPCN2基因的rs930786。TMPRSS2、CTSL、PIKFYVE、TPCN2基因的4個eQTL位點可能與上述4個基因在東亞人群中的較低表達水平有關。在TMPRSS2、CTSL、PIKFYVE、TPCN2基因上分別有10、6、15、30個有害錯義變異,大部分變異都是低頻變異,其中大多數僅在一個人群中具有特異性。唯一的例外是TPCN2基因的變異位點rs78034812,它在全球的等位基因頻率大于1%,在東亞人群中具有最高的等位基因頻率且該位點在物種間具有保守性。
結論 TMPRSS2、CTSL、PIKFYVE、TPCN2基因存在重要功能變異,這些變異的等位基因頻率在不同人群間存在差異,可能影響基因的表達和功能,從而影響人群對新型冠狀病毒的易感性以及感染后癥狀的差異。
【關鍵詞】 新型冠狀病毒;TMPRSS2;CTSL;PIKFYVE;TPCN2;人群;變異
中圖分類號:R181.3 文獻標志碼:A DOI:10.3969/j.issn.1003-1383.2022.02.002
Analysis of important functional variation of host genes required for SARS-CoV-2: TMPRSS2, CTSL, PIKFYVE and TPCN2
[HJ1][HJ]
CHEN Huizhen, YANG Jiankang
(Laboratory of Biochemistry and Molecular Biology of School of Basic Medical Sciences, Dali University, Dali 671000, Yunnan, China)
【Abstract】 Objective To study the distribution differences of important functional variants of the host genes TMPRSS2, CTSL, PIKFYVE and TPCN2 required for SARS-CoV-2 infection among different populations in the world.
Methods GTEx database was used, and the eQTL loci of the TMPRSS2, CTSL, PIKFYVE, and TPCN2 genes in the lungs of the main infecting organs of the SARS-CoV-2 were analyzed. 1k GP (1000 Genomes Project) database was used, and the distribution of missense variants of the above-mentioned 4 genes among different populations in the world were systematically analyzed, and PolyPhen-2 and SIFT software were used to predict whether amino acid substitutions caused by missense mutations to affect protein function.
Results 4 eQTL loci with q value less than 0.05 were found in the lungs, including rs35074065 of TMPRSS2 gene, rs2378757 of CTSL gene, rs12475932 of PIKFYVE gene, and rs930786 of TPCN2 gene. The 4 eQTL loci of TMPRSS2, CTSL, PIKFYVE, and TPCN2 genes may be related to the lower expression levels of the above-mentioned 4 genes in East Asian populations. There were 10, 6, 15, and 30 deleterious missense variants in TMPRSS2, CTSL, PIKFYVE, and TPCN2 genes, respectively. Most of the variants were low-frequency variants, and most of them were specific in only one population. The only exception was rs78034812, a variant in the TPCN2 gene, which had an allele frequency greater than 1% worldwide. It had the highest allele frequency in East Asian populations and this locus was conserved among species.
Conclusion There are important functional variations in TMPRSS2, CTSL, PIKFYVE, and TPCN2 genes. The allele frequency of these variants vary among different populations, which may affect gene expression and function, thereby affecting the population's susceptibility to the SARS-CoV-2 and the difference in symptoms after infection.
【Key words】 SARS-CoV-2; TMPRSS2; CTSL; PIKFYVE; TPCN2; population; mutation
新型冠狀病毒肺炎是指由一種β新型冠狀病毒,新型致病性SARS冠狀病毒2(SARS-CoV-2)引起的傳染性呼吸道疾病[1],以發熱、咳嗽、頭痛、乏力、呼吸困難等癥狀為主要臨床表現的病毒性肺炎[2]。全球SARS-CoV-2的流行構成全球衛生緊急情況[3]。SARS-CoV-2侵染細胞依賴于病毒刺突(S)蛋白與細胞受體ACE2的結合[4],以及跨膜絲氨酸蛋白酶2(TMPRSS2基因)和組織蛋白酶L(CTSL基因)等蛋白酶對病毒S蛋白的活化[5]。SARS-CoV-2侵染293/hACE2細胞的過程主要是通過內吞作用介導的,而阻斷PIKfyve(PIKFYVE基因)和TPCN2(TPCN2基因)能強烈抑制SARS-CoV-2進入細胞,這說明PIKfyve和TPC2對病毒進入細胞至關重要[6]。
TMPRSS2、CTSL、PIKFYVE、TPCN2基因對于SARS-CoV-2侵染宿主細胞都發揮了重要的作用,因此研究上述基因的重要功能變異在全世界不同人群間的分布差異也具有重要的意義。許多基因變異位點,包括編碼區錯義突變和表達定量性狀位點(eQTL),都可能影響這些基因的表達和功能。進一步在世界不同人群中對這4個基因進行遺傳分析,有助于解釋疾病的癥狀及易感性差異。現將對4個基因的遺傳變異,包括eQTL位點和功能編碼區錯義變異在人群中的分布差異進行分析,旨在為新型冠狀病毒在世界不同人群中傳播的流行病學研究提供參考。
1 材料與方法
1.1 TMPRSS2、CTSL、PIKFYVE、TPCN2基因eQTL的人群分布
新型冠狀病毒主要靶器官是肺,因此分析肺組織的eQTL位點[7]。使用GTEx數據庫[8],選擇q值小于0.05的位點作為與肺組織表達相關的eQTL位點。1 k GP(千人基因組計劃)的數據庫[9]包括2504個個體的全基因組突變位點數據。從1 k GP的數據庫中下載TMPRSS2、CTSL、PIKFYVE、TPCN2基因的eQTL位點的等位基因頻率數據。分別統計南亞、歐洲、東亞、美洲和非洲5類人群的等位基因頻率分布。
1.2 TMPRSS2、CTSL、PIKFYVE、TPCN2基因錯義突變的人群分布
從1 k GP數據庫中下載TMPRSS2、CTSL、PIKFYVE、TPCN2基因編碼區的錯義突變數據,并使用PolyPhen-2和SIFT軟件預測錯義突變導致的氨基酸替代是否影響蛋白功能。SIFT軟件中,預測結果小于0.05則為有害變異。PolyPhen-2軟件中,預測結果大于0.4470則為有害變異。分別計算錯義突變和有害錯義突變的等位基因頻率的世界主要人群分布,并用Ensembl數據庫[10]檢查部分重要突變的物種保守性。
2 結 果
2.1 TMPRSS2、CTSL、PIKFYVE、TPCN2基因eQTL位點的人群分布
本研究使用GTEx數據庫,在肺組織中發現了4個q值小于0.05的eQTL位點,分別為TMPRSS2的rs35074065、CTSL的rs2378757、PIKFYVE的rs12475932、TPCN2的rs930786。使用1 k GP數據比較了不同人群中4個eQTL位點的等位基因頻率分布差異,結果表明,位于TMPRSS2基因上的eQTL變異rs35074065(等位基因對表達的影響值為0.2749)在東亞人群中的等位基因頻率最低(0.0060)。與其他人群相比,在東亞人群中TMPRSS2基因上的rs35074065和TPCN2基因上的rs930786兩個eQTL變異的等位基因頻率明顯低于其他人群。而其他兩個eQTL變異(CTSL的rs2378757和PIKFYVE的rs12475932)具有更高的等位基因頻率。例如,位于CTSL基因中的eQTL變異rs2378757(等位基因對表達的影響值為-0.2319)的等位基因頻率在東亞人群中最高(0.9831)。見表1。
2.2 TMPRSS2、CTSL、PIKFYVE、TPCN2基因錯義突變的人群分布
本研究統計了來自1 k GP數據庫的TMPRSS2、CTSL、PIKFYVE、TPCN2基因編碼區所有錯義突變的數量和頻率分布(表2),重點對這4個基因的有害錯義突變的人群分布進行了分析。
表3結果顯示TMPRSS2基因中10個有害錯義突變的等位基因頻率。所有這些變異在5個人群中都是低頻變異,且其中大多數僅在一個人群中具有特異性。例如,rs544474510、rs372286621、rs190265904這三個變異位點對于東亞人群是特異的,其他人群中不存在相關突變。表4~表6的結果分別顯示,CTSL、PIKFYVE、TPCN2中有6個、15個、30個有害錯義突變。除TPCN2基因上的rs78034812等位基因頻率>0.01外,這些大多數變異在所有人群中都是低頻變異。
我們試圖評估這4個基因的所有有害錯義突變的總攜帶率。這4個基因的總攜帶率也很低(表2),但在人群之間差異很大。TPCN2具有比其他三個基因更多的有害錯義突變。東亞人群中的總攜帶率是全球人口的兩倍。
3 討 論
新型冠狀病毒具有很強的傳播性和致病性,容易引起呼吸道感染,導致病毒性肺炎[11]。截至北京時間2021年4月13日,全球累計確診病例達1億3千萬人,累計死亡病例達290萬余人。這些數字仍以驚人的速度增長,這使全世界的公共衛生和經濟受到巨大影響[12]。目前為止,尚無針對新型冠狀病毒肺炎的特效治療手段。我們通過研究TMPRSS、CTSL、PIKFYVE、TPCN2基因上的功能變異位點,鑒定這些基因中自然發生的重要功能變異,這些變異可能影響不同群體間基因功能或表達的差異。
SARS-CoV-2的生命周期可分為三個階段:進入宿主細胞及細胞內的運輸,病毒基因組的復制,以及新病毒粒子的包裝成熟和排出[13]。目前已有研究發現,SARS-CoV-2的蛋白(NSP1、NSP5、ORF8等)可與人類宿主蛋白相互作用。并發現不同新型冠狀病毒蛋白可參與多種復合物的形成和生物學過程,包括DNA復制、表觀遺傳學和基因表達的調控、囊泡運輸、脂類修飾等。如NSP5可能抑制人類HDAC2蛋白轉運到細胞核中,并可能影響HDAC2介導的炎癥和干擾素反應。ORF8可參與調控內質網對蛋白質加工過程[14]。另有研究表明,宿主細胞RNA結合蛋白(TIA1、SND1、IGF2BP1、DDX42等)可與SARS-CoV-2 RNA基因組相互作用。此外,下調4個基因TIA1、SND1、IGF2BP1、DDX42的表達顯著降低了受感染細胞中SARS-CoV-2基因組RNA的總量[15]。
目前已有研究表明,新型冠狀病毒除了對肺有影響外,還會對胃腸道產生影響,常表現為腹瀉、惡心和嘔吐[16]。同時,SARS-CoV-2也可以侵染神經細胞,使機體出現頭痛、頭暈等癥狀[17]。極少數患者甚至還會出現幻覺、躁動等精神方面的表現[18]。不僅如此,SARS-CoV-2還會導致急性腎損傷、急性心肌損傷等嚴重的并發癥[19~20]。
本研究系統地分析了TMPRSS2、CTSL、PIKFYVE、TPCN2基因中重要的功能變異,包括eQTL變異。結果顯示與其他人群相比,在東亞人群中TMPRSS2基因中的rs35074065和TPCN2基因中的rs930786這兩個eQTL變異的等位基因頻率明顯低于其他人群。相反,其他兩個eQTL變異(CTSL基因中的rs2378757和PIKFYVE基因中的rs12475932)在東亞人群中比其他人群具有更高的等位基因頻率。這些發現表明,TMPRSS2、CTSL、PIKFYVE、TPCN2基因的eQTL位點可能與它們在東亞人群中的較低表達水平相關。
除TPCN2基因中的rs78034812外,其他大多數變異在所有人群中都是低頻變異。rs78034812在東亞人群具有最高的等位基因頻率,頻率高達3.87%,奇怪的是非洲人群中不存在該變異。而此變異會導致TPCN2蛋白第681位氨基酸殘基從絲氨酸變為亮氨酸,從親水性氨基酸變為疏水性氨基酸。使用Ensembl數據庫檢查這個變異的保守性,發現這個變異在靈長類動物和哺乳動物中都是保守的。因此,此變異與TPCN2蛋白功能的關系值得進一步研究。雙孔通道(TPCs)是位于宿主細胞內溶酶體區室膜上的鈣陽離子通道,SARS-CoV-2依賴于這些細胞器進行感染和復制。TPCs的兩種亞型TPC1和TPC2主要分布在溶酶體內,而TPC2主要位于晚期溶酶體區室[21]。TPCs直接參與鈉外流,調節細胞內滲透壓,使得囊泡表面積與體積比發生顯著變化。因此,TPCs抑制劑可抑制溶酶體的融合潛力進而限制病毒侵染[22]。有研究表明,抑制劑粉防己堿、柚皮素阻斷TPC2活性時,SARS-CoV-2侵染細胞的能力會被抑制[6,23]。
另外,我們發現雖然這4個基因的有害錯義突變總攜帶率很低,但在人群之間差異很大。TPCN2具有比其他三個基因更多的有害錯義突變。東亞人群中的總攜帶率是全球人口的兩倍。不同人群之間功能變異的等位基因頻率差異表明,遺傳基礎的多樣性可能影響人群之間相應基因的功能。
參 考 文 獻
[1] CHUGH H,AWASTHI A,AGARWAL Y,et al.A comprehensive review on potential therapeutics interventions for COVID-19[J].Eur J Pharmacol,2021,890:173741.
[2] 何青林,劉芳麗,姬新穎,等.新型冠狀病毒肺炎相關并發癥研究進展[J].河南大學學報(醫學版),2020,39(6):391-396.
[3] PHAN T.Novel coronavirus:from discovery to clinical diagnostics[J].Infect Genet Evol,2020,79:104211.
[4] HOFFMANN M,KLEINE-WEBER H,SCHROEDER S,et al.SARS-CoV-2 cell entry depends on ACE2 and TMPRSS2 and is blocked by a clinically proven protease inhibitor[J].Cell,2020,181(2):271-280.e8.
[5] VIVEK-ANANTH R P,RANA A,RAJAN N,et al.In silico identification of potential natural product inhibitors of human proteases key to SARS-CoV-2 infection[J].Molecules,2020,25(17):E3822.
[6] OU X Y,LIU Y,LEI X B,et al.Characterization of spike glycoprotein of SARS-CoV-2 on virus entry and its immune cross-reactivity with SARS-CoV[J].Nat Commun,2020,11(1):1620.
[7] 王淮,楊健康.新型冠狀病毒復制依賴基因MTHFD1的表達及功能[J].重慶師范大學學報(自然科學版),2020,37(4):140-146,封3.
[8] GTEX CONSORTIUM,HUMAN GENOMICS.The Genotype-Tissue Expression (GTEx) pilot analysis:multitissue gene regulation in humans[J].Science,2015,348(6235):648-660.
[9] 1000 GENOMES PROJECT CONSORTIUM,AUTON A,BROOKS L D,et al.A global reference for human genetic variation[J].Nature,2015,526(7571):68-74.
[10] BUSHEHRI A,BAREZ M R,MANSOURI S K,et al.Genome-wide identification of human-and primate-specific core promoter short tandem repeats[J].Gene,2016,587(1):83-90.
[11] 嚴新忠,洪大富,程智,等.新型冠狀病毒(SARS-CoV-2)采樣方法的現狀與展望[J].天津科技大學學報,2020,35(6):1-6.
[12] AHMED R,HASAN R,SIDDIKI AMAMZ,et al.Host range projection of SARS-CoV-2:South Asia perspective[J].Infect Genet Evol,2021,87:104670.
[13] WONG J P,DAMANIA B.SARS-CoV-2 dependence on host pathways[J].Science,2021,371(6532):884-885.
[14] GORDON D E,JANG G M,BOUHADDOU M,et al.A SARS-CoV-2 protein interaction map reveals targets for drug repurposing[J].Nature,2020,583(7816):459-468.
[15] SUN L,LI P,JU X,et al.In vivo structural characterization of the SARS-CoV-2 RNA genome identifies host proteins vulnerable to repurposed drugs[J].Cell,2021,184(7):1865-1883.e20.
[16] LI LY,WU W,CHEN S,et al.Digestive system involvement of novel coronavirus infection:prevention and control infection from a gastroenterology perspective[J].J Dig Dis,2020,21(4):199-204.
[17] LV P,PENG F,ZHANG Y Q,et al.COVID-19-associated meningoencephalitis:a care report and literature review[J].Exp Ther Med,2021,21(4):362.
[18] ELKHALED W,BEN ABID F,AKHTAR N,et al.A 23-year-old man with SARS-CoV-2 infection who presented with auditory hallucinations and imaging findings of cytotoxic lesions of the corpus callosum (CLOCC)[J].Am J Case Rep,2020,21:e928798.
[19] LI N,ZHU L,SUN L,et al.The effects of novel coronavirus (SARS-CoV-2) infection on cardiovascular diseases and cardiopulmonary injuries[J].Stem Cell Res,2021,51:102168.
[20] MIGLIACCIO M G,DI MAURO M,RICCIOLINO R,et al.Renal involvement in COVID-19:a review of the literature[J].Infect Drug Resist,2021,14:895-903.
[21] HEISTER P M,POSTON R N.Pharmacological hypothesis:TPC2 antagonist tetrandrine as a potential therapeutic agent for COVID-19[J].Pharmacol Res Perspect,2020,8(5):e00653.
[22] FILIPPINI A,D'AMORE A,PALOMBI F,et al.Could the inhibition of endo-lysosomal two-pore channels (TPCs) by the natural flavonoid naringenin represent an option to fight SARS-CoV-2 infection?[J].Front Microbiol,2020,11:970.
[23] CLEMENTI N,SCAGNOLARI C,D'AMORE A,et al.Naringenin is a powerful inhibitor of SARS-CoV-2 infection in vitro[J].Pharmacol Res,2021,163:105255.
(收稿日期:2021-09-28 修回日期:2021-12-06)
(編輯:梁明佩)