唐可欣 伍茜 付文龍 程建國 吳杰 周磊 王翔 趙位 任梓薇 李依濛 劉潔 羅燕



摘 要 林麝(Moschus berezovskii)是一種具有較高經濟價值和藥用價值的保護野生動物。為深入研究林麝線粒體基因組的結構特征及遺傳變異,基于Illumina NovaSeq平臺對林麝肺成纖維細胞FMD-C1線粒體進行全基因組測序,并進行特征注釋、結構預測、序列分析和系統發育重建。結果顯示,FMD-C1線粒體基因組序列全長為16 351 bp,共有13個蛋白編碼基因(protein coding gene,PCG),22個tRNA,2個rRNA和兩段非編碼區,具有明顯的AT偏好性。將序列上傳至GenBank,登錄號為MW879208。與NCBI上林麝的其余序列比對,FMD-C1的4個PCGs中檢測出5個單氨基酸突變和3個插入氨基酸;D-loop區檢測出19個差異堿基和2個堿基缺失。系統進化分析發現與林麝親緣關系最近的是安徽麝。研究結果可為林麝的選育和遺傳多樣性保護提供參考依據,也為進一步探討林麝肺部疾病線粒體水平的致病機制奠定基礎。
關鍵詞 林麝;線粒體基因組;蛋白編碼基因;非編碼區;系統進化
林麝(Moschus berezovskii)是麝屬中體型最小的一種。雄麝香腺中分泌的麝香是一種高級動物香料,也是一味名貴中藥材,具有較高的經濟價值和藥用價值[1]。由于近幾十年棲息地破壞和人為捕殺,種群數量大幅減少,麝現已被列為中國一級重點保護動物[2]。為解決麝數量驟降以及推廣麝香的可持續利用,中國現大力發展人工養麝產業,但麝養殖種群發病率高、死亡率高,導致人工養麝產業發展緩慢。其中,肺部疾病是林麝主要死因之一,對其背后的病理機制探究目前多集中在病原菌分離鑒定等方面[3-4]。
線粒體是廣泛存在真核生物細胞內的重要細胞器,參與細胞供能、信息傳遞和細胞凋亡等過程,與多種疾病、衰老過程、發育及生物的性狀密切相關[5]。線粒體基因組(mitochondrial DNA,mtDNA)獨立于核基因組之外,具有分子質量小、獨立復制、母系遺傳、突變速率快等可成為理想遺傳標記的特點,是研究物種起源和遺傳進化的重要分子工具[6-7]。除此之外,線粒體產生的活性氧(reactive oxygen species,ROS)在以肺部為代表的多種疾病發病機制中發揮廣泛的作用,過量的ROS還可以反作用在mtDNA上引起堿基突變[8-9]。由于林麝馴化期短,其警覺、易應激的特點使其疾病難以在病危前被察覺,并且麝的分類至今仍在探討階段[10-12]。因此本研究對林麝肺成纖維細胞mtDNA進行測序和分析,進一步豐富林麝mtDNA的信息,鞏固林麝的系統分類,為林麝選育和遺傳資源保護奠定基礎。通過比較林麝mtDNA的差異,以期為林麝的肺部疾病前期發現和多樣性保護等研究提供科學依據。
1 材料與方法
1.1 試驗材料
林麝肺成纖維細胞系FMD-C1由四川農業大學動物檢疫實驗室建立并保存。線粒體基因組提取試劑盒購于北京索萊寶科技有限公司。
1.2 方? 法
1.2.1 線粒體提取 將5×107個林麝肺成纖維細胞FMD-C1消化洗滌后離心,將收集到的細胞用1.0 mL預冷的Lysis Buffer重懸,冰浴研磨后轉移至離心管,1 000×g離心5 min后收集上清并轉移至新的離心管中重復離心,然后將收集到的上清再次轉移至新的離心管中,12 000×g離心10 min,收集沉淀,經洗滌后將最終得到的高純度線粒體沉淀用100 μL的Store Buffer重懸。全程4 ℃低溫操作。濃度及純度經NanoDrop 2000檢測合格后,送至南京派森諾基因科技有限公司進行全基因組測序。
1.2.2 全基因組測序與組裝 采用全基因組鳥槍法策略構建文庫。然后利用第二代測序技術,基于Illumina NovaSeq平臺對文庫進行雙末端測序。將平均質量值小于20和長度小于50 bp的序列過濾后,采用A5-miseq 2015和SPAdes 3.9.0對其余高質量數據從頭拼裝,構建contig和scaffold序列。根據拼接序列的測序深度提取序列,將高測序深度的序列同 NCBI 上的 nt 庫進行 blastn比對,挑出各拼接結果的線粒體序列。將拼接結果整合,確定contig間的位置關系,填補gap。使用pilon 1.18軟件對結果進行校正后,得到最終的林麝線粒體序列。
1.2.3 序列分析 采用 cgview(http://cgview.ca/)可視化軟件繪制線粒體全基因組圈圖。將拼接得到的完整線粒體基因組序列上傳至在線服務器MITOS(http://mitos2.bioinf.uni-leipzig.de/index.py)進行功能注釋和tRNA二級結構預測。再分別計算線粒體全基因組和各特征的堿基組成并分析。從NCBI下載已發布的林麝線粒體序列,將蛋白編碼基因(protein coding gene,PCG)翻譯后進行氨基酸差異比對,并比對兩段非編碼區的堿基位點突變情況。
1.2.4 系統發育分析 從NCBI上下載28個哺乳動物的mtDNA作為參考序列,包括麝科、牛科、鹿科、叉角羚科和其他哺乳動物。運用軟件MEGA 7.0以鄰接法構建系統進化樹,bootstrap重復次數設置為1 000。
2 結果與分析
2.1 線粒體基因組結構與組成
林麝肺成纖維細胞FMD-C1線粒體基因組序列經注釋后提交GenBank(登錄號:MW879208)。如圖1所示,林麝線粒體基因組序列全長為16 351 bp,共有13個PCGs,22個tRNA,2個rRNA和兩段非編碼區。林麝FMD-C1線粒體的堿基組成為A(33.96%)、G(12.92%)、C(25.03%)和T(28.10%)。林麝線粒體各特征的分布和堿基組成情況如表1所示,線粒體基因排列緊湊,部分基因間存在重疊現象,除trnY之外,各基因的GC含量均小于50%,表明林麝線粒體基因組具有AT偏好性。
2.2 rRNA與tRNA編碼基因結構特征
林麝肺成纖維細胞FMD-C1線粒體包含兩個rRNA,分別為12S rRNA和16S rRNA,兩者均位于正義鏈上,之間夾著1個trnV基因。與大多數麝類似,林麝線粒體中也包含22個tRNA基因,其序列長度為66~75 bp,tRNA的總序列長度達1 511 bp。22個tRNA基因中,有2個絲氨酸轉運RNA和2個亮氨酸轉運RNA;8個tRNA(trnQ、trnA、trnN、trnC、trnY、trnS2、trnE和trnP)在反義鏈上,其余14個tRNA均位于正義鏈。tRNA預測顯示(圖2),FMD-C1的 21個tRNA均可形成三葉草型二級結構,而 trnS1(AGY)由于缺失二氫尿嘧啶臂(D臂)而不能形成典型的三葉草結構。
2.3 蛋白編碼基因
林麝線粒體包含13個PCGs,基因長度為201~1 830 bp,占基因組總長度的69.84%,除nad6外,其他12個蛋白基因均編碼于正義鏈上。將林麝線粒體13個PCGs進行編碼氨基酸差異比對,結果如圖3所示,除cox2外的其余12個PCGs均有差異氨基酸出現。大部分差異氨基酸出現在登錄號為KY792714的林麝上。對于FMD-C1,僅在4個PCGs中檢測出差異氨基酸,分別是位于nad1的I102V、nad2的M217T、nad5的T41M、I580V和2~4位3個插入氨基酸KVI以及cob的I232V。
2.4 非編碼區
林麝肺成纖維細胞FMD-C1線粒體的非編碼區包含2 段,分別是D-loop (displacement-loop region) 區和OL (origin of L-strandreplicationregion)區。其中D-loop區位于trnP和trnF之間,共922 bp。統計兩段非編碼區的突變位點發現,OL區在林麝線粒體中無突變發生。D-loop區的堿基位點突變情況如圖4所示,出現差異的90個堿基中,大部分突變發生在登錄號為KY792714的林麝上,且同源樹顯示6條D-loop序列形成以KY792714和其余序列的兩個分支。在其余5條序列中,則僅有30個位點出現堿基不一致的情況,其中FMD-C1的單一突變占19個,并在149~150 bp出現2個堿基缺失。
2.5 線粒體基因組系統進化分析
系統發育重建結果如圖5所示,該進化樹由兩個大分支構成,蘇門答臘猩猩單獨形成一個分支,在進化樹上與林麝的親緣關系最遠。同科物種在進化樹上聚類。5條林麝mtDNA序列于進化樹頂部聚類,與安徽麝共同組成一個分支,而登錄號為KY792714的林麝與喜馬拉雅麝等處于同一分支,置信度均為100。根據聚類情況可知與FMD-C1親緣關系最近的物種是安徽麝。
3 討? 論
mtDNA常常被作為遺傳多樣性分析的工具和相關疾病的分子標記。隨著高通量測序技術的快速發展,其應用范圍在林麝基因組學的研究中也越來越廣。本研究通過高通量測序獲得林麝肺成纖維細胞線粒體FMD-C1的全基因組序列。該序列為雙鏈環狀閉合分子,包含37個基因,基因排列順序與其余林麝完全一致,總體堿基含量呈現出AT偏好,這可能與自然突變和選擇壓力等原因有關[6,13]。22個tRNA中,除trnS1外均能形成典型的三葉草結構。兩個rRNA(rrnS和rrnL)均為單拷貝,基因內部無間隔區,也符合后生動物的特征[6]。
研究證實,線粒體損傷與炎癥性疾病和自身免疫性疾病的發生有關,異常線粒體特征如mtDNA突變的發生率增加等也是導致多種肺部疾病的重要原因[8,14-15]。mtDNA的改變不僅可以作為獨立的病理過程,而且還可以與現有的病理機制協同作用,從而誘發、促進或加劇肺部疾病[8]。Gazdhar等[16]的研究證明,mtDNA突變在肺纖維化過程中累積,成為ROS和隨后纖維化的重要驅動因素,而ROS釋放增加反過來繼續損害mtDNA。且由于其不包含內含子或組蛋白,靠近ROS的產生位點和復制遵循不對稱分裂等特點,mtDNA比核DNA更容易受到損傷,突變率高出10~20倍[15,17]。低效的氧化磷酸化(oxidative phosphorylation,OXPHOS)易引起ROS的產生,mtDNA編碼的13種蛋白質均與OXPHO有關,因此本研究對13個PCGs進行單氨基酸突變分析[18]。從結果來看,不同功能的PCGs的堿基組成和選擇壓力不同。登錄號為KY792714的林麝氨基酸差異率高,與其余林麝呈現顯著異常,因此應除去該條序列進行討論。與其余林麝PCGs編碼蛋白對比,FMD-C1在nad1、nad2、nad5和cob中檢測出單氨基酸突變,內容均為I與V、M與T之間的替換,經預測對蛋白質結構無明顯影響,跨膜蛋白的分布也與其余序列一致,因此在FMD-C1的mtDNA中未檢出引起PCGs明顯功能障礙的突變位點。
目前,麝的分類仍在探討中,早期麝科動物的分類主要依據外形、地理分布和解剖學特征,此后一些學者結合單基因序列比較來對麝科動物的系統分類進行研究,但研究結果仍存在差異,如彭紅元等[10]提出,麝科動物的分類還存在著喜馬拉雅麝和安徽麝等是不是有效種的爭議。隨著分子生物學技術的發展,借助于mtDNA可以提高線粒體遺傳樹和物種樹之間的一致性概率。線粒體中的非編碼區在調節線粒體DNA 復制和轉錄中起到非常重要的作用,該區域由于不編碼基因,可以容納和積累堿基突變[19-20]。非編碼區一般包括兩段,其中D-loop 區突變速率快且多態性豐富,因此在生物的遺傳多樣性和起源進化研究中具有重要意義。從D-loop區的堿基突變情況來看,與PCGs相同,大部分突變發生在登錄號為KY792714的林麝上。除去該條序列,FMD-C1的該區域也存在著較為豐富的變異,有一定的遺傳多樣性。而登錄號為EU043465和NC_012694的林麝D-loop區序列完全一致,可見兩個種群間基因交流較多。
但實際上,單基因系統發育通常與涉及多個數據集的研究有很大不同,因此,完整的mtDNA逐漸被用于構建可靠的系統發育,以確定具有準確時間尺度的物種或更高分類群之間的進化關系[21]。本研究的系統進化樹展示了明確的分類關系,鼷鹿相對于其他反芻動物依然占據基礎位置,這與Hassanin等[22]的研究相同,不同的是麝科更靠近鹿科而不是牛科。本研究中,林麝與安徽麝的親緣關系相近,這與Pan等[12]的研究一致。而對于登錄號為KY792714的林麝線粒體mtDNA與喜馬拉雅麝等聚類更近的情況,結合與其余林麝PCGs的氨基酸差異比較和D-loop區堿基突變位點分析結果,推測是該麝在分類時方法選擇不同或是未鑒定的雜交個體,建議根據核基因組分析重新判斷其作為林麝mtDNA的可靠性[23]。
結合線粒體基因組研究的意義,本研究結果為林麝的遺傳多樣性保護與育種提供了參考依據。同時也為進一步探討林麝肺部疾病線粒體水平的致病機制奠定基礎。
參考文獻 Reference:
[1] 楊 威,伍 茜,程建國,等. 林麝干擾素α基因克隆、表達及轉錄調控分析[J]. 生物技術通報,2022,38(1):21-31.
YANG W,WU X,CHENG J G,et al. Cloning,expression and transcriptional regulation of interferon-α in forest musk deer[J].Biotechnology Bulletin,2021,38(1):1-11.
[2] 王 霞,袁旭東,周洪艷,等. 重慶金佛山國家級自然保護區林麝(Moschus berezovskii)種群數量初步調查及地理分布[J]. 中國農學通報,2022,38(1):21-31.
WANG X,YUAN X D,ZHOU H Y,et al. Moschus berezovskii in Chongqing Jinfo Mountain national nature reserve:population size and geographical distribution[J]. Chinese Agricultural Science Bulletin,2020,36(19):44-47.
[3] 伍 茜,李雄婕,喻 東,等. 林麝源支氣管敗血波氏桿菌FMDBb1株的分離鑒定及全基因組序列分析[J]. 微生物學通報,2021,48(12):4731-4741.
WU X,LI X J,YU D,et al. Isolation,identification and whole-genome analysis of? Bordetella bronchiseptica FMDBb1 from forest musk deer (Moschus berezovskii)[J].Microbiology China,2021,48(12):4731-4741.
[4] 劉春燕. 林麝Moschus berezovskii養殖種群死亡原因及其生命生理特征研究[D]. 上海:華東師范大學,2008.
LIU CH Y. A study on reasons of death and physiological features for breeding forest musk deer(Moschus berezovskii)[D]. Shanghai:East China Normal University,2008.
[5] 侯俊秀. 冬蟲夏草菌的線粒體基因組測序及比較線粒體基因組學研究[D]. 太原:山西大學,2016.
HOU J X. Asssembly of the mitochondrial genome of Ophiocordyceps sinensis and its comparative genomic analysis[D]. Taiyuan:Shanxi University,2016.
[6] 劉 凱,馮曉宇,馬恒甲,等. 錢塘江三角魴線粒體基因組測序及其結構特征分析[J]. 浙江農業學報,2020,32(9):1591-1608.
LIU K,FENG X Y,MA H J,et al. Complete sequence and gene organization of mitochondrial genome of Megalobrama terminalis from Qiantang River[J]. Acta Agriculturae Zhejiangensis,2020,32(9):1591-1608.
[7] KRAMER P,BRESSAN P. Our(mothers) mitochondria and our mind[J]. Perspectives on Psychological Science,2018,13(1):88-100.
[8] CLOONAN S M,CHOI A M. Mitochondria in lung disease[J]. The Journal of Clinical Investigation,2016,126(3):809-820.
[9] ARAVAMUDAN B,THOMPSON M A,PABELICK C M,et al. Mitochondria in lung diseases[J]. Expert Review of Respiratory Medicine,2013,7(6):631-646.
[10] 彭紅元,陳偉才,張修月. 麝的分類研究概述[J]. 玉林師范學院學報,2010,31(02):66-72.
PENG H Y,CHEN W C,ZHANG X Y. A review on the classification of musk deer[J]. Journal of Yulin Normal University (Natural Science),2010,31(2):66-72.
[11] 竭 航,鄭程莉,王建明,等. 林麝分子遺傳學研究進展[J]. 中國中藥雜志,2015,40(22):4319-4323.
JIE H,ZHENG CH L,WANG J M,et al. Research progress on molecular genetics of forest musk deer[J]. China Journal of Chinese Materia Medica,2015,40(22):4319-4323.
[12] PAN T,WANG H,HU C,et al. Species delimitation in the genus moschus (ruminantia:Moschidae) and its high-plateau origin[J]. Plos One,2015,10(8):e134183.
[13] 夏立萍,徐 鳴,郭寶英,等. 等邊淺蛤線粒體全基因組測序和系統發育研究[J]. 浙江海洋大學學報(自然科學版),2021,40(2):93-100.
XIA L P,XU M,GUO B Y,et al. Complete mitochondrial genome sequencing and phylogeny analysis of macridiscus multifarius[J].Journal of Zhejiang Ocean University (Natural Science),2021,40(2):93-100.
[14] RILEY J S,TAIT S W. Mitochondrial DNA in inflammation and immunity[J].EMBO Reports,2020,21(4):e49799.
[15] ANNESLEY S J,FISHER P R. Mitochondria in health and disease[J].Cells,2019,8(7):680.
[16] GAZDHAR A,LEBRECHT D,ROTH M,et al. Time-dependent and somatically acquired mitochondrial DNA mutagenesis and respiratory chain dysfunction in a scleroderma model of lung fibrosis[J].Science Report,2014,4:5336.
[17] SON J M,LEE C. Mitochondria:multifaceted regulators of aging[J].BMB Reports,2019,52(1):13-23.
[18] SINGH A,KUKRETI R,SASO L,et al. Oxidative stress:a key modulator in neurodegenerative diseases[J].Molecules,2019,24(8):1583.
[19] 張惠鋒,王華偉,謝振榮,等. 結直腸癌患者瘤內線粒體DNA非編碼區突變異質性研究[J]. 中華腫瘤防治雜志,2019,26(7):473-478.
ZHANG H F,WANG H W,XIE ZH R,et al. Intratumoralheterogeneity of non coding region of mitochondria DNA in patients with colorectal cancer[J]. Chinese Journal of Cancer Prevention and Treatment,2019,26(7):473-478.
[20] 于 萍,曹 婷,趙春萍,等. 五指山豬線粒體基因組全序列測定與分析[J]. 西北農業學報,2015,24(7):16-22.
YU P,CAO T,ZHAO CH? P,et al. Complete mitochondrial genome sequence and analysis of wuzhishan pig[J]. Acta Agriculturae Boreali-occidentalis Sinica,2015,24(7):16-22.
[21] 肖 帆,張利平,朗 俠,等. 不同品種綿羊D-loop區遺傳多樣性研究[J]. 西北農業學報,2021,30(8):1122-1129.
XIAO F,ZHANG L P,LANG X,et al. Genetic diversity of mitochondrial DNA D-loop region in different breeds of sheep[J]. Acta Agriculturae Boreali-occidentalis Sinica,2021,30(8):1122-1129.
[22] HASSANIN A,DOUZERY E J. Molecular and morphological phylogenies of ruminantia and the alternative position of the moschidae[J].Systematic Biology,2003,52(2):206-228.
[23] YANG C,WANG W F,DU X J,et al. Mitochondrial genome of captive Alpine musk deer,Moschus chrysogaster (Moschidae),and phylogenetic analyses with its coordinal species[J]. Mitochondrial DNA. Part B,Resources,2021,6(2):598-600.
Abstract Moschus berezovskii(FMD) is a kind of nationally protected species with high value. In order to further study the structural characteristics and genetic variation of mitochondrial genome of FMD,the whole-genome of FMD-C1 mitochondria from FMD fibroblasts was sequenced based on Illumina novaseq platform. Then its? features were annotated. Structure prediction,sequence analysis and systematic development reconstruction were carried out. The results showed the length of whole-genome sequence was 16 351 bp. With obvious AT preference,there were 13 protein coding genes (PCGs),22 tRNAs,2 rRNAs and two non-coding regions. The sequence was submitted to GenBank and the accession number MW879208 was obtained. Compared with other FMD mitochondrial whole-genome sequences of NCBI,5 single amino acid mutations and 3 inserted amino acids were detected in 4 PCGs of FMD-C1; 19 differential bases and 2 bases deletion were detected in D-loop region. Phylogenetic analysis showed that moschus anhuiensis was the closest relative to FMD.The results provided a reference for the breeding and genetic diversity protection of FMD,and also laid a foundation for further exploring the pathogenic mechanism of mitochondrial level of lung diseases in FMD.
Key words Moschus berezovskii; Mitochondrial DNA; Protein coding gene; Non-coding region; Phylogeny