
















摘要:為進(jìn)一步豐富金沙鱸鯉(Percocypris pingi)基因信息數(shù)據(jù)庫,采用PacBio測序平臺對金沙鱸鯉進(jìn)行全長轉(zhuǎn)錄組測序。共獲得499 007個(gè)全長非嵌合序列(Full-length non-chimeric read,F(xiàn)LNC),通過聚類和去冗余獲得70 321個(gè)isoforms,isoforms的平均長度和N50分別為1 882 bp、2 243 bp。將isoforms與NR、GO、KEGG、KOG和Swiss-Prot 5個(gè)公共數(shù)據(jù)庫進(jìn)行比對,成功注釋了57 521個(gè)isoforms,并鑒定到" " 2 310個(gè)TF、16 225個(gè)LncRNA和35 314條CDS。鑒定到5個(gè)抗菌肽基因,包括2個(gè)hepcidin基因和3個(gè)hemoglobin基因。金沙鱸鯉的hepcidin-1、hepcidin-2與多鱗白甲魚(Onychostoma macrolepis)的hepcidin親緣關(guān)系較近;金沙鱸鯉的hemoglobin-1α與斑馬魚(Danio rerio)的hemoglobin α親緣關(guān)系較近;金沙鱸鯉的hemoglobin-1β與斑點(diǎn)叉尾鮰(Ictalurus punctatus)的hemoglobin 1β、hemoglobin 2β親緣關(guān)系較近;hemoglobin-2β與多鱗白甲魚的hemoglobin 2β親緣關(guān)系較近。通過對金沙鱸鯉全長轉(zhuǎn)錄組的注釋分析,闡明了金沙鱸鯉基因參與的生物過程、所在的代謝途徑或信號通路等,可以更有效地探究抗菌肽在魚類免疫中的作用。
關(guān)鍵詞:金沙鱸鯉(Percocypris pingi);全長轉(zhuǎn)錄組;測序;抗菌肽基因;鑒定
中圖分類號:Q917.4" " " " "文獻(xiàn)標(biāo)識碼:A
文章編號:0439-8114(2025)03-0167-09
DOI:10.14088/j.cnki.issn0439-8114.2025.03.027 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Full-length transcriptome sequencing analysis of Percocypris pingi and identification of antimicrobial peptide gene
ZHU Si-yi 1,DENG Long-jun2,LI Tian-cai2,ZHANG Yang2,GUO Yong-yao1,LUO Wei1,DU Zong-jun1
(1. College of Animal Science and Technology, Sichuan Agricultural University, Chengdu" 611130, China;
2. Yalong River Hydropower Development Co., Ltd., Chengdu" 610051, China)
Abstract: In order to further enrich the Percocypris pingi gene information database, the PacBio sequencing platform was used to perform full-length transcriptome sequencing of Percocypris pingi. A total of 499 007 full-length non-chimeric reads (FLNC) were obtained, and 70 321 isoforms were obtained through clustering and redundancy removal. The average length and N50 of the isoforms were 1 882 bp and 2 243 bp, respectively. By comparing isoforms with five public databases including NR, GO, KEGG, KOG, and Swiss-Prot, 57 521 isoforms were successfully annotated and 2 310 TFs, 16 225 LncRNAs, and 35 314 CDS were identified. Five antimicrobial peptide genes were identified, including two hepcidin genes and three hemoglobin genes. The hepcidin-1and hepcidin-2 of Percocypris pingi was closely related to hepcidin of Onychostoma macrolepis; the hemoglobin-1α of Percocypris pingi was closely related to hemoglobin α of Danio rerio; the hemoglobin-1β of Percocypris pingi was closely related to hemoglobin 1β and hemoglobin 2β of Ictalurus punctatus; the hemoglobin-2β of Percocypris pingi was closely related to hemoglobin 2β of Onychostoma macrolepis. Through annotation analysis of the full-length transcriptome of Percocypris pingi, the biological processes, metabolic pathways, or signaling pathways involved in the Percocypris pingi gene were elucidated, which could more effectively explore the role of antimicrobial peptides in fish immunity.
Key words: Percocypris pingi; full-length transcriptome; sequencing; antimicrobial peptide gene; identification
金沙鱸鯉(Percocypris pingi)屬鯉形目鯉科鲃亞科鱸鯉屬,俗稱江鯉、花鯉、花魚,主要分布于四川省的岷江、金沙江、雅礱江等水系,是長江上游特有的兇猛肉食性魚類,具有較高的生態(tài)價(jià)值及經(jīng)濟(jì)價(jià)值[1]。近年來,由于過度捕撈和病害等因素的影響,導(dǎo)致金沙鱸鯉種群數(shù)量急劇下降,目前已被列為國家二級保護(hù)動物[2]。
金沙鱸鯉在面對特定病害時(shí)表現(xiàn)出了不同的抗性特征。研究發(fā)現(xiàn),鯉魚春季病毒血癥(SVC)會導(dǎo)致金沙鱸鯉大量死亡[3]。但是,金沙鱸鯉對多子小瓜蟲表現(xiàn)出較高抗性[4],是研究魚類抵抗多子小瓜蟲侵染免疫機(jī)制的理想模型。目前,金沙鱸鯉基因組信息鮮見報(bào)道,轉(zhuǎn)錄組數(shù)據(jù)也比較有限,美國國家生物技術(shù)信息中心(NCBI)中僅見2個(gè)項(xiàng)目,分別是SRS11375415和SRS11390644。為了深入了解金沙鱸鯉的先天免疫機(jī)制,特別是其對多子小瓜蟲的抗性,迫切需要對金沙鱸鯉基因資源進(jìn)行系統(tǒng)性的挖掘和研究。
抗菌肽(Antimicrobial peptides,AMPs)又稱宿主防御肽(Host defence peptides,HDPs),是一類小分子肽,具有抵抗外界病原活性的作用。作為機(jī)體先天免疫系統(tǒng)的重要組成部分,它們對革蘭氏陰性菌、革蘭氏陽性菌、真菌、病毒和寄生蟲等均具有較好的抑制或殺傷作用[5]。抗菌肽在動物黏膜和皮膚防御方面起重要作用,有助于提高水產(chǎn)動物對病原微生物的非特異性免疫能力[6]。研究表明,抗菌肽Hbβ-C可能在魚類抵抗多子小瓜蟲時(shí)發(fā)揮關(guān)鍵作用[7]。因此,開展更深入的研究可能為揭示金沙鱸鯉對抗多子小瓜蟲的機(jī)制提供新的見解。
近年來,轉(zhuǎn)錄組學(xué)技術(shù)在水產(chǎn)動物繁育、營養(yǎng)、發(fā)育和免疫等研究中得到廣泛應(yīng)用[8]。目前,二代測序技術(shù)(RNA-Seq)由于具有高通量和低成本的優(yōu)勢,成為最常用的轉(zhuǎn)錄組測序方式。然而,由于其讀長相對較短,導(dǎo)致在后續(xù)的序列組裝、拼接和注釋等方面效果不及第三代全長轉(zhuǎn)錄組測序技術(shù)(又被稱為單分子實(shí)時(shí)DNA測序技術(shù),SMRT)[9]。第三代全長轉(zhuǎn)錄組測序技術(shù)可以直接讀取目標(biāo)序列,無需PCR擴(kuò)增等步驟,大大降低了假陽性率,并避免了偏置和堿基替換等問題,精準(zhǔn)度可達(dá)99.9%[10]。目前,該技術(shù)已在魚類研究中得到廣泛應(yīng)用,例如黃顙魚(Pelteobagrus fulvidraco)[11]、全州禾花鯉(Cyprinus carpio var. Quanzhounensis)[12]、極邊扁咽齒魚(Platypharodon extremus)[13]等。
本研究采用PacBio平臺的第三代全長轉(zhuǎn)錄組測序技術(shù)對金沙鱸鯉9種組織的RNA混樣進(jìn)行全轉(zhuǎn)錄組測序,對所得的轉(zhuǎn)錄本進(jìn)行分析和注釋,重點(diǎn)挖掘金沙鱸鯉抗菌肽相關(guān)基因。本研究將為金沙鱸鯉提供較全面的基因資源,為后續(xù)深入研究魚類對抗多子小瓜蟲的免疫機(jī)制提供參考。
1 材料與方法
1.1 組織樣本采集
金沙鱸鯉從雅礱江流域水電開發(fā)有限公司獲得,使用3-氨基苯甲酸乙酯甲磺酸鹽(MS-222)將其麻醉,分離出鱗片、皮膚、背部肌肉、肝臟、脾臟、腸道、腎臟、鰓、腦等組織,用液氮速凍后送至北京百邁客生物科技有限公司進(jìn)行RNA提取、質(zhì)量和濃度測定及測序分析。
1.2 文庫構(gòu)建
利用Trizol法提取金沙鱸鯉各組織的RNA。通過Nanodrop2000(美國Thermo Scientific公司)檢測RNA的純度(OD260 nm/OD280 nm)和濃度,使用Agilent2100(美國Agilent公司)精確檢測RNA的完整性,利用瓊脂糖凝膠電泳檢測是否存在基因組DNA污染。各組織RNA檢測合格后等量混勻,采用SMARTer PCRcDNA Synthesis Kit(日本Takara Bio公司)合成全長cDNA;通過PCR技術(shù)對全長cDNA進(jìn)行擴(kuò)增。對全長cDNA進(jìn)行末端修復(fù),加上SMRT啞鈴型接頭,使用核酸外切酶消化。通過BluePippin進(jìn)行二次篩選以獲得測序文庫。使用Qubit 2.0(美國Thermo Scientific公司)和Agilent 2100對構(gòu)建的文庫進(jìn)行質(zhì)量檢測,檢測結(jié)果達(dá)到要求后上機(jī)測序。
1.3 全長轉(zhuǎn)錄組測序數(shù)據(jù)分析
使用PacBio平臺對經(jīng)檢測合格的文庫進(jìn)行測序。對測序下機(jī)的原始輸出數(shù)據(jù)使用SMRT Link(https://github.com/WenchaoLin/SMRT-Link)進(jìn)行處理,獲取Subreads,并對單分子多次測序序列進(jìn)行自我糾錯(cuò)處理,得到環(huán)形一致性序列(Circular consensus sequence,CCS)。通過檢測確定CCS序列包含5′端引物、3′端引物以及polyA后進(jìn)行分類,找出全長非嵌合(Full-length non-chimeric read,F(xiàn)LNC)序列。通過去除冗余轉(zhuǎn)錄本和過濾低可信度轉(zhuǎn)錄本,獲得合格的isoforms。序列數(shù)據(jù)提交至國家基因組科學(xué)數(shù)據(jù)中心(NGDC,https://ngdc.cncb.ac.cn/?lang=zh),BioProject號為PRJCA025600,GSA提交號為CRA016173。
1.4 基因功能注釋
使用公共數(shù)據(jù)庫對isoforms進(jìn)行基因功能注釋,公共數(shù)據(jù)庫包括非冗余蛋白數(shù)據(jù)庫(Non-redundant protein data-base,NR)、蛋白質(zhì)真核同源數(shù)據(jù)庫(Eukaryotic or-thologous groups,KOG)、基因本體論數(shù)據(jù)庫(Gene ontology,GO)、東京基因與基金組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)和蛋白質(zhì)序列數(shù)據(jù)庫(Swiss-Prot)。
1.5 TF、LncRNA和CDS預(yù)測分析
根據(jù)測序結(jié)果使用iTAK(https://github.com/kentnf/iTAK)預(yù)測轉(zhuǎn)錄因子;使用CNCI(https://github.com/www-bioinfo-org/CNCI)、PLEK[14]、CPC(https://github.com/jefflai108/Contrastive-Predictive-Coding-PyTorch)以及Pfam數(shù)據(jù)庫對測序數(shù)據(jù)進(jìn)行編碼潛能預(yù)測,選取4個(gè)軟件共有的非編碼轉(zhuǎn)錄本進(jìn)行后續(xù)分析;使用TransDecoder(https://github.com/TransDecoder/TransDecoder)對新鑒定的轉(zhuǎn)錄本進(jìn)行蛋白質(zhì)編碼序列(Coding sequence,CDS)預(yù)測。
1.6 抗菌肽基因鑒定及分析
基于金沙鱸鯉的全長轉(zhuǎn)錄組測序數(shù)據(jù)及其注釋結(jié)果,采用兩種方法鑒定金沙鱸鯉的hepcidin、cathelicidins、piscidin、defensin和hemoglobin基因。①利用NCBI相關(guān)基因進(jìn)行BLAST比對,搜索金沙鱸鯉全長轉(zhuǎn)錄組數(shù)據(jù)庫中去冗余產(chǎn)生的Unigene蛋白質(zhì)序列,篩選閾值E≤10-5。②采用Tbtools(https://github.com/CJ-Chen/TBtools-II)的HMM搜索模塊,通過Hepcidin(PF06446)、Cathelicidins(PF00666)和Defensin(PF00711)結(jié)構(gòu)域的隱馬氏模型搜索全長轉(zhuǎn)錄組數(shù)據(jù)庫中去冗余產(chǎn)生的蛋白質(zhì)序列(E≤10-5)。合并兩種方法得到的候選蛋白,去除重復(fù)序列后利用NCBI-CDD(https://www.ncbi.nlm.nih.gov/cdd)和SMART(http://smart.embl.de/)數(shù)據(jù)庫工具進(jìn)行結(jié)構(gòu)域驗(yàn)證,最終獲得金沙鱸鯉抗菌肽相關(guān)基因。利用Expasy(https://web.expasy.org/protparam/)預(yù)測其分子質(zhì)量、等電點(diǎn)和親水性;利用WoLF PSORT(https://www.genscript.com/wolf-psort.html)預(yù)測其亞細(xì)胞定位;利用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)預(yù)測蛋白質(zhì)二級結(jié)構(gòu);利用在線軟件SWISSMODEL(https://swissmodel.expasy.org/)建模,預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)。
使用MEGA7.0[15],采用最大似然法(Maximum likelihood,ML)構(gòu)建系統(tǒng)發(fā)育樹,采用默認(rèn)參數(shù),自展值(Bootstrap)為1 000。通過多序列比對和系統(tǒng)發(fā)育樹分析相結(jié)合的方法鑒定金沙鱸鯉中與抗菌肽相關(guān)的基因。
2 結(jié)果與分析
2.1 測序結(jié)果與數(shù)據(jù)分析
經(jīng)全長轉(zhuǎn)錄組測序得到554 382個(gè)CCS reads,平均長度和N50分別為1 584 bp和1 674 bp。在排除35 421個(gè)全長嵌合體和不含polyA的FLNC后,最終獲得499 007個(gè)FLNC(含polyA),其平均長度和N50分別為1 412 bp和1 676 bp。通過序列聚類得到132 504個(gè)初始isoforms,平均長度和N50分別為1 673 bp和2 022 bp;通過序列去冗余得到了70 321個(gè)isoforms,平均長度和N50分別為1 882 bp和" " " "2 243 bp,這70 321個(gè)數(shù)據(jù)將被用于下一步的分析(表1)。
表1 金沙鱸鯉全長轉(zhuǎn)錄組序列信息
[序列 數(shù)量//個(gè) 最小長度//bp 平均長度//bp 最大長度//bp N50//bp CCS 554 382 187 1 584 13 580 1 674 FLNC(含Ploy A) 499 007 50 1 412 7 679 1 676 初始 isoforms 132 504 50 1 673 7 299 2 022 isoforms 70 321 50 1 882 7 299 2 243 ]
2.2 轉(zhuǎn)錄本的功能注釋及覆蓋度分析
通過GO、KEGG、KOG、Swiss-Prot、NR共5個(gè)數(shù)據(jù)庫對isoforms進(jìn)行功能注釋,共計(jì)57 521個(gè)isoforms成功注釋,5個(gè)數(shù)據(jù)庫分別注釋到47 012、48 620、35 935、29 281、57 109個(gè)isoforms(圖1),5個(gè)數(shù)據(jù)庫涵蓋了81.80%的isoforms。由圖2可知,5個(gè)數(shù)據(jù)庫中均有注釋的isoforms有21 513個(gè),NR中單獨(dú)檢索到3 457個(gè)isoforms,KOG中單獨(dú)檢索到35個(gè)isoforms,GO中單獨(dú)檢索到225個(gè)isoforms,KEGG中單獨(dú)檢索到42個(gè)isoforms,Swiss-Prot中單獨(dú)檢索到30個(gè)isoforms。
NR注釋結(jié)果(圖3)顯示,同源相似性較高的分別是多鱗白甲魚(Onychostoma macrolepis)、犀角金線鲃(Sinocyclocheilus rhinocerous)、安水金線鲃(Sinocyclocheilus anshuiensis)、鯉(Cyprinus carpio)、滇池金線鲃(Sinocyclocheilus grahami)、鯽(Carassius auratus)、露斯塔野鯪(Labeo rohita)、鱇白魚(Anabarilius grahami)、斑馬魚(Danio rerio),占比分別為36.88%、12.54%、11.39%、10.72%、8.41%、6.29%、3.20%、2.02%、1.68%。
GO注釋中的isoforms分為3大類,包括細(xì)胞組分、分子功能和生物過程,具體分為45個(gè)小類(圖4)。其中,在細(xì)胞組分中細(xì)胞內(nèi)(Intracellular)和細(xì)胞解剖結(jié)構(gòu)(Cellular anatomical entity)占比較高,分別有28 750、35 825個(gè)isoforms被注釋;在分子功能中結(jié)合(Binding)占比較高,有30 647個(gè)isoforms被注釋;在生物過程中細(xì)胞過程(Cellular process)和生物學(xué)調(diào)節(jié)(Biological regulation)占比較高,分別有" 33 329、24 663個(gè)isoforms被注釋。
KOG功能注釋的結(jié)果(圖5)顯示,一般功能預(yù)測的isoforms最多,達(dá)6 404個(gè);信號轉(zhuǎn)導(dǎo)機(jī)制的isoforms有6 179個(gè)。此外,還有少部分isoforms分布于細(xì)胞周期控制、細(xì)胞分裂、染色體分離(874個(gè))和次級代謝產(chǎn)物的生物合成、運(yùn)輸和分解(842個(gè))。
KEGG注釋(圖6)中isoforms分布于6個(gè)大類中,分別是細(xì)胞過程、環(huán)境信息處理、遺傳信息處理、人類疾病、新陳代謝和有機(jī)體系統(tǒng),注釋的基因數(shù)分別為10 801、8 739、5 808、3 921、15 157、7 104個(gè)。
2.3 TF、LncRNA和CDS預(yù)測分析
對金沙鱸鯉樣本轉(zhuǎn)錄本進(jìn)行轉(zhuǎn)錄因子的功能預(yù)測,共鑒定到屬于61個(gè)基因家族的2 310個(gè)isoforms(圖7)。其中含有isoforms數(shù)量最多的5個(gè)家族分別為zf-C2H2(859個(gè))、Homeobox(163個(gè))、bHLH(145個(gè))、ZBTB(139個(gè))、HMG(139個(gè))。
利用CNCI、CPAT、CPC2和PLEK分別預(yù)測了20 044、23 309、26 443、16 225個(gè)LncRNA,并將4個(gè)軟件預(yù)測的交集部分16 225個(gè)LncRNA作為最終的非編碼長鏈RNA預(yù)測結(jié)果(圖8)。LncRNA的長度分布如圖9所示,最小長度為201 bp,最大長度為" "6 584 bp,平均長度和N50分別是1 393、1 228 bp。通過預(yù)測,LncRNA調(diào)控44 261個(gè)靶mRNA,主要包括細(xì)胞結(jié)構(gòu)與功能(1 701個(gè))、感染與免疫反應(yīng)" " (1 108個(gè))、遺傳信息處理(591個(gè))和細(xì)胞間通訊(504個(gè))4個(gè)類別。
為進(jìn)一步了解isoform的基因信息,利用Blast和EST Scan注釋預(yù)測其CDS序列,結(jié)果如圖10所示。最終獲得35 314條CDS序列,CDS 序列長度在50~" 1 935 nt,平均長度和N50分別是269、222 nt。
2.4 抗菌肽相關(guān)基因鑒定及分析
通過2種方式共鑒定到5個(gè)抗菌肽基因,其中hepcidin基因有2個(gè)、hemoglobin基因有3個(gè)(表2)。5個(gè)基因預(yù)測的蛋白序列在氨基酸數(shù)量上有所不同,為83~148 aa,蛋白分子質(zhì)量從9.63~16.30 ku。hepcidin的2個(gè)蛋白均表現(xiàn)出疏水性,為酸性蛋白,亞細(xì)胞定位于細(xì)胞外;hemoglobin的3個(gè)蛋白則均表現(xiàn)出親水性,為堿性蛋白,亞細(xì)胞定位在細(xì)胞質(zhì)。
根據(jù)LncRNA的靶點(diǎn)預(yù)測,發(fā)現(xiàn)6個(gè)轉(zhuǎn)錄本的潛在靶序列與抗菌肽基因的轉(zhuǎn)錄本相對應(yīng)。其中,潛在靶序列A-YLJ-MIX_transcript_92476可能調(diào)控hemoglobin-1α,潛在靶序列A-YLJ-MIX_transcript_42068、A-YLJ-MIX_transcript_130167、A-YLJ-MIX_ transcript_105509和A-YLJ-MIX_transcript_121918可能調(diào)控hemoglobin-1β,潛在靶序列A-YLJ-MIX_ transcript_87629可能調(diào)控hemoglobin-2β。
通過金沙鱸鯉抗菌肽二級結(jié)構(gòu)的預(yù)測發(fā)現(xiàn)(表3),hepcidin二級結(jié)構(gòu)中占比最多的為無規(guī)則卷曲,不穩(wěn)定的結(jié)構(gòu)有助于抗菌肽插入并破壞細(xì)菌的細(xì)胞膜。hemoglobin二級結(jié)構(gòu)中占比最多的為α螺旋,大量的α螺旋保證了二級結(jié)構(gòu)的穩(wěn)定性。
空間三維結(jié)構(gòu)研究表明,hepcidin和hemoglobin擁有大量α螺旋和無規(guī)則卷曲(圖11和圖12)。通過金沙鱸鯉蛋白三級結(jié)構(gòu)的預(yù)測發(fā)現(xiàn)(表4),hepcidin和hemoglobin的同源性為68.53%~88.04%(均大于40.00%),與模板蛋白結(jié)構(gòu)一致性較好,預(yù)測模型可信度較高。hepcidin和hemoglobin的全球性模型質(zhì)量估測(GMQE)均大于0.60,蛋白質(zhì)模型的結(jié)構(gòu)準(zhǔn)確性較高,可以用于進(jìn)一步地分析和研究。
金沙鱸鯉抗菌肽基因親緣進(jìn)化樹(圖13)表明,金沙鱸鯉的hepcidin-1、hepcidin-2與多鱗白甲魚的hepcidin親緣關(guān)系較近;金沙鱸鯉的hemoglobin-1α與斑馬魚的hemoglobin α親緣關(guān)系較近;金沙鱸鯉的hemoglobin-1β與斑點(diǎn)叉尾鮰(Ictalurus punctatus)的hemoglobin 1β、hemoglobin 2β親緣關(guān)系較近;hemoglobin-2β與多鱗白甲魚的hemoglobin 2β親緣關(guān)系較近。
3 討論
轉(zhuǎn)錄組測序技術(shù)已廣泛應(yīng)用于農(nóng)業(yè)、生物和醫(yī)學(xué)等領(lǐng)域,這有助于深入探討功能基因的序列特性、調(diào)控機(jī)制以及在不同生物學(xué)過程中的重要作用[9]。研究表明,通過對物種不同組織樣本進(jìn)行全長轉(zhuǎn)錄組測序,獲得該物種較完整的轉(zhuǎn)錄本信息[16,17]。本研究提取了金沙鱸鯉的鱗片、皮膚、背部肌肉、肝臟、脾臟、腸道、腎臟、鰓、腦的RNA,等質(zhì)量混合后構(gòu)建了cDNA文庫并進(jìn)行全長轉(zhuǎn)錄組測序,測序結(jié)果結(jié)合測序數(shù)據(jù)進(jìn)行校正,得到isoforms 70 321個(gè),N50為2 243 bp,獲得金沙鱸鯉各組織中較完整的轉(zhuǎn)錄表達(dá)圖譜。
LncRNA 是長度大于200 bp的長鏈非編碼RNA,在生物體內(nèi)廣泛存在,介導(dǎo)許多復(fù)雜的生命活動過程[18]。全長轉(zhuǎn)錄組測序則可以進(jìn)行l(wèi)ncRNA的預(yù)測[19],這為高效、深入探究lncRNA提供新的策略和方法。本研究利用CNCI、CPC2、PLEK和CPAT軟件預(yù)測到16 225個(gè)LncRNA,共調(diào)控44 261個(gè)靶mRNA。在此基礎(chǔ)上,對LncRNA靶基因進(jìn)行KEGG富集分析,發(fā)現(xiàn)感染與免疫基因占比較高,有1 108個(gè)基因受調(diào)控,且其他占比較高的多為信號傳遞和蛋白質(zhì)合成相關(guān)基因,與免疫具有較高相關(guān)性。說明該魚可能有較強(qiáng)的免疫力,而這可能與多子小瓜蟲抗性也有潛在聯(lián)系,進(jìn)一步研究發(fā)現(xiàn)了6個(gè)可能調(diào)控抗菌肽的LncRNA。因此,未來的研究可基于已鑒定的LncRNA,深入探討其在免疫學(xué)中的作用,進(jìn)一步揭示LncRNA種類、豐度與魚類免疫之間的關(guān)系。
抗菌肽是硬骨魚先天免疫和適應(yīng)性免疫的重要組成部分[20]。根據(jù)其結(jié)構(gòu)特點(diǎn),魚類抗菌肽可分為兩大類:一類是不含半胱氨酸、具有疏水性或雙親性α螺旋結(jié)構(gòu)的抗菌肽,如piscidins;另一類是含有多個(gè)半胱氨酸、β折疊結(jié)構(gòu)的抗菌肽,如hepcidin、cathelicidins等[21]。本研究對常見的4個(gè)魚類抗菌肽和被報(bào)道對多子小瓜蟲具有殺滅作用的hemoglobin進(jìn)行了鑒定,共發(fā)現(xiàn)hepcidin基因2個(gè)、hemoglobin基因3個(gè),未鑒定到piscidins、cathelicidins和defensin。其中,piscidins和cathelicidins在多個(gè)鯉科魚類中鮮見報(bào)道,而defensin已有相關(guān)報(bào)道,如斑馬魚(NM_001081554.2)、鯉(XM_042770865.1)和多鱗白甲魚(XM_058759259.1)未在金沙鱸鯉中被鑒定到。在NR比對結(jié)果中,金沙鱸鯉大部分基因與多鱗白甲魚具有相似性,但hemoglobin-1β表現(xiàn)出與斑點(diǎn)叉尾鮰較近的親緣關(guān)系。Cannon等[22]的研究表明,盡管物種間的氨基酸替換率可能反映出親緣關(guān)系的相似性,但在某些基因(如抗性基因)中,某一物種的不同基因可能分別與不同物種具有較近的親緣關(guān)系。因此,推測金沙鱸鯉相較于其他鯉科魚類具有獨(dú)特的抗菌肽,可能就是其具有多子小瓜蟲抗性的原因。
本研究利用全長轉(zhuǎn)錄組進(jìn)行抗菌肽基因的篩選,成功鑒定到5個(gè)基因。但預(yù)測的CDS所編碼的蛋白需要進(jìn)一步修飾,最終才能形成抗菌肽[23],因此本研究通過抗菌肽數(shù)據(jù)庫(https://aps.unmc.edu/downloads)進(jìn)行再次驗(yàn)證,確保結(jié)果的準(zhǔn)確性。目前在開放閱讀框(ORF)預(yù)測中,TransDecoder 是常用的軟件,但它通常會排除長度小于100個(gè)氨基酸的ORF。這是因?yàn)槎绦蛄械腛RF往往難以準(zhǔn)確預(yù)測其功能,且可能僅是組裝噪音或偽基因,缺乏生物學(xué)意義。然而,這一策略可能導(dǎo)致一些短序列抗菌肽的CDS區(qū)域未能被直接預(yù)測到。此外,使用NCBI的Blast或Pfam等工具進(jìn)行序列對比預(yù)測,已被廣泛應(yīng)用于獲得較為準(zhǔn)確的抗菌肽序列,但通過多種方式進(jìn)行結(jié)構(gòu)域預(yù)測的基因組序列也被發(fā)現(xiàn)能夠有效地鑒別抗菌肽[24]。然而,基因組數(shù)據(jù)無法提供LncRNA和差異表達(dá)等信息,通過結(jié)合基因組和全長轉(zhuǎn)錄組數(shù)據(jù)的方式,可以更全面地探討抗菌肽在魚類免疫中的作用。
4 小結(jié)
本研究使用PacBio SMRT測序技術(shù)對金沙鱸鯉各組織的全長轉(zhuǎn)錄組進(jìn)行測序分析。共鑒定了" 499 007個(gè)FLNC(含polyA),獲得isoforms 70 321個(gè),GO、KEGG、KOG、Swiss-Prot、NR 5個(gè)數(shù)據(jù)庫共注釋了57 521個(gè)isoforms。此外,鑒定出61個(gè)轉(zhuǎn)錄因子家族的2 310個(gè)isoforms;16 225個(gè)lncRNA,預(yù)測可能調(diào)控44 261個(gè)靶mRNA,主要涉及細(xì)胞結(jié)構(gòu)與功能、感染與免疫反應(yīng)、遺傳信息處理和細(xì)胞間通訊。鑒定出抗菌肽相關(guān)基因5個(gè),分別是hepcidin基因" "2個(gè)、hemoglobin基因3個(gè),未鑒定到piscidins、cathelicidins和defensin。通過對金沙鱸鯉全長轉(zhuǎn)錄組的注釋分析,初步闡明了金沙鱸鯉基因參與的生物過程、所在的代謝途徑或信號通路等,為深入研究金沙鱸鯉基因的功能奠定了基礎(chǔ)。
參考文獻(xiàn):
[1] 鄧龍君, 甘維熊, 曾如奎,等. 雅礱江鱸鯉的人工繁殖、胚胎及卵黃囊仔魚發(fā)育[J]. 水產(chǎn)科學(xué), 2016, 35(4): 393-397.
[2] 蒲德永, 丁雨簫, 劉小紅,等. 溫度和攝食率對鱸鯉幼魚攝食代謝特征的影響[J]. 水產(chǎn)學(xué)報(bào), 2021, 45(10): 1634-1641.
[3] ZHENG L, GENG Y, YU Z, et al. First report of spring viremia of carp virus in Percocypris pingi in China[J]. Aquaculture, 2018, 493: 214-218.
[4] LI L, LI M, ZENG R, et al. High resistance to Ichthyophthirius multifiliis in Percocypris pingi, an endemic fish in upper Yangtze River[J]. Aquaculture, 2023, 562: 738767.
[5] CHUNG C R, JHONG J H, WANG Z, et al. Characterization and identification of natural antimicrobial peptides on different organisms[J]. International journal of molecular sciences,2020, 21(3): 986.
[6] 王自蕊, 譙仕彥, 李 波,等. 飼料中添加天蠶素抗菌肽對湘云鯽生長性能、非特異性免疫功能及抗病力的影響[J]. 動物營養(yǎng)學(xué)報(bào), 2014, 26(7): 1856-1863.
[7] 熊 陽, 王 帥, 丹 成,等. 抗菌肽HBβ-C在全雄和雜交黃顙魚對多子小瓜蟲抗性差異中的作用[J]. 水生生物學(xué)報(bào), 2021, 45(5): 975-985.
[8] CHANDHINI S, REJISH K V J. Transcriptomics in aquaculture: Current status and applications[J]. Reviews in aquaculture, 2019, 11(4): 1379.
[9] 崔 凱,吳偉偉,刁其玉. 轉(zhuǎn)錄組測序技術(shù)的研究和應(yīng)用進(jìn)展[J]. 生物技術(shù)通報(bào), 2019, 35(7): 1-9.
[10] 馬麗娜,楊進(jìn)波,丁逸菲,等. 三代測序技術(shù)及其應(yīng)用研究進(jìn)展[J]. 中國畜牧獸醫(yī), 2019, 46(8): 2246-2256.
[11] 王家琪, 熊 陽, 韓慶慶,等. 基于PacBio平臺的黃顙魚全長轉(zhuǎn)錄組測序及分析[J]. 湖北農(nóng)業(yè)科學(xué), 2023, 62(4): 194-201.
[12] 杜雪松, 文露婷, 許藝蘭,等 全州禾花鯉鱗片下層組織的結(jié)構(gòu)及全長轉(zhuǎn)錄組分析[J]. 漁業(yè)科學(xué)進(jìn)展, 2024, 45(1): 70-84.
[13] 吳曉雲(yún),陳葉雨,龔 全,等. 基于三代全長轉(zhuǎn)錄組測序的極邊扁咽齒魚SSR分子標(biāo)記開發(fā)[J]. 南方農(nóng)業(yè)學(xué)報(bào), 2023, 54(9): 2525-2532.
[14] LI A, ZHANG J, ZHOU Z. PLEK: A tool for predicting long non-coding RNAs and messenger RNAs based on an improved k-mer scheme[J]. BMC bioinformatics, 2014, 15: 1-10.
[15] KUMAR S, STECHER G, TAMURA K. MEGA7: Molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular biology evolution, 2016, 33(7): 1870-1874.
[16] GE H, ZHANG H, YANG L, et al. Full-Length transcriptome sequencing from the longest-lived freshwater bony fish of the world: Bigmouth Buffalo (Ictiobus Cyprinellus)[J]. Frontiers in marine science, 2021, 8: 736188.
[17] LOU F, REN Z, TANG Y, et al. Full-length transcriptome reveals the circularly polarized light response-related molecular genetic characteristics of Oratosquilla oratoria[J]. Comparative biochemistry physiology part D: Genomics proteomics, 2024, 49: 101183.
[18] FATICA A, BOZZONI I. Long non-coding RNAs: New players in cell differentiation and development [J]. Nature reviews genetics, 2014, 15(1): 7-21.
[19] KAPRANOV P, CHENG J, DIKE S, et al. RNA maps reveal new RNA classes and a possible function for pervasive transcription[J]. Science, 2007, 316(5830): 1484-1488.
[20] MASSO-SILVA J A, DIAMOND G. Antimicrobial peptides from fish[J]. Pharmaceuticals, 2014, 7(3): 265-310.
[21] 劉德財(cái), 韓學(xué)東. 水產(chǎn)動物抗菌肽及其在水產(chǎn)養(yǎng)殖中的應(yīng)用研究進(jìn)展[J]. 水產(chǎn)學(xué)雜志, 2022, 35(6): 113-121.
[22] CANNON S B, ZHU H, BAUMGARTEN A M, et al. Diversity, distribution, and ancient taxonomic relationships within the TIR and non-TIR NBS-LRR resistance gene subfamilies[J]. Journal of molecular evolution, 2002, 54: 5485-5462.
[23] YAN J, BHADRA P, LI A, et al. Deep-AmPEP30: Improve short antimicrobial peptides prediction with deep learning[J]. Molecular therapy-nucleic acids, 2020, 20: 882-894.
[24] 孫 芳. 基于基因家族的藥用植物抗菌肽的計(jì)算機(jī)分析與活性驗(yàn)證[D]. 長沙: 中南大學(xué), 2023.