畢映慧,苗貴東,楊申才,呂彤彤,楊 進
(興義民族師范學院生物與化學學院,貴州 興義 562400)
昆明裂腹魚已成為我國重要的經濟養殖魚類之一[1],屬鯉科(Cyprinidae)裂腹魚屬(Schizothorax Hecke),地方名常稱之為細鱗魚[2],主要生活在我國的西南部分地區,貴州省境內主要生活在南盤江、北盤江上游的支流中,此外金沙江下游、烏江上游等都有分布。昆明裂腹魚的最適生長水溫范圍在14~18℃之間,為冷水性魚類,由于具有較強的耐低溫能力以及肉味鮮美的優點,因此具有開發養殖前景,已被列入貴州省“十四五”鄉村振興生態漁業產業重要的經濟魚種。然而,昆明裂腹魚存在性成熟時期較晚(一般雌性魚4齡、雄性魚3齡的個體性腺才開始逐漸發育成熟)、繁殖能力較低、生長畸形率較高[3]等困擾產業發展的問題。
細胞色素P450(Cytochrome P450,CYP450)由一群基因超家族(super family)編碼的酶蛋白所形成。CYP450在生物體內廣泛分布,是微粒體混合功能氧化酶中不可或缺的一族氧化酶。CYP450與雌激素在內的外源性以及內源性化學物質在生物體內的相互轉化是依賴于酶來實現的。在雌激素致癌鏈上,雌激素代謝酶的活性以及功能會對雌激素與靶細胞的作用產生直接影響[2]。研究表明CYP450就包括了CYPlAl、CYP1B1以及CYPl9等。細胞色素P4501A1(Cytochrome P4501A1,CYP1A1)是一種芳香烴羥化酶[4],是一種重要的體內I相代謝解毒酶,能對多種環境致癌物以及突變物進行失活[5]。許多研究表明,CYP1A1是一種重要的激活環境污染物(多環芳香碳氫化合物)的酶[6-7]。通過開展發育調控及性別控制相關基因研究,進一步研究其功能,為認識昆明裂腹魚的發育特點及性別控制相關育種研究奠定理論基礎。
本研究材料昆明裂腹魚個體取自中國科學院昆明動物研究所云南瀕危物種保育中心,通過解剖取雌雄成熟個體性腺,構建了雌雄個體的全長轉錄組文庫,并進行高通量測序。取魚鰭,用95%酒精脫水,-20℃保存。通過對昆明裂腹魚全長轉錄組文庫數據分析與挖掘,獲得昆明裂腹魚CYP1A1基因的全長,設計引物,然后通過PCR擴增產物直接測序方法,驗證CYP1A1基因的全長。
取適量魚鰭組織,采用天根生物海洋動物組織基因組提取試劑盒,按照試劑盒方法提取高質量基因組DNA,-20℃保存備用。
基因組DNA經檢測,DNA瓊脂糖凝膠電泳檢測結果圖顯示主條帶清晰,點樣孔干凈無熒光,表明DNA質量良好,見圖1。圖1中,M為D2000 Marker。

圖1 DNA瓊脂糖凝膠電泳檢測結果圖
對獲得昆明裂腹魚CYP1A1基因的全長序列進行基因組擴增,PCR擴增產物直接測序驗證,獲得序列與高通量測序所獲基因序列進行比較,高通量測序所獲基因序列的堿基準確性大于99%,高通量測序所獲基因序列結果較為可靠(見圖2、圖3)。圖2中,M為D2000 Marker。

圖2 部分引物PCR擴增產物結果

圖3 CYP1A1基因部分引物PCR擴增產物測序結果
根據整理的基因序列,采用美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)網站上的ORF Finder程序,對測序獲得的mRNA序列進行開放閱讀框定位;確定其起始密碼子以及終止密碼子位點;進而獲得其CDS序列全長。昆明裂腹魚CYP1A1基因的CDS序列全長為1 498 pb。采用DNASTAR軟件,把CDS序列堿基翻譯成氨基酸序列,得到499個氨基酸。采用SMART軟件,對昆明裂腹魚CYP1A1基因的CDS序列進行預測,發現其氨基酸的45~368區域和382~499區域為Pfam(見圖4),跨膜區可能在9~31區域(見表1)。

圖4 SMART軟件預測的CDS序列蛋白質結構

表1 SMART軟件預測的昆明裂腹魚蛋白結構數據(%)
運用NCBI網站上的Blast程序,對擴增獲得的昆明裂腹魚CYP1A1基因與近源物種的同源性進行比對。昆明裂腹魚CYP1A1基因與鯉魚、安水金線鲃、鯽魚、犀角金線鲃、金線鲃、南亞野鯪、草魚、卡特拉魚、黑頭呆魚和斑馬魚等物種的CYP1A1基因的CDS序列區的同源性比對結果,見表2。

表2 CYP 1A1基因的CDS序列區的同源性比對結果(%)
由表2分析可知,昆明裂腹魚CYP1A1基因與安水金線鲃和犀角金線鲃的同源性相似比率較高,均為92.23%;其次與鯉魚、鯽魚、南亞野鯪、卡特拉魚、草魚和黑頭呆魚的同源性相似比率依次為91.70%、91.63%、89.28%、89.20%、87.16%、84.32%;與斑馬魚的同源性相似比率較低,為82.12%。
CYP1A1基因的氨基酸序列的同源性比對結果見表3。

表3 CYP1A1基因的氨基酸序列的同源性比對結果(%)
由表3分析可知,昆明裂腹魚CYP1A1基因的氨基酸序列與鯉魚的氨基酸序列同源性相似比率最高,為90.55%;與安水金線鲃和犀角金線鲃的氨基酸序列同源性相似比率均為90.16%;與南亞野鯪、和黑頭呆魚的氨基酸序列同源性相似比率為86.42%。
可以推測,CDS序列區和氨基酸序列的同源性比對結果顯示,擴增得到的基因即為昆明裂腹魚的CYP1A1基因。
運用BioEdit軟件,對本次試驗擴增獲得的CYP1A1基因的CDS序列進行堿基組成成分分析。CYP1A1基因的4種堿基組成含量見表4。

表4 昆明裂腹魚CYP1A1基因的CDS序列4種堿基含量
由數據分析可知,CDS序列的單鏈蛋白質的相對分子質量為455 822.00 KD,雙鏈蛋白質的相對分子質量為911 589.00 KD;GC含量為53.60%,AT含量為46.40%。
從NCBI網站的Ge Ba nk數據庫里下載鯉魚、安水金線鲃、鯽魚、犀角金線鲃、金線鲃、卡特拉魚、南亞野鯪、黑頭呆魚、草魚和斑馬魚等同源性物種的CYP1A1基因氨基酸序列。采用MEG A7.0軟件里面P hyrogeny的N eighbor-Joining Tree程序,對該序列構建分子系統進化樹(見圖5)。

圖5 CYP1A1基因氨基酸序列的分子系統進化樹
2.5.1 昆明裂腹魚CYP1A1基因蛋白質疏水性分析
運用ExPASy在線平臺上的ProtScale程序,對擴增得到的CYP1A1基因的蛋白質進行疏水性分析,將蛋白質序列提交到該程序,由程序給出CYP1A1基因的疏水性圖譜(見第29頁圖6),從而對其進行分析。
分析圖6疏水性圖譜可知,最小值為-3.144,位于序列214位置上;最大值為3.478,位于序列472位置;昆明裂腹魚CYP1A1基因序列的N-端的5~32位置區域、192~208位置區域、322~341位置區域和465~479位置區域表現為明顯的疏水性,在其序列N-端的209~218位置區域表現為存在明顯的親水性,由此預測其信號肽可能存在于疏水性區域內。

圖6 CYP 1A1基因的疏水性圖譜
通過ExPASy在線平臺上的ProtParam程序可知,昆明裂腹魚CYP1A1基因的氨基酸序列的平均親水性為-0.078;理論等電點(pI)為6.44,氨基酸的相對分子質量為55 867.48 Da,原子組成為C(2505)、H(3965)、N(671)、O(728)、S(23);分子式為C2505H3965N671O728S23。該序列的N-端是甲硫氨酸(Met)。由于其不穩定指數(II)為35.37,因此將其蛋白質歸類為穩定蛋白質。
2.5.2 昆明裂腹魚CYP1A1基因信號肽分析
基于對昆明裂腹魚CYP1A1基因蛋白質的疏水性分析,其蛋白質序列可能存在信號肽,將CYP1A1基因的氨基酸序列上傳到SignaIP 3.0在線服務器,通過隱馬可夫模型(HMM),預測該序列中是否含有信號肽,見圖7。運用神經網絡法(NN)程序,預測該序列中的信號肽位點(見圖8)。

圖7 預測CYP1A1基因的氨基酸序列中是否含有信號肽

圖8 預測CYP 1A1基因的氨基酸序列中的信號肽位點
信號肽分析主要涉及3個參數值,分別為C、S和Y。程序會給出一個相對應的數據,并能夠對是否含有信號肽做出判斷。根據SignaIP3.0服務器呈現的數據(見表5),可對其進行分析。

表5 昆明裂腹魚CYP1A1基因信號肽預測結果測量參數
由表5的預測結果表明,最可能的裂解位點在33和34之間MRL-MR,可能存在信號肽的概率為0.081;信號錨定概率為0.869;該序列最大切割位點概率為0.050;位點在15和16之間。根據數據并結合圖形分析可知,昆明裂腹魚CYP1A1基因的蛋白質的N-端存在1個信號肽,位點在33和34之間MRL-MR。
2.5.3 昆明裂腹魚CYP1A1基因跨膜區分析
將昆明裂腹魚CYP1A1基因的氨基酸序列提交到ExPASy在線平臺上的TMPRED程序,讓其對該序列進行跨膜區預測,見圖9。

圖9 預測CYP1A1基因的跨膜區
由圖9分析表明,該序列的N-端有2個強跨膜螺旋,由內到外的螺旋有4個,分別位于14~34位置區域、194~210位置區域、319~339位置區域以及368~388位置區域;由外到內的螺旋有2個,見第30頁表6。因此,該基因有2個跨膜區,并且能夠預測跨膜區的長度為17到33之間。

表6 CYP1A1基因的氨基酸序列的強跨膜螺旋區
2.5.4 昆明裂腹魚CYP1A1基因磷酸化位點和糖基化位點
采用NetPhos3.1服務器,在線對擴增的昆明裂腹魚CYP1A1基因進行磷酸化位點預測,見第30頁圖10。

圖10 預測CYP 1A1基因的磷酸化位點
蛋白質的磷酸化主要是指氨基酸殘基被磷酸化后能夠導致蛋白質結構發生改變,進而導致蛋白質活性發生改變的過程。由圖10分析結果顯示,昆明裂腹魚CYP1A1基因中,共發現27個磷酸化位點,其中,蘇氨酸(Thr)為7個,絲氨酸(Ser)為17個,酪氨酸(Tyr)為3個。
利用NetNGlyc1.0及NetOGlyc3.1服務器,分別對擴增的昆明裂腹魚CYP1A1蛋白質進行N-糖基化位點預測和O-糖基化位點預測。N-糖基化位點預測見圖11。

圖11 預測CYP 1A1基因的N-糖基化位點
由圖11分析結果顯示,昆明裂腹魚CYP1A1蛋白質序列有1個N-糖基化位點,位于224位置上,該蛋白質序列暴露N-糖基化機制,因此能被糖基化。O-糖基化位點預測見圖12。由圖12分析結果可知,昆明裂腹魚CYP1A1基因的O-糖基化位點有3個,見表7。分別位于15位置、198位置和391位置。O-糖基化發生在絲氨酸(Ser)上。

圖12 預測CYP 1A1基因的O-糖基化位點

表7 昆明裂腹魚CYP1A1基因O-糖基化位點數據統計
2.5.5 CYP1A1基因二級結構分析
運用SOPMA在線服務器,對擴增的昆明裂腹魚CYP1A1基因進行預測,見圖13。

圖13 CYP1A1基因的二級結構
由圖13分析顯示,昆明裂腹魚CYP1A1基因主要以α-螺旋(Alpha helix)為主;無規則卷曲(Random coil)次之;β-折疊(Beta bridge)最少。昆明裂腹魚CYP1A1基因的無規則卷曲區域、α-螺旋區域、β-折疊區域分別占36.87%、45.89%、5.01%。
2.5.6 CYP1A1基因三級結構分析
運用同源建模的方法,將昆明裂腹魚CYP1A1基因的氨基酸序列提交到SWISS-MODEL在線服務器,對該序列進行建模,見第31頁圖14。分析可知,建模以4i8v.1.A序列作為模板,與目標序列之間的一致度為56.99%,遠大于30%,滿足同源建模的基本條件。

圖14 昆明裂腹魚CYP1A1基因的氨基酸序列的同源建模
基于可信度(GMQE)范圍為0~1,QMEAN區間為0~1,由數據分析可知,待測蛋白質的GMQE值為0.76,QMEAN值為-1.10。因此,可根據模板蛋白質的三維結構,預測待測蛋白質的三維結構,見圖15。在圖15中,圖像由彩虹著色N→C端;尺寸如下:x=64.745?,y=47.352?,z=72.452?。

圖15 昆明裂腹魚CYP 1A1基因的蛋白質的三維結構預測圖
分析可知,旋轉異構體離群值(Rotamer Outliers)為2.72%;C-Beta偏差(C-Beta Deviations)有5個,分別位于A366 SER,A299 LEU,A336 VAL,A122 ASP,A324 PHE;非脯氨酸順式肽鍵(Cis Non-Proline)有1個,位于A438 THR-A439 ASP。昆明裂腹魚CYP1A1基因的各氨基酸殘渣質量見圖16。分析顯示,昆明裂腹魚CYP1A1基因的N-端是甘氨酸(Gly),C-端是甲硫氨酸(Met);缺失突變位點有1個,位于SER 386;半胱氨酸(Cys)位點有6個,分別位于序列162位置、204位置、207位置、294位置、406位置和458位置上。

圖16 昆明裂腹魚CYP1A1基因的各氨基酸殘渣質量
采用NCBI網站上的ORF Finder程序,對測序獲得的mR NA序列進行開放閱讀框位置定位;確定其序列的起始密碼子以及終止密碼子的位置;從而確定試驗擴增CYP1A1基因的CDS序列全長為1 498 bp,通過DNAS T A R軟件,對該序列進行翻譯,可得出該序列共編碼299個氨基酸。從NCBI網站的Ge Ba nk數據庫中,獲取鯉魚、安水金線鲃、鯽魚、犀角金線鲃、金線鲃和黑頭呆魚等物種的CYP1A1基因的CDS序列。利用Blast程序,對這些物種的CYP1A1基因進行全CDS序列比對,通過比對發現昆明裂腹魚與安水金線鲃和犀角金線鲃的堿基同源性相似比率達到92.23%,與鯉魚的堿基同源性相似比率達到91.70%。比對結果表明,昆明裂腹魚與安水金線鲃以及犀角金線鲃的氨基酸同源性相似比率達到90.16%,與鯉魚的氨基酸同源性相似比率達到90.55%,根據CDS序列和氨基酸序列同源性比對結果分析,進而可以確定擴增獲得的基因序列即為昆明裂腹魚的CYP1A1基因序列。利用SMART軟件,對昆明裂腹魚CYP1A1基因的CDS序列進行預測,發現其氨基酸的45~368位置區域和382~499位置區域為Pfam(P450),進一步證實了擴增獲得的基因序列就是昆明裂腹魚的CYP1A1基因序列。同源性比對結果分析表明,昆明裂腹魚與鯉科魚類和高原冷水魚類的CYP1A1基因同源性相似比率高,這與其均屬于冷水魚類和具有相似的棲息環境是一致的。
昆明裂腹魚的CYP1A1基因的氨基酸序列與其他多種魚類的分子系統進化樹表明,昆明裂腹魚與金線鲃、犀角金線鲃以及安水金線鲃的親緣關系較為相近;與斑馬魚的親緣關系較遠。通過分析可知,安水金線鲃是金線鲃屬的一個新種[8];金線鲃屬于鯉形目鯉科[9];犀角金線鲃是云南鯉科魚類的一個新種[10]。這些物種與昆明裂腹魚均屬于鯉科冷水性魚類,主要分布于我國西南地區高原河流與湖泊內。斑馬魚是鯉形目鯉科,是一種常見的熱帶魚,主要分布于印度、孟加拉國以及巴基斯坦等南亞國家[11]。不同的地理分布以及生存環境可能是導致其親緣關系之間遠近不同的一個原因。
運用ExPASy在線平臺上的相應程序,對擴增獲得的昆明裂腹魚CYP1A1基因的蛋白質序列進行疏水性預測,發現其序列有4個明顯的疏水性區域,進而推測在疏水性區域內可能存在信號肽。運用ExPASy在線平臺上的ProtParam程序分析表明,該序列的氨基酸平均親水性為-0.078,理論等電點為6.44?;谑杷灶A測可能存在信號肽,通過SignaIP3.0在線服務器,運用隱馬可夫模型(HMM)預測其序列中是否含有信號肽;運用神經網絡法(NN)程序預測信號肽位點研究發現,昆明裂腹魚CYP1A1基因的蛋白質序列的N-端存在1個信號肽,信號肽位點為33和34之間MRL-MR。在跨膜區預測的分析中,發現序列的N-端有2個強跨膜螺旋,因此,預測昆明裂腹魚CYP1A1基因有2個跨膜區。
蛋白質翻譯后修飾過程主要有糖基化以及磷酸化等,蛋白質的磷酸化是生物界最普遍同時也是比較重要的一種蛋白質翻譯后修飾。在磷酸化調節的過程中,細胞的形態和功能都會隨著磷酸化狀態發生改變[12]。本次試驗擴增獲得的昆明裂腹魚CYP1A1基因蛋白質翻譯后修飾主要是磷酸化位點和O-糖基化位點。有27個磷酸化位點,其中,蘇氨酸(Thr)有7個,絲氨酸(Ser)有17個,酪氨酸(Tyr)有3個。有3個O-糖基化位點,分別位于15位置、198位置和391位置上。昆明裂腹魚CYP1A1基因的蛋白質序列只有1個N-糖基化位點,位于該序列的224位置上。
本次試驗擴增獲取的昆明裂腹魚CYP1A1基因蛋白質二級結構以α-螺旋為主,占45.89%;無規則卷曲次之,占36.87%。采用同源建模的方法,將昆明裂腹魚CYP1A1基因的蛋白質序列提交到SIWSS-MODEL程序,得到與模板蛋白質序列較高的一致度,為56.99%,遠大于30%,可用于預測待測蛋白質序列的三維結構。由SIWSS-MODEL程序計算的數據分析顯示,擴增獲得的昆明裂腹魚CYP1A1基因在保守區域內存在6個半光氨酸(Cys);在保守區域內有3個二硫鍵,其二硫鍵主要是以相鄰的2個Cys依次構成的亞域。昆明裂腹魚CYP1A1基因的蛋白質氨基酸序列的穩定CYP1A1球狀結構是通過二硫鍵折疊而形成的,維持了CYP1A1的高級結構。蛋白質結構特征具備典型的魚類CYP1A1基因的高級結構特點[13]。
通過構建昆明裂腹魚全長轉錄組文庫獲得全長基因的結果是可靠的,通過引物設計、PCR擴增產物直接測序獲得序列分析,昆明裂腹魚CYP1A1基因的堿基和氨基酸水平分析結果表明,昆明裂腹魚與高原區抗寒魚類和多倍體鯉科魚類的同源性相似比率較高,與鯉科魚類斑馬魚同源性相似比率較低,表明基因與低溫魚類及多倍體高原魚類有相似的進化方向;其蛋白質預測結果表明,該基因能夠形成穩定蛋白,與鯉科魚類CYP1A1同源性相似比率較高,具備維持其生物學特性的完整的蛋白質空間構型,該研究為進一步認識CYP1A1基因功能及在昆明裂腹魚性別發育及控制及發育中的作用研究奠定了一定基礎。