




摘 要:為了分析塔里木馬鹿(Cervus elaphus yarkandensis)細胞色素P450 2U1(CP2U1)基因的結構和相關功能,利用RT-PCR方法獲取塔里木馬鹿CP2U1基因288 bp的CDS序列,并構建其真核表達載體pcDNA3.1(+)-CeyCP2U1。生物信息學分析結果表明:該基因能編碼95個氨基酸,氨基酸組分中沒有天冬酰胺;其蛋白為疏水性、不穩定蛋白,沒有跨膜區、信號肽、N-糖基化位點和O-糖基化位點,但具有8個潛在的磷酸化位點;塔里木馬鹿CP2U1與東歐馬鹿和白尾鹿的相似性最高,而與褐家鼠的同源性最低.;CP2U1蛋白在適應極端干旱環境中發揮潛在的作用。
關鍵詞:塔里木馬鹿;CP2U1基因;生物信息學分析
中圖分類號:Q786 文獻標志碼:B 文章編號:2095–3305(2024)09–00-03
CP2U1(Cytochrome P450 2U1)基因屬于細胞色素
P450超家族的一員,其唯一的酶活性是不飽和脂肪酸的氧化,可能在調節腦血流和免疫功能方面發揮重要作用。CP2U1基因還可以作用于二十二碳六烯酸(DHA)或二十碳五烯酸(EPA)等脂肪酸,這些脂肪酸與降低甘油三酯水平和降低患冠心病的風險有關[1]。
塔里木馬鹿(Cervus elaphus yarkandensis)是新疆維吾爾族自治區塔里木盆地特有的耐旱鹿科動物。該物種對塔里木盆地的極端干旱環境表現出高度的適應性,能夠耐受高礦化度的鹽堿水和鹽堿度較高的飼料[2-3]。在前期研究中,利用FST-θπ和XP-EHH選擇消除對塔里木馬鹿極端干旱環境適應性機制進行分析發現,塔里木馬鹿CP2U1(CeyCP2U1)基因具有較強的選擇性信號,并在功能上參與花生四烯酸代謝途徑[4]。該基因產物將花生四烯酸轉化為19(S)-HETE(羥基二十碳四烯酸)或20-HETE,在極端干旱環境中的CP2U1基因受到強烈的選擇作用并富集到花生四烯酸代謝通路,參與水的重吸收[5-6]。因此,推測CeyCP2U1基因與塔里木馬鹿適應干旱、沙漠環境間存在一定的聯系。然而,有關塔里木馬鹿CP2U1基因還未有研究報道。
基于此,對CeyCP2U1進行基因擴增、克隆及測序,利用在線軟件對基因進行生物信息學分析,為后續深入研究塔里木馬鹿乃至其他藥用動物CP2U1基因的作用機制提供理論依據和初步實驗數據。
1 材料與方法
1.1 實驗材料和主要試劑
實驗材料和主要試劑有:塔里木馬鹿皮膚組織、大腸桿菌感受態細胞DH5α、pcDNA3.1(+)質粒載體、First Strand cDNA Synthesis Kit、限制性核酸內切酶、Trizol、質粒DNA小量抽提試劑盒、Tris等。
1.2 塔里木馬鹿CP2U1基因CDS序列的RT-PCR擴增
從塔里木馬鹿轉錄組測序數據中選擇CeyCP2U1基因CDS序列,設計帶有BamH I和EcoR I核酸酶切位點相互補配對的引物序列,并進行人工合成,引物序列信息F(BamHI):ttaagcttggtaccgagctcGGATCCATGGGGAAGCAGAGGATACGGAT,R(EcoRI):cactgtgctggatatctgcaGAATTCTCAATCCATGGGTCTGGAAGATCCC。其中,引物序列中的小寫字母和下劃線部分分別表示同源臂序列和酶切位點序列,擴增序列長度為288 bp。取塔里木馬鹿皮膚組織,提取總RNA后反轉錄合成cDNA,并進行RT-PCR擴增。PCR結束后進行瓊脂糖凝膠電泳,并對目的基因條帶進行純化回收。
1.3 塔里木馬鹿CP2U1基因表達載體的構建
從含載體質粒的菌液中提取質粒。用BamH I和EcoR I限制性內切酶進行雙酶切,將酶切產物進行瓊脂糖凝膠電泳后,進行膠回收。將pcDNA3.1(+)載體與CP2U1基因的CDS片段進行重組。用大腸桿菌感受態細胞DH5α對重組子進行轉化,并對陽性克隆進行鑒定。同時,對重組質粒進行酶切鑒定并送至測序鑒定。將測序成功的序列進行比對,重組質粒命名為pcDNA3.1(+)-CeyCP2U1表達載體。
1.4 塔里木馬鹿CP2U1基因的生物信息學分析
擬用DNAStar軟件中的MegAlign程序對測序得到的塔里木馬鹿CP2U1基因序列與從NCBI數據庫中下載的東歐馬鹿(Cervus elaphus)、牛(Bos taurus)、綿羊(Ovis aries)、野駱駝(Camelus ferus)、貓(Felis catus)等16種哺乳動物和人(Homo sapiens)CP2U1基因的CDS序列進行同源性比對。利用MEGA 11.0中的最大似然樹(Maximum Likelihood,ML)法構建系統進化樹,并利用多種在線軟件,如ProtParam、ProtScale、NetNG-lyc-1.0、NetOGlyc-4.0、NetPhos-3.1、SignalP-5.0、TMHMM-2.0、PSORT II、SOPMA、SWISS-MODEL和STRING 11.5,對氨基酸序列的結構特征進行初步預測和分析。
2 結果與分析
2.1 塔里木馬鹿CP2U1基因的RT-PCR擴增
利用RT-PCR方法,CeyCP2U1基因CDS序列特異引物來擴增基因片段后進行的15 g/L瓊脂糖凝膠電泳,如圖1所示,在250 bp上方處出現特異條帶。此條帶大小與預期的該基因CDS序列的大小相一致(288 bp),表明獲得了CeyCP2U1基因CDS序列。
2.2 重組質粒pcDNA3.1(+)-CeyCP2U1的構建
將pcDNA3.1(+)載體與CeyCP2U1基因的CDS片段進行重組并轉化,挑取陽性克隆進行測序獲得清晰、單一的測序峰,如圖2所示,重組子的酶切結果出現的條帶大小與CeyCP2U1擴增得到的基因產物大小相符。經過比對,重組子的堿基序列與CeyCP2U1基因預期序列一致。以上結果表明,確認該基因表達載體成功構建并命名為pcDNA3.1(+)-CeyCP2U1。
2.3 塔里木馬鹿CP2U1基因的生物信息學分析
利用MEGA 11.0軟件,將塔里木馬鹿測序獲得的CP2U1基因序列與從NCBI數據庫中下載東歐馬鹿、牛、綿羊、野駱駝、貓等16種哺乳動物和人CP2U1基因的CDS序列進行同源性比對,結果如圖3所示。結果顯示,塔里木馬鹿CP2U1基因與本研究所使用的其他哺乳動物之間的相似性為57.3%~100%,其中,塔里木馬鹿與東歐馬鹿的相似性最高(100%),其次是與白尾鹿的相似性(92.2%),而與褐家鼠的同源性(57.3%)最低。
以褐家鼠為外群,對以上物種CP2U1構建ML系統進化樹,如圖4所示,塔里木馬鹿與鹿科動物的親緣關系最近,其次與牛科動物和麝科動物的親緣關系較近,而與嚙齒類動物的親緣性較遠,系統進化關系與同源性比對結果相一致。
2.4 塔里木馬鹿CP2U1基因的生物信息學分析
塔里木馬鹿CP2U1基因CDS序列編碼95個氨基酸。利用在線軟件ProtParam對該基因氨基酸序列進行基本理化性質分析,結果顯示,CP2U1氨基酸相對分子質量為10 717.75,分子式為C470H759N135O127S12,理論等電點pI值是8.92;氨基酸組分中亮氨酸和絲氨酸含量最高,占11.6%,沒有天冬酰胺;正電荷殘基數和負電荷殘基數的比例為6∶10;半衰期為30 h;脂肪系數為91.26,不穩定系數為59.73,推測為不穩定蛋白。通過在線分析工具Protscale對蛋白親疏水性進行分析,發現蛋白質總平均親水性值為0.088,疏水氨基酸(正值)稍多于親水性氨基酸(負值),91位的絲氨酸分值最低(-1.667),親水性最強;82位的纈氨酸分值最高(1.889),疏水性最強。從整體來看,可以推測塔里木馬鹿CP2U1蛋白為疏水性蛋白。
從信號肽和跨膜區預測結果可以看出,塔里木馬鹿CP2U1蛋白沒有信號肽也不存在跨膜區(圖5)。
亞細胞定位結果表明:該蛋白分別定位在線粒體(43.5%)、細胞核(39.1%)、細胞外,包括細胞壁(13.0%)和細胞骨架(4.3%)等部位。塔里木馬鹿CP2U1蛋白共有8個潛在的磷酸化位點,包括7個絲氨酸(第23、27、29、64、87、90和91位點)和1個蘇氨酸(第30位點),而沒有酪氨酸磷酸化位點。其中,第23位的絲氨酸磷酸化位點可能與DNA損傷修復過程中關鍵的調節因子絲氨酸-蘇氨酸蛋白激酶相結合,第27、29的絲氨酸磷酸化位點和第30位的蘇氨酸點酸磷酸化位點可能與蛋白激酶C相結合,第64位的絲氨酸磷酸化位點可能與細胞周期素依賴蛋白激酶5相結合,第87、90和91位的絲氨酸磷酸化位點可能與非特異性預測的活性激酶相結合。由于塔里木馬鹿CP2U1蛋白沒有天冬酰胺氨基酸成分,因此,沒有N-糖基化位點,也沒有O-糖基化位點。
蛋白質二級結構的預測結果表明:無規則卷曲是構成該蛋白質二級結構最多的組分(44.21%),β-轉角的含量最少(5.26%)。該蛋白三級結構預測結果與二級結構預測結果相一致。
互作蛋白預測結果顯示:塔里木馬鹿CP2U1蛋白可能與屬于細胞色素P450家族的CYP2J2、CYP4F2、CYP2E1、CYP4A22、CYP4A11、CYP4F2-2、未鑒定的蛋白質LOC100295883、LOC534967、LOC509506和LOC784417等蛋白之間存在潛在的相互作用。
3 結論
CP2U1在腺、腦、胸腎、肺或心臟等組織的血流調節中發揮作用,在線粒體功能調節方面也發揮著潛在的作用[6]。
從同源性比對結果可以看出,塔里木馬鹿CP2U1與東歐馬鹿和白尾鹿的相似性最高,而與褐家鼠的同源性最低,系統進化樹也證實了此結果,符合該物種的系統進化關系。
利用在線軟件對CP2U1基因的核苷酸及其編碼氨基酸序列的結構特征進行初步預測和分析,該基因能編碼95個氨基酸,氨基酸組分中沒有天冬酰胺,因此其蛋白沒有N-糖基化位點,也沒有O-糖基化位點。推測塔里木馬鹿CP2U1為疏水性、不穩定蛋白。
根據研究中互作蛋白預測結果,可以推測出塔里木馬鹿CP2U1蛋白可能通過細胞色素P450家族蛋白質之間的相互作用發揮單加氧酶活性、氧化還原酶活性等多種生物學功能,并參與脂肪酸ω-羥化酶活性、脂肪酸和花生四烯酸代謝等代謝途徑,從而使得該物種在極端干旱環境適應性中發揮潛在的作用。
參考文獻
[1] 帕爾哈提·薩依提.塔里木馬鹿遺傳資源調查情況[J].當代畜禽養殖業,2015(6):37-38.
[2] Zhu L, Cao D, Xiang Z, et al. Endangered Père David’s deer genome provides insights into population recovering [J]. Evolutionary applications, 2018, 11(10): 2040-2053.
[3] Strazzullo P, D’Elia L , Kandala N B, et al. Salt intake, stroke, and cardiovascular disease: meta-analysis of prospective studies [J]. BMJ, 2009, 339(7733): 1296- 1296.
[4] Ababaikeri B, Abduriyim S, Tohetahong Y, et al. Whole-genome sequencing of Tarim red deer (Cervus elaphus yarkandensis) reveals demographic history and adaptations"to an arid-desert environment [J]. Frontiers in zoology, 2020(17): 31.
[5] 布威海麗且姆·阿巴拜科日,單文娟,馬合木提·哈力克,等.基于RNA-Seq技術的野生和圈養塔里木馬鹿皮膚組織轉錄組比較分析[J].野生動物學報, 2023, 44(1):76-89.
[6] Devos A , Cardenas C L L , Glowacki F, et al. Genetic polymorphism of CYP2U1, a cytochrome P450 involved in fatty acids hydroxylation[J]. Prostaglandins leukotrienes amp; essential fatty acids, 2010, 83(2):105-110.
收稿日期:2024-07-15
基金項目:新疆維吾爾醫學專科學校校級自然科學基金項目(2020XK01)。
作者簡介:布威海麗且姆·阿巴拜科日(1988—),女,新疆和田人,副教授,研究方向為野生哺乳動物保護遺傳學與利用和適應性進化。#通信作者:克熱木江·阿布都熱合曼,E-mail:431772718@qq.com。