王國秀,陳占玉,黃永亮,李 沖
(甘肅農業大學動物科學技術學院,甘肅 蘭州 730070)
載脂蛋白(Apolipoprotein,APO)是構成血漿脂蛋白的蛋白質組分,基本功能是運載脂類物質及穩定脂蛋白的結構,在血漿脂蛋白的代謝中能促進脂類運輸并調節酶活性[1]。其主要在肝臟和小腸中合成,可分為A、B、C、D、E 五類,能夠影響血脂代謝和利用,從而引起冠心病、糖尿病等的發生[2]。
載脂蛋白A-IV(Apolipoprotein A-IV,APOA4)是1974 年由Swaney 等人在大鼠的高密度脂蛋白中首次發現的,經過水解后生成酸性糖蛋白,主要存在于乳糜微粒、極低密度脂蛋白和高密度脂蛋白中[3-4]。APOA4 基因與APOA1 和APOC3 基因連鎖[5]。眾多研究表明,APOA4 基因上的多態現象與血糖、血漿脂蛋白、膽固醇以及甘油三酯等的水平相關,也有研究發現APOA4 基因多態性變異可能會影響膽固醇的吸收和分解[6]。另外,APOA4 基因的缺陷可直接導致血漿中的載脂蛋白A-IV 水平的下降或活性的改變,其他一些脂蛋白和膽固醇的水平相應升高,從而大大提高患高脂蛋白血癥和冠心病的風險[2]。近年來,學者研究還發現,除小腸以外脂類的吸收還可以刺激下丘腦合成APOA4[5]。
脂質代謝和能量平衡是羊生長發育的重要限制因素,同時綿羊肌內脂肪的沉積受肌肉組織中代謝酶和功能基因的調控,深入全面地了解綿羊脂肪代謝和肌內脂肪沉積的機制及影響因素,對生產高品質肉產品至關重要[7]。APOA4 基因作為載脂蛋白家族基因成員,有可能對綿羊脂類代謝和能量平衡發揮重要作用。但目前對APOA4 基因的研究大多局限于人類醫學,而綿羊APOA4 基因方面的研究和分析較少。有研究通過轉錄組測序發現熱應激條件下湖羊肝臟的差異表達lncRNA Lnc_001782 可能正向影響APOA4 的表達,共同調節肝臟功能[8]。但專門針對綿羊APOA4 基因及其編碼產物理化特性和生物功能的研究未見報道。生物信息學是利用數學方法處理和分析生物數據,基于人們現有對分子生物學的認識和構建生物模型,進而分析其生物學特性的方法[9-10]。我們用生物信息學方法對綿羊APOA4 基因及其編碼產物的理化性質、序列特征、蛋白質結構以及生物學功能進行分析,以期為進一步探索APOA4 基因及其編碼蛋白的生物學功能,以及APOA4 基因和綿羊健康與生長發育的關系提供線索。
從美國國立生物技術信息中心(NCBI)GenBank數據庫中檢索綿羊、山羊、牛、馬、豬、雞、人、貓、狗、小鼠、兔、鴨等12 個物種的APOA4 基因mRNA 序列。物種名稱及GenBank 登錄號見表1。

表1 12 個物種APOA4 基因的GenBank 登錄號
綿羊APOA4 基因開放閱讀框(Open reading frame,ORF)采 用ORFfinder 程序預測(https://www.ncbi.nlm.nih.gov/orffinder),APOA4 基因編碼產物的理化性質采用Bioedit 程序分析(https://www.expasy.org/resources/protparam),蛋白潛在信號肽剪切位點采用Signalp 3.0 程序分析(http://www.cbs.dtu.dk/services/SignalP-3.0),蛋白跨膜螺旋結構采用TMHMM Server v.2.0 程序分析(http://www.cbs.dtu.dk/services/TMHMM),蛋白保守結構域采用Smart 程序分析(http://smart.embl-heidelberg.de),蛋白親疏水性采用ProtScale 工具分析(http://ca.expasy.org/tools/protscale.html)。不同物種間多序列比對和同源性分析采用DNAMAN 軟件完成。蛋白二級結構采用Jpred 軟件分析預測,蛋白三級結構采用Swiss-model 軟件分析預測。
從ORF 分析結果可以看出(圖1),綿羊APOA4基因序列共識別出4 個ORF。其中ORF2 有1 143 bp,起始密碼子位于201 bp 處,終止密碼子位于1 343 bp 處,推測其編碼380 個氨基酸殘基。

圖1 綿羊APOA4 基因序列的ORF 分析
蛋白質的基本性質包括其相對分子質量、氨基酸組成、等電點基因編碼產物半衰期和不穩定指數等[9]。對綿羊APOA4 蛋白的理化性質進行分析,結果表明綿羊APOA4 蛋白共380 個氨基酸,其分子式為C1881H3051N535O594S5,分子質量為42 825.44 kDa,理論等電點pI 為5.36。其氨基酸組成如表2 所示,其中含量最多的是Leu(亮氨酸),所占比例為13.66%;含量最少的是Cys(胱氨酸),含量為0。負電荷殘基總數(Asp+Glu)為59,正電荷殘基總數(Arg+Lys)為48。基因編碼產物半衰期為30 h,不穩定指數為53.11,不穩定指數為53.11>40.00,屬不穩定蛋白。

表2 綿羊APOA4 基因編碼蛋白的氨基酸組成
通過ProtScale 工具分析APOA4 基因編碼蛋白質的親疏水性。結果(圖2)表明,該基因編碼蛋白疏水性最大值為2.978(第9 位),最小值為-2.522(第97位)。多數位點疏水性值為負值,即該基因編碼的蛋白屬于親水蛋白。

圖2 綿羊APOA4 基因編碼蛋白質疏水性/親水性預測分析
信號肽序列是起始密碼子后一段編碼疏水性氨基酸序列的RNA 區域,負責把蛋白質引導到細胞含不同膜結構的亞細胞器內,或被分泌到細胞外發揮功能[11]。通過Signalp 3.0 程序分析檢測綿羊APOA4 蛋白潛在信號肽的存在情況,分析APOA4 基因編碼產物是否是分泌蛋白和跨膜蛋白以及跨膜蛋白的基本信息。從綿羊APOA4 基因蛋白潛在信號肽剪切位點分析結果可以看出(圖3),該基因編碼產物的C 值、Y 值和S 值分別為0.826、0.638 和0.999,綿羊APOA4 蛋白存在信號肽剪切位點,位于第23 和第24 個氨基酸之間(VLA-QVV)。

圖3 綿羊APOA4 蛋白潛在信號肽剪切位點分析
從TMHMM 2.0 軟件的分析結果可以看出(圖4),APOA 蛋白沒有跨膜螺旋結構,所有序列均在膜外,該序列編碼的是分泌性蛋白。

圖4 綿羊APOA4 蛋白跨膜螺旋結構分析結果
從綿羊APOA4 蛋白的亞細胞定位預測結果可以看出(表3),綿羊APOA4 蛋白分布于細胞外的可能性為66.77%,分布于細胞質的可能性為11.1%,分布于內質網的可能性為11.1%,分布于液泡的可能性也為11.1%。由此推斷,綿羊APOA4 基因編碼蛋白為胞外蛋白,主要在細胞外發揮生物學作用。

表3 綿羊APOA4 蛋白質亞細胞定位預測分析
通過Smart 軟件分析,綿羊APOA4 蛋白包含3 個結構域(圖5)。其中第1 個結構域位于第3~18位,為低復雜性結構域(low-complexity domain);第2 個結構域和第3 個結構域分別位于83~114和237~265 位,為卷曲螺旋結構域(coiled coil)。

圖5 綿羊APOA4 蛋白保守結構域分析
采用DNAMAN 軟件對綿羊、山羊、牛、馬、豬、雞、人、貓、狗、家鼠、兔和野鴨APOA4 蛋白進行多序列比對,結果如圖6、圖7 所示。APOA4 基因在這12 個物種中均有表達,且綿羊與牛和山羊的APOA4 蛋白氨基酸序列同源性較高(圖6)。APOA4 編碼產物同源樹也表明(圖7),在分析中選取的12 個物種中,綿羊、山羊和牛的APOA4 蛋白氨基酸序列同源性最高。

圖6 12 個物種的APOA4 基因編碼序列比對

圖7 12 個物種的APOA4 基因編碼產物序列的同源樹
二級結構(secondary structure)是蛋白質分子中的局部區域內氨基酸殘基的有規則的排列[10]。通過Jpred 軟件分析可知(圖8),綿羊APOA4 蛋白二級結構α-螺旋(α-helix,Hh)和無規卷曲(random coil,Cc)分別占比98.16%和1.84%,不存在β-折疊。即綿羊APOA4 蛋白的二級結構以α-螺旋為主。

圖8 綿羊APOA4 蛋白二級結構預測
三級結構(tertiary structure)是指蛋白質在二級結構基礎上的進一步折疊,通過將二級結構元素組裝在一起形成每個蛋白質特有的三維構象[12]。由分析結果可知(圖9),APOA4 蛋白的三級結構主要由α-卷曲折疊纏繞形成。

圖9 APOA4 蛋白的三級結構的分析結果
對綿羊APOA4 基因生物信息學的分析結果表明,綿羊APOA4 基因的ORF 編碼380 個氨基酸殘基,編碼蛋白分子質量為32 825.44 kDa,理論等電點為5.36,為不穩定的親水蛋白;存在信號肽,不存在跨膜結構,為分泌性蛋白,主要在細胞外發揮生物學作用。二級結構和三級結構都以α-螺旋為主,與山羊和牛的同源性最高。
綿羊作為草食反芻動物,體內能量平衡對于健康和生長發育非常關鍵,而脂質的吸收、轉運和代謝是能量平衡的重要組成部分。APOA4 作為載脂蛋白家族的一員,在人類醫學的研究中已發現它具有許多生理功能,包括體外激活卵磷脂-膽固醇酰基轉移酶和膽固醇轉移蛋白;在小鼠動物模型中發揮食欲和飽足調節作用,在體外和小鼠動物模型中顯示抗氧化和抗動脈粥樣硬化特性,以及調節腸細胞和肝細胞間脂質轉運的效率的作用[13-14]。本研究表明,綿羊APOA4 基因編碼蛋白分子質量為32 825.44 kDa,理論等電點為5.36,為酸性親水性蛋白。載脂蛋白的主要功能是作為脂蛋白的結構成分,賦予脂質以可溶的形式,通過血液和淋巴運輸脂質,此外還可作為細胞表面受體的配體和酶的輔助因子[15]。本研究下APOA4蛋白的理化特性和親疏水性與載脂蛋白的主要功能是一致的,能夠實現引導血漿脂蛋白同細胞表面受體結合的基本功能要求。
本研究表明,APOA4 蛋白為不穩定蛋白。蛋白質的穩定性指的是蛋白質抵抗各種因素的影響,保持其生物活力的能力,蛋白質的穩定性通常由蛋白質的空間結構決定。近年來有研究認為,當系統的自由度很低時,蛋白質的功能敏感性和穩定性之間不存在矛盾[16]。蛋白質在發揮功能的時候,常常對于外界的擾動和噪聲有高度的敏感性,甚至表現出類似于臨界態的高敏感性特征,并能根據外界環境中的擾動做出相應的構象變化[17];與此同時,蛋白質分子在面臨著內部的擾動時,常常表現出較高的穩定性。蛋白質的結構相對不穩定,意味著對環境或突變敏感,也意味著隨環境變化狀態的可塑性,有可能與蛋白質分子的生物學功能有關。本研究下APOA4 蛋白的三級結構主要由α 卷曲折疊纏繞形成,較高的不穩定指數與該蛋白調節脂質代謝效率和能量平衡等生物學功能的關系仍需進一步研究。
本研究表明,APOA4 蛋白存在信號肽及剪切位點,沒有跨膜螺旋結構,亞細胞定位預測分析也表明該蛋白主要在細胞外發揮生物學作用。根據以上生物信息學分析結果,推測APOA4 為分泌性蛋白,APOA4 基因在翻譯時首先合成的是N 末端帶有疏水氨基酸殘基的信號肽,被內質網膜上的受體識別并與之相結合,信號肽經由膜中蛋白質形成的孔道到達內質網內腔,隨即被位于腔表面的信號肽酶水解;由于信號肽的引導,新生的肽鏈通過內質網膜進入腔內,加工后成熟的蛋白質再以液泡運至細胞膜,以胞吐的方式運出細胞外,在細胞外發揮生物學功能[18]。結合APOA4的弱酸性和親水性特征,推測APOA4 分泌到細胞外與脂類結合,其親水性特征賦予脂類可溶的形式,從而促進脂類的運輸,并可能具有引導血漿脂蛋白與細胞表面受體結合的作用。有研究認為豬APOA1 存在跨膜螺旋結構,為跨膜蛋白,且不存在信號肽[19],與本研究結果不一致;但更多的研究表明載脂蛋白主要在肝臟和小腸合成,作為分泌性蛋白進入血液,構成血漿脂蛋白的重要組分,在血漿脂質運輸和脂質代謝中發揮重要作用,與本研究預測的綿羊APOA4 蛋白的上述特征相符合。
本研究下綿羊APOA4 基因序列與山羊和牛的同源性較高,這也說明它們在進化過程具有較近的親緣關系。綿羊、山羊和牛均為反芻動物,脂質代謝方式具有較高的相似性。反芻動物日糧中通常脂質含量較低,脂質在瘤胃中會在微生物作用下被廣泛水解為游離脂肪酸和甘油,不飽和脂肪酸會涉及微生物的生物氫化作用,同時小腸內的脂肪酶相對于豬、禽等單胃動物通常活性較低[20]。本研究表明了綿羊APOA4 基因與禽類的同源性較低。不同物種間有可能是脂肪消化代謝的方式導致的自然選擇過程中APOA4 基因在進化中出現了變異,但具體的進化機制,以及差異位點對該基因在脂肪代謝中發揮的生物學功能的影響和相關機理仍需進一步研究。
APOA4 基因作為載脂蛋白基因家族的成員,有可能對綿羊脂質代謝和能量平衡具有重要作用。以APOA4 基因作為綿羊抗應激能力的分子標記選育開展分子標記輔助選育,有可能加快綿羊育種進程,改善綿羊飼料利用效率,提高生產性能。然而APOA4 基因編碼蛋白的生物學功能、表達調控以及APOA4 基因多態性與綿羊健康與生長發育的關系仍有待進一步的研究。