諶 芳 仲崇超 陳姝為 張電光 呂武宏 譚肖英
(華中農業大學水產學院, 農業農村部淡水生物繁育重點實驗室, 武漢 430070)
目前, 養殖魚類普遍存在脂肪肝、內臟脂質過多和相關代謝紊亂的問題, 導致成活率下降、生長性能下降和抗病性下降等[1]。在脂肪分解中除了中性脂肪酶介導的脂解外, 溶酶體酸性脂肪酶(Lysosmal acid lipase, LAL)承擔著重要脂解功能。lal作為溶酶體中的酸性脂肪酶, 由LIPA基因編碼, 主要作用是將膽固醇酯(Cholesteryl esters, CEs)和甘油三酯(Triglycerides, TGs)水解成游離的膽固醇(Free cholesterols, FCs)和脂肪酸(Free fatty acids,FFAs)[2]。而lal在脂解反應中, 除了水解由低密度脂蛋白(Low density lipoprotein, LDL)內吞進入胞質內的CEs、TGs和REs (Retinyl esters, REs)以外[3],還通過自噬分解脂滴[4]。人的LAL由372個氨基酸組成含有27個殘基的疏水信號肽[5]、6個N-糖基化位點[6], 并且通過與高爾基體中甘露糖-6-磷酸受體結合, 靶向溶酶體發揮其生理作用[7]。目前有關LAL的研究多集中于哺乳動物的分子結構[5]、LIPA基因突變或缺失導致脂肪沉積、肝臟病變[8]、免疫機能下降[9]和冠狀動脈疾病[10]等, 而有關lal在魚類生長發育和生理營養過程中所起到的作用尚不清楚。
黃顙魚(Pelteobagrus fulvidraco)肉質細嫩、耐低溫, 是我國重要的淡水經濟養殖魚類, 其養殖產量逐年增加[11]。鑒于lal對脂質代謝的重要作用, 為深入解析lal功能, 本實驗首先克隆黃顙魚lal基因全長的cDNA序列, 進行生物信息學分析并探討其組織表達模式, 然后從啟動子結構及活性分析研究黃顙魚lal的轉錄調控方式, 以期為深入解析黃顙魚lal基因的功能奠定基礎。
本實驗的黃顙魚分為2組, 購自武漢市農貿市場。黃顙魚樣品采集參照本實驗室的方法[12]。第一組黃顙魚, 取肝臟和卵巢組織用于lal基因cDNA全長序列的克隆, 取肝臟、脾臟、腎臟、腸道、腸系膜脂肪、肌肉、大腦、心臟和性腺組織用于組織表達水平的測定。第二組黃顙魚用于lal基因的啟動子克隆, 取樣參照本實驗室的方法[13], 隨機選取黃顙魚3尾, 麻醉后冰浴上迅速剪取尾鰭進行總DNA提取。
凝膠回收試劑盒購自Omega公司; TRIzol總RNA提取試劑盒、胰蛋白酶、DNA提取試劑盒、Lipo2000轉染試劑盒、DMEM培養基和新生胎牛血清(FBS)等購自Invitrogen公司; 其他分子試劑均購自TaKaRa公司; 化學試劑均為分析純, 購自上海國藥; 胰蛋白胨、酵母提取物、瓊脂粉、大腸桿菌DH5α感受態細胞和氨芐青霉素等購自武漢迪躍創新生物有限公司。HEK293T細胞株來自華中農業大學水產學院細胞資源中心。
根據本實驗室已有的方法[12], 參照Invitrogen的TRIzol說明書進行總RNA的提取。1%的瓊脂糖凝膠電泳和Nanodrop ND-2000分光光度計檢測總RNA的質量和純度。用TaKaRa的反轉錄試劑盒(PrimeScriptTMII 1st Strand cDNA Synthesis Kit)進行反轉錄。
根據GenBank數據庫中已報道的黃顙魚lal基因序列, 用Premier 5.0分別設計3′和5′ RACE特異性引物(表 1), 通過巢式PCR反應進行末端的擴增, 第一輪PCR反應參數: 95℃ 5min; 然后95℃ 30s, 55℃30s, 72℃ 1min, 25個循環; 72℃ 5min。第二輪PCR反應參數: 95℃ 3min; 95℃ 30s, 57℃ 30s, 72℃1min, 30個循環; 最后72℃ 5min。
用Seqman軟件將擴增得到的核心片段、3′ 和5′ 末端序列拼接, 從而獲得基因cDNA全長。利用NCBI進行BLAST, 以確定該序列對應的基因亞型(http://blast.ncbi.nlm.nih.gov/)。同時, 利用NCBI中ORF finder軟件(https://www.ncbi.nlm.nih.gov/orffinder/)找出開放閱讀框(ORF)并翻譯成氨基酸序列。信號肽用Signal 5.0在線軟性預測(http://www.cbs.dtu.dk/services/SignalP/), 通過在線軟件Expasy(https://web.expasy.org/compute_pi/)預測蛋白分子量大小及等電點, NetNGlyc 1.0 Server(http://www.cbs.dtu.dk/services/NetNGlyc/)分析N-糖基化位點, 使用Clustal-W軟件進行序列比對和氨基酸同源性分析。用MEGA 5.0軟件采用鄰接法(NJ) 構建進化樹[14],選擇的最適進化模型為JTT+G[15], 每個節點的可信值進行1000次重復計算。
利用SWISS-MODEL同源蛋白建模構建黃顙魚LAL蛋白質的三維模型, 選擇狗的胃脂肪酶(PDB code 1k8q.1)[16]作為合適的結構模板, 其中兩者序列一致度達到56.84%。用VMD 1.9.2(https://www.ks.uiuc.edu/Research/vmd/)顯示和分析得到蛋白單體的理論模型。
參照文獻[12], 利用實時熒光定量PCR(q-PCR)方法檢測lal基因在黃顙魚不同組織中的表達。q-PCR反應參數: 95℃ 30s; 95℃ 5s, 57℃ 30s, 72℃30s, 40個循環。選用β-actin和ubce作為內參基因,相對表達水平采用2-ΔΔCt方法計算[17]。熒光定量引物見表 1。
利用RNA連接酶介導的5′ cDNA末端快速擴增(RLM-5′ RACE)方法鑒定黃顙魚lal的5′ cDNA序列和轉錄起始位點(Transcription start sites, TSS)。啟動子克隆是基于上一步得到的5′末端的DNA序列及已發表的黃顙魚[18]的基因組, 實驗過程參照本實驗室已有的方法[13]。利用Omega試劑盒從黃顙魚尾鰭中提取基因組DNA, 并設計具有酶切位點的特異性引物(表 2), 將PCR產物和pGL3-Basic質粒純化并使用相應的內切酶(Hind Ⅲ和SacⅠ)消化, 重組連接按照ClonExpressTMⅡ One Step Cloning Kit說明書操作。簡要操作步驟如下: 第一輪進行RTPCR反應: 95℃ 3min; 95℃ 15s, 57℃ 15s, 72℃ 50s,35個循環; 72℃ 3min。以第一輪PCR產物為模板,加入含有酶切位點的引物進行第二輪PCR: 95℃3min; 95℃ 15s, 55℃ 30s, 72℃ 2min, 35個循環;72℃ 3min, 獲得對應的目的片段。將目的片段與pGL-3載體連接30min后, 轉化至DH5α感受態細胞中, 氨芐抗性平板篩選出陽性克隆, 送北京擎科生物科技有限公司測序。將測序后返還的質粒重新轉化后, 進行擴大培養和質粒抽提。質粒抽提方法參照說明書進行。本實驗共構建4個黃顙魚lal啟動子缺失載體, 分別命名為pGL3-554/+51、pGL3-1016/+51、pGL3-1567/+51和pGL3-2052/+51。

表 1 黃顙魚lal基因cDNA全長序列的克隆及熒光定量所用的引物Tab. 1 Primers used for lal cDNA cloning and PCR

表 2 黃顙魚lal cDNA啟動子克隆所用到的引物Tab. 2 Primers used for lal promoter cloning of P. fulvidraco
利用JASPAR數據庫(http://jaspar.genereg.net/)預測黃顙魚lal啟動子可能的轉錄因子結合位點。
HEK293T細胞在10% FBS-DMEM培養基中生長, 并置于37℃、5% CO2的環境中培養。瞬時轉染前, 將HEK293T細胞以1.2×105的密度接種于24孔細胞培養板中, 培養24h, 需達到70%—80%的密度。使用LipofectamineTM2000將450 ng構建好的質粒和20 ng pRL-TK(內參質粒)共轉染到HEK293T細胞中, 陰性對照為pGL3-Basic質粒。4h后, 更換含有10% FBS-DMEM培養基。24h后收集細胞,進行雙熒光素酶活性檢測, 檢測步驟參照說明書進行。
采用平均值±標準誤(mean±SE)表示結果。統計分析之前, 采用Kolmogorov-Smirnov檢驗所有數據的正態分布性。利用SPSS 19.0軟件采用單因素方差分析和Duncan’s多重比較評估組織分布數據,采用Student’sttest評估雙熒光活性數據中相鄰兩組之間的差異。顯著性水平為P<0.05, 極顯著性水平為P<0.01。
本研究通過RT-PCR和RACE方法獲取lal基因的cDNA全長序列, 長度為1802 bp, 序列分析顯示它們的5′非翻譯區長度為131 bp, 3′非翻譯區長度為474 bp, cDNA序列ORF長度為1197 bp, 編碼398個氨基酸, 理論蛋白分子量為45.42 kD, 等電點為7.70。黃顙魚LAL蛋白序列含有一段具有23個氨基酸殘基的信號肽、α/β水解酶折疊類結構域, 5個N-糖基化位點(Asn35-Ile36-Ser37、Asn101-Thr102-Ser103、Asn273-Met274-Thr275、Asn320-Gln321-Ser322和Lys161-Thr162-Thr163)、2個氧陰離子孔(Leu89和Gln175)、1個“帽子”結構域(Thr205-Val329)和“蓋子”結構域(Phe233-Leu272), 及催化三元體(Ser174、Asp344和His373)和三個半胱氨酸殘基(Cys257、Cys265和Cys284)。根據以上主要位點繪制出黃顙魚LAL的氨基酸結構示意圖(圖 1)。

圖 1 黃顙魚LAL氨基酸結構示意圖Fig. 1 Structural diagram of LAL amino acids from P. fulvidraco

圖 2 基于NJ法構建的脊椎動物LAL氨基酸序列的系統進化樹Fig. 2 The neighbor-joining phylogenetic tree based on the amino acid sequences from P. fulvidraco (▲) and other vertebrate species,using MEGA 5.0 with 1000 bootstrap replicates
多重序列比顯示, 黃顙魚LAL氨基酸序列與斑點叉尾鮰相應氨基酸序列的相似性為85.64%, 與哺乳類的相似性為57.66%—62.77%, 其中與人的相似性為60.83%, 與大鼠的相似性為57.66%。
在進化樹中, 哺乳類和兩棲類聚為一支, 硬骨魚獨立聚為另一支(圖 2)。同時在硬骨魚類中, 黃顙魚lal多肽與斑點叉尾鮰(Ictalurus punctatus)親緣關系最近, 且這兩2個物種與水金線鲃(Sinocyclocheilus anshuiensis)、犀角金線魮(Sinocyclocheilus rhinocerous)和金魚(Carassius auratus)聚為一支, 其他硬骨魚類聚為另一支。
LAL的三維結構主要由3個領域組成, 包括α螺旋、β折疊及轉角, 3個半胱氨酸殘基Cys257、Cys265和Cys284的結合位點在LAL中相互接近(圖 3)。
黃顙魚lal基因在多個組織中(心臟、肝臟、腦、脾臟、腎臟、肌肉、腸系膜脂肪、腸道和性腺)均有表達, 其中脾臟、腸道和精巢中表達最高,表達量最低的是心臟和大腦(圖 4)。

圖 3 黃顙魚LAL蛋白三級預測Fig. 3 The three-dimensional structure prediction of LAL protein from P. fulvidraco
本研究克隆得到2103 bp的黃顙魚lal序列, 并將其提交到在線轉錄因子數據庫(JASPAR)進行序列分析。lal的5′ cDNA序列的第一個堿基為基因的轉錄起始位點, 其位置定義為+1。利用JASPAR(http://jaspar.genereg.net/)軟件預測轉錄因子結合位點, 發現lal啟動區存在Sp1、PPARα、FOXO1、PPARγ、HNF4α和TFEB等轉錄因子結合位點, 同時核心啟動子結構含有TATA盒和CCAAT盒。
通過5′缺失載體構建、細胞轉染及雙熒光素酶活性測定, 結果顯示lal的-1507/-1016區域負調控啟動子活性, 而-1016 bp/+51 bp區域正調控啟動子活性(圖 5)。

圖 4 黃顙魚lal mRNA的組織表達Fig. 4 The relative mRNA levels of P. fulvidraco lal in different tissues

圖 5 黃顙魚5′ lal啟動子區啟動子活性Fig. 5 5′ unidirectional deletion analysis of the lal promoter region for P. fulvidraco
本研究獲得cDNA全長為1802 bp的黃顙魚lal基因序列, 通過對其蛋白序列分析發現, LAL蛋白質結構擁有保守的α/β水解酶折疊類結構域, 一個活性位點(Gly172-His173-Ser174-Gln175-Gly176), 1個“帽子”結構域(Thr205-Val329)和“蓋子”結構域(Phe233-Leu272), 2個氧陰離子孔(Leu89、Gln175), 催化三元體(Ser174、Asp344、His373)和3個半胱氨酸殘基(Cys257、Cys265、Cys284), 及5個潛在的N-糖基化位點(Asn35-Ile36-Ser37、Asn101-Thr102-Ser103、Asn273-Met274-Thr275、Asn320-Gln321-Ser322、Lys161-Thr162-Thr163)。除此之外, LAL具有23個殘基的信號肽, 能夠將該蛋白輸送到內質網中進行信號肽裂解和N-鍵糖基化[5,19]。在本研究中, 黃顙魚具有5個N-糖基化位點, 其中除第三個Lys161-Thr162-Thr163糖基化位點以外, 其余4個在進化上都非常保守[20]。蛋白質的N-糖基化是一種新生肽鏈的共翻譯或翻譯后修飾方式, 對膜和分泌蛋白的折疊和穩定性調節具有重要意義[21]。其中, 由Asn-X-Thr/Ser組成的N-糖基化位點[22], 這3種氨基酸與高爾基體中甘露糖-6-磷酸結合, 能夠識別出溶酶體表面的特定甘露糖受體[23]。當N-糖基化位點中Asn273發生突變時, LAL活性完全喪失[19], 這表明糖基化位點對LAL的功能、定位及活性至關重要。負責酶活性的催化三元體(Ser174、Asp344和His373)有2個位于蛋白質的C-末端區域, 當2個等位基因都存在時, 幾乎所有的無義突變都會導致溶酶體酸性脂肪酶缺乏(Lysosomal acid lipase deficiency, LALD)[24]。在人的LAL蛋白質序列中, 半胱氨酸殘基有助于提高LAL對底物的選擇活性[25], 而人與黃顙魚半胱氨酸數目不同, 可能由于物種的差異性。此外, 我們還發現黃顙魚LAL氨基酸序列上存在一個“帽子”結構域和“蓋子”結構域, Rajamohan等[26]認為“蓋子”結構域打開, LAL活性被激活, 同時移動“蓋子”, 使底物接近催化三元體Ser174[16]。Holmes等[27]認為來自靈長類等近親物種的LAL半胱氨酸殘基顯示出高度的序列一致性,在我們的進化樹分析中, 黃顙魚lal與其他硬骨魚類聚為聚為一只, 哺乳動物聚為另一大分支。
利用已知的脂肪酶結構模型來預測LAL的三級結構, 通過三級同源模型揭示了LAL結構的保守性[23,28], 我們的研究也顯示LAL和dGL之間具有較高的氨基酸序列相似度(56.84%), 這使得基于dGL結構構建LAL的三級結構模型具有一定的現實意義。同時, Ataya[23]預測LAL的三級結構中帶負電荷的Asp344與His373和Ser174形成氫鍵網絡, 激活絲氨酸羥基。該結構隱藏在由Gln175和Leu89主鏈的NH基團組成的氧陰離子孔中, 它們通過形成2個短氫鍵為催化反應的過渡態提供了穩定的環境[29]。
了解基因的生理功能可以通過組織分布模式分析。本研究發現, 黃顙魚lal基因在各組織中均有表達, 但在脾臟、腸道和精巢中高表達, 心臟和大腦表達量最低, 這與其他研究報道相同[30]。另外Ataya認為[23]lal在精巢中高表達的原因, 可能是由于精巢組織分裂活躍, 精子細胞膜脂雙層的產生和降解需要持續進行。溶酶體酸性脂肪酶能為這一過程提供能量。
RNA聚合酶能夠識別真核生物的核心啟動子,并與其結合后, 可調控基因的轉錄起始和效率, 保證基因轉錄的準確性和精確性[31]。通常基因的TATA盒位于轉錄起始位點的上游-50 bp至-100 bp區域[32], 并且除虹鱒(Oncorhynchus mykiss)和斑馬魚(Danio rerio)外, 類似TATA的基序(TTTAAA)在所有魚類中都比較保守[33]。因此識別這些核心啟動子是轉錄起始的一般機制的第一步[34]。在本研究中,lal核心啟動子區存在CCAAT和TATA盒,分別位于-8 bp至-19 bp, -22 bp至-27 bp。黃顙魚lal的核心啟動子區存在下游核心元件(Downstream core element, DCE)、轉錄起始元件(Initiator, INR),從而保證基因轉錄的正常啟動[31]。
基因的轉錄也受轉錄因子結合位點(Transcription factor binding site, TFBS)的調控作用[35]。根據在線軟件預測, 黃顙魚lal基因的啟動子上存在Sp1(-87 bp/-101 bp)、STAT3(-233 bp/-243 bp)和PPARα(-286 bp/-313 bp)結合位點。本研究結果顯示5′缺失突變分析結果顯示lal的-1016 bp/+51 bp啟動子區域正調控啟動子活性, 這表明Sp1、STAT3和PPARα可能是lal基因啟動子可能存在的正調控轉錄因子。Sp1屬于C2H2型鋅指蛋白家族, 它與富含GC的基序結合調節基因的表達[36], Sp1能夠協同AP-2正調控lal轉錄表達[37]。STAT3作為一種轉錄因子, 正調控CPT Iα1b啟動子活性[38]。PPARα是草魚脂肪組織甘油三酯脂肪酶(Adipose triglyceride lipase, ATGL)基因啟動子活性的順式作用元件[39]。而LAL作為一種酸性脂肪酶, 將膽固醇酯(CE)和甘油三酯(TG)水解成游離的膽固醇(FC)和脂肪酸(FFA)[2], 我們可以推測STAT3和PPARα也是lal基因啟動子活性的順式作用元件。
本研究結果顯示-1507/-1016區域負調控lal啟動子活性。在這個區域中, 存在2個FOXO1結合位點(-1066 bp/-1076 bp、-1333 bp/-1343 bp)。FOXO1在調節代謝、應激反應和細胞凋亡中發揮中心作用, 研究表明FOXO1正調控lal的轉錄[4]。在本研究中, FOXO1結合位點處于黃顙魚lal啟動子的負調控區域, FOXO1可能是黃顙魚lal基因潛在的負調控轉錄因子, 但需要在往后的點突變實驗進行論證。另外, 在-2052 bp/-1507 bp區域存在1個PPARγ(-1755 bp/1774 bp)和1個HNF4α(-1758 bp/-1772 bp)位點, 值得注意的是P P A R γ結合位點正包含HNF4α結合位點, 這與You等[36]報道PPARα啟動子上 也 存 在P P A R位 點 包 含H N F 4 α結 果 相 似。PPARγ作為脂質代謝過程中的一種重要轉錄因子,對脂肪細胞的分化和脂質儲存具有重要作用[40], 同樣HNF4α是一種核受體轉錄因子, 在肝臟特異性基因表達中起關鍵作用[41]。本研究也發現lal在肝臟的表達量比較高, 這提示我們PPARγ和HNF4α能夠調節lal的轉錄表達, 但具體的調節方式有待深入探討。
本研究克隆得到了lal基因的cDNA全長和5′上游啟動子序列, 為深入了解該基因的功能提供了基礎。組織表達分析結果表明,lal在心、肝臟、腦、脾臟、腎臟、肌肉、腸系膜脂肪、腸及性腺等組織中都有表達, 這表明lal基因對黃顙魚體內的代謝調控發揮重要的作用。啟動子序列及活性分析, 發現lal核心啟動區含TATA和CCAAT盒, 存在多個轉錄因子, 確定了lal啟動子的-1507 bp/-1016 bp區域負調控啟動子活性, -1016 bp/+51 bp區域正調控啟動子活性, 表明不同的轉錄因子對lal的轉錄表達有不同作用。此研究為日后深入了解魚類lal基因在脂質代謝及相關轉錄水平調控機制等研究提供科學依據。