路玉潔,莫家遠,朱思燃,楊麗麗,陳奎蓉,呂冬玲,李月月,劉笑笑,梁 靚,蘭干球,梁 晶
(廣西大學動物科學技術學院,南寧 530004)
隆林豬是廣西六大地方豬種之一,具有生長較快、體型較大、性早熟、抗病力強和耐粗飼等特點。由于西方商業豬種的沖擊,隆林豬的保有量持續下降,據隆林縣畜牧局統計,2005年上半年存欄隆林豬僅剩765頭,其中公豬15頭[1]。特別是暴發非洲豬瘟以來,中國養豬業遭受了巨大損失,很多中國地方豬種的種群數量進一步下降,進而造成了種質資源丟失和遺傳多樣性下降。中國地方豬種由于具有產仔數高、抗病性好、性早熟和肉質優良等特點,歷來被作為豬育種的優良材料,如通過隆林豬與杜洛克豬雜交對種質資源進行利用[2-3]。拷貝數變異(copy number variation,CNV)是指基因組中從50 bp到5 Mb不等的缺失或重復,拷貝數變異區域(copy number variation region,CNVR)則是指具有重疊片段的相鄰CNV構成的區域。由于CNVR的長度均超過50 bp,所以其對基因結構和基因劑量產生影響的可能性更大,研究也證明了CNVR可以影響豬的很多重要經濟性狀。Qiu等[4]發現了9個CNVRs與杜洛克豬的平均日增重和達100 kg日齡有關;Zheng等[5]發現AHR基因的拷貝數變異與繁殖性狀有關;Wang等[6]發現GPER1基因拷貝數變異與大白豬的產仔數相關。本研究通過中芯一號50 K SNP芯片對廣西隆林豬進行CNV檢測,以期為進一步提高隆林豬的種質資源利用效率,深入挖掘隆林豬的優良遺傳特性提供理論依據。
于廣西隆林縣采集33頭成年隆林母豬耳組織,使用酚-氯仿法提取耳組織DNA,經過瓊脂糖凝膠電泳和微量紫外分光光度計鑒定質量,符合分型標準后送北京康普森公司進行豬中芯一號50K SNP芯片分型。
使用Genomestudio 2.0軟件對Grn和Red原始數據進行讀取,并將每個個體的51 315個位點的BAF和LRR值單獨導出。使用Linux系統將文件整理為PennCNV軟件輸入格式。
使用Genomestudio 2.0軟件的插件CNVPartition 3.2.0對CNV進行檢測,參數為:置信閾值35,最小純合區域大小1 Mb,最小SNP數3。使用PennCNV 1.0.5對整理后的文件進行CNV檢測,參數為:最小SNP數3,最小CNV長度1 kb。去除性染色體上檢測到的CNV。
使用Bedtools軟件分別對CNVPartition和PennCNV軟件檢測到的CNV進行合并。將合并后的CNVR分為缺失、獲得和混合3種類型,對2種軟件檢測到的CNVR再次合并為共同CNVR。
使用BioMart軟件對CNVPartition檢測到的CNVR、PennCNV檢測到的CNVR和共同CNVR內包含的基因比對豬基因組(Susscrofa10.2)進行注釋,并通過David網站對3種CNVR注釋到的基因進行GO和KEGG富集分析。使用豬QTL數據庫對與隆林豬共同CNVR重疊的QTL進行注釋。
使用CNVPartition軟件在常染色體中共檢測到260個CNVs,合并后得到47個CNVRs,其中缺失型40個、獲得型5個、混合型2個,長度范圍為53.35~1 201.49 kb(圖1)。基因定位發現共有84個編碼蛋白基因位于CNVR內。David分析富集到了20條通路,其中13條通路顯著富集(P<0.05),包括涉及嗅覺感官知覺的化學刺激檢測通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)和嗅覺轉導通路(hsa04740)等(表1)。

圖1 CNVPartition軟件檢測到的CNVRFig.1 CNVR detected by CNVPartition software


使用PennCNV軟件在常染色體中共檢測到96個CNVs,合并后得到15個CNVRs,其中缺失型9個、獲得型1個、混合型5個,長度范圍為9.28~797.77 kb(圖2)。 基因定位發現,OR6C4、OR6C65、OR6C76、OR8K5、OR9G4、TRAV10、TRAV14DV4、TRAV9-1共8個基因位于CNVR內。David分析富集到了8條信號通路,均為顯著富集通路(P<0.05),包括涉及嗅覺感官知覺的化學刺激檢測通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)和嗅覺轉導通路(hsa04740)等(表2)。

圖2 PennCNV軟件檢測到的CNVRFig.2 CNVR detected by PennCNV software

表2 8條顯著富集通路
使用Bedtools軟件對2個軟件檢測到的CNVR進行合并后獲得了3個共同CNVRs,其中缺失型、獲得型和混合型各1個,長度范圍為600.70~1 201.49 kb(表3)。 基因定位發現,OR10AG1、OR6C4、OR6C65、OR6C76、OR8K5、TRAV10、TRAV14DV4、TRAV9-1共8個基因位于共同CNVR內。David分析富集到了7條信號通路,均為顯著富集通路(P<0.05),包括涉及嗅覺感官知覺的化學刺激檢測通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)和嗅覺轉導通路(hsa04740)等(表4)。對共同CNVR進行QTL注釋發現,共有130個QTLs與3個共同CNVRs重疊,排名前11的性狀中,與背膘厚相關的性狀包括平均背膘厚、最后一根肋骨背膘和第十肋背膘,共有11個QTLs;肉質相關的性狀包括肉色b*、pH24 h(死后腰部)和剪切力,共有9個QTLs;乳頭數性狀相關的QTLs為6個(圖3)。

表3 共同CNVR

表4 7條顯著富集通路

圖3 共同CNVR的QTL注釋圖Fig.3 QTL map annotation of common CNVR
豬的基因組中存在大量的單堿基和多堿基變異,如巴馬香豬包含14 691 086個SNPs,3 207個CNVs和4 191 263個Indels等[7]。其中由SNP構成的商業芯片,如中芯一號[8]、60K芯片[9]和80K芯片[6]已被廣泛應用于基因組選擇中來提高豬育種的遺傳進展[10]。特別是Yang等[11]研究發現,基于大樣本低深度重測序可以大大降低SNP分型的成本,為基因組選擇技術的發展作出了重要貢獻。但基因組選擇并不是育種工作的最終手段,未來的發展方向之一是精準育種,即通過基因編輯等手段對性狀相關的因果突變進行人工改造,從而改良動物的表型。而CNV由于長度比SNP更長,所以對基因的結構和表達影響可能更大,因此未來在豬精準育種工作中也應該將CNV考慮進去。本研究對隆林豬的CNV進行分析,為深入挖掘隆林豬的遺傳特性和未來使用CNV進行精準育種提供參考。
本研究使用CNVPartition軟件檢測CNV,發現共有47個CNVRs,使用PennCNV軟件檢測發現共有15個CNVRs,而2個軟件共同檢測到的CNVRs僅有3個,這可能是由于CNVPartition軟件使用的算法是將BAF與LRR值與作為二元高斯分布創建的14個預測拷貝數進行比較來鑒定CNV,而PennCNV使用的算法是基于隱馬科夫模型來鑒定CNV[12]。因為2個個體鑒定的CNV具有重疊部分會被定義為一個CNVR[13],所以研究中使用的個體越多理論上能檢測到的CNVR也會越多,因此本研究鑒定到的CNVR較少可能與使用的個體較少有關,這與邱恒清等[14]研究發現樣品越多CNV檢出率越高的結果一致。同時本研究使用的中芯一號芯片雖然是參照了中國本地豬種的SNP進行設計,但是其包含位點僅有51 315個,即平均每47.92 kb才有1個SNP,因此很多較短的CNV使用中芯一號芯片難以被檢測到,而CNV出現的頻率與CNV長度呈負相關[15],這與本研究發現共同CNVR范圍在600.70~1 201.49 kb一致,這也相應導致了本研究得到的CNVR較少。
對2個軟件檢測到的CNVR進行基因定位和富集分析發現,用CNVPartition軟件定位到了84個編碼蛋白基因,其中INPP5B、NEURL1和GAPDHS基因顯著富集到精子活力通路(GO:0030317)中。Marcello等[16]對INPP5B基因雙敲除小鼠進行研究顯示,INPP5B基因雙敲除小鼠的精子由于與卵質膜的結合和融合的減少,導致受精顯著減少;NEURL1基因在人類的睪丸中高表達[17],可能與人類的繁殖能力有關;GAPDHS基因作為一種精子特異性糖酵解酶,參與了精子發生和精子運動過程,并在次級精子和卵母細胞結合過程中具有重要作用[18],說明這3個基因相關的CNVR可能與隆林豬的繁殖性能有關。2個軟件富集到的顯著條目中有6條為共同顯著條目,包括涉及嗅覺感官知覺的化學刺激檢測通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)、嗅覺轉導通路(hsa04740)、G-蛋白偶聯受體活性通路(GO:0004930)、G-蛋白偶聯受體信號通路(GO:0007186)和膜整體組件通路(GO:0016021),這些結果與張笠[15]發現巴馬香豬和巴馬小型豬CNV定位到的基因大量富集在G-蛋白偶聯受體相關通路、嗅覺相關通路的結果一致。而G-蛋白偶聯受體在向細胞傳輸各種細胞外信號和調節各種生理功能方面發揮著關鍵作用,其廣泛參與了機體的各種功能和生命活動,如消化功能[19]、肥胖發生[20]、糖尿病發生[21]、繁殖能力[22]等。本研究中參與G-蛋白偶聯受體相關通路的基因中除了OR8K5、OR5D18、OR6C76、OR6C65、OR4C12、OR12D3、OR10AG1、OR6C4和OR5D16這9個嗅覺相關的基因外還有FFAR2和FFAR1基因,有研究發現FFAR2基因與免疫功能[23]、能量代謝[24]、骨重塑[25]等重要功能相關;FFAR1基因與血管生成[26]、能量代謝[27]、母性行為[28]等有關;其中FFAR2和FFAR1基因都與能量代謝和糖尿病發生有密切關系[29-30],甚至可作為糖尿病治療的藥物靶點[31],提示豬雖然肥胖但不容易發生糖尿病可能與糖尿病相關基因的CNV有關。
本研究使用2個軟件共同鑒定的CNVRs僅有3個,定位到了8個編碼蛋白基因,嗅覺相關基因和免疫相關基因仍然是主要基因,其顯著富集通路同樣主要是嗅覺相關通路和G-蛋白偶聯相關通路。對與共同CNVR重疊的QTL進行分析發現了排名前11的性狀分別是乳頭數、平均背膘厚、眼肌面積、胴體長度、平均日采食量、最后一根肋骨背膘、第十肋背膘、腰部重量、肉色b*、pH24 h(死后腰部)和剪切力,其中背膘厚相關QTLs共有11個;肉質相關QTLs共有9個,乳頭數相關QTLs共有6個。綜上,本研究的3個共同CNVRs可能與背膘厚、肉質和乳頭數性狀相關。
本研究通過2種軟件對隆林豬CNV進行檢測,并進行了基因定位、富集分析和QTL分析,共獲得了356個CNVs、62個CNVRs和3個共同CNVRs;基因主要富集在嗅覺相關通路和G-蛋白偶聯相關通路中,其中INPP5B、NEURL1和GAPDHS基因顯著富集在精子活力通路;分別有11、9和6個與背膘厚、肉質和乳頭數性狀相關的QTLs與共同CNVR重疊;隆林豬CNV可能與嗅覺功能、繁殖性能、背膘厚、肉質和乳頭數性狀相關。