李完波,朱亞玲,艾華水,郭添福
(江西農業大學省部共建豬遺傳改良與養殖技術國家重點實驗室,南昌 330045)
?
豬小體型相關受選擇基因位點的研究
李完波*#,朱亞玲#,艾華水,郭添福*
(江西農業大學省部共建豬遺傳改良與養殖技術國家重點實驗室,南昌 330045)
旨在通過對比大、小體型兩組中國地方豬種在基因組上的遺傳分化,檢測出全基因組選擇信號,以期能鑒別出影響豬體型大小的相關基因及可能的突變位點,解析小體型豬種形成的分子機制。本研究選用小體型的五指山豬和巴馬香豬,以大體型的金華豬、二花臉、河套大耳豬為對照,基于全基因組重測序數據,使用兩組豬群間的遺傳分化系數(Fst)和小體型豬組內的雜合度(Heterozygosity) 檢測體型選擇信號。Fst值較大而雜合度小的染色體區段作為體型相關的受選擇候選區域。對這些候選區域所包含的基因進行基因功能及通路的注釋分析、以及突變位點的搜尋,試圖揭示與豬體型大小相關的可能受選擇的基因和突變。結果,通過篩選全基因組重測序數據,我們得到32 475 218個高質量的SNPs,利用40 kb的滑動窗口進行Fst和雜合度的計算。Fst值經Z轉換(Z(Fst))后大于5的區段有242個。取雜合度最小值的前200個區間與242個Z(Fst)>5的區間的交集,確定了13個受選擇候選區域,其中共包含28個基因。通過PANTHER進行基因注釋,發現了17個與體型性狀相關的候選基因,包括IGF1R、GUCY1A3等功能候選基因。本研究基于高通量測序數據,結合群體遺傳學分析手段,確定了與體型大小相關的受選擇區域,綜合分析推測五指山和巴馬香小體型豬的形成可能是由于處于非基因編碼區域的一個或者多個突變造成。
小型豬;全基因組重測序;選擇信號;體型大小;候選基因
豬是人類較早馴化的家養動物之一。由于受到較強的人工選擇及對所處圈養環境的適應,家豬品種在體型外貌、生長性能和行為習慣等重要性狀上與野豬有了明顯分化。中國南方地區有著豐富的小型豬豬種資源,如五指山豬、巴馬香豬、從江香豬、劍白香豬、環江香豬、滇南小耳豬等,其一般都具有體型小、生長緩慢、肉質細嫩和耐近交的特點[1]。小型豬的成年個體體重多在40 kg以下,而五指山豬成年個體體重更低于25 kg[2]。與小型豬相比,分布在中國南方和北方的大型豬的體型明顯要大,成年豬體重一般超過100 kg[3]。而豬的體型大小和生長速度一直都是商業豬種選育的重點,在遺傳上解析小型豬的形成機制,并定位相關的突變基因位點,對豬種遺傳差異的探索及品種的選育都具有重要的指導意義。此外,豬在器官大小和生理特性等方面和人類接近,而小型豬體型小、飼養經濟、便于管理的優點可作為人類醫學模式動物的理想材料。在弄清小型豬遺傳機制的基礎上,通過常規或基因工程育種方法進一步縮小我國現存的小型豬豬種的體型,將有可能推動小型醫學試驗豬在更大范圍的應用。
隨著第二代高通量測序技術成本的大幅下降,全基因組重測序的策略被大量應用于遺傳學和基因組學研究中。近年來,基于全基因組重測序數據,通過檢測基因組范圍內的選擇信號(Signatures of selection),大量與馴化、適應性和重要性狀相關的受選擇區段被相繼報道。其中,涉及的研究對象有雞、牛、狗、豬、羊等[4-7]。對單一品種或群體進行選擇信號檢測時,很難確定該區段是真正的受選擇區域還是由于遺傳漂變造成的。本研究借鑒前人的策略,將五指山豬和巴馬香豬合為小型豬組,將金華豬、二花臉豬和河套大耳豬合為大型豬組。同時,在大、小體型豬組間應用群體分化系數(Fst)初步確定兩組間的受選擇區域。Fst利用了群體間存在的較顯著的等位基因頻率差異來檢測選擇信號,但它并不能說明到底是哪個群體存在選擇,即選擇方向不明確。因此,結合小型豬群體的雜合度(Heterozygosity)分析,進一步確定小型豬中特異受選擇的區段,并以Fst和雜合度分析結果的重疊區間做為小型豬中受選擇的候選區間,從而可以較為準確的確定與體型大小相關的受選擇區間。
本研究利用公共數據庫和本試驗新增的小型豬和大型豬的全基因組測序數據,通過群體遺傳學方法檢測全基因組選擇信號,以期解析中國小型豬形成的分子機理,為豬種遺傳改良及開發實用的小型醫用模式豬提供理論基礎。
1.1試驗材料
本研究選用小型豬五指山豬6頭、巴馬香豬12頭,大型豬金華豬6頭、二花臉豬6頭和河套大耳豬6頭作為試驗材料(表1)。五指山豬、巴馬香豬、二花臉豬、河套大耳豬全基因組重測序數據從H.S.Ai等[8]發表的數據中獲得。金華豬重測序數據是基于Illumina公司Hiseq 4000平臺產生。
1.2全基因組重測序數據的處理
質控過濾后的測序reads通過BWA軟件(http://bio-bwa.sourceforge.net/)比對到豬參考基因組susScr3版本(http://hgdownload.soe.ucsc.edu/goldenPath/susScr3/bigZips/)。 Picard軟件(http://picard.sourceforge.net)用來去除重復reads。其后,使用GATK(The Genome Analysis Toolkit)軟件[9],將比對后得到的bam文件在含有插入或缺失突變的區間進行區域內重新比對,并進行堿基測序質量校正(Recalibration)。通過使用GATK HaplotypeCaller算法,針對每一個測序個體生成一個gVCF文件。最后,使用所有試驗個體的gVCF文件產生了單核苷酸多態位點(SNP)和短插入缺失(INDEL)數據集。通過使用GATK的SelectVariants功能選擇出高質量SNP位點,并設定如下的SNP過濾標準“QD>2.0 && MQ>40.0 && FS<60.0 && ReadPosRankSum>-8.0 && MQRankSum>-12.5”,舍棄含3個以上等位基因的位點,最終獲得了一套高質量SNP數據集用于群體遺傳學分析。
表1試驗豬樣本信息表
Table 1The summary information for sampled pigs

分組Group品種Breed個體數Numberofanimals測序深度Depthofcoverage金華豬6~26×大體型豬Large-size二花臉豬6~21×河套大耳豬6~20×小體型豬Small-size五指山豬6~21×巴馬香豬12~22×
1.3選擇信號檢測
本研究采用VCFtools (http://vcftools.sourceforge.net/),以40 kb染色體區間為滑動窗口,每次滑動20 kb來計算大、小體型豬之間的Fst。VCFtools采用C.C.Cockerham 和B.S.Weir于1984年發表的算法來計算Fst值[10]。同時,以相同大小的滑動窗口策略進行小型豬組內期望雜合度的計算。滑動窗口的期望雜合度為區間內每個SNP位點期望雜合度的平均值,該計算使用Python代碼完成。因有些區間可能是調控序列受選擇,為盡可能囊括靶向基因,在候選受選擇區域上下游各加100 kb再繼續下游分析。
1.4受選擇區域的候選基因注釋、GO分析和通路分析
由于豬參考序列基因注釋不完善,豬中注釋的RefSeq轉錄本僅有5 305個,相較于人和老鼠的基因數差距很大。為避免在后續分析中遺漏基因,通過利用UCSC Genome Browser (http://genome.ucsc.edu/)在受選擇區間選出豬中已注釋的RefSeq基因,同時,將人和小鼠中同時注釋了的同源基因(豬中暫無注釋的)也納入后續分析。通過這種策略,大大擴充了后續分析基因集,有效避免了遺漏未注釋的基因。其后,采用PANTHER (http://www.pantherdb.org/)和DAVID (https://david.ncifcrf.gov/)兩個軟件對候選基因的功能和通路進行注釋分析。此外,還系統檢索了豬的QTL數據庫(http://www.animalgenome.org/cgi-bin/QTLdb/SS/index),分析與體重、體長和生長等性狀相關的QTL是否在受選擇區域富集。
1.5基因突變注釋
為找到可能影響小型豬體型形成的關鍵突變,本研究對13個候選區域里的變異進行注釋。通過應用本地版Variant Effect Predictor (VEP)(http://www.ensembl.org/info/docs/tools/vep/index.html)軟件,對候選基因所包含的所有SNP和插入缺失突變進行注釋。同時,對可能顯著影響基因功能、結構的突變位點,還進行了多物種間的序列保守性分析。VEP軟件運行代碼:
perl variant_effect_predictor.pl --database --coding_only --sift b --species sus_scrofa --input_file Input_selected.vcf --force_overwrite。
2.1候選受選擇區域
本試驗利用常染色體40 kb滑動窗口計算區間Fst值。所得Fst平均值為0.092,方差為0.049,接近正態分布,將Fst進行標準化得到Z(Fst)。Z(Fst)越大表明群體間遺傳分化程度越大。以相同滑動窗口策略計算五指山和巴馬香豬群體的雜合度(Heterozygosity),得到區間雜合度平均值為0.342,方差為0.043,符合正態分布,標準化后得到Z(H)。通過Z(Fst)值可以看出,大、小體型豬種在很多染色體區間存在遺傳分化,最顯著的區間出現在8號染色體上(圖1a,表2)。由于大、小體型豬種間可能存在除體型以外的差異,這些區間不一定都和體型大小相關。通過比較Z(H)較小區間和Z(Fst)較大區間之間的重疊區間來判定這些區間是否和體型大小相關(圖1b)。為選擇出極端候選受選擇區域,使用242個Z(Fst)≥5的區間與Z(H)負值端最小的200個區間的重疊區域,再經合并得到13個候選區間(長度為240~720 kb)。這些候選區間共覆蓋約4.2 Mb基因組區域,包含28個基因(圖1a)。
a.豬18條常染色體上Z(Fst)正值端的分布,虛線為Z(Fst)=5;b.豬18條常染色體Z(H)負值端的分布,虛線為取200個最小Z(H)的閾值a.The positive end of the Z(Fst) plotted on 18 pig autosomes.A dashed horizontal line indicates the cut-off Z(Fst)=5;b.The negative end of the Z(H) plotted on 18 pig autosomes.A dashed horizontal line indicates the cut-off for 200 smallest Z(H)圖1 常染色體上Z(Fst)和Z(H)的分布情況Fig.1 The distribution of Z(Fst) and Z(H) on autosomes
2.2相關性狀QTL 在候選受選擇區域的富集
為驗證所得到的候選受選擇區域和豬的生長、體重、體長等性狀相關,在pig QTLdb數據庫中搜索13個候選受選擇區域所包含的已知QTL(http://www.animalgenome.org)。共發現924個QTLs與候選區間重疊,其中407個(~44%)QTLs與體型大小直接或間接相關。與生長、體型直接相關的QTLs為95個,如與體重、胴體長、胴體重、體長、脊椎數、日增重等相關QTLs(表2)。同時,大多數選擇區域至少對應3個以上和生長相關的QTLs。這些結果說明和體型相關的QTL在候選區域富集,同時說明本研究檢測選擇信號的方法可靠。
表213個選擇區域
Table 213 regions of selection

染色體Chromosome受選擇區間RegionZ(Fst)Z(H)相關數量性狀位點MappedQTL*1151180001~1514200007.040-3.940Bodyweight(20weeks)QTL(5)TeatnumberQTL(3)1153360001~1536200009.624-4.046Bodyweight(20weeks)QTL(5)DailyfeedintakeQTL(1)1256760001~2570600009.745-4.067AveragedailygainQTL(10)BodyweightQTL(4)1274500001~2747400007.415-3.940averagedailygainQTL(12)BodyweightQTL(7)278540001~787800005.298-3.452CarcassweightQTL(4)BodyweightQTL(2)846180001~469000008.442-3.919TeatnumberQTL(2)Bodyweight(birth)QTL(5)854900001~5532000010.247-4.088BodyweightQTL(5)FeetweightQTL(1)856080001~5642000011.768-4.322TeatnumberQTL(3)BodyweightQTL(5)865840001~660800009.667-4.025Bodyweight(birth)QTL(5)CarcasslengthQTL(1)891160001~914800005.325-3.322BodyweightQTL(3)FeetweightQTL(1)8102460001~1027000008.973-3.982Bodyweight(30weeks)QTL(2)HamweightQTL(1)13114200001~1144800007.284-4.004AveragedailygainQTL(4)VertebranumberQTL(1)1586720001~8706000010.779-4.088AveragedailygainQTL(2)Bodyweight(weaning)QTL(1)
* 括號中數字為相應QTL出現的次數
* The number in bracket indicate occurrence of the corresponding QTL
2.3候選基因的GO富集分析和通路分析
利用在線UCSC genome browser工具對候選區域進行基因注釋,共發現了28個基因(圖1a)。為闡明這28個基因的功能,使用PANTHER (Protein ANalysis THrough Evolutionary Relationships)對其進行功能注釋及GO分析。結果表明,17個基因與機體生長發育直接或間接相關(表3)。這17個基因大多參與細胞生長發育的生物學過程或者重要基礎信號通路。比如,IGF1R、MCTS1、OBSCN、NPY5R、SMC2等基因參與細胞生長、增殖、遷移、分化和凋亡[11];DNAJB6、NAF1、ZNF423等基因調節基礎轉錄、翻譯;IGF1R、CXXC4、ZNF423、TRIML1等基因參與調控動物體型大小的重要基礎信號通路。
與動物體型大小相關的信號通路有:胰島素信號通路、Wnt信號通路和Notch信號通路。胰島素信號通路(亦稱生長信號通路),調控個體發育始于胰島素與胰島素受體的結合,并由此引發細胞內一系列信號轉導,最終到達各效應器官發揮作用。IGF1R不僅與細胞生長增殖直接相關,同時在胰島素通路中起著關鍵調節作用,當IGF1R受體因子失活時,會抑制胰島素信號通路功能的發揮,從而影響細胞、器官乃至個體大小。Wnt信號通路在生物進化過程中高度保守,該通路的開啟或關閉控制著大量生長和代謝相關基因的表達[12]。而Notch信號通路是通過相鄰細胞之間的相互作用來調節細胞、組織、器官的分化和發育,相鄰細胞借助Notch受體與配體結合傳遞Notch信號,從而擴大并固化細胞間的分子差異,最終決定細胞命運。Notch信號通路影響器官形成和細胞正常形態,同時在調節細胞生長和維持組織體內平衡的過程中也起著十分關鍵的作用[13]。采用DAVID 軟件對這些候選基因進行KEGG通路分析,結果只富集到了“Long-term depression”信號通路。從文獻上看,該通路和神經突觸的功能相關,并不與生長發育有直接聯系。
表3生長發育相關基因的GO富集分析
Table 3GO term enrichment for genes related to growth and development

染色體Chromosome基因Gene生物學過程Biologicalprocess1MCTS1regulationoftranscription(GO:0006355);cellcycle(GO:0007049);positiveregulationofcellproliferation(GO:0008284);regulationofgrowth(GO:0040008);translation(GO:0006412);translationalinitiation(GO:0006413)1PGPEP1Lproteolysis(GO:0006508)1IGF1Rpositiveregulationofcellproliferation(GO:0008284);insulinreceptorsignalingpathway(GO:0008286);insulinreceptorsignalingpathway(GO:0008286);negativeregulationofap-optoticprocess(GO:0043066);organmorphogenesis(GO:0009887)1SMC2mitoticcellcycle(GO:0000278);cellcycle(GO:0007049)1VPS13AproteinretentioninGolgiapparatus(GO:0045053)2OBSCNpositiveregulationofGTPaseactivity(GO:0043547);multicellularorganismaldevelopment(GO:0007275);positiveregulationofapoptoticprocess(GO:0043065);apoptoticsignalingpathway(GO:0097190);celldifferentiation(GO:0030154)2DNAJB6negativeregulationoftranscription,DNA-templated(GO:0045892)4TRIML1multicellularorganismaldevelopment(GO:0007275);negativeregulationofWntsignalingpathway(GO:0030178)8GUCY1A3cGMPbiosyntheticprocess(GO:0006182);translationalinitiation(GO:0006413)8NPY1RG-proteincoupledreceptorsignalingpathway(GO:0007186);celldifferentiation(GO:0030154)8NAF1rRNAprocessing(GO:0006364);ribosomebiogenesis(GO:0042254)8CXXC4zygoticspecificationofdorsal/ventralaxis(GO:0007352);negativeregulationofapoptoticprocess(GO:0043066);negativeregulationofWntsignalingpathway(GO:0030178)8ZNF423Notchsignalingpathway(GO:0007219);celldifferentiation(GO:0030154);positiveregula-tionofBMPsignalingpathway(GO:0030513);regulationoftranscription,DNA-templated(GO:0006355);multicellularorganismaldevelopment(GO:0007275)8GUCY1B3cGMPbiosyntheticprocess(GO:0006182)8NPY5Rnegativeregulationofapoptoticprocess(GO:0043066);positiveregulationofsmoothmusclecellproliferation(GO:0048661)15METTL8methylation(GO:0032259)15DCAF17nucleolus(GO:0005730);integralcomponentofmembrane(GO:0016021);Cul4-RINGE3ubiquitinligasecomplex(GO:0080008)
綜上推測,控制小型豬發育的基因很可能不局限在一個信號通路里,也可能不是由少量幾個突變造成的,而是由多個參與細胞生長發育及生命基礎代謝的基因突變來協同完成。
2.4候選基因的突變注釋
對所有候選區間SNP和短插入缺失突變進行注釋,共發現139個位于基因編碼區及剪切位點的突變。其中,55個突變可能影響相關候選基因的蛋白質結構,包括50個錯義突變,3個移碼突變,2個剪切位點突變,其余全部為同義突變。3個移碼突變都只出現在一個個體上,不太可能是影響小型豬的突變。兩個剪切突變分別在TDO2和HIGH基因,兩個突變在大小型豬群中都存在,且頻率類似。在50個錯義突變中,有5個突變在大、小型豬中有顯著的頻率差異,即大型豬以參考基因組(杜洛克豬)等位基因純合子為主,小型豬以突變型純合子為主(表4)。它們分別位于ENSSSCG00000027431、VPS13A、OBSCN、ENSSSCG00000027713和DCAF17基因。VPS13A調節蛋白等大分子的合成和運輸,能夠促進蛋白前體的吸收和轉化,從而促進或抑制細胞增殖及其分化[14];OBSCN(Obscurins)編碼骨架蛋白,在橫紋肌中起著結構和調節作用;DCAF17介入CUL4-DDB1泛素酶調控通路,泛素酶通過對一些特定調節子的泛素化來調控細胞的增殖、存活、DNA修復和基因組完整性[15]。而ENSSSCG00000027431和ENSSSCG00000027713兩個基因的功能未知。但這5個錯義突變都處于基因的非保守區,表明其不太可能為導致大、小體型豬差異的突變位點。而IGF1R基因對發育過程中的細胞增殖、細胞遷移和器官形成等方面都起到重要的正向調控作用,同時參與調控動物體型大小的胰島素信號通路,可作為本研究理想的候選基因,本研究在該基因上僅找到一個錯義突變,但該突變等位基因僅在大體型豬群中以低頻存在。鑒于本研究的限制,我們不排除有大的結構突變(CNV、大片段插入缺失等)或者調控序列突變,從而影響這些基因及候選區間內其他基因的表達,進而影響體型發育。
表4候選錯義突變位點
Table 4Candidate missense mutations

染色體Chromosome位置Position參考等位基因Referenceallele突變等位基因Alternativeallele基因Gene小型豬Small-sized*大型豬Large-sized*1153408833CTENSSSCG0000002743126/361/361256877225TGVPS13A33/3611/36278651109TCOBSCN31/363/368102608851ACENSSSCG0000002771333/360/361586982578AGDCAF1736/361/36
*. 突變等位基因在大、小體型豬群中的頻率
*. The alternative allele frequency in small-sized and large-sized pigs
近年來,第二代高通量測序技術在基因組學和遺傳學中廣泛應用,使得利用少量個體基因組測序信息檢測基因組范圍內的選擇信號(Signature of selection)成為可能。大量與馴化、適應性和重要性狀相關的受選擇區段被報道,其中,涉及的研究對象有雞、牛、狗、豬、羊等。本研究借鑒前人的策略,將五指山豬和巴馬香豬合為小型豬組,將金華豬、二花臉豬和河套大耳豬合為大型豬組,在大、小體型豬分組間應用群體分化系數(Fst)初步確定兩個分組間受選擇區域。考慮到單個SNP的選擇信號在經歷正向選擇時,通常會受到種群歷史的隨機因素影響,很難精確區分真實信號和噪音信號,故本研究結合40 kb 滑動窗口(Sliding window)遺傳分化系數Fst和雜合度來確定體型相關的候選區域。
本研究共確定13個選擇區域,包含了大量影響豬體重、胴體重、腿重和脊椎數的QTLs,同時,還包含了一系列影響豬采食量和平均日增重的QTLs[16]。此結果表明,小型豬的形成可能是從遺傳上控制其身體及各個臟器的生長發育,同時導致其采食量的降低。此外,這13個區間共包含28個基因,通過PANTHER進行基因注釋和富集分析,發現其中17個基因與機體的生長發育存在直接或者間接的關聯。其中,IGF1R在哺乳動物的生長發育過程中起著重要作用。N.B.Sutter等鑒別出決定狗體型大小的關鍵基因IGF1[17],而IGF1主要是通過結合胰島素樣生長因子受體IGF1R和IGF2R,介導生長激素的促生長作用,通過自身磷酸化激活PI3K以及MAPK信號通路,調控細胞的增殖、分化和凋亡。此外,有研究表明,IGF1R缺陷小鼠在一定程度上患有侏儒癥,同時會改變軟骨細胞增殖,導致骨延長區生長板過度肥大并凋亡[18],在老鼠中將IGF1R敲除,結果表明IGF1會影響骨細胞介導的骨礦化,而骨礦化則是骨骼形成的關鍵,因此IGF1R可能是影響豬體型大小的關鍵候選基因。此外,候選基因GUCY1A3是蛋白編碼基因,編碼可溶性鳥苷酸環化酶(sGC)α亞基,而sGC是一氧化氮(NO)的主要受體,它啟動NO信號轉導通路,是NO-cGMP通路中的關鍵酶,它參與血管舒縮、抑制血小板凝集及細胞增殖和凋亡,是控制冠心病和動脈粥樣硬化的重要因子,它在金屬離子輔助因子如Mg2+或Mn2+存在下,可轉換5在-三磷酸甘氨酸(三磷酸鳥苷)為3′,5′-磷酸鳥苷(cGMP)和焦磷酸。第二信使cGMP通過刺激蛋白激酶G可改變cGMP-gated離子通道和cGMP調節磷酸二酯酶活性,它的關鍵生理作用是調節細胞增生、細胞肥大、遷移、細胞外基質生產和細胞分化等過程[19]。研究表明,GUCY1A3的敲除會大幅度影響cGMP調節磷酸二酯酶活性,從而影響體內細胞的增殖分化。雖然目前有關GUCY1A3與動物體型大小的研究還不多,但GUCY1A3具有調控細胞增殖和凋亡的功能,使其可以作為影響體型大小較為理想的候選基因。另外,DCAF17介入CUL4-DDB1泛素酶調控通路, 泛素酶通過對一些特定調節子的泛素化來調控細胞的增殖、存活、DNA修復和基因組完整性。DCAFs(DDB1和CUL4相關因子家族)作為DDB1和CUL4蛋白直接的橋梁而介入細胞泛素化過程,從而調控細胞的基礎功能[15],具有調控生長的可能。
本研究在受選擇區域里富集的基因大多在生命體發育、基礎代謝中起著極為關鍵的作用,多個基因還參與到Wnt、Notch等重要信號通路。這些關鍵基因上如果出現較大的蛋白質結構突變,有可能會導致個體死亡,這也從側面解釋了為什么候選基因中出現的突變大多在非保守區。同時也表明,五指山豬和巴馬香豬小體型的形成不太可能是某個發育過程中關鍵基因的結構突變造成,而更可能是由于一個或者多個基因調節突變(比如位于啟動子、增強子區域等)協同產生。類似的,M.Carneiro等研究發現,野兔的馴化過程中,野兔和家兔之間的行為差異主要來源于基因調控區域突變(研究人員并未發現馴化過程中有基因失活或主效基因的突變,馴化帶來的改變主要發生在基因組的非編碼區域)[20]。基因調控區的注釋目前在人和小鼠的研究中依據其相應ENCODE項目產生的數據來實現[21]。當前,國際動物遺傳學界開展的FAANG(Functional Annotation of Animal Genomes)計劃將有類似ENCODE數據產生[22],該計劃將在多個動物物種中系統進行基因表達譜、染色質開放區、調控序列(啟動子、增強子、絕緣子等)、甲基化位點和三維染色質折疊調控的研究。屆時,將有可能通過這些數據對豬的調控突變進行注釋。此外,在本研究中,不能排除存在拷貝數變異或其他染色體結構突變在小型豬發育中起作用。
本研究基于全基因組重測序數據,結合種群遺傳分化指數Fst和小型豬種內雜合度,進行系統選擇信號檢測,共確定了13個選擇區域,包含28個基因。通過PANTHER進行基因注釋和富集分析,發現其中17個基因與機體的生長發育存在直接或者間接的關聯。GO基因富集分析鑒別到多個體型相關的基因,其中包含IGF1R、GUCY1A3等基因。受豬基因組注釋不完善的影響,尤其欠缺調控序列的注釋,本研究沒有揭示造成小型豬形成的分子機制。后續通過完善基因及其調控序列的注釋,將有助于解釋形成小型豬體型的遺傳變異。
致謝:感謝江西農業大學黃路生院士在試驗設計和文章修改上提供指導。
[1]商海濤,魏泓.我國小型豬品系資源狀況初淺分析[J].中國實驗動物學報,2007,15(1):70-75.
SHANG H T,WEI H.Preliminary analysis of Chinese miniature pig strains and resources[J].ActaLaboratoriumAnimalisScientiaSinica,2007,15(1):70-75.(in Chinese)
[2]王峰,魏立民,鄭心力,等.海南五指山豬生長發育性能測定試驗[J].豬業科學,2009,26(5):108-109.
WANG F,WEI L M,ZHENG X L,et al.The analysis of growth development in Wuzhishan pig in Hainan[J].SwineIndustryScience,2009,26(5):108-109.(in Chinese)
[3]朱榮生,王懷中,張印.杜洛克和大約克豬體重和體尺性狀間典型相關分析[J].家畜生態學報,2009,30(2):26-28.
ZHU R S,WANG H Z,ZHANG Y.Canonical correlation analysis of body weight and body measurement traits in duroc and yorkshire[J].ActaEcologiaeAnimalisDomastici,2009,30(2):26-28.(in Chinese)
[4]RUBIN C J,ZODY M C,ERIKSSON J,et al.Whole-genome resequencing reveals loci under selection during chicken domestication[J].Nature,2010,464(7288):587-591.
[5]AXELSSON E,RATNAKUMAR A,ARENDT M L,et al.The genomic signature of dog domestication reveals adaptation to a starch-rich diet[J].Nature,2013,495(7441):360-364.
[6]MOON S,KIM T H,LEE K T,et al.A genome-wide scan for signatures of directional selection in domesticated pigs[J].BMCGenomics,2015,16:130.
[7]劉真,王慧華,劉瑞鑿,等.不同尾型綿羊全基因組選擇信號檢測[J].畜牧獸醫學報,2015,46(10):1721-1732.
LIU Z,WANG H H,LIU R Z,et al.Genome-wide detection of selection signatures of distinct tail types in sheep populations[J].ActaVeterinariaetZootechnicaSinica,2015,46(10):1721-1732.(in Chinese)
[8]AI H S,FANG X,YANG B,et al.Adaptation and possible ancient interspecies introgression in pigs identified by whole-genome sequencing[J].NatGenet,2015,47(3):217-225.
[9]MCKENNA A,HANNA M,BANKS E,et al.The genome analysis toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data[J].GenomeRes,2010,20(9):1297-1303.
[10]COCKERHAM C C,WEIR B S.Covariances of relatives stemming from a population undergoing mixed self and random mating[J].Biometrics,1984,40(1):157-164.
[11]WANG Z,LU P,LIANG Z,et al.Increased insulin-like growth factor 1 receptor (IGF1R) expression in small cell lung cancer and the effect of inhibition of IGF1R expression by RNAi on growth of human small cell lung cancer NCI-H446 cell[J].GrowthFactors,2015,33(5-6):337-346.
[12]XU Y,YANG Z,YUAN H,et al.PCDH10 inhibits cell proliferation of multiple myeloma via the negative regulation of the Wnt/beta-catenin/BCL-9 signaling pathway[J].OncolRep,2015,34(2):747-754.
[13]KIDD S,LIEBER T.Mechanism of notch pathway activation and its role in the regulation of olfactory plasticity in drosophila melanogaster[J].PLoSOne,2016,11(3):e0151279.
[14]HONISH S,YU W,LIU G,et al.Chorein addiction in VPS13A overexpressing rhabdomyosarcoma cells[J].Oncotarget,2015,6(12):10309-10319.
[15]LEE J,ZHOU P.DCAFs,the missing link of the CUL4-DDB1 ubiquitin ligase[J].MolCell,2007,26(6):775-780.
[16]DOUMAYROU J,THEBAUD G,VUILLAUME F,et al.Mapping genetic determinants of viral traits with FST and quantitative trait locus (QTL) approaches[J].Virology,2015,484:346-353.
[17]SUTTER N B,BUSTAMANTE C D,CHASE K,et al.A single IGF1 allele is a major determinant of small size in dogs[J].Science,2007,316(5821):112-115.
[18]LEE Y,WANG Y,JAMES M,et al.Inhibition of IGF1R signaling abrogates resistance to afatinib (BIBW2992) in EGFR T790M mutant lung cancer cells[J].MolCarcinog,2016,55(5):991-1001.
[19]SAINO M,MARUYAMA T,SEKIYA T.Inhibition of angiogenesis in human glioma cell lines by antisense RNA from the soluble guanylate cyclase genes GUCY1A3 and GUCY1B3[J].OncolRep,2004,12(1):47-52.
[20]CARNEIRO M,RUBIN C J,DI PALMA F,et al.Rabbit genome analysis reveals a polygenic basis for phenotypic change during domestication[J].Science,2014,345(6200):1074-1079.
[21]CONSORTIUM E P.An integrated encyclopedia of DNA elements in the human genome[J].Nature,2012,489(7414):57-74.
[22]ANDERSSON L,ARCHIBALD A L,BOTTEMA C D,et al.Coordinated international action to accelerate genome-to-phenome with FAANG,the functional annotation of animal genomes project[J].GenomeBiol,2015,16:57.
(編輯郭云雁)
Identifying Signatures of Selection Related to Small Body Size in Pigs
LI Wan-bo*#,ZHU Ya-ling#,AI Hua-shui,GUO Tian-fu*
(StateKeyLaboratoryforPigGeneticImprovementandProductionTechnology,JiangxiAgriculturalUniversity,Nanchang330045,China)
In this study,we analyzed genetic differentiation between small- and large-sized Chinese indigenous pigs,aiming to detect signatures of selection and to identify candidate genes and mutations related to small body size.Fixation index (Fst) and heterozygosity were calculated based on whole-genome resequencing data from miniature pigs (Wuzhishan and Bamaxiang) and large-sized pigs (Jinhua,Erhualian and Hetao).The regions with largerFstvalues and lower heterozygosity were regarded as candidate regions of selection.Through further annotation on gene function,pathway and mutations of the genes located in the candidate regions,we sought to screen genes and mutations related to body size.In total,32 475 218 SNPs were obtained after stringent filtering from whole-genome resequencing data.Fstand heterozygosity were calculated using 40 kb sliding window strategy.And 242 putative selection regions were kept by applying a Z-transformedFst(Z(Fst))>5.There are 13 regions overlapped between these 242 regions and the 200 regions with lowest Z-transformed heterozygosity (Z(H)),encompassing 28 genes.Seventeen out of the 28 genes are found to be associated with growth or body size through PANTHER annotation.Among these genes,IGF1RandGUCY1A3 were the most promising candidate genes.Together,by applying population genetic methods,we can detect regions of signature of selection related to body size in pigs.And after comprehensive analysis in gene function and mutations,we proposed that mutation(s) associated with small-sized phenotype in Wuzhishan and Bamaxiang pigs might be located in the non-coding regions detected.
miniature pigs;whole-genome resequencing;signatures of selection;body size;candidate genes
10.11843/j.issn.0366-6964.2016.10.005
2016-01-11
國家自然科學基金(31402058);江西省自然科學基金(2010GQN0045)
李完波(1982-),男,湖南岳陽人,助理研究員,博士生,主要從事生物信息學研究,Tel:0791-83813080,E-mail:li.wanbo.jxau@gmail.com;朱亞玲(1993-),女,江西上饒人,碩士生,主要從事動物遺傳育種研究,Tel:0791-83813080,E-mail:yaling_zhu @qq.com。二者并列為第一作者
李完波,E-mail:li.wanbo.jxau@gmail.com;郭添福,E-mail:guotianfu2001@163.com
S828.2
A
0366-6964(2016)10-1977-09