999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

參考群篩選方法及規模對基因型填充準確性的影響

2021-12-31 01:08:46陽文攀葉紹潘葉浩強張志剛張細權陳贊謀
畜牧獸醫學報 2021年12期
關鍵詞:一致性方法

陽文攀,葉紹潘,葉浩強,林 清,魏 趁,張志剛,張細權,陳贊謀,張 哲*

(1.華南農業大學動物科學學院 國家生豬種業工程技術研究中心,廣州 510642;2.福建傲農生物科技集團股份有限公司,漳州 363000;3.廈門銀祥集團有限公司 肉食品安全生產技術國家重點實驗室,廈門 361100;4.汕頭大學理學院,廣東省海洋生物技術重點實驗室,汕頭 515063)

在畜禽選育中,育種值估計準確性是影響畜禽遺傳進展的重要因素之一。基因組選擇(genomic selection,GS)能有效提高育種值估計準確性,已在奶牛育種中取得了較大效益[1],并逐漸推廣到豬[2]、雞[3]、魚[4]等畜禽及水產品種選育中。在實施基因組選擇時,參考群規模和標記密度是影響基因組選擇準確性的重要因素[5-6]。由于基因分型成本較高,常通過構建具有高密度SNP芯片數據或全基因組序列數據的參考群體,根據不同方法對低密度SNP芯片進行基因型填充,以獲得高質量的基因型數據[7-9]。目前,該技術已廣泛應用于奶牛[10]、豬[11]、雞[12]等畜禽育種中。

通過基因型填充獲取高質量高密度的基因型數據是提高基因組選擇準確性的有效方式之一[13]。然而,基因型填充的準確性受諸多因素影響,如基因型填充軟件[14]、參考群規模[15]、參考群體和目標群體之間的關系[16]等。其中,參考群篩選和構建方式尤為重要,參考群規模越大,基因型填充準確性越高,然而基因分型成本也隨之增加[17]。研究表明,當參考群體與目標群體間的親緣關系較近時,兩者之間的單倍型長度和數量都會增加,使填充更準確[18-19]。因此,如何篩選關鍵個體構建參考群至關重要,能夠保證基因型填充準確性從而降低成本。

本研究擬使用矮小黃羽肉雞資源群體作為研究對象,采用不同方法篩選關鍵個體構建參考群,將低密度標記的驗證群填充至高密度標記,通過比較不同參考群篩選方法的基因型填充準確性及其在基因組預測中的應用效果,探究構建參考群最佳的策略,為基因型填充技術在遺傳育種中的應用提供參考。

1 材料與方法

1.1 試驗群體

本研究所用群體來自廣東溫氏南方家禽育種有限公司提供的矮小型黃羽肉雞N301系第25世代03批次,共1 600羽個體,公母各半,全部由30只公雞和360只母雞產生。結合系譜信息和性狀記錄的完整性,選取15羽親本公雞及435羽子代公雞送往上海伯豪生物技術有限公司(Shanghai Biotechnology Corporation)進行基因分型,基因分型采用雞600K SNP芯片(Affymetrix Axion HD genotyping array),最終共檢測到559 898個SNPs位點。同時測定435羽子代公雞45、56、70、84、91日齡體重。

1.2 低密度芯片數據模擬

為保證SNP芯片的質量及基因型填充,本研究使用Plink v1.90[20]去除未定位到參考基因組染色體上的SNP位點后剩余552 335個SNPs,使用Beagle4.0(r1399)[21]對缺失位點進行填充;使用Plink對填充后的數據進行質量控制,剔除小等位基因頻率小于0.005的SNP位點,剩余464 119個SNPs。60K芯片數據生成采用隨機提取和相等排序間隔提取兩種方式,共進行5次重復。隨機提取方式是使用R v4.0.1[22]軟件設立3組隨機數種子,從464 119個SNPs中隨機選取46 412個SNPs生成,共3次重復。相等排序間隔提取方式是從根據染色體與物理位置排序后的600K芯片中每隔10個SNPs取1個SNP,從第2、7個SNP開始,共2次重復。

1.3 關鍵群體篩選方法

為探究不同參考群篩選方法對基因型填充準確性的影響,本研究主要涉及表1中的5種參考群篩選方法。

表1 不同參考群篩選方法Table 1 The different methods for choosing reference population

1.4 基因型填充準確性影響因素比較

為探究不同版本Beagle軟件及系譜使用對基因型填充準確性的影響,本研究根據MCA、RELA、KIN、RAN方法篩選前50個關鍵群體作為參考群,分別使用Beagle4.0+系譜信息、Beagle4.0、Beagle5.1(18May20.d20)[21,23]將60K SNP芯片數據填充至600K SNP芯片數據,比較不同版本Beagle軟件及系譜使用基因型填充等位基因一致性比率。

為探究不同參考群篩選方法對基因型填充準確性的影響,本研究分別根據RELA、MCA、KIN、RAN方法篩選的前15個關鍵個體和15個共同祖先作為參考群,使用Beagle4.0與系譜信息對目標群體進行填充,軟件使用默認參數,將60K SNP芯片數據填充至600K SNP芯片數據,比較不同篩選關鍵群體方法進行基因型填充等位基因一致性比率。

為探究參考群規模對基因型填充準確性的影響,本研究分別根據MCA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數據填充至600K SNP芯片數據,比較使用不同規模參考群進行基因型填充等位基因一致性比率。

為探究填充芯片對基因組預測準確性的影響,本研究分別根據MCA、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數據填充至600K SNP芯片數據,比較填充芯片數據與真實芯片數據基因組預測準確性與基因組預測無偏性。

1.5 基因型填充準確性的評估

本研究使用兩種驗證標準來衡量基因型填充準確性。一種是等位基因一致性比率,另一種是基因組預測準確性和無偏性。

1.5.1 等位基因一致性比率 等位基因一致性比率為正確填充基因型所占百分比,其具體操作為:將60K SNP芯片填充至600K SNP芯片數據后,使用R軟件比較每個個體填充基因型與真實基因型間的正確率,并將其平均值作為基因型填充準確性的評判依據。

1.5.2 基因組預測準確性和無偏性 為比較填充芯片數據與真實芯片數據在基因組預測中的應用效果,本研究采用基因組最佳線性無偏預測(genomic best linear unbiased prediction,GBLUP)進行預測,具體公式如下:

yi=u+ai+ei,

基因組預測準確性與無偏性為基因組估計育種值(GEBV)和校正表型間的相關系數與回歸系數。其具體操作為:使用R軟件中的lm函數對子代435羽個體45、56、70、84、91日齡體重等原始表型值進行年-季節固定效應校正,將殘差作為校正后的表型值用于交叉驗證。使用R軟件中的 rrBLUP包[24]計算群體基因組估計育種值,通過5*10的交叉驗證計算填充芯片數據與真實芯片數據基因組預測準確性與無偏性。

2 結 果

2.1 Beagle版本與系譜信息對基因型填充準確性的影響

根據MCA、RELA、KIN、RAN方法篩選前50個關鍵個體作為參考群,使用不同版本Beagle與系譜信息進行基因型填充準確性估計,如圖1所示。從圖1可知,使用Beagle5.1進行基因型填充的等位基因一致性比率最低,為0.594~0.595。使用Beagle4.0進行基因型填充,未使用系譜信息時,MCA、RELA、KIN等方法進行基因型填充的等位基因一致性比率為0.961、0.963、0.947;使用系譜信息時,MCA、RELA、KIN等方法進行基因型填充的等位基因一致性比率為0.970、0.971、0.953。提供系譜信息可以提高MCA、RELA、KIN等方法的等位基因一致性比率,但會導致RAN方法等位基因一致性比率降低,使其從0.956降低至0.939。

圖1 不同Beagle版本和系譜信息使用與否的基因型填充準確性Fig.1 Genotype imputation accuracy by different Beagle versions and pedigree information

2.2 不同篩選關鍵群體策略對基因型填充準確性的影響

表2展示了不同參考群篩選方法篩選的關鍵個體交叉數量。可以看出,使用CA、MCA、RELA、KIN等方法篩選的參考群至少有10個共同個體,而RAN方法篩選出的15個關鍵個體與其它方法篩選出的關鍵個體無共同個體。

表2 不同參考群篩選方法所篩選關鍵個體交叉表Table 2 Individual crosstab selected by different reference population selection methods

根據RELA、MCA、KIN、RAN方法篩選的前15關鍵個體和15個共同祖先作為參考群,使用Beagle4.0與系譜信息對目標群體進行基因型填充,不同參考群篩選方法基因型填充準確性如圖2所示。由圖2可知,MCA方法篩選參考群進行基因型填充的等位基因一致性比率最高為0.757,其次是CA、RELA方法為0.755、0.751。此外,MCA、RELA、CA 3種方法的等位基因一致性比率差別較小,RAN方法等位基因一致性比率最低為0.595。

圖2 不同參考群篩選方法的基因型填充準確性Fig.2 Genotype imputation accuracy of different reference population choosing methods

2.3 參考群規模對基因型填充準確性的影響

根據MCA、RELA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息對目標群體進行填充,不同參考群規模對基因型填充準確性的影響如圖3所示。由圖3可以看出,MCA、RELA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,基因型填充的等位基因一致性比率為0.595~0.757、0.773~0.897、0.939~0.971。隨著參考群規模增加,等位基因一致性比率也隨之增加。但隨著參考群規模增大(從15增加至25再增加至50),等位基因一致性比率的提升幅度下降,從0.150降低至0.100。當參考群規模較小時,MCA與RELA方法篩選參考群的等位基因一致性比率保持明顯優勢,但是隨著參考群規模的增加,MCA與RELA方法篩選參考群的等位基因一致性比率優勢降低。

圖3 不同參考群規模的基因型填充準確性Fig.3 Genotype imputation accuracy of different reference population sizes

2.4 填充芯片對基因組預測準確性的影響

根據MCA、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息進行基因填充,不同填充芯片與真實芯片數據基因組預測準確性如表3、表4所示。可以看出,真實芯片預測無偏性一般表現為最佳。隨著參考群規模增加,填充基因組預測準確性與無偏性同真實芯片基因組預測準確性與無偏性相比差別越小。相對于RAN方法,使用MCA方法篩選關鍵個體進行基因型填充的基因組預測準確性與真實芯片數據的預測結果更為接近。

表3 基因型填充的基因組預測準確性Table 3 Genome prediction accuracy of genotype imputation

表4 基因型填充的基因組預測無偏性Table 4 Genome prediction unbiased of genotype imputation

3 討 論

本研究使用Beagle4.0、Beagle4.0+系譜信息、Beagle5.1等軟件進行基因型填充,其中Beagle4.0+系譜信息填充效果最佳,其次為Beagle4.0,而Beagle5.1填充效果最差。Pook等[25]對比了Beagle4.0、Beagle5.1未使用系譜信息時雙單倍型玉米基因型填充效果,結果發現Beagle5.1填充錯誤率最低,這與本研究結果存在較大差異,可能是由于其試驗群體基因型都為純合位點且群體較大,而本研究選取的群體是由15羽親本公雞與435羽子代群體構成,雜合位點較高且群體較小。Whalen和Hickey[26]使用Beagle4.1、Beagle5.1在18 349個個體的模擬豬家系中使用350、10 000、33 000、46 000個標記進行填充,Beagle4.1填充準確性為0.995、0.944、0.969、0.327,Beagle5.1填充準確性為0.626、0.909、0.939、0.219,當標記數目為46 000時,與本研究結果類似。這可能與Beagle5.1采用綜合單倍型有關,在輸入目標單倍型時,僅使用參考單倍型的子集[27-28]。本研究僅使用Beagle軟件進行測試,根據不同使用需求可以選擇不同軟件進行基因型填充[29],如FImpute[17]、Impute5[14]等。

本研究結果表明,參考群規模一定時,不同參考群篩選方法基因型填充準確性不同。使用CA、MCA、RELA法篩選參考群進行基因型填充的準確性較好,使用RAN法篩選參考群進行基因型填充的準確性較差。Druet等[19]發現,RELA方法填充效果優于RAN法,特別是在MAF較低的位點,這與本研究結果類似。Yu等[18]發現,MCA方法填充效果優于RELA、KIN、RAN方法。當使用Beagle4.0+系譜信息進行基因型填充時,對篩選構建的參考群填充效果更佳。這是因為通過參考群篩選方法篩選關鍵個體可最大限度的代表群體的遺傳變異,同時使參考群體與低密度基因型目標群體有更強的親緣關系[15,18,30]。所以使用共同祖先與親本信息進行基因型填充,也可獲取高質量的填充基因型數據[31]。本研究僅采用系譜親緣關系矩陣進行參考群篩選,在擁有稀疏基因型信息的情況下,可以考慮使用基因型親緣關系矩陣進行關鍵個體篩選[32]。同時,當僅存在部分個體有低密度基因型的情況下,可以使用一步法建立H矩陣[33-34],進行關鍵個體篩選。

隨著參考群規模增大,基因型填充準確性增高。但隨著關鍵個體參考群的增大(從15增加至25再增加至50),基因型填充準確性的提升幅度下降。Wang等[35]使用3K、50K芯片對2 246頭安格斯牛進行基因型填充,參考群體比例分別為總群體的1%、10%、20%、50%,填充準確性分別為64%、71%、75%、75%。Ghoreishifar等[36]使用水牛群體在保持目標群體數目不變的情況下增加參考群規模,填充準確性在參考群從小到中等規模變化時提升較快,從中等到大規模時提升較慢。這與本研究結果相似,隨著參考群規模增加,單倍型推斷及匹配更加準確,基因型填充準確性也隨之增加,這可能是因為較多的參考群個體能夠提供更多的單倍型。但是隨著參考群規模的進一步擴大提升幅度會逐漸降低[30,37],因此,在保證基因型填充準確性足夠分析的情況下,可以適當控制參考群規模,以降低檢測成本。

不同填充芯片與真實芯片數據基因組預測準確性相比,基因型填充一致性比率越大越接近真實芯片預測結果,真實芯片預測無偏性一般表現最佳。然而當參考群規模較小時,其基因型填充一致性比率較低,而預測準確性卻表現較佳。這可能是因為使用了系譜信息進行填充,導致填充后的結果與系譜預期更符合,從而導致預測準確性更高。

小等位基因頻率[38]、目標群體與參考群體芯片密度[38]、填充軟件、參考群組成、參考群體大小等因素都會影響基因型填充準確性,然而在實際生產中對于小等位基因頻率難以進行控制,目標群體與參考群體也基本使用定制芯片。本研究通過探究參考群篩選方法及規模對基因型填充準確性的影響,發現使用Beagle4.0+系譜信息有更好的填充效果。使用MCA法篩選參考群進行基因型填充準確性最高,但當系譜關系清晰時使用共同祖先與親本信息進行基因型填充也可以獲取高質量的高密度芯片。參考群規模增加,基因型填充準確性也隨之增加,但過多的增加參考群所帶來的的收益較低。將公共動植物基因型填充數據庫中的個體添加到參考群體中,以此增加參考群數目也可以有效增加基因型填充準確性[39-40]。

4 結 論

綜上所述,可以通過參考群篩選方法構建參考群以及控制參考群規模,以保證基因型填充和基因組預測準確性并節省成本,本研究可為基因型填充在畜禽遺傳育種中的應用提供技術參考。

猜你喜歡
一致性方法
關注減污降碳協同的一致性和整體性
公民與法治(2022年5期)2022-07-29 00:47:28
注重教、學、評一致性 提高一輪復習效率
對歷史課堂教、學、評一體化(一致性)的幾點探討
IOl-master 700和Pentacam測量Kappa角一致性分析
學習方法
ONVIF的全新主張:一致性及最訪問控制的Profile A
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
基于事件觸發的多智能體輸入飽和一致性控制
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 亚洲免费黄色网| 成人在线天堂| 五月婷婷丁香色| 亚洲成a人片在线观看88| 91精品人妻一区二区| 久久国产乱子| 免费在线国产一区二区三区精品| 亚洲乱码视频| 精品超清无码视频在线观看| 欧美日一级片| 亚洲天堂久久久| 成年免费在线观看| 少妇人妻无码首页| 久久久久88色偷偷| 午夜福利视频一区| 91精品专区| 好吊妞欧美视频免费| 国产福利影院在线观看| 亚洲水蜜桃久久综合网站| 国产精品免费入口视频| 亚洲人成日本在线观看| 日本一区二区三区精品国产| 国产日韩久久久久无码精品| AV在线天堂进入| 九色国产在线| 99人妻碰碰碰久久久久禁片| 成人精品免费视频| 久久夜色精品国产嚕嚕亚洲av| 无码一区18禁| 亚洲高清中文字幕在线看不卡| 国产美女精品人人做人人爽| 波多野结衣一二三| 在线观看无码a∨| 日韩欧美中文字幕在线精品| 亚洲高清国产拍精品26u| 亚洲第一黄色网址| 91无码视频在线观看| 精品伊人久久大香线蕉网站| 色婷婷狠狠干| 日韩无码视频专区| 男女精品视频| 91九色最新地址| 精品视频一区二区三区在线播| 国产黄色爱视频| 凹凸精品免费精品视频| 成人综合在线观看| 亚洲中文字幕av无码区| 第九色区aⅴ天堂久久香| 国产十八禁在线观看免费| 亚洲综合18p| 国产成人精品无码一区二 | 欧美成人午夜影院| 久久亚洲天堂| 国产乱子伦手机在线| 精品一区国产精品| 国产在线精彩视频二区| 欧美性猛交一区二区三区| 国产99视频精品免费观看9e| 亚洲中文字幕手机在线第一页| 国产另类视频| 欧美日韩亚洲综合在线观看| 看你懂的巨臀中文字幕一区二区| 亚洲女人在线| 国产三级国产精品国产普男人| 免费一级无码在线网站| 狠狠亚洲五月天| 久久人与动人物A级毛片| 国产在线视频导航| 久久99精品国产麻豆宅宅| 午夜视频在线观看免费网站| 国产精品网址在线观看你懂的| 91久久国产综合精品女同我| 中文字幕无码制服中字| 最新亚洲av女人的天堂| 2021国产精品自拍| 青青草a国产免费观看| 免费人成视频在线观看网站| 亚洲综合二区| 亚洲日产2021三区在线| 日韩免费视频播播| 中文无码精品A∨在线观看不卡| 99热这里只有免费国产精品 |