999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

參考群篩選方法及規模對基因型填充準確性的影響

2021-12-31 01:08:46陽文攀葉紹潘葉浩強張志剛張細權陳贊謀
畜牧獸醫學報 2021年12期
關鍵詞:一致性方法

陽文攀,葉紹潘,葉浩強,林 清,魏 趁,張志剛,張細權,陳贊謀,張 哲*

(1.華南農業大學動物科學學院 國家生豬種業工程技術研究中心,廣州 510642;2.福建傲農生物科技集團股份有限公司,漳州 363000;3.廈門銀祥集團有限公司 肉食品安全生產技術國家重點實驗室,廈門 361100;4.汕頭大學理學院,廣東省海洋生物技術重點實驗室,汕頭 515063)

在畜禽選育中,育種值估計準確性是影響畜禽遺傳進展的重要因素之一。基因組選擇(genomic selection,GS)能有效提高育種值估計準確性,已在奶牛育種中取得了較大效益[1],并逐漸推廣到豬[2]、雞[3]、魚[4]等畜禽及水產品種選育中。在實施基因組選擇時,參考群規模和標記密度是影響基因組選擇準確性的重要因素[5-6]。由于基因分型成本較高,常通過構建具有高密度SNP芯片數據或全基因組序列數據的參考群體,根據不同方法對低密度SNP芯片進行基因型填充,以獲得高質量的基因型數據[7-9]。目前,該技術已廣泛應用于奶牛[10]、豬[11]、雞[12]等畜禽育種中。

通過基因型填充獲取高質量高密度的基因型數據是提高基因組選擇準確性的有效方式之一[13]。然而,基因型填充的準確性受諸多因素影響,如基因型填充軟件[14]、參考群規模[15]、參考群體和目標群體之間的關系[16]等。其中,參考群篩選和構建方式尤為重要,參考群規模越大,基因型填充準確性越高,然而基因分型成本也隨之增加[17]。研究表明,當參考群體與目標群體間的親緣關系較近時,兩者之間的單倍型長度和數量都會增加,使填充更準確[18-19]。因此,如何篩選關鍵個體構建參考群至關重要,能夠保證基因型填充準確性從而降低成本。

本研究擬使用矮小黃羽肉雞資源群體作為研究對象,采用不同方法篩選關鍵個體構建參考群,將低密度標記的驗證群填充至高密度標記,通過比較不同參考群篩選方法的基因型填充準確性及其在基因組預測中的應用效果,探究構建參考群最佳的策略,為基因型填充技術在遺傳育種中的應用提供參考。

1 材料與方法

1.1 試驗群體

本研究所用群體來自廣東溫氏南方家禽育種有限公司提供的矮小型黃羽肉雞N301系第25世代03批次,共1 600羽個體,公母各半,全部由30只公雞和360只母雞產生。結合系譜信息和性狀記錄的完整性,選取15羽親本公雞及435羽子代公雞送往上海伯豪生物技術有限公司(Shanghai Biotechnology Corporation)進行基因分型,基因分型采用雞600K SNP芯片(Affymetrix Axion HD genotyping array),最終共檢測到559 898個SNPs位點。同時測定435羽子代公雞45、56、70、84、91日齡體重。

1.2 低密度芯片數據模擬

為保證SNP芯片的質量及基因型填充,本研究使用Plink v1.90[20]去除未定位到參考基因組染色體上的SNP位點后剩余552 335個SNPs,使用Beagle4.0(r1399)[21]對缺失位點進行填充;使用Plink對填充后的數據進行質量控制,剔除小等位基因頻率小于0.005的SNP位點,剩余464 119個SNPs。60K芯片數據生成采用隨機提取和相等排序間隔提取兩種方式,共進行5次重復。隨機提取方式是使用R v4.0.1[22]軟件設立3組隨機數種子,從464 119個SNPs中隨機選取46 412個SNPs生成,共3次重復。相等排序間隔提取方式是從根據染色體與物理位置排序后的600K芯片中每隔10個SNPs取1個SNP,從第2、7個SNP開始,共2次重復。

1.3 關鍵群體篩選方法

為探究不同參考群篩選方法對基因型填充準確性的影響,本研究主要涉及表1中的5種參考群篩選方法。

表1 不同參考群篩選方法Table 1 The different methods for choosing reference population

1.4 基因型填充準確性影響因素比較

為探究不同版本Beagle軟件及系譜使用對基因型填充準確性的影響,本研究根據MCA、RELA、KIN、RAN方法篩選前50個關鍵群體作為參考群,分別使用Beagle4.0+系譜信息、Beagle4.0、Beagle5.1(18May20.d20)[21,23]將60K SNP芯片數據填充至600K SNP芯片數據,比較不同版本Beagle軟件及系譜使用基因型填充等位基因一致性比率。

為探究不同參考群篩選方法對基因型填充準確性的影響,本研究分別根據RELA、MCA、KIN、RAN方法篩選的前15個關鍵個體和15個共同祖先作為參考群,使用Beagle4.0與系譜信息對目標群體進行填充,軟件使用默認參數,將60K SNP芯片數據填充至600K SNP芯片數據,比較不同篩選關鍵群體方法進行基因型填充等位基因一致性比率。

為探究參考群規模對基因型填充準確性的影響,本研究分別根據MCA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數據填充至600K SNP芯片數據,比較使用不同規模參考群進行基因型填充等位基因一致性比率。

為探究填充芯片對基因組預測準確性的影響,本研究分別根據MCA、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數據填充至600K SNP芯片數據,比較填充芯片數據與真實芯片數據基因組預測準確性與基因組預測無偏性。

1.5 基因型填充準確性的評估

本研究使用兩種驗證標準來衡量基因型填充準確性。一種是等位基因一致性比率,另一種是基因組預測準確性和無偏性。

1.5.1 等位基因一致性比率 等位基因一致性比率為正確填充基因型所占百分比,其具體操作為:將60K SNP芯片填充至600K SNP芯片數據后,使用R軟件比較每個個體填充基因型與真實基因型間的正確率,并將其平均值作為基因型填充準確性的評判依據。

1.5.2 基因組預測準確性和無偏性 為比較填充芯片數據與真實芯片數據在基因組預測中的應用效果,本研究采用基因組最佳線性無偏預測(genomic best linear unbiased prediction,GBLUP)進行預測,具體公式如下:

yi=u+ai+ei,

基因組預測準確性與無偏性為基因組估計育種值(GEBV)和校正表型間的相關系數與回歸系數。其具體操作為:使用R軟件中的lm函數對子代435羽個體45、56、70、84、91日齡體重等原始表型值進行年-季節固定效應校正,將殘差作為校正后的表型值用于交叉驗證。使用R軟件中的 rrBLUP包[24]計算群體基因組估計育種值,通過5*10的交叉驗證計算填充芯片數據與真實芯片數據基因組預測準確性與無偏性。

2 結 果

2.1 Beagle版本與系譜信息對基因型填充準確性的影響

根據MCA、RELA、KIN、RAN方法篩選前50個關鍵個體作為參考群,使用不同版本Beagle與系譜信息進行基因型填充準確性估計,如圖1所示。從圖1可知,使用Beagle5.1進行基因型填充的等位基因一致性比率最低,為0.594~0.595。使用Beagle4.0進行基因型填充,未使用系譜信息時,MCA、RELA、KIN等方法進行基因型填充的等位基因一致性比率為0.961、0.963、0.947;使用系譜信息時,MCA、RELA、KIN等方法進行基因型填充的等位基因一致性比率為0.970、0.971、0.953。提供系譜信息可以提高MCA、RELA、KIN等方法的等位基因一致性比率,但會導致RAN方法等位基因一致性比率降低,使其從0.956降低至0.939。

圖1 不同Beagle版本和系譜信息使用與否的基因型填充準確性Fig.1 Genotype imputation accuracy by different Beagle versions and pedigree information

2.2 不同篩選關鍵群體策略對基因型填充準確性的影響

表2展示了不同參考群篩選方法篩選的關鍵個體交叉數量。可以看出,使用CA、MCA、RELA、KIN等方法篩選的參考群至少有10個共同個體,而RAN方法篩選出的15個關鍵個體與其它方法篩選出的關鍵個體無共同個體。

表2 不同參考群篩選方法所篩選關鍵個體交叉表Table 2 Individual crosstab selected by different reference population selection methods

根據RELA、MCA、KIN、RAN方法篩選的前15關鍵個體和15個共同祖先作為參考群,使用Beagle4.0與系譜信息對目標群體進行基因型填充,不同參考群篩選方法基因型填充準確性如圖2所示。由圖2可知,MCA方法篩選參考群進行基因型填充的等位基因一致性比率最高為0.757,其次是CA、RELA方法為0.755、0.751。此外,MCA、RELA、CA 3種方法的等位基因一致性比率差別較小,RAN方法等位基因一致性比率最低為0.595。

圖2 不同參考群篩選方法的基因型填充準確性Fig.2 Genotype imputation accuracy of different reference population choosing methods

2.3 參考群規模對基因型填充準確性的影響

根據MCA、RELA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息對目標群體進行填充,不同參考群規模對基因型填充準確性的影響如圖3所示。由圖3可以看出,MCA、RELA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,基因型填充的等位基因一致性比率為0.595~0.757、0.773~0.897、0.939~0.971。隨著參考群規模增加,等位基因一致性比率也隨之增加。但隨著參考群規模增大(從15增加至25再增加至50),等位基因一致性比率的提升幅度下降,從0.150降低至0.100。當參考群規模較小時,MCA與RELA方法篩選參考群的等位基因一致性比率保持明顯優勢,但是隨著參考群規模的增加,MCA與RELA方法篩選參考群的等位基因一致性比率優勢降低。

圖3 不同參考群規模的基因型填充準確性Fig.3 Genotype imputation accuracy of different reference population sizes

2.4 填充芯片對基因組預測準確性的影響

根據MCA、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息進行基因填充,不同填充芯片與真實芯片數據基因組預測準確性如表3、表4所示。可以看出,真實芯片預測無偏性一般表現為最佳。隨著參考群規模增加,填充基因組預測準確性與無偏性同真實芯片基因組預測準確性與無偏性相比差別越小。相對于RAN方法,使用MCA方法篩選關鍵個體進行基因型填充的基因組預測準確性與真實芯片數據的預測結果更為接近。

表3 基因型填充的基因組預測準確性Table 3 Genome prediction accuracy of genotype imputation

表4 基因型填充的基因組預測無偏性Table 4 Genome prediction unbiased of genotype imputation

3 討 論

本研究使用Beagle4.0、Beagle4.0+系譜信息、Beagle5.1等軟件進行基因型填充,其中Beagle4.0+系譜信息填充效果最佳,其次為Beagle4.0,而Beagle5.1填充效果最差。Pook等[25]對比了Beagle4.0、Beagle5.1未使用系譜信息時雙單倍型玉米基因型填充效果,結果發現Beagle5.1填充錯誤率最低,這與本研究結果存在較大差異,可能是由于其試驗群體基因型都為純合位點且群體較大,而本研究選取的群體是由15羽親本公雞與435羽子代群體構成,雜合位點較高且群體較小。Whalen和Hickey[26]使用Beagle4.1、Beagle5.1在18 349個個體的模擬豬家系中使用350、10 000、33 000、46 000個標記進行填充,Beagle4.1填充準確性為0.995、0.944、0.969、0.327,Beagle5.1填充準確性為0.626、0.909、0.939、0.219,當標記數目為46 000時,與本研究結果類似。這可能與Beagle5.1采用綜合單倍型有關,在輸入目標單倍型時,僅使用參考單倍型的子集[27-28]。本研究僅使用Beagle軟件進行測試,根據不同使用需求可以選擇不同軟件進行基因型填充[29],如FImpute[17]、Impute5[14]等。

本研究結果表明,參考群規模一定時,不同參考群篩選方法基因型填充準確性不同。使用CA、MCA、RELA法篩選參考群進行基因型填充的準確性較好,使用RAN法篩選參考群進行基因型填充的準確性較差。Druet等[19]發現,RELA方法填充效果優于RAN法,特別是在MAF較低的位點,這與本研究結果類似。Yu等[18]發現,MCA方法填充效果優于RELA、KIN、RAN方法。當使用Beagle4.0+系譜信息進行基因型填充時,對篩選構建的參考群填充效果更佳。這是因為通過參考群篩選方法篩選關鍵個體可最大限度的代表群體的遺傳變異,同時使參考群體與低密度基因型目標群體有更強的親緣關系[15,18,30]。所以使用共同祖先與親本信息進行基因型填充,也可獲取高質量的填充基因型數據[31]。本研究僅采用系譜親緣關系矩陣進行參考群篩選,在擁有稀疏基因型信息的情況下,可以考慮使用基因型親緣關系矩陣進行關鍵個體篩選[32]。同時,當僅存在部分個體有低密度基因型的情況下,可以使用一步法建立H矩陣[33-34],進行關鍵個體篩選。

隨著參考群規模增大,基因型填充準確性增高。但隨著關鍵個體參考群的增大(從15增加至25再增加至50),基因型填充準確性的提升幅度下降。Wang等[35]使用3K、50K芯片對2 246頭安格斯牛進行基因型填充,參考群體比例分別為總群體的1%、10%、20%、50%,填充準確性分別為64%、71%、75%、75%。Ghoreishifar等[36]使用水牛群體在保持目標群體數目不變的情況下增加參考群規模,填充準確性在參考群從小到中等規模變化時提升較快,從中等到大規模時提升較慢。這與本研究結果相似,隨著參考群規模增加,單倍型推斷及匹配更加準確,基因型填充準確性也隨之增加,這可能是因為較多的參考群個體能夠提供更多的單倍型。但是隨著參考群規模的進一步擴大提升幅度會逐漸降低[30,37],因此,在保證基因型填充準確性足夠分析的情況下,可以適當控制參考群規模,以降低檢測成本。

不同填充芯片與真實芯片數據基因組預測準確性相比,基因型填充一致性比率越大越接近真實芯片預測結果,真實芯片預測無偏性一般表現最佳。然而當參考群規模較小時,其基因型填充一致性比率較低,而預測準確性卻表現較佳。這可能是因為使用了系譜信息進行填充,導致填充后的結果與系譜預期更符合,從而導致預測準確性更高。

小等位基因頻率[38]、目標群體與參考群體芯片密度[38]、填充軟件、參考群組成、參考群體大小等因素都會影響基因型填充準確性,然而在實際生產中對于小等位基因頻率難以進行控制,目標群體與參考群體也基本使用定制芯片。本研究通過探究參考群篩選方法及規模對基因型填充準確性的影響,發現使用Beagle4.0+系譜信息有更好的填充效果。使用MCA法篩選參考群進行基因型填充準確性最高,但當系譜關系清晰時使用共同祖先與親本信息進行基因型填充也可以獲取高質量的高密度芯片。參考群規模增加,基因型填充準確性也隨之增加,但過多的增加參考群所帶來的的收益較低。將公共動植物基因型填充數據庫中的個體添加到參考群體中,以此增加參考群數目也可以有效增加基因型填充準確性[39-40]。

4 結 論

綜上所述,可以通過參考群篩選方法構建參考群以及控制參考群規模,以保證基因型填充和基因組預測準確性并節省成本,本研究可為基因型填充在畜禽遺傳育種中的應用提供技術參考。

猜你喜歡
一致性方法
關注減污降碳協同的一致性和整體性
公民與法治(2022年5期)2022-07-29 00:47:28
注重教、學、評一致性 提高一輪復習效率
對歷史課堂教、學、評一體化(一致性)的幾點探討
IOl-master 700和Pentacam測量Kappa角一致性分析
學習方法
ONVIF的全新主張:一致性及最訪問控制的Profile A
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
基于事件觸發的多智能體輸入飽和一致性控制
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 香蕉久久国产超碰青草| julia中文字幕久久亚洲| 亚洲AⅤ综合在线欧美一区| 精品伊人久久久久7777人| 亚洲欧洲日产国产无码AV| 欧美成人免费午夜全| 在线观看无码av五月花| 99精品国产高清一区二区| 色综合五月婷婷| 五月天在线网站| 九九热精品视频在线| 国产91精选在线观看| 国产精品白浆无码流出在线看| 欧美成人在线免费| 精品無碼一區在線觀看 | 日本黄色不卡视频| 国产久操视频| 国产色婷婷| 亚洲日本中文综合在线| 国产极品美女在线| 亚洲精品制服丝袜二区| 美女视频黄又黄又免费高清| 四虎影视库国产精品一区| 制服无码网站| 一区二区三区高清视频国产女人| 一级片一区| 高清无码一本到东京热| 1769国产精品免费视频| 亚洲六月丁香六月婷婷蜜芽| 91午夜福利在线观看| 国禁国产you女视频网站| a毛片在线播放| 尤物亚洲最大AV无码网站| 毛片免费在线| 免费人成网站在线观看欧美| 色婷婷啪啪| 欧美日韩亚洲综合在线观看| 9cao视频精品| 91福利在线看| 美女无遮挡被啪啪到高潮免费| 久久久噜噜噜| 国产尹人香蕉综合在线电影| 国产97公开成人免费视频| 国产xx在线观看| 永久免费AⅤ无码网站在线观看| 亚洲色图欧美激情| 亚洲最大综合网| 国产欧美日韩综合在线第一| 国产成人久视频免费| 久久中文字幕不卡一二区| 久久久久亚洲AV成人网站软件| 国产极品美女在线| 成人福利一区二区视频在线| 波多野结衣在线一区二区| 中文字幕欧美日韩| 99在线视频免费观看| 亚洲色图另类| 国产男人天堂| 三上悠亚一区二区| 人妻丰满熟妇αv无码| 高清免费毛片| 国产精品片在线观看手机版 | 丰满人妻久久中文字幕| av一区二区三区在线观看| 在线观看av永久| 国产三级毛片| 国产在线观看99| 午夜啪啪网| 国产区免费精品视频| 亚洲第一成人在线| 蝴蝶伊人久久中文娱乐网| 欧美日韩国产成人高清视频| 日本人妻一区二区三区不卡影院| 久久香蕉国产线看精品| 久久精品国产电影| 毛片在线看网站| 黄色网址手机国内免费在线观看| 成人韩免费网站| 99伊人精品| 无码人妻热线精品视频| 精品撒尿视频一区二区三区| 在线观看热码亚洲av每日更新|