999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

不同人群的SNPs基因型數(shù)據(jù)中r2值對TagSNP數(shù)量的影響*

2012-03-11 14:02:12張鎦琢鄭娟娟孫遠(yuǎn)潔袁重勝
中國衛(wèi)生統(tǒng)計(jì) 2012年3期
關(guān)鍵詞:研究

張鎦琢 秦 平 李 昂 鄭娟娟 孫遠(yuǎn)潔 袁重勝 劉 艷△

研究人員通過對比病例組和對照組的基因型頻率的不同來發(fā)現(xiàn)基因?qū)膊〉挠绊懀捎趩误w型(haplotype)整合了各個多態(tài)位點(diǎn)之間的連鎖不平衡(linkage disequilibrium,LD)信息,因此基于單體型的關(guān)聯(lián)研究比基于單個單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)的分析能夠提供更高的檢出功效〔1-2〕。與疾病相關(guān)的基因型很有可能就存在于病例組和對照組之間基因型頻率不同的染色體區(qū)域內(nèi),理論上對全部的SNPs位點(diǎn)都進(jìn)行基因分型,就能夠?qū)ふ业竭@樣的區(qū)域〔3〕,但應(yīng)用這種方法進(jìn)行鑒定的成本卻過于昂貴。已有研究表明〔4〕,用少部分的遺傳標(biāo)記仍可保留單體型的大部分信息,例如單體型圖計(jì)劃已鑒定出約50萬個標(biāo)簽SNP(TagSNP)位點(diǎn),提供了與一千萬個SNPs位點(diǎn)大致相同的圖譜信息,從而大幅度地減少了成本使得研究易于進(jìn)行。目前,已有幾種根據(jù)基因分型或單體型數(shù)據(jù)篩選tagSNP的方法〔5〕,研究者利用SNPs及其他遺傳變異在染色體上的組成特點(diǎn),從HapMap中獲得tagSNP的信息,通過軟件分析用來定位與重要醫(yī)學(xué)特征相關(guān)的基因〔6〕。TagSNP的篩選大大簡化了基因與疾病的關(guān)聯(lián)分析,使遺傳疾病的基因定位能夠更為有效的進(jìn)行。

材料與方法

1.數(shù)據(jù)來源

利用國際人類基因組單體型圖計(jì)劃(The International HapMap Project,http://www.hapmap.org) 的通用基因組瀏覽器(HapMap Genome Btowser)下載2009年2月公布的Ⅲ期22號染色體的SNPs基因型數(shù)據(jù)。其中,北京漢族人群(Han Chinese in Beijing,China,CHB)包括84個樣本的18 588個SNPs信息;東京日本人群(Japanese in Tokyo,Japan,JPT)包括86個樣本的18 103個SNPs信息;而來自歐洲北部和西部的猶他州人群(Utah residents with Northern and Western European ancestry from the CEPH collection,CEU)則包括165個樣本的19 660個SNPs信息。

2.軟件介紹

在SNPs基因型數(shù)據(jù)分析中,常用的軟件有BEST、GeneDigger、HaploBlock 以及 Haploview,其中 Haploview是由劍橋大學(xué)編寫的利用已有的基因型數(shù)據(jù)來計(jì)算連鎖不平衡統(tǒng)計(jì)量并推斷人群單體型模型的公用軟件包,目前的最新版本為Haploview4.2(可從http://www.broadinstitute.org/haploview/haploview-downloads免費(fèi)下載),可在1.4版及以上的Java運(yùn)行環(huán)境(JRE)中使用。

Haploview中的Tagger計(jì)算機(jī)程序提供了篩選tagSNP的方法〔7〕,主要參數(shù)是次等位基因頻率(Minor Allele Frequency,MAF)閾值以及 tagSNP和未檢測SNP之間的最小連鎖不平衡相關(guān)程度(用r2值來表示),即侯選基因上所有常見 SNPs(即次等位基因頻率大于閾值者),要么作為tag-SNP進(jìn)行直接檢測,要么與一個待檢SNP相關(guān)聯(lián)(r2值超過設(shè)定值)。此外,研究者也可以結(jié)合現(xiàn)有文獻(xiàn)選取感興趣的可能的功能位點(diǎn)(如基因編碼區(qū)和調(diào)控區(qū)的多態(tài)位點(diǎn))作為tagSNP。

3.篩選tagSNP

運(yùn)行Haploview4.2分別讀取HapMap中的CHB、JPT和CEU的22號染色體SNPs基因型數(shù)據(jù),之后首先要對數(shù)據(jù)的信息進(jìn)行整理,設(shè)定Hardy-Weinberg平衡切斷值(HW p-value cutoff)為0.0010,次等位基因頻率(minimum minor allele freq)的最小值為0.0010,未缺失的基因型頻率最小值為75%,最大孟德爾遺傳規(guī)律錯誤的個數(shù)(max mendel errors)為1,Haploview將最終選取滿足這些條件的SNPs進(jìn)行有效的分析;隨后在tagSNP的篩選過程中設(shè)定不同的r2值(0.5~1.0),并記錄tagSNP的數(shù)量。

4.TagSNP數(shù)量的比例關(guān)系

HapMap所提供的不同人群的相同染色體的SNPs數(shù)量并不完全相同,為了排除所篩選的tagSNP數(shù)量會受到人群總SNPs數(shù)量的影響,需要計(jì)算不同人群中不同r2值所對應(yīng)的tagNP數(shù)量占總SNPs數(shù)量的百分比例。

結(jié) 果

運(yùn)行Haploview4.2分別處理三個人群的SNPs基因型數(shù)據(jù),不同r2值所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例的具體情況見表1。當(dāng)r2值為0.8(軟件默認(rèn)值)時,在CHB中篩選出7 752個tag-SNP,這表示由占總SNPs數(shù)量41.70%的這7 752個tagSNP所構(gòu)建的單體型即可反映北京漢族人群整個22號染色體上的18 588個SNPs的大部分信息;與此相比,依然是在 r2值為0.8時,分別需要7 460個(41.21%)和9086個(46.22%)tagSNP才能反映東京日本人群和來自歐洲北部和西部的猶他州人群22號染色體上的單體型信息。即使在相鄰的SNPs位點(diǎn)存在著完全連鎖的情況下(r2值為1)所篩選的tagSNP的數(shù)量還是明顯的低于總SNPs數(shù)量,此時CHB、JPT和CEU的tagSNP數(shù)量分別占總SNPs數(shù)量的65.56%、63.35%和70.05%。

表1 三個人群中不同r2值所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例

若以設(shè)定的r2值為橫坐標(biāo),以所篩選的tagSNP數(shù)量或其占總SNPs數(shù)量百分比例為縱坐標(biāo)做圖,則可以更為直觀地看到三個人群中北京漢族人群和東京日本人群比較接近,且三個人群均表現(xiàn)出隨著所設(shè)定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢;但在r2值相同時三個人群的tagSNP數(shù)量卻存在著一定的差異,表現(xiàn)為日本人群的數(shù)量最少,北京漢族人群其次,歐洲北部和西部的猶他州人群的數(shù)量最多。在三個人群中tagSNP數(shù)量的增加速度都表現(xiàn)為在r2值小于0.9時較為平穩(wěn),r2值大于0.9時增加速度都有所提高,其中以北京漢族人群的增加更為明顯。

討 論

運(yùn)用Haploview軟件進(jìn)行tagSNP的篩選,可直接分析從HapMap上下載到的階段性SNPs基因型數(shù)據(jù),通過計(jì)算連鎖不平衡統(tǒng)計(jì)量來推斷人群單體型模型。有研究顯示利用HapMap基因型數(shù)據(jù)所篩選的tagSNP進(jìn)行關(guān)聯(lián)研究比單位點(diǎn)研究的統(tǒng)計(jì)效力更高,且可不受數(shù)據(jù)庫完整性的影響〔7〕。本研究即是運(yùn)用Haploview4.2軟件計(jì)算出三個人群(北京漢族人群、東京日本人群和來自歐洲北部和西部的猶他州人群)22號染色體在不同r2值(最小連鎖不平衡相關(guān)程度)時所對應(yīng)的tagSNP數(shù)量及其占總SNPs數(shù)量的百分比例,結(jié)果顯現(xiàn)出tagSNP的數(shù)量受r2值的影響較大,雖然三個人群在SNPs連鎖不平衡關(guān)系上存在著一定的差異(相對說來,北京漢族人群和東京日本人群的結(jié)果較為接近),但均表現(xiàn)出隨著所設(shè)定的r2值的增大tagSNP數(shù)量及其百分比例呈現(xiàn)出逐漸增多的趨勢,不過tagSNP數(shù)量的增加速度在三個人群中略有不同。究其增加速度不同的原因,一方面在于HapMap計(jì)劃所檢測的三個人群總SNPs位點(diǎn)個數(shù)以及樣本例數(shù)的差異(北京漢族人群和東京日本人群樣本例數(shù)幾乎相等,而歐洲北部和西部的猶他州人群的樣本例數(shù)則幾乎是北京漢族人群和東京日本人群樣本例數(shù)的總和),理論上較大的樣本量意味著位點(diǎn)間有更多的重組機(jī)會(重組機(jī)會的增多可降低原位點(diǎn)間的r2值),故當(dāng)固定r2值以篩選tagSNP時,較大的樣本量就可導(dǎo)致有更多的tagSNP被篩選出來;另一方面,影響r2值的因素還包括群體有效大小(Ne)以及位點(diǎn)間重組率(c),三個人群不同的遺傳背景使得位點(diǎn)間重組率和重組率圖(相鄰的SNPs位點(diǎn)間的重組率即組成了重組率圖) 產(chǎn)生差異,因 E(r2)=1/(1+4Nec)〔8〕,從而也導(dǎo)致了三個人群的tagSNP在數(shù)量及增加速度上的差異。所以,在實(shí)際研究中要依據(jù)目標(biāo)人群、研究經(jīng)費(fèi)等方面的具體情況設(shè)置合理的r2值,若因研究經(jīng)費(fèi)有限需要檢測的SNPs位點(diǎn)數(shù)量較少時,可通過降低r2值來減少tagSNP的數(shù)量,尤其是當(dāng)研究人群不同時,不應(yīng)盲目地遵從由參考樣本數(shù)據(jù)所計(jì)算出的r2值,應(yīng)更相信從實(shí)際研究數(shù)據(jù)中所計(jì)算得到的r2值。此外,當(dāng)估算出位點(diǎn)間的r2值后,還可進(jìn)一步推斷群體有效大小,因?yàn)槿后w有效大小是一個重要參數(shù),有助于解釋人群是如何進(jìn)行演變和擴(kuò)大的,并可提高對復(fù)雜性狀遺傳模式的理解和建模〔9〕。

目前,在疾病的病因?qū)W研究中,盡管已在發(fā)現(xiàn)疾病的危險(xiǎn)等位基因方面取得了很大的進(jìn)步,但大多數(shù)的遺傳風(fēng)險(xiǎn)仍然無法解釋。在廣泛的人群中全面的檢測所有常見和稀有的等位基因可對疾病的遺傳風(fēng)險(xiǎn)有一個更為完整的認(rèn)識〔8〕。但對全部SNPs位點(diǎn)進(jìn)行關(guān)聯(lián)研究確實(shí)存在著諸多困難(工作量大、成本較高等),而利用少量的tagSNP就能提供與全基因組SNPs位點(diǎn)大致相同的圖譜信息的方式,則可以良好的解決這些問題。相信,隨著生命科學(xué)的不斷發(fā)展和進(jìn)步,提取tagSNP的算法將會得到逐步完善,從而在分子流行病學(xué)和生命科學(xué)的研究中發(fā)揮積極的作用。

1.Akey J,Jin L,Xiong M.Haplotypes vs single marker linkage disequilibrium tests:what do we gain?Eur J Hum Genet,2001,9(4):291-300.

2.鄒莉玲,趙耐青,秦國友,等.應(yīng)用關(guān)聯(lián)規(guī)則篩選疾病相關(guān)的SNP位點(diǎn)及其組合的分析方法.中國衛(wèi)生統(tǒng)計(jì),2009,26(3):226-233.

3.Johnson GC,Esposito L,Barratt BJ,et al.Haplotype tagging for the identification of common disease genes.Nat Genet,2001,29(2):233-237.

4.Patil N,Berno AJ,Hinds DA,et al.Blocks of limited haplotype diversity revealed by high-resolution scanning of human chromosome 21.Science,2001,294(5547):1669-1670.

5.Gopalakrishnan S,Qin ZS.TagSNPselection based on pairwise LD criteria and power analysis in association studies.Pac Symp Biocomput,2006,511-522.

6.Xu Z,Kaplan NL,Taylor JA.Tag SNPselection for candidate gene association studies using HapMap and gene resequencing data.Eur J Hum Genet,2007,15(10):1063-1070.

7.Bakker PI,Yelensky R,Pe'er I,et al.Efficiency and power in genetic association studies.Nat Genet,2005,37(11):1217-1223.

8.Sved JA.Correlation measures for linkage disequilibrium within and between populations.Genet Res(Camb),2009,91(3):183-192.

9.Tenesa A,Navarro P,Hayes BJ,et al.Recent human effective population size estimated from linkage disequilibrium.Genome Res,2007,17(4):520-526.

猜你喜歡
研究
FMS與YBT相關(guān)性的實(shí)證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關(guān)于遼朝“一國兩制”研究的回顧與思考
EMA伺服控制系統(tǒng)研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側(cè)面碰撞假人損傷研究
關(guān)于反傾銷會計(jì)研究的思考
焊接膜層脫落的攻關(guān)研究
電子制作(2017年23期)2017-02-02 07:17:19
主站蜘蛛池模板: 国产成人h在线观看网站站| 99ri精品视频在线观看播放| 亚洲熟女偷拍| 国产第一色| www.精品国产| 成年人午夜免费视频| 婷婷激情亚洲| 亚洲Av综合日韩精品久久久| 国产精欧美一区二区三区| 亚洲黄网在线| 亚洲无码高清一区二区| 中文字幕日韩丝袜一区| 欧美性爱精品一区二区三区| 亚洲毛片一级带毛片基地| 五月激情综合网| 日韩欧美国产综合| 午夜精品久久久久久久无码软件 | 国产精品欧美亚洲韩国日本不卡| 欧美在线精品怡红院| 另类重口100页在线播放| 91毛片网| 国产在线无码一区二区三区| 国产一区三区二区中文在线| 欧美视频在线播放观看免费福利资源| 亚洲av色吊丝无码| 亚洲专区一区二区在线观看| 国产乱肥老妇精品视频| 国产午夜福利亚洲第一| 国产在线自在拍91精品黑人| 最新加勒比隔壁人妻| 亚洲第一区在线| 欧美激情二区三区| 亚洲人成在线免费观看| 久久免费视频6| 欧美激情福利| 黄色三级毛片网站| 在线免费无码视频| 九九九国产| 欧洲欧美人成免费全部视频| 亚洲天堂777| 亚洲国产天堂在线观看| 国产精品漂亮美女在线观看| 乱人伦99久久| 成人精品视频一区二区在线| 久久精品国产精品青草app| 午夜国产在线观看| 国产人人射| 亚洲AⅤ综合在线欧美一区| 欧美另类精品一区二区三区| 国产精品成人啪精品视频| 国产真实乱了在线播放| 一区二区欧美日韩高清免费 | 欧美精品v欧洲精品| 四虎精品免费久久| 亚洲国产精品VA在线看黑人| 色悠久久久久久久综合网伊人| 亚洲av成人无码网站在线观看| 午夜视频www| 日韩精品中文字幕一区三区| 国产v精品成人免费视频71pao | 精品少妇人妻无码久久| 美女一区二区在线观看| 亚洲成在人线av品善网好看| 一级一级特黄女人精品毛片| 欧美午夜精品| 四虎永久免费地址在线网站| 免费va国产在线观看| 日本亚洲成高清一区二区三区| 欧美国产日韩另类| 国产在线日本| 欧美特黄一免在线观看| 爱爱影院18禁免费| 精品国产成人国产在线| 国产高清国内精品福利| 国产精品亚洲а∨天堂免下载| 天堂网亚洲系列亚洲系列| 亚洲欧美成人在线视频| 中文字幕调教一区二区视频| 国产午夜福利在线小视频| 国产精品一区不卡| 手机永久AV在线播放| 亚洲一区波多野结衣二区三区|