999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

候選基因關(guān)聯(lián)研究的統(tǒng)計(jì)分析方法*

2017-03-09 08:35:28哈爾濱醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室150081史曉雯劉蕓良
關(guān)鍵詞:關(guān)聯(lián)分析方法

哈爾濱醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(150081) 肖 純 史曉雯 劉蕓良 張 奇 劉 艷

候選基因關(guān)聯(lián)研究的統(tǒng)計(jì)分析方法*

哈爾濱醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(150081) 肖 純 史曉雯 劉蕓良 張 奇 劉 艷△

隨著新一代測(cè)序技術(shù)的發(fā)展及全基因組關(guān)聯(lián)研究(genome-wide association study,GWAS)策略的推廣,復(fù)雜性疾病基因關(guān)聯(lián)研究涉及的SNP位點(diǎn)逐漸增加[1],且資料收集的逐漸完善促使描述疾病結(jié)局相關(guān)的指標(biāo)增多,使樣本信息多元化[2]。

所謂候選基因關(guān)聯(lián)研究是根據(jù)已有的生理、生化背景知識(shí)或現(xiàn)有的研究結(jié)果(例如連鎖分析的結(jié)果或表達(dá)產(chǎn)物的功能)提示某段基因序列的變異可能與表型的變異有關(guān)來確定待研究的基因,也就是候選基因[3]。假設(shè)所選基因本身就是影響表型變異的主基因,同時(shí)借助基因擴(kuò)增等實(shí)驗(yàn)技術(shù),采用病例對(duì)照設(shè)計(jì)方法來比較病例組與對(duì)照組候選基因的組間差異,以此來確定候選基因與表型變異是否存在關(guān)聯(lián)[4],有利于探索復(fù)雜性疾病的致病基因,樣本易收集且能檢出基因的主效應(yīng)及微效基因的作用[5-6]。目前針對(duì)候選基因關(guān)聯(lián)研究的統(tǒng)計(jì)分析方法主要分為疾病結(jié)局由多個(gè)指標(biāo)共同描述和SNP位點(diǎn)數(shù)目較多這兩種數(shù)據(jù)類型[7],本文對(duì)這兩種數(shù)據(jù)類型的主要分析方法進(jìn)行回顧,并對(duì)其中較為高效的分析方法進(jìn)行詳細(xì)介紹。

多指標(biāo)數(shù)據(jù)分析方法

針對(duì)多指標(biāo)數(shù)據(jù)的統(tǒng)計(jì)分析方法主要區(qū)別在于對(duì)各指標(biāo)間相關(guān)性的校正方法不同,實(shí)際數(shù)據(jù)操作中應(yīng)根據(jù)研究目的、專業(yè)背景知識(shí)及數(shù)據(jù)的分布類型來選擇適當(dāng)?shù)慕y(tǒng)計(jì)分析方法。

1.傳統(tǒng)分析方法

傳統(tǒng)分析方法通常是采用回歸模型對(duì)疾病結(jié)局與相關(guān)變量進(jìn)行分析,以研究對(duì)象是否患病作為應(yīng)變量,以位點(diǎn)的基因型和需要調(diào)整的混雜因素作為自變量進(jìn)行分析,并且可以估計(jì)基因之間及基因與環(huán)境之間的交互作用[8-10]。但當(dāng)疾病結(jié)局并非由單一指標(biāo)來描述時(shí),模型中的應(yīng)變量就不再是是否患病,而是一些彼此相關(guān)的多個(gè)指標(biāo),采用回歸模型就需將多指標(biāo)信息縮減為一個(gè)綜合得分,在損失數(shù)據(jù)信息的同時(shí)也降低了檢驗(yàn)功效[11-12]。

2.TATES法

Sluis等人[13]同時(shí)指出當(dāng)校正了各指標(biāo)間的相關(guān)性后,在0.05檢驗(yàn)水準(zhǔn)下其檢驗(yàn)效能是傳統(tǒng)方法(即回歸模型)的2.5~9.0倍,是多元方差分析的1.5~2.0倍。TATES法可通過PLINK、Mach2.dat/qtl、SNPtest和Gen/ProbABLE軟件實(shí)現(xiàn),同時(shí)兼具高效、人群分層校正的優(yōu)勢(shì)。

改良Fisher合并統(tǒng)計(jì)量可以通過R軟件中fCopulae包實(shí)現(xiàn),運(yùn)行速度較快。Yang等通過一組模擬實(shí)驗(yàn)證實(shí)改良Fisher合并統(tǒng)計(jì)量方法對(duì)表型變量具有相關(guān)性的數(shù)據(jù)具有較高的檢驗(yàn)效能,并有效地控制了Ⅰ類錯(cuò)誤。Yang等同時(shí)將該方法應(yīng)用于酒精濫用的遺傳學(xué)研究。

此外,多元方差分析[16-17]通過基因型內(nèi)與基因型間變異的協(xié)方差矩陣來計(jì)算表型變量的平均值的大小。將多個(gè)表形向量看作一個(gè)整體,從表形向量的任意線性組合中發(fā)現(xiàn)不同總體的最大組間差異,即基因位點(diǎn)對(duì)多個(gè)表型變量整體的影響。多元方差分析對(duì)于最小等位基因頻率較大且指標(biāo)間呈負(fù)相關(guān)的資料效能較高。另外,主成分分析可用于降低變量維度,同時(shí)可提高檢驗(yàn)效能[18-19]。當(dāng)疾病表型相關(guān)程度較高時(shí),采用主成分分析得到的第一個(gè)主成分包含最多的表型信息(VarZ1≥VarZ2…≥VarZm),故在基因關(guān)聯(lián)研究中檢驗(yàn)第一個(gè)主成分與SNP位點(diǎn)間的關(guān)系是將眾多相關(guān)指標(biāo)轉(zhuǎn)化為較少幾個(gè)成分的一種常用且有效的方法。但如何確定合適的主成分個(gè)數(shù)以及對(duì)抽象主成分的實(shí)際意義做出合理解釋則成為該方法的難點(diǎn)[20]。

多位點(diǎn)數(shù)據(jù)分析方法

隨著全基因組關(guān)聯(lián)研究技術(shù)的發(fā)展成熟,一些疾病的基因組關(guān)聯(lián)分析會(huì)產(chǎn)生幾十個(gè)甚至是上百個(gè)的SNP位點(diǎn),采用傳統(tǒng)方法對(duì)這種多位點(diǎn)數(shù)據(jù)進(jìn)行分析時(shí),會(huì)受到維度的限制(即使三個(gè)基因位點(diǎn)也很難解釋其交互作用)和單基因作用效果較弱的問題[21-23]。若每次僅分析一個(gè)或幾個(gè)位點(diǎn)與疾病的關(guān)聯(lián),因檢驗(yàn)效能較低常獲得陰性結(jié)果,同時(shí)也帶來了多重檢驗(yàn)的校正問題[24]。

1.傳統(tǒng)分析方法

傳統(tǒng)的參數(shù)模型通常采用χ2檢驗(yàn)或回歸模型進(jìn)行關(guān)聯(lián)分析。基于χ2檢驗(yàn)的關(guān)聯(lián)分析方法原理是比較病例組與對(duì)照組某一等位基因頻率是否有差異,若結(jié)果呈陽性,可提示該基因與變異相關(guān),但基于χ2檢驗(yàn)的關(guān)聯(lián)分析并沒有綜合考慮到家族聚集因素和其他環(huán)境因素的共同作用[25-26]。

當(dāng)前的候選基因研究中通常產(chǎn)生包含幾十甚至上百個(gè)SNP位點(diǎn)的數(shù)據(jù),采用傳統(tǒng)的回歸模型進(jìn)行分析時(shí)也陷入了困境。第一,眾多的位點(diǎn)信息導(dǎo)致模型中需要估計(jì)的參數(shù)增加,同時(shí)也導(dǎo)致了參數(shù)估計(jì)結(jié)果存在偏倚;第二,復(fù)雜性疾病是受多個(gè)基因的共同影響,每個(gè)基因的效應(yīng)都較弱,采用回歸模型進(jìn)行篩選時(shí),在分析交互作用之前需要存在一個(gè)主效應(yīng),復(fù)雜性疾病的各基因并不存在明顯的主效應(yīng);第三,回歸模型通常是在各種假定的遺傳方式(顯性遺傳、隱形遺傳、加性遺傳等)下對(duì)各基因型進(jìn)行了評(píng)分量化,然而這種量化具有不確定性或推測(cè)的特點(diǎn)[27]。

2.核心關(guān)聯(lián)分析法(kernel association analysis)

3.混合潛變量模型(latent variable modeling)

此外,機(jī)器學(xué)習(xí)方法(如多因子降維、分類回歸樹、隨機(jī)森林等)也可以解決傳統(tǒng)參數(shù)模型中的維度災(zāi)難問題。例如,多因子降維法(MDR)可減小因數(shù)據(jù)劃分的偶然性引起的I類錯(cuò)誤同時(shí)彌補(bǔ)了傳統(tǒng)參數(shù)模型分析高階交互作用時(shí)的缺陷,但是當(dāng)測(cè)試集的病例對(duì)照比與整個(gè)數(shù)據(jù)集相近時(shí)會(huì)增加假陽性率[39];分類回歸樹(CART)以二叉決策樹的形式構(gòu)建預(yù)測(cè)準(zhǔn)則,容易理解、解釋和使用,但當(dāng)樣本數(shù)據(jù)有小幅度變動(dòng)時(shí),構(gòu)建的樹就有較大變動(dòng),導(dǎo)致結(jié)果不穩(wěn)定[40]。

[1]顧星博,李昂,溫琪,等.Rstudio和隨機(jī)叢林在高維全基因組學(xué)數(shù)據(jù)分析中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2015,32(6):955-962.

[2]韓建文,張學(xué)軍.全基因組關(guān)聯(lián)研究現(xiàn)狀.遺傳,2011,33(1):25-35.

[3]Zondervan KT,Cardon LR.Designing candidate gene and genome-wide case-control association studies.Nat Protoc,2007,2(10):2492-2501.

[4]嚴(yán)衛(wèi)麗.復(fù)雜疾病關(guān)聯(lián)研究中的若干問題.遺傳學(xué)報(bào),2004,31(5):533-537.

[5]Tabor HK,Risch NJ,Myers RM.Candidate-gene approaches for studying complex genetic traits:practical considerations.Nat Rev Genet,2002,3(5):391-397.

[6]Johnson T.Bayesian method for gene detection and mapping,using a case and control design and DNA pooling.Biostatistics,2007,8(3):546-565.

[7]張學(xué)軍.復(fù)雜疾病的遺傳學(xué)研究策略.安徽醫(yī)科大學(xué)學(xué)報(bào),2007,42(3):237-240.

[8]葛銳,潘發(fā)明,夏果,等.強(qiáng)直性脊柱炎FcRL基因與環(huán)境暴露因素交互作用研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(6):617-619.

[9]陳軍,段煉,伍亞舟,等.直腸癌相關(guān)基因多態(tài)性及環(huán)境因素的影響因素分析.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(1):31-33.

[10]張鎦琢,秦平,李昂,等.不同人群的SNPs基因型數(shù)據(jù)中r2值對(duì)TagSNP數(shù)量的影響.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,33(3):367-368.

[11]Paterson AD,Waggott D,Boright AP,et al.A genome-wide association study identifies a novel major locus for glycemic control in type 1 diabetes,as measured by both A1C and glucose.Diabetes,2010,59(2):539-549.

[12]Sung Y,Feng Z,Subedi S.A genome-wide association study of multiple longitudinal traits with related subjects.Stat(Int Stat Inst),2016,5(1):22-44.

[13]van der Sluis S,Posthuma D,Dolan CV.TATES:efficient multivariate genotype-phenotype analysis for genome-wide association studies.PLoS Genet,2013,9(1):e1003235.

[14]Li Q,Hu J,Ding J,et al.Fisher′s method of combining dependent statistics using generalizations of the gamma distribution with applications to genetic pleiotropic associations.Biostatistics,2014,15(2):284-295.

[15]Yang JJ,Li J,Williams LK,et al.An efficient genome-wide association test for multivariate phenotypes based on the Fisher combination function.BMC Bioinformatics,2016,17:19.

[16]Solovieff N,Cotsapas C,Lee PH,et al.Pleiotropy in complex traits:challenges and strategies.Nat Rev Genet,2013,14(7):483-495.

[17]王苗苗.雙因素方差分析模型的構(gòu)建及應(yīng)用.統(tǒng)計(jì)與決策,2015,(18):72-75.

[18]Mei H,Chen W,Dellinger A,et al.Principal-component-based multivariate regression for genetic association studies of metabolic syndrome components.BMC Genet,2010,11:100-112.

[19]陳玉柱,方志峰,唐振柱,等.基于主成分回歸分析的尿酸與相關(guān)影響因素研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2016,33(3):382-388.

[20]Zhang F,Guo X,Wu S,et al.Genome-wide pathway association studies of multiple correlated quantitative phenotypes using principle component analyses.PLoS One,2012,7(12):e53320.

[21]Schaid DJ,McDonnell SK,Hebbring SJ,et al.Nonparametric tests of association of multiple genes with human disease.Am J Hum Genet,2005,76(5):780-793.

[22]李彪,陳潤(rùn)生.復(fù)雜疾病關(guān)聯(lián)分析進(jìn)展.中國(guó)醫(yī)學(xué)科學(xué)院學(xué)報(bào),2006,28(2):271-277.

[23]王璟濤,侯艷,李康.高維組學(xué)變量篩選方法的穩(wěn)定性評(píng)價(jià)方法及應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2016,33(3):374-378.

[24]金如鋒,夏昭林.病例對(duì)照設(shè)計(jì)為基礎(chǔ)的候選基因關(guān)聯(lián)研究中交互作用的統(tǒng)計(jì)方法進(jìn)展.復(fù)旦學(xué)報(bào)(醫(yī)學(xué)版),2011,38(3):265-270.

[25]鄒莉玲,趙耐青,秦國(guó)友,等.應(yīng)用關(guān)聯(lián)規(guī)則篩選疾病相關(guān)的SNP位點(diǎn)及其組合的分析方法.中國(guó)衛(wèi)生統(tǒng)計(jì),2009,6(3):226-233.

[26]李鵬飛,馮靖宇,嚴(yán)瀅瀅,等.胃癌易感基因篩選及多基因危險(xiǎn)度分析.環(huán)境與職業(yè)醫(yī)學(xué),2011,28(9):531-534.

[27]陳峰,柏建嶺,趙楊,等.全基因組關(guān)聯(lián)研究中的統(tǒng)計(jì)分析方法.中華流行病學(xué)雜志,2011,32(4):400-404.

[28]Li H.U-statistics in genetic association studies.Hum Genet,2012,131(9):1395-1401.

[29]Wei Z,Li M,Rebbeck T,et al.U-statistics-based tests for multiple genes in genetic association studies.Ann Hum Genet,2008,72(6):821-833.

[30]Wu MC,Maity A,Lee S,et al.Kernel machine SNP-set testing under multiple candidate kernels.Genet Epidemiol,2013,37(3):267-275.

[31]李麗霞,郜艷暉,張敏,等.潛變量增長(zhǎng)曲線模型及其應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(5):713-716.

[32]武淑琴,張巖波.結(jié)構(gòu)方程模型等同性檢驗(yàn)及其在分組比較中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(3):237-240.

[33]Dean N,Raftery AE.Latent Class Analysis Variable Selection.Ann Inst Stat Math,2010,62(1):11-35.

[34]Lee S,Jhun M,Lee EK,et al.Application of structural equation models to construct genetic networks using differentially expressed genes and single-nucleotide polymorphisms.BMC Proc,2007,1(Suppl 1):76.

[35]Tueller S,Lubke G.Evaluation of structural equation mixture models Parameter estimates and correct class assignment.Struct Equ Modeling,2010,17(2):165-192.

[36]Kelava A,Brandt H.A general non-linear multilevel structural equation mixture model.Front Psychol,2014,5:748.

[37]Berlin KS,Parra GR,Williams NA.An introduction to latent variable mixture modeling(part 2):longitudinal latent class growth analysis and growth mixture models.J Pediatr Psychol,2014,39(2):188-203.

[38]Tueller S,Lubke G.Evaluation of structural equation mixture models Parameter estimates and correct class assignment.Struct Equ Modeling,2010,17(2):165-192.

[39]華琳,鄭衛(wèi)英,劉紅.基于優(yōu)勢(shì)比的多因子降維法在SNP交互分析中的應(yīng)用.中國(guó)優(yōu)生與遺傳雜志,2008,16(11):938-947.

[40]梁茵.分類回歸樹算法的探討.廣東技術(shù)師范學(xué)院學(xué)報(bào),2008,(6):29-32.

(責(zé)任編輯:郭海強(qiáng))

國(guó)家自然科學(xué)基金(81172741;30972537)

△通信作者:劉艷,E-mail:liuyan@ems.hrbmu.edu.cn

猜你喜歡
關(guān)聯(lián)分析方法
“苦”的關(guān)聯(lián)
隱蔽失效適航要求符合性驗(yàn)證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
語言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
主站蜘蛛池模板: 成年午夜精品久久精品| 亚洲伊人久久精品影院| 欧美成人午夜影院| 波多野结衣中文字幕久久| 日韩美一区二区| 亚洲最大情网站在线观看| 亚洲国产看片基地久久1024| 无码 在线 在线| 国产精品一线天| 国产精品毛片一区| 国产乱人伦AV在线A| 在线播放国产99re| 国产麻豆福利av在线播放 | 色九九视频| www.精品国产| 激情国产精品一区| 免费在线色| 亚洲成人一区二区| 成人午夜天| 亚卅精品无码久久毛片乌克兰| 国产高清自拍视频| 国产99视频精品免费视频7| 国产成人综合欧美精品久久| 亚洲精品国产首次亮相| 99这里精品| 丁香五月婷婷激情基地| 国产激爽爽爽大片在线观看| 欧美区一区| 久久精品人妻中文视频| 丁香婷婷久久| 九色综合伊人久久富二代| 青青极品在线| 亚洲成A人V欧美综合| 國產尤物AV尤物在線觀看| 免费毛片网站在线观看| 99热这里只有精品5| 五月激激激综合网色播免费| 好吊妞欧美视频免费| 亚洲丝袜第一页| 国产91小视频| 国产成熟女人性满足视频| 久久女人网| 亚洲综合日韩精品| 国产一在线| 亚洲 日韩 激情 无码 中出| 2021国产v亚洲v天堂无码| 国产成人综合欧美精品久久| 九九九国产| 免费高清a毛片| 国产美女免费| 欧美日韩精品综合在线一区| 国产午夜一级毛片| 无码中文AⅤ在线观看| 亚洲日韩精品欧美中文字幕 | 国产成人一二三| 久久人与动人物A级毛片| 欧美a在线视频| 日韩久久精品无码aV| 夜夜操狠狠操| 日韩欧美91| 一级高清毛片免费a级高清毛片| 日韩不卡高清视频| 尤物精品视频一区二区三区| 久久久久88色偷偷| 91成人在线免费视频| 国产xxxxx免费视频| 久久天天躁夜夜躁狠狠| 成人另类稀缺在线观看| 日本欧美中文字幕精品亚洲| 亚洲国产天堂在线观看| 三上悠亚在线精品二区| 99热国产在线精品99| 男人的天堂久久精品激情| 永久免费av网站可以直接看的 | 一级毛片a女人刺激视频免费| 在线毛片免费| 亚洲无线视频| 最新国产高清在线| 色综合中文| 国产在线观看91精品亚瑟| 丁香亚洲综合五月天婷婷| 大学生久久香蕉国产线观看|