999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于組合策略的慢性阻塞性肺疾病的差異表達基因的篩選

2014-06-23 13:56:21華琳夏翃周萍安立
中國醫療設備 2014年7期
關鍵詞:一致性差異分析

華琳,夏翃,周萍,安立

1.首都醫科大學 a.生物醫學工程學院;b.臨床生物力學應用基礎研究北京市重點實驗室,北京 100069;2.首都醫科大學附屬北京朝陽醫院 呼吸醫學中心,北京 100020

基于組合策略的慢性阻塞性肺疾病的差異表達基因的篩選

華琳1,夏翃1,周萍1,安立2

1.首都醫科大學 a.生物醫學工程學院;b.臨床生物力學應用基礎研究北京市重點實驗室,北京 100069;2.首都醫科大學附屬北京朝陽醫院 呼吸醫學中心,北京 100020

目的應用組合策略篩選慢性阻塞性肺疾病(COPD)的差異表達基因。方法采用芯片顯著性分析算法(SAM)從GEO數據庫中提取COPD差異表達基因,并通過5種基因排序算法對基因進行篩選,并對篩選后的COPD相關基因進行隨機擾動分析和GO功能富集分析。結果發現GON4L和P4HB是重要的COPD相關基因。結論組合策略提高了COPD易感基因識別的準確率。

慢性阻塞性肺疾病;差異表達基因;隨機擾動分析;GO功能富集分析;基因芯片

0 前言

慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)是一種嚴重危害公眾健康的慢性呼吸系統疾病,患病人數多,死亡率高。患者患病后自身防御和免疫功能降低,易受外界各種有害因素的影響,逐漸產生各種心肺并發癥,勞動能力和生活質量受到嚴重影響。COPD具有家族聚集傾向,較少由單基因缺陷引起,往往由多基因互作及多基因和環境因素互作累積所致[1]。目前,已經確認吸煙是導致COPD最重要的環境因素,但據報道僅有10%的吸煙者能進展為COPD患者[2]。日前,相關研究人員指出大氣污染物會影響COPD的入院人數和死亡人數,導致COPD發病率和死亡率增加,其中PM10是主要的危險因子。以上均說明遺傳易感性和環境因素對于COPD發病起著重要作用,而基因又是決定遺傳易感性的關鍵因素。

COPD的病因十分復雜,具有遺傳異質性,基因型和表現型間沒有簡單的對應關系。因此,目前遺傳學和功能基因組學研究的熱點和難點就是通過遺傳標記進行連鎖定位,鑒定該疾病表型的相關基因。近年來,基因芯片(Gene Microarray)技術發展迅猛,大量算法被用于識別疾病的差異表達基因,但這些算法識別的差異表達基因往往不一致。本文采用組合策略,通過對5種基因排序算法排序的COPD差異表達基因進行隨機擾動分析和整合分析,還對識別的COPD相關基因進行GO功能富集分析,以提高COPD易感基因識別的準確度。

1 材料與方法

1.1 COPD數據的選擇

從GEO(Gene Expression Omnibus)數據庫(http:// www.ncbi.nlm.nih.gov/geo)中下載一套COPD的基因表達譜數據,包含了18個COPD患者、12個正常樣本的22283個基因。按照P<0.05和錯誤發現率(False Discovery Rate,FDR)<0.1的標準,采用芯片顯著性分析算法(Significance Analysis of Microarrays,SAM)從表達譜數據中提取差異表達基因,然后對其進行進一步的分析。

1.2 Rank方法

本文采用5種Rank方法對差異表達基因進行排序:① 傳統的兩兩比較t檢驗;②Bayesiant檢驗[3-5];③SAM檢驗[3];④Welch'st檢驗;⑤ Shrinkaget檢驗[6]。把每種方法中排在前10位的基因篩選出來,進行一致性比較,再把一致的基因列出來,并進一步采用隨機重排檢驗,分析結果的穩定性。

1.3 隨機擾動分析

為判定篩選結果的穩定性,傳統做法是對原始數據集進行隨機擾動,然后對擾動后的數據集再進行分析。理想的結果是經過隨機擾動后,Rank列表和原始數據集得出的結果保持一致。本文分別采用GeneSelector軟件包中的jackknife法、label exchange法、bootstrap法和noise法進行隨機擾動分析[4]。

1.4 GO富集分析

對于5種Rank方法中排在前10位的基因,將其中出現頻次≥3次的基因挑選出來做GO功能富集分析,并計算相應的P值和FDR值,找出顯著的GO功能結點(按照FDR<0.05的標準),從而分析出應用組合策略獲得的基因的相應生物學功能。

2 數值分析結果

2.1 Rank排序篩選結果

對5種Rank方法獲得的排在前10位的基因的分析結果表明,基因GON4L、P4HB、LUM、ACTA2、RPS8P8在5種方法中均排在前10位,并且出現頻次最高(4次);其次是基因SERP1和S100A10,出現頻次為3次。具體結果見表1。

表1 5種Rank方法中出現頻次≥3次的基因

通過查閱文獻,發現頻次≥3次的基因中,P4HB和GON4L均是COPD相關的潛在候選基因。

2.2 隨機擾動分析結果

4種方法均隨機重復30次,結果如下:

(1)t檢驗。4種擾動分析后,GON4L排在第一位,即出現的頻次最高;其次是P4HB。label exchange方法和bootstrap方法比jackknife方法的一致性差。t檢驗的隨機擾動分析結果,見圖1。

圖1 t 檢驗的隨機擾動分析結果

(2)Bayesiant檢驗。4種擾動分析后,GON4L排在第一位,即出現的頻次最高;其次是P4HB。label exchange方法和bootstrap方法比jackknife方法的一致性差。Bayesiant檢驗Noise方法的結果不如t檢驗。Bayesiant檢驗的隨機擾動分析結果,見圖2。

圖2 Bayesian t檢驗的隨機擾動分析結果

(3)SAM檢驗。4種擾動分析后,P4HB排在第一位,即出現的頻次最高;其次是GON4L。4種方法的一致性較為相似。Noise方法的結果一致性較好。SAM檢驗的隨機擾動分析結果,見圖3。

圖3 SAM檢驗的隨機擾動分析結果

(4)Welch'st檢驗。4種擾動分析后,GON4L排在第一位,即出現的頻次最高;其次是P4HB。label exchange方法和bootstrap方法比jackknife方法的一致性差。Noise方法的結果一致性較好。Welch'st檢驗的隨機擾動分析結果,見圖4。

圖4 Welch's t 檢驗的隨機擾動分析結果

(5)Shrinkaget檢驗。4種擾動分析后,GON4L排在第一位,即出現的頻次最高;排在其次是P4HB。4種方法的一致性也較為相似。Noise方法的結果一致性較好。Shrinkaget檢驗的隨機擾動分析結果,見圖5。

圖5 Shrinkage t 檢驗的隨機擾動分析結果

綜上,GON4L是隨機擾動分析后出現頻次最高的基因。事實上,GON4L被報道過和蛋白質Yin Yang 1(YY1)相關[7],并且其調控行為在COPD患者中會出現改變[8]。此外,4種隨機擾動分析后,P4HB出現頻次除了在SAM方法中排在第一位,在其他方法中均排在第二位,表明P4HB也可能與COPD較為相關。事實上P4HB被發現在吸煙者中的表達要高于非吸煙者[9]。這些證據均證實GON4L和P4HB是重要的COPD相關的易感基因,且篩選結果穩定性較好。

2.3 GO功能富集分析

對于5種Rank方法中排在前10位的基因,采用clusterProfiler Package進行GO功能富集分析,結果見表2。可以看出,顯著的GO功能結點主要有:GO:0030485(smooth muscle contractile fiber),GO:0016860(intramolecular oxidoreductase activity),GO:0004667(prostaglandin-D synthase activity),GO:0004656(procollagen-proline 4-dioxygenase activity),GO:0031545(peptidyl-proline 4-dioxygenase activity),GO:0016853(isomerase activity)和GO:0019798(procollagen-proline dioxygenase activity)。這些功能多與酶的活動相關。

表2 GO功能富集分析結果(FDR<0.05)

3 討論

很多基因表達譜的基本分析都是差異表達基因的篩選,篩選方法也層出不窮。本文采用組合策略,對5種不同的Rank方法排序篩選的COPD差異表達基因進行比較,結果發現這些基因的確能夠很好地區分COPD疾病和對照樣本。隨機擾動分析結果表明,基因GON4L和P4HB出現頻次在5種方法的隨機擾動分析中的穩定性較強,且經過文獻驗證的確是與COPD相關的基因。

作為單變量分析,對基因排序穩定性的研究是十分重要的,特別是對于不同方法獲得的差異表達基因的一致性檢驗。最近一些研究還特別關注了穩定性的測度[10-11],比如采用聚集性測度來分析結果穩定性,可以對不同方法的結果進行更加深度的比較。此外,在具體的問題分析中,對不同方法獲得的結果進行合成,也有助于對結果進行合理的解釋。

穩定性在臨床應用中是非常重要的,如果發現通過某方法獲得的基因列表是不穩定的,說明該方法在驗證新的數據集時效果可能會較差,從而產生假陰性或假陽性結果。此外,采用不同方法對同一數據集進行分析,潛在的不穩定性也會導致假陰性或假陽性結果。因此,采用更合理的測量方法來分析不同方法所得結果的穩定性,從而發現真正的疾病易感基因是非常重要的。

4 結語

隨著個性化醫療和轉化醫學的發展,基因診斷和基因治療逐漸成為未來醫學發展的新趨勢。除了應用算法組合和改進策略提高疾病易感基因識別的準確率,加強對基因診斷技術平臺的建設,改進相關領域的醫療儀器和設備也十分重要。目前一些基因診斷技術有限公司已經改進了基于定量PCR的技術平臺和生物芯片技術平臺,為遺傳性疾病、腫瘤的科研及臨床診斷提供了相關的解決方案。

[1] Sethi,JM,Rochester CL.Smoking and chronic obstructive pulmonary diseas[J].Clin Chest Med,2000,21(1):67-86.

[2]Snider GL.Chronic obstructive pulmonary disease:risk factors,pathophysiology and pathogenesis[J].Annu Rev Med, 1989,40:411-429.

[3] Tusher VG,Tibshirani R,Chu G.Significance analysis of microarrays applied to the ionizing radiation response[J].Proc Natl Acad Sci USA,2001,98(9):5116-5121.

[4] Boulesteix AL,Slawski M.Stability and aggregation of ranked gene list[J].Brief Bioinform,2009,10(5):556-568.

[5] Baldi P,Long AD.A Bayesian framework for the analysis of microarray expression data: regularized t-test and statistical inferences of gene changes[J].Bioinformatics,2001,17(6):509-519.

[6] Opgen-Rhein R,Strimmer K.Accurate ranking of differentially expressed genes by a distribution-free shrinkage approach[J].Stat Appl Genet Mol Biol,2007,(6):9.

[7] Lu P,Hankel IL,Hostager BS,et al.The developmental regulator protein Gon4l associates with protein YY1,co-repressor Sin3a,and histone deacetylase 1 and mediates transcriptional repression[J].J Biol Chem,2011,286(20):18311-18319.

[8] Natanek SA,Riddoch-Contreras J,Marsh GS,et al.Yin Yang 1 expression and localisation in quadriceps muscle in COPD[J].Arch Bronconeumol,2011,47(6):296-302.

[9] Steiling K,Kadar AY,Bergerat A,et al.Comparison of Proteomic and Transcriptomic Profiles in the Bronchial Airway Epithelium of Current and Never Smokers[J].PLoS One,2009,4(4):e5043.

[10] Yang X,Bentink S,Scheid S,et al.Similarities of ordered gene lists [J].J Bioinform Comput Biol,2006,4(3):693-708.

[11] Lottaz C,Yang X,Scheid S,et al.OrderedList-a bioconductor package for detecting similarity in ordered gene lists[J].Bioinfor matics,2006,22(18):2315-2316.

Screening of Differentially Expressed Genes of COPD Based on Combined Strategy

HUA Lin1, XIA Hong1,
ZHOU Ping1, AN Li2
1.a.School of Biomedical Engineering; b.Beijing Key Laboratory of Fundamental Research on Biomechanics in Clinical Application, Capital Medical University, Beijing 100069, China;
2.Respiratory Medicine Center, Beijing Chaoyang Hospital, Capital Medical University, Beijing 100020, China

ObjectiveTo screen differentially expressed genes of chronic obstructive pulmonary disease (COPD) through combined strategy.MethodsSignificance analysis of microarrays (SAM) was used to extract the differentially expressed genes of COPD from GEO database, which then were screened through five kinds of genetic sort algorithms. Then stochastic disturbance analysis and function enrichment analysis of the screened genes were conducted.ResultsGON4L and P4HB were important genes related to COPD.ConclusionThe recognition accuracy of susceptibility genes of COPD has been improved with the application of combined strategy.

chronic obstructive pulmonary disease; differentially expressed genes; stochastic disturbance analysis; function enrichment analysis; gene microarray

R563.9

B

10.3969/j.issn.1674-1633.2014.07.050

1674-1633(2014)07-0133-04

2014-01-20

2014-02-10

北京市自然科學基金項目(7142015);北京市教育委員會

科技計劃面上項目(SQKM201210025008);北京市優秀人才培養資助項目(2012D005018000002);國家自然科學基金項目(31100905);首都醫科大學基礎臨床-合作項目(11JL30,11JL33,12JL75)。

本文作者:華琳,首都醫科大學生物醫學工程學院副教授。

安立,副主任醫師。

作者郵箱:hualin7750@139.com

猜你喜歡
一致性差異分析
關注減污降碳協同的一致性和整體性
公民與法治(2022年5期)2022-07-29 00:47:28
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
注重教、學、評一致性 提高一輪復習效率
IOl-master 700和Pentacam測量Kappa角一致性分析
隱蔽失效適航要求符合性驗證分析
找句子差異
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
生物為什么會有差異?
電力系統及其自動化發展趨勢分析
基于事件觸發的多智能體輸入飽和一致性控制
主站蜘蛛池模板: 精品1区2区3区| 99视频免费观看| 久久亚洲欧美综合| 国产无码精品在线| 亚洲福利片无码最新在线播放| 久久免费看片| 综合社区亚洲熟妇p| 91精品视频在线播放| 国产成人av一区二区三区| 国产精品短篇二区| 日韩精品免费一线在线观看| 九九九精品成人免费视频7| 亚洲国产看片基地久久1024 | 97国产精品视频人人做人人爱| 精品五夜婷香蕉国产线看观看| 亚洲成人福利网站| 亚洲日本在线免费观看| 天堂亚洲网| 国产成人亚洲毛片| 狠狠干综合| 九九这里只有精品视频| 狠狠色成人综合首页| 高清视频一区| 欧美一区二区福利视频| 亚洲三级色| 国产无码在线调教| 亚洲精品无码AⅤ片青青在线观看| 亚洲欧美不卡视频| 日本亚洲欧美在线| 国产欧美日韩另类| 午夜福利在线观看成人| 青草娱乐极品免费视频| 亚洲视频在线网| 婷五月综合| 伊人久久大香线蕉aⅴ色| 自慰网址在线观看| 亚洲精品黄| 成人福利在线免费观看| 99视频精品在线观看| 日韩高清中文字幕| 日本国产精品一区久久久| 亚洲人成电影在线播放| 亚洲V日韩V无码一区二区| 在线国产综合一区二区三区| 日本精品中文字幕在线不卡| 综合久久久久久久综合网| 亚洲男人的天堂久久香蕉| 成人免费黄色小视频| 热re99久久精品国99热| 91小视频在线播放| 久久夜色精品| 成人午夜久久| 欧美综合区自拍亚洲综合绿色 | 在线观看免费黄色网址| 暴力调教一区二区三区| 亚洲愉拍一区二区精品| 色悠久久久| 久久精品中文字幕免费| 欧美日韩中文国产va另类| 久久久精品国产SM调教网站| 欧美精品xx| 亚洲综合中文字幕国产精品欧美| 国产午夜精品一区二区三| 中文无码伦av中文字幕| 性视频一区| 欧美在线一级片| 在线精品欧美日韩| 女人18毛片一级毛片在线 | 一区二区理伦视频| 毛片大全免费观看| 欧美一级片在线| 亚洲乱码在线视频| 亚洲欧美综合在线观看| 很黄的网站在线观看| 亚洲综合经典在线一区二区| 国产成人亚洲综合A∨在线播放| 亚洲三级视频在线观看| 日本午夜影院| 国产免费怡红院视频| 97se综合| 亚洲日韩精品综合在线一区二区| 亚洲精品福利网站|