999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基因芯片數據分析方法及其在醫學中的應用

2010-02-09 12:40:31荊志偉王忠
中國醫藥生物技術 2010年6期
關鍵詞:分類方法

荊志偉,王忠

基因芯片數據分析方法及其在醫學中的應用

荊志偉,王忠

基因芯片技術帶來了大規模、高通量的信息,同時也對數據的探索性分析及信息提取提出新的挑戰。伴隨出現的諸多方法,如基因芯片數據的標準化,樣本(或基因)間距離的度量,以及樣本(或基因)的監督和非監督分類等分析方法,力圖將無機的信息數據和有機的生命活動結合起來,闡釋生命特征及基因功能,已成為生物信息學的研究課題[1]。探索基因功能的新技術和新方法[2]亦成為研究的重點,新的分析工具不斷產生[3]。本文就近 5 年來醫學研究領域中基因芯片數據以分類分析方法為主作一綜述。

1 基因芯片數據分析的非監督算法

1.1 系統聚類(hierarchical clustering)

系統聚類根據聚類的方式分為凝聚法(agglomerative approach)和分裂法(divisive approach)。凝聚法按照從下到上的方式對個體進行聚類:初始每個個體為一類,按照一定的規則進行逐步合并,直到所有個體都歸為一類或達到預定的終止條件。因類間相似性的度量方法的不同而又有所差異。分裂法按照從上到下的方式對個體進行聚類:初始所有個體為一類,然后按照一定規則逐漸分裂,直到每個個體形成一類或滿足某個特定的結束條件,如達到預定的類數或兩個最鄰近的類之間的距離超過某預定值。

系統聚類方法簡單,但有時在選擇分裂或合并點時存在困難,因為一旦將一組個體分裂或合并,后續的類將在新類的基礎上產生,而不能取消己經完成的分裂或合并,也不能在類間對個體進行調整。系統聚類分析適合正向同源類基因組數據的分析并具有相對好的穩定性[4]。

1.2 分割聚類(partitioning methods)

最常用的分割算法為 k-means 法和 k-medoids 法。k-means 法是把 n 個觀察個體分成 k 個類,使類內的相似性高,而類間的相似性低。類的相似性用類內觀察個體的均值來度量,此均值被視為類的重心。通過計算新形成的k 類的類均數,達到目標函數收斂。該法的局限性在于:①此方法在較大數據量時的擴展性和效率都較理想,但可能陷入局部最優;②只能用于類均數確定的情況下,若包含分類變量時就不適用;③必須提前確定類數;④受噪聲和異常值的影響較大。目前常先使用凝聚算法確定類數和初始的類,再利用迭代重定位技術提高聚類的效果;k-modes 算法中用模式代替類均數,使用新的非相似性指標處理分類資料,用以頻數為基礎的方法對類的模式進行更替,而 k-prototypes算法(k-means 和 k-modes 的結合)可以處理數值變量和分類變量的混合資料;EM(expectation maximization)算法是 k-means 算法的另一種擴展,把每一個體不是劃為具體的某種類別,而是賦予其屬于各類的概率。如 Srinivasan等[5]運用 k-means 算法比較頸椎病變的轉歸。

1.3 自組織圖(self-organizing maps,SOM)

SOM 是一種基于神經網絡的聚類算法,由若干簡單的拓撲結構的節點構成,且節點中包含了其距離函數,自組織圖的形成就是這些節點以迭代的形式分布到 k維的基因表達空間的過程[6]。其適合于復雜的多維數據的模式識別和特征分類等探索性的分析,它允許對聚類的部分結構施加干預(相比于系統聚類中嚴格的結構、貝葉斯聚類中對先驗假設的要求及 k-means 聚類的無結構,SOM 則更靈活),首先被 Tamayo 等[7]用于基因表達數據的分析。與多維標度法(multi-dimensional scaling,MDS)及主成分分析(principal component analysis,PCA)類似,SOM 可以對數據集中的不同表達模式實現可視化,從而判斷某種模式是否為另外一種模式的變異。如鄭培烝等[8]通過建立基因芯片平臺,用全反式維甲酸誘導急性早幼粒細胞白血病來源的 NB4 細胞分化作為模型,并應用自主開發的自組織圖結合成分平面展示動態地觀察了藥物作用過程。

1.4 模糊聚類(fuzzy clustering)

在實際情況中,基因各功能類間的邊界經常是不能截然分開的,模糊聚類適合于解決此類問題。該方法首先由Bezdek 提出,后被 Guthke 用于基因芯片數據中基因的分類。它給出向量(代表觀察個體或基因)屬于各類的隸屬度,即該向量屬于各類的概率。非監督模糊聚類的應用包括模糊 c-means 法、概率 SOM 法和 Gustafson-plaid 法。GenShaving 聚類和 plaid 聚類也是兩種應用模糊聚類基本概念的方法,plaid 法是一種非監督算法,GenShaving 可以是監督或非監督算法,只是監督算法中應用了向量的先驗知識。兩種方法在模糊聚類的基礎上還允許根據部分樣本(觀察個體或基因)來確定基因(或樣本)的類。

1.5 主成分分析(PCA)

在大規模基因表達數據的分析中,由于組織樣本例數遠遠小于所觀察基因個數,如果直接采用前述聚類分析可能產生較大誤差,故需要對聚類算法進行改進,其中較為流行的是應用 PCA 方法[9]。PCA 的目的是要對多變量數據矩陣進行最佳綜合簡化[10],通過尋找這些變量的線性組合(主成分),使第一主成分最能反映數據間的差異。如 Crescenzi和 Giuliani[11]應用 PCA 對 60 個腫瘤細胞株的基因表達譜數據進行分析,結果發現腫瘤分型相關的基因有1375 個,PCA 得到細胞運動等 5 個獨立的成分。本課題組[12]在聚類分析的基礎上應用 PCA,比較清開靈主要組分黃芩苷、梔子苷及其配伍干預腦缺血損傷的基因表達模式,發現配伍后對黏附相關功能基因的影響大于單一組分組,其基因表達模式和其中的黃芩苷相近。

PCA 利用降維的思想,尋找多變量線性組合的綜合因子,這些主成分之間又是彼此獨立的,故其缺陷是一部分有用信息的丟失。為此,Yeung 和 Ruzzo[13]采用兩個真實數據集和三個模擬數據集作為實驗材料,對采用 PCA 方法所得出的聚類結果作了評估。他們發現,進行主成分處理后的聚類質量沒有明顯提高,甚至有所降低。基于以上研究結果,他們不主張使用 PCA 進行聚類分析。

上述非監督聚類方法盡管在對疾病或生物特性方面已經取得了許多有意義的結果,卻存在著下述三點不足:①不同樣本實驗獲得的基因表達譜存在著噪聲干擾,目前的解決辦法是對每個樣本的基因表達譜進行歸一化處理;②不管對基因還是對樣本,所考慮向量的維數相當高,而樣本個數相對較少,某些情況下結果不穩定,分類的性能難以評價;③難以明確隱含的類別數,非線性 PCA 有助于理解這種復雜表達[14]。這三點是目前非監督聚類方法難于克服的問題。

2 基因芯片數據分析的監督算法

2.1 線性判別分析(linear discriminant analysis,LDA)

線性判別分析首先根據基因樣本數據的先驗知識建立線性判別函數,然后把未知類的樣本代入判別函數,從而判斷新樣本(基因或個體)的類別歸屬,較為適合用于基因芯片數據[15]。線性判別分析的特點是計算簡單,易于應用,一般具有較低的誤差率,但不能處理基因(或個體)間的交互作用。因此,當基因(或個體)間存在復雜的交互作用時,線性判別分析不易發現數據中的規律性。常見的有Diagonal 線性判別分析,Fisher 線性判別分析。另外,與LDA 接近的還包括二次方判別分析等。Cho等[16]應用fisher 判別方法分析腫瘤患者的基因表達譜資料以判別腫瘤的分型;Dangond等[17]將 fisher 判別方法應用于計算肌萎縮側索硬化病的基因表達譜研究。

2.2 k 最臨近分類法(k-nearest neighbor classifiers)

k 最臨近分類法建立在通過類比進行學習的基礎上,訓練樣本由 n 維計量變量描述,而每個觀察個體由 n 維空間中的一個點來描述。當給定一個未知樣本,k 最臨近分類法將在模式空間中搜尋與此樣本最臨近的 k 個觀察個體,這 k 個個體就是該未知觀察個體的 k 個最臨近點。一般采用歐氏距離來衡量臨近程度。未知樣本將被賦予 k 個最臨近的個體中類數最多的類。k 最臨近算法又被稱為“instance-based”或“lazy learners”,因為它把所有的訓練樣本儲存起來,并且在對一個未知個體分類以前不建立任何分類模型。lazy learners 方法在訓練階段要比 eager methods快,而在分類階段比 eager methods 慢。與復雜的分類算法相比具有簡單、直觀、誤差率較低等特點,能夠以“黑箱”的方式處理基因間的交互作用,但不能洞悉數據的結構。

2.3 分類樹算法(classification tree algorithm)

分類樹(又稱判定樹,decision tree)是一種自上而下遞歸地對數據進行分割的算法,如何確定變量選擇的方法是分類樹算法的核心。信息增益是一種變量選擇的方法:具有最大信息增益(嫡的減小最大)的變量作為當前對樣本進行分類的檢驗變量(此檢驗變量稱為一個節點),根據此變量的不同取值對樣本進行分類,此變量將使對樣本分類所需的信息量以及對樣本分類的隨和性和不純性達到最小。最初的分類樹算法較簡單,功能也受到一定的限制,如只能實現對分類資料的處理以及解決模型的過度擬合問題,隨著算法的改進,已能實現計量變量截斷數和截斷點的自動判斷,以及通過修剪算法(包括前剪枝和后剪枝算法)防止模型的過度擬合。分類樹算法能夠探索和揭示基因間的交互作用,對變量在模型中的重要性進行排充,并且結果易于解釋,能獲得預測變量和反應變量間的關系,但分類樹方法在穩定性和精確性方面較差,通過使用改進算法“bagging”和“hosting”可提高其精確性[18]。

2.4 人工神經網絡(artificial neural networks,ANNs)

人工神經網絡最初是心理學家和神經生物學家在研究神經元的計算類似物時提出的。神經網絡是一套相互連接的輸入和輸出單元的集合,每個連接具有一個權重。在學習階段,神經網絡調節權重,使其能對輸入樣本進行明確的分類。通常需要根據經驗對其參數進行最佳設定,如網絡的拓撲結構。神經網絡很難對其權重的象征意義給予解釋,這一特點限制了神經網絡的應用。神經網絡的優點包括對噪聲數據的高度容錯性及對未訓練過的樣本的模式識別能力。理論上已經證明,以任何一種 S 形函數作為神經元的轉換函數,都含有一個隱含層的神經網絡,只要隱含層的神經元足夠多,該網絡就可以擬合數據中任何復雜形式的非線性關系。另外,一些算法已經可以提取訓練后的神經網絡中的規則。這些因素都有利于神經網絡在基因數據分類中的應用。常用的神經網絡有 BP 神經網絡、徑向基網絡、自組織神經網絡及 Hopfield 網絡等,其中以 BP 算法最為常用[19]。如Lancashire 等[20]運用了 ANNs 分析癌癥亞型分類的基因芯片數據。

2.5 貝葉斯分類(bayesian classification)和貝葉斯網絡

貝葉斯分類建立在貝葉斯理論的基礎之上,樸素貝葉斯分類的前提假設是類條件的獨立性,即一個變量對分類的作用獨立于其他變量[21]。理論上講,貝葉斯分類與其他分類方法相比具有最小的誤差率,但由于各種原因,實際情況并非如此,如類條件獨立性的條件不滿足,概率資料無法得到等。對于不同分類方法的比較發現:簡單的貝葉斯分類方法在性能上可以和決策樹、人工神經網絡相比擬,貝葉斯分類在大型數據庫中也表現出了較高的精確性和速度。

貝葉斯分類的前提假設是類條件獨立,此假設簡化了計算,并且當假設成立時,樸素貝葉斯分類與其他分類方法相比具有最高的精確性。實際情況是基因之間通常存在依存關系,貝葉斯網絡定義了聯合條件概率分布,它允許類條件獨立性只在部分變量之間存在,提供了一個因果關系的圖形模型,預期在基因網絡推斷(gene network inference)中發揮重要作用[22]。如 Imoto等[23]結合貝葉斯網絡和生物學知識進行基因表達譜數據的基因網絡分析,并以釀酒酵母的基因表達譜數據為例進行了論證。Kim 等[24]將貝葉斯網絡法應用于時間系列的基因表達譜數據的基因網絡分析等。

3 數據分類模型的性能和評價

對通過基因芯片數據建立的聚類或判別模型,常進行多個方面的性能評價。

3.1 精確性

留取法(holdout method)和交叉驗證(cross validation)方法是評價分類方法精確性的兩種常用技術,它們都建立在對給定數據集的隨機抽樣所得到樣本的基礎之上[25]。留取法是把給定數據隨機分割成獨立的兩部分:訓練集和檢驗集。訓練集用于建立模型;檢驗集用于對建立的模型的精確性進行估計。隨機子抽樣(random subsampling)是對留取方法的改進,其基本思想是重復留取方法 k 次,避免了一次留取可能造成的偏性;k-fold 交叉驗證(k-fold cross-validation)是把初始數據隨機分割成 k 個互不包含的子集,S1,S2,… SK,一般例數近似相等。訓練過程和檢驗過程分別進行 k 次。精確性的估計等于 k 次迭代的檢驗樣本總的分類正確數除以初始數據的總例數。分層交叉驗證是交叉驗證的另一種方法,它對初始樣本的分割是分層抽樣,使得產生的子數據集中類的分布與初始數據中類的分布接近。

3.2 穩健性

擾動法是常用的檢驗模型穩健性的方法,其通過對基因表達數據施加隨機噪聲,比較原始基因表達數據和含噪聲的數據的分類結果,從而評價模型的穩健性[26]。另外還要從模型的計算速度、數據量增大時的可擴展性及結果的可解釋性等方面對基因的分類算法進行評價。Dumur 等[27]建立質控標準,對細胞系、冷凍處理的腫瘤細胞的總 RNA 和商業RNA 對照品的數據分析加以評估,發現高質量的樣本在電泳圖和 cDNA 和 cRNA 合成產物表現為超過 30% 的2.0 ~ 3.0 kb 的 rRNA,認為制定更為精細化的質控標準,對區分基因表達的分析和生物學變異尤為必要。Norris 和Kahn[28]運用均衡概率分析解決了噪聲基因的假陰性率的問題。

4 數據挖掘(data mining)

數據挖掘也稱為數據庫知識發現(knowledge discovery in database,KDD),是從數據庫中識別出有效的、新穎的、潛在有用的、并且最終可理解的模式的非常規過程[29]。這是一個反復的、不斷求精的過程,可以用于基因芯片數據差異表達基因的不同聚類分析和聚類分析有效算法,可以提高數據分析的質量[30]。但迄今為止還沒有一套完整、統一的數據挖掘理論體系來指導有用信息的獲取。

目前已有很多數據挖掘、機器學習系統和工具用于生物信息處理。一般的數據挖掘分析系統有:SAS 挖掘器、IBM智能挖掘器和 SGI MinSet 等。其中 GCG(genetics computer group)主要用于核酸序列分析和蛋白質序列分析。Staden 是 DNA 和蛋白質序列分析的軟件包[31]。此外還有用于大規模測序的 Sequencher,用于快速克隆的 Vector NTI 等。GeneMine 是由 molecular application group 開發的生物信息學數據挖掘系統,該系統可以用于生物信息數據的過濾、計算和聚類操作,并支持進一步的綜合分析和可視化。目前世界數據庫巨頭 ORACLE、IBM 紛紛將生物信息挖掘工具分別嵌入至 ORACLE 9i、DB2 中,大大提高了生物數據的安全性和分析的準確性。

支持向量機(suppport vector machines,SVMs)是數據挖掘中的一個新方法,它通過訓練一種“分類器”來辨識與已知的共調控基因表達類型相似的新基因。SVMs 可以通過定義一個核心函數(kernel function)來確定特征空間中的超平面,此核心函數就代表了特征空間中的點積。該法較好地解決了計算和學習理論問題[32]。當數據量增大時,SVMs 算法可能無法在特征空間中找到一個超平面實現完全的分割,原因可能是該核心函數并不適合于此資料的分類,或訓練樣本本身含有誤分類的基因。使用柔性邊際(soft margin)可以解決后者,它允許基因分到超平面錯誤的一側[33]。如Williams 等[34]為了鑒定出腎母細胞瘤復發的基因表達譜模型,研究了 27 例腎母細胞瘤患者的腫瘤組織,其中 13 例2 年內復發,對復發和未復發的腫瘤組織進行基因芯片實驗,并應用支持向量機對基因表達譜數據進行分析,結果發現了一小類可能用于腫瘤預診的基因。

5 生物信息工具軟件的應用

數據處理的進展必然伴隨著數據平臺軟件的誕生,基于網絡數據庫架構的生物信息學軟件業已在醫學研究中應用,其研究路徑已經拓展到信號通路模擬方面。利用計算機圖形學和圖像處理技術,將復雜數據圖形化,成為近年來基因芯片數據分析軟件的特征。Pathway Studio 可分析基因表達實驗中差異表達基因的分子生物學通路、基因調節網絡及蛋白質之間的交互作用,已經用于癡呆疾病的機制研究[35]。IPA系統(ingenuity pathway analysis)是建立在網絡基礎上的用來分析基因表達、蛋白組學和 SNP 微陣列數據的工具,已經應用于多種疾病的分子機制研究[36]。

6 展望

基因芯片技術及其數據分析已成功應用于醫學研究許多領域,如臨床診斷、藥物篩選、基因突變研究、基因組分型及測序、中醫藥研究等[37]。基因數據的分析方法研究仍處于探索階段,目前的相似性檢測方法多適用于特定的情況下。在實際應用中可以從以下幾個方面對算法進行改進:①強化對來自不同平臺數據的提取和解釋;②噪音數據的消除,改進遴選假陽性樣本的算法;③特征基因的選取,在最少量特征(基因)選取的基礎上得到較高的分類準確率;④嘗試針對某種數據分布,采用粗糙集或模糊集與分類樹以及基于神經網絡與遺傳算法分類法的融合,以提高分類的準確性、穩健性等重要性能。發現數據中所隱藏的信息,快速合理地處理,并且結合醫學研究的目的選擇具有較好精確性和穩健性的方法。即使運用的是現成的工具軟件,亦應明確其數理方法,實現與統計學、信息科學等學科的合理交叉,為基因芯片數據信息的提取提供最佳路徑。

參考文獻

[1] Reimers M. Statistical analysis of microarray data. Addict Biol, 2005, 10(1):23-35.

[2] Handl J, Knowles J, Kell DB. Computational cluster validation in post-genomic data analysis. Bioinformatics, 2005, 21(15):3201-3212.

[3] Khatri P, Dr?ghici S. Ontological analysis of gene expression data: current tools, limitions, and open problems. Bioinformatics, 2005, 21(18):3587-3595.

[4] Uchiyama I. Hierarchical clustering algorithm for comprehensive orthologous-domain classification in multiple genomes. Nucleic Acids Res, 2006, 34(2):647-658.

[5] Srinivasan A, Galbán CJ, Johnson TD, et al. Utility of the k-means clustering algorithm in differentiating apparent diffusion coefficient values of benign and malignant neck pathologies. AJNR Am J Neuroradiol, 2009, 31(4):736-740.

[6] Dougherty ER, Barrera J, Brun M, et al. Inference from clustering with application to gene-expression microarrays. J Comput Biol, 2002, 9(1):418-429.

[7] Tamayo P, Slonim D, Mesirov J, et al. Interpreting pattems of gene expression with self-organizing maps: methods and application to hematopoietic differentiation. Proc Natl Acad Sci U S A, 1999, 96(6):2907-2912.

[8] Zheng PC, Zhao CJ, Du YZ, et al. Establishment of CPP-SOM integrated cDNA microarray technology. Chin J Med Genet, 2004, 21(5):422-425. (in Chinese)鄭培烝, 趙春軍, 杜艷芝, 等. CPP-SOM整合cDNA基因芯片平臺的建立. 中華醫學遺傳學雜志, 2004, 21(5):422-425.

[9] Wang A, Gehan EA. Gene selection for microarray data analysis using principal component analysis. Stat Med, 2005, 24(13):2069-2087.

[10] Diamantaras KI, Kung SY. Principal Component Neural Networks. New York: Wiley-Interscience, 1996:26.

[11] Crescenzi M, Giuliani A. The main biological determinants of tumor line taxonomy elucidated by a principal component analysis of microarray data. FEBS Lett, 2001, 507:114-118.

[12] Jing ZW, Zhou CX, Wang Z, et al. Principal component analysis of gene expression of baicalin, jasminoidin and their combination in experimental stroke. J Traditional Chin Med, 2010, 51(2):164-167. (in Chinese)荊志偉, 周才秀, 王忠, 等. 用主成分分析探索不同中藥組分配伍干預腦缺血的基因表達模式. 中醫雜志,2010, 51(2):164-167.

[13] Yeung KY, Ruzzo WL. Principal component analysis for clustering gene expression data. Bioinformatics, 2001, 17(9):763-774.

[14] Scholz M, Kaplan F, Guy CL, et al. Non-linear PCA: a missing data approach. Bioinformatics, 2005, 21(20):3887-3895.

[15] Lee JW, Lee Jb, Park M, et al. An extensive comparison of recent classification tools applied to microarray data. Comput Stat Data Anal, 2005, 48(4):869-885.

[16] Cho JH, Lee D, Park JH, et al. Gene selection and classification from microarray data using kernel machine. FEBS Lett, 2004, 571(1/3): 93-98.

[17] Dangond F, Hwang D, Camelo S, et al. Molecular signature of late-stage human ALS revealed by expression profiling of postmortem spinal cord gray matter. Physiol Genomics, 2004, 16(2):229-239.

[18] Breiman L. Arcing classifier (with discussion and a rejoinder by the author). Ann Statist, 1998, 26(3):801-849.

[19] Islam MM, Sattar MA, Amin MF, et al. A new adaptive merging and growing algorithm for designing artificial neural networks. IEEE Trans Syst Man Cybern B Cybern, 2009, 39(3):705-722.

[20] Lancashire LJ, Lemetre C, Ball GR. An introduction to artificial neural networks in bioinformatics--application to complex microarray and mass spectrometry datasets in cancer studies. Briefings in Bioinformatics, 2009, 10(3):315-329.

[21] Efemn B, Tibshirani R, Storey JD, et al. Empirical bayes analysis of a microarray experiment. J Am Stats Assoc, 2001, 96(456):1151-1160.

[22] Friedman N, Linial M, Nachman I, et al. Using Bayesian networks to analyze expression data. J Comput Boil, 2000, 7(3/4):601-620.

[23] Imoto S, Higuchi T, Goto T, et al. Combining microarrays and biological knowledge for estimating gene networks via bayesian networks. J Bioinform Comput Biol, 2004, 2(1):77-98.

[24] Kim SY, Imoto S, Miyano S. Inferring gene networks from time series microarray data using dynamic Bayesian networks. Brief Bioinform, 2003, 4(3):228-235.

[25] Azuaje F. A cluster validity framework for genome expression data. Bioinformatics, 2002, 18:319-320.

[26] McShane LM, Radmacher MD, Freidlin B, et al. Methods for assessing reproducibility of clustering patterns observed in analyses of microarray data. Informatics, 2002, 18(11):1462-1469.

[27] Dumur CI, Nasim S, Best AM, et al. Evaluation of quality-control criteria for microarray gene expression analysis. Clin Chem, 2004, 50(11):1994-2002.

[28] Norris AW, Kahn CR. Analysis of gene expression in pathophysiological states: balancing false discovery and false negative rates. Proc Natl Acad Sci U S A, 2006, 103(3):649-653.

[29] Fayyad U, Piatetsky-Shapiro G, Smyth P, et al. Knowledge discovery and data mining: toward a unifying framework. KDD-96, 1996:82-88 [2010-01-20]. http://www.aaai.org/Papers/KDD/1996/KDD96-014.pdf

[30] Bolshakova N, Azuaje F, Cunningham P. An integrated tool for microarray data clustering and cluster validity assessment. Bioinformatics, 2005, 21(4):451-455.

[31] Gershenzon NI, Stormo GD, Ioshikhes IP. Computational technique for improvement of the position-weight matrices for the DNA/protein binding sites. Nucleic Acids Res, 2005, 33(7):2290-2301.

[32] Brown MP, Grundy WN, Lin D, et al. Knowledge-based analysis of microarray gene expression data by using support vector machines.Proc Natl Acad Sci U S A, 2000, 97(1):262-267.

[33] Furey TS, Cristianini N, Duffy N, et al. Supporting vector machines classification and validation of cancer tissue samples using microarray expression data.Bioinformatics, 2000, 16(10):906-914.

[34] Williams RD, Hing SN, Greer BT, et al. Prognostic classification of relapsing favorable histology Wilms tumor using cDNA microarray expression profiling and support vector machines. Genes Chromosomes Cancer, 2004, 41(1):65-79.

[35] Durrenberger PF, Filiou MD, Moran LB, et al. DnaJB6 is present in the core of Lewy bodies and is highly up-regulated in parkinsonian astrocytes. J Neurosci Res, 2008, 87(1):238-245.

[36] Ghosh M, Aguila HL, Michaud J, et al. Essential role of the RNA-binding protein HuR in progenitor cell survival in mice. J Clin Invest, 2009, 119(12):3530-3543.

[37] Licino J, Wong ML, Wong L. Pharmacogenomics. Berlin: WILEY-VCH Verlag GmbH & Co. KGaA, 2002:79-109.

基金項目:國家“十一五”科技支撐計劃(2006BAI08B04-06)

作者單位:100700 北京,中國中醫科學院中醫臨床基礎醫學研究所

通訊作者:王忠,Email:zhonw@vip.sina.com

收稿日期:2010-01-27

DOI:10.3969/cmba.j.issn.1673-713X.2010.06.010

猜你喜歡
分類方法
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
學習方法
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
給塑料分分類吧
主站蜘蛛池模板: 亚洲国产理论片在线播放| 激情五月婷婷综合网| 精品人妻一区二区三区蜜桃AⅤ| 5555国产在线观看| 免费三A级毛片视频| 又黄又湿又爽的视频| www.av男人.com| 久久精品嫩草研究院| 亚洲电影天堂在线国语对白| 国产成人乱无码视频| 国产白浆视频| 91精品专区| 毛片网站在线看| 免费无遮挡AV| 99精品国产自在现线观看| 亚洲日韩每日更新| 波多野结衣在线一区二区| 国产精品lululu在线观看| 91www在线观看| 国产区人妖精品人妖精品视频| 欧美色图久久| 色综合天天综合| 日本亚洲成高清一区二区三区| 91成人在线免费视频| 国产18在线播放| 欧美色99| 欧美日韩综合网| 在线视频亚洲色图| 91久久国产综合精品| 色综合国产| 亚洲第一成年人网站| 最新日韩AV网址在线观看| 国产青榴视频| 国产福利2021最新在线观看| 国产亚洲精久久久久久无码AV| 乱人伦99久久| 国产伦精品一区二区三区视频优播 | 国产97视频在线| 国产精品 欧美激情 在线播放| 秋霞午夜国产精品成人片| 成人在线视频一区| 欧美啪啪精品| 国产成人一区免费观看| 亚洲最新地址| 国产黄在线免费观看| 日韩a在线观看免费观看| 欧美色综合网站| 欧美久久网| 久久久久久国产精品mv| 国产美女久久久久不卡| 亚洲中文久久精品无玛| 欧美啪啪一区| 欧美区国产区| 亚洲无码久久久久| 狠狠ⅴ日韩v欧美v天堂| 毛片手机在线看| 午夜激情婷婷| 国产在线观看精品| 色哟哟国产成人精品| 熟妇无码人妻| 精品一区二区三区水蜜桃| 亚洲性影院| 国内精品视频区在线2021| 5555国产在线观看| 四虎国产在线观看| 伊人久久久久久久| 欧美综合成人| 亚洲欧美一区二区三区蜜芽| 国产AV毛片| 精品久久777| 国产精品分类视频分类一区| 91在线精品麻豆欧美在线| 尤物国产在线| 国产精品亚洲精品爽爽 | 精品国产中文一级毛片在线看| 欧美精品1区| 亚洲精品无码抽插日韩| 久久成人免费| 无码不卡的中文字幕视频| 中文字幕2区| 久久一级电影| 亚洲男人天堂2020|