999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

灰色關(guān)聯(lián)決策在NSNP曲線擬合中的應(yīng)用

2012-07-24 09:35:38郭曉龍
統(tǒng)計(jì)與決策 2012年20期
關(guān)鍵詞:關(guān)聯(lián)

邱 路,蔣 艷,郭曉龍

(上海理工大學(xué) 管理學(xué)院,上海 200093)

0 引言

近些年來,隨著人類全基因技術(shù)發(fā)生了迅猛的發(fā)展,分析研究基因變異以及基因讀取的軟件和算法也越來越先進(jìn)[1][2]。其中以生物統(tǒng)計(jì)學(xué)的發(fā)展最為明顯,對(duì)于龐雜的生物數(shù)據(jù)進(jìn)行匯總,并且對(duì)其進(jìn)行計(jì)算研究,最后得出一些有利于科學(xué)家進(jìn)行進(jìn)一步研究的素材,這極大地推動(dòng)了基因技術(shù)的發(fā)展。可是由于統(tǒng)計(jì)學(xué)的方法畢竟是有限的,在處理一些數(shù)據(jù)時(shí),并不能真實(shí)有效地反映出這些數(shù)據(jù)的確切含義,而且有時(shí)精確度也有待于提高。

單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)為DNA序列變異的基本形式。SNP不僅可以作為遺傳學(xué)標(biāo)記,通過連鎖或關(guān)聯(lián)分析定位疾病易感基因,而且有些SNP本身就可以導(dǎo)致疾病,SNP對(duì)疾病的早期風(fēng)險(xiǎn)評(píng)估、早期診斷、預(yù)防和治療等各方面均有巨大的應(yīng)用價(jià)值[7]。為了探求人類的基因庫中NSNPS(Novel SNPs)的變化規(guī)律,文獻(xiàn)[1]中用了隨機(jī)排序算法,將每一次排序所得的NSNP數(shù)量進(jìn)行平均化,最后用STATA軟件擬合出來一條曲線,擬合的確定系數(shù)98.3%。本文為了進(jìn)一步提高曲線的擬合可信度,分別采用matlab和spss對(duì)于NSNP進(jìn)行了4種模型的預(yù)測,4種模型中有3個(gè)確定系數(shù)都在99.8%左右。本文進(jìn)一步引入灰色關(guān)聯(lián)評(píng)價(jià)方法,在3個(gè)確定系數(shù)都是99.8%的曲線中再擬合出一個(gè)最優(yōu)的曲線。結(jié)果表明該方法對(duì)提高擬合曲線精確度有明顯的效果。

1 模型建立與問題描述

本文采取了排序算法[1]對(duì)于44個(gè)人全基因組外顯子上的SNP進(jìn)行了研究。本文采用R軟件中隨機(jī)排序算法對(duì)44個(gè)隨機(jī)數(shù)進(jìn)行1000次全排列,如表1。

表1 44個(gè)全基因組外顯子SNP序列一次隨機(jī)排列表

在此基礎(chǔ)上,將這44個(gè)全基因組上的NSNP和合并后的NSNP進(jìn)行對(duì)比,每次對(duì)比都刪除重復(fù)的NSNP,最后對(duì)1000次結(jié)果求平均數(shù)。對(duì)比后的數(shù)據(jù)序列如表2所示。該表中數(shù)據(jù)包括44個(gè)基因組每次的NSNPs數(shù),每個(gè)基因組中NSNPs的1000對(duì)比后的平均數(shù)。

表2 NSNP匯總表

表2中的平均值和基因組數(shù)作成曲線如圖1:

圖1 44個(gè)基因組中NSNP變化趨勢圖

為了對(duì)NSNP的數(shù)量進(jìn)行預(yù)測,在這里我們采取了擬合曲線的方法,圖2是分別用matlab和spss軟件擬合的幾條曲線。

圖24 種模型的擬合圖

從圖2可以看出,幾條擬合曲線都比較理想。他們的確定系數(shù)如下:雖然這四條曲線和原曲線的差別相當(dāng)小,但其與原曲線的區(qū)分度依然值得提高。本文采用灰色關(guān)聯(lián)評(píng)價(jià)方法以得到一條最能精確表達(dá)原曲線的函數(shù)。

2 方法提出與數(shù)據(jù)處理

灰色關(guān)聯(lián)分析的基本思想是根據(jù)序列曲線的集合形狀的相似程度來判斷其聯(lián)系是否緊密。曲線越接近,相應(yīng)序列之間的關(guān)聯(lián)度也就越大[8]。進(jìn)行灰色關(guān)聯(lián)評(píng)價(jià)的步驟如下:

首先,選取一條序列為參考序列,在這里我們采取NSNPS數(shù)這條原序列為參考序列。

X0=(X0(1),X0(2),X0(3)…X0(43),X0(44))=(3272.98,2768.01,2586.54…1489.43,1482.77)將其余四條曲線也分別變換成數(shù)字序列形式:令matlab擬合的冪曲線1:

X1=(X1(1),X1(2),X1(3)…X1(43),X1(44))=(3257.00,2824.79,2599.06,…,1504.19,1497.10)

令matlab擬合的冪曲線2:

X2=(X2(1),X2(2),X2(3)…X2(43),X2(44))=(3230.3,2819.79,2601.64,…,1495.08,1487.58)

令spss擬合的冪曲線:

X3=(X3(1),X3(2),X3(3)…X3(43),X3(44))=(3273.36,2835.83,2607353,…,1502.67,1495.54)

令spss擬合的對(duì)數(shù)曲線:

X4=X4(1),X4(2),X4(3)…X4(43),X4(44)=(3068.63,2771.09,2597.05,…,1454.13,1444.27)

其次,對(duì)于X0,X1,X2,X3,X4這5個(gè)數(shù)列進(jìn)行無量綱化。在這里采取均值像法:

xi(k)d=無量綱化的5個(gè)序列如表3。

表3 無量綱化的五個(gè)序列

幾種灰色關(guān)聯(lián)度的公式如下:[9]

(1)灰色絕對(duì)關(guān)聯(lián)公式為:

(2)灰色相對(duì)關(guān)聯(lián)度公式為:

其中(n)是xi(n)初值像的始點(diǎn)零化像。

(3)灰綜合關(guān)聯(lián)度公式為:

(4)灰色相似關(guān)聯(lián)度公式為:

灰色系統(tǒng)理論建模系統(tǒng)3.0是一套用Visual Basic6.0開發(fā)的第一套基于Windows視窗界面的灰色系統(tǒng)建模軟件。[9]這套軟件極大地簡化了數(shù)據(jù)輸入中的繁瑣過程,便利了灰色關(guān)聯(lián)度的計(jì)算。

最后,將表3中的經(jīng)過無量綱化的數(shù)據(jù)導(dǎo)入到灰色系統(tǒng)建模軟件中,分別得出了4條曲線和原NSNP曲線的灰色關(guān)聯(lián)度,如表4所示:

表4 4種灰色關(guān)聯(lián)度對(duì)比表

由表4可見,四種灰色關(guān)聯(lián)度中X3與X0都是最大的,也就是說用SPSS軟件擬合的冪曲線是最優(yōu)曲線,方程為:Y=3273.356X-0.207。在這四種灰色關(guān)聯(lián)度中,灰色相似關(guān)聯(lián)度區(qū)分度最高,這也符合了灰色相似關(guān)聯(lián)度的基本思想:根據(jù)曲線幾何形狀來判斷不同序列之間的聯(lián)系是否緊密。

3 結(jié)論

為了探求44個(gè)全基因組上NSNP出現(xiàn)的規(guī)律,我們采取了擬合的方法,有利于對(duì)于更多數(shù)量的基因出現(xiàn)時(shí)對(duì)NSNP進(jìn)行預(yù)測。文獻(xiàn)[1]中采取的是STATA軟件,最后的確定系數(shù)是98.3%,并沒有達(dá)到最優(yōu)的擬合效果。本文用matlab和SPSS擬合,并用灰色關(guān)聯(lián)決策進(jìn)行最后擬合比選,確定系數(shù)大于99.8%。可見采取多種軟件進(jìn)行擬合,并用灰色關(guān)聯(lián)決策理論進(jìn)行最后的擬合比選的這種決策思想,為基因變異數(shù)量的預(yù)測提供了一個(gè)很有開創(chuàng)性的方法。

[1]Kimberly Pelak,Kevin V,Shianna,et al.The Characterization of Twen?ty Sequenced Human Genomes[Z].PLoS Genet 6(9):e1001111.doi:10.1371/journal.pgen.1001111.

[2]Li H,Durbin R.Fast and Accurate Short Read Alignment with Bur?rows-Wheeler Transform[J].Bioinformatics,2009,25.

[3]Li-Juan,Zhang,Zhou-Jun,Li,Huo-Wang,Chenand,Jian Wen.Mini?mum Redundancy Gene Selection Based on Grey Relational Analysis[J].Computer Science2006,4265.

[4]崔立志,劉思峰,李致平,崔杰.一種新的灰色相似關(guān)聯(lián)度模型及其應(yīng)用[M].統(tǒng)計(jì)與決策,2010,(7).

[5]黨耀國,劉思峰.灰色斜率關(guān)聯(lián)度的改進(jìn)[J].中國工程科學(xué),2004,6(3).

[6]謝乃明,劉思峰.幾類關(guān)聯(lián)度的平行性和一致性[J].系統(tǒng)工程,2007,25(8).

[7]張小燕,胡木林,周才秀,王忠,陳沁.中風(fēng)易感性與候選基因SNP位點(diǎn)關(guān)聯(lián)研究[J].生物技術(shù)通報(bào),2008,(增刊).

[8]鄧聚龍.灰理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002.

[9]劉思峰,黨耀國,方志耕,謝乃明.灰色系統(tǒng)理論及應(yīng)用[M].北京:科學(xué)出版社,2010.

[10]寧宣熙,劉思峰.管理預(yù)測與決策方法[M].北京:科學(xué)出版社,2008.

猜你喜歡
關(guān)聯(lián)
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
船山與宋學(xué)關(guān)聯(lián)的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
新制度關(guān)聯(lián)、組織控制與社會(huì)組織的倡導(dǎo)行為
奇趣搭配
基于廣義關(guān)聯(lián)聚類圖的分層關(guān)聯(lián)多目標(biāo)跟蹤
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫(yī)學(xué)與因明學(xué)之間的關(guān)聯(lián)
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監(jiān)測數(shù)據(jù)的關(guān)聯(lián)負(fù)選擇分步識(shí)別算法
主站蜘蛛池模板: 亚洲国产精品久久久久秋霞影院| 亚洲区一区| 国产成人精品高清不卡在线| 国产黄在线观看| 亚洲一区二区三区麻豆| 91热爆在线| 九九久久精品免费观看| 亚洲h视频在线| 久久不卡精品| 在线播放精品一区二区啪视频| 91在线国内在线播放老师| 亚洲中文字幕日产无码2021| 免费jjzz在在线播放国产| 久久这里只精品热免费99| 国产精品一线天| 中文字幕第4页| 国产chinese男男gay视频网| 精品国产91爱| 伊人欧美在线| 91美女视频在线| 91欧美亚洲国产五月天| 国产精品永久久久久| 亚洲第一色视频| 97国产精品视频自在拍| 国产成人免费| 亚洲综合婷婷激情| 亚洲综合精品第一页| 欧美日韩国产在线人| 午夜国产精品视频| 亚洲乱强伦| 精品免费在线视频| 1769国产精品免费视频| 九色免费视频| 伊人久久大香线蕉aⅴ色| 91黄色在线观看| 午夜国产大片免费观看| 欧美日韩精品综合在线一区| 99九九成人免费视频精品| 91久久天天躁狠狠躁夜夜| 国产成人精品一区二区| 朝桐光一区二区| 亚洲免费黄色网| 91精品国产一区| 亚洲天堂首页| 国产青青草视频| 她的性爱视频| 欧美国产精品不卡在线观看 | 熟妇人妻无乱码中文字幕真矢织江| 网友自拍视频精品区| 成人字幕网视频在线观看| 动漫精品中文字幕无码| 国产成人精品无码一区二| 中文精品久久久久国产网址| 欧美无专区| 91青青草视频在线观看的| 国产自无码视频在线观看| 为你提供最新久久精品久久综合| 欧美成人午夜影院| 欧美精品在线看| 精品亚洲麻豆1区2区3区| 一本久道久久综合多人| 国产微拍一区| 偷拍久久网| 91九色国产porny| 亚洲第一视频区| 国产啪在线| 欧美视频在线观看第一页| 色亚洲成人| 久久国产精品电影| 香港一级毛片免费看| 91视频青青草| 国产一区三区二区中文在线| 婷婷综合亚洲| 日韩在线2020专区| 色国产视频| 亚洲欧美在线综合图区| 丁香婷婷激情网| 蜜芽国产尤物av尤物在线看| 国产91小视频在线观看| 日韩欧美中文在线| 精品夜恋影院亚洲欧洲| 国产美女无遮挡免费视频|