999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

灰色關(guān)聯(lián)決策在NSNP曲線擬合中的應(yīng)用

2012-07-24 09:35:38郭曉龍
統(tǒng)計(jì)與決策 2012年20期
關(guān)鍵詞:關(guān)聯(lián)

邱 路,蔣 艷,郭曉龍

(上海理工大學(xué) 管理學(xué)院,上海 200093)

0 引言

近些年來,隨著人類全基因技術(shù)發(fā)生了迅猛的發(fā)展,分析研究基因變異以及基因讀取的軟件和算法也越來越先進(jìn)[1][2]。其中以生物統(tǒng)計(jì)學(xué)的發(fā)展最為明顯,對(duì)于龐雜的生物數(shù)據(jù)進(jìn)行匯總,并且對(duì)其進(jìn)行計(jì)算研究,最后得出一些有利于科學(xué)家進(jìn)行進(jìn)一步研究的素材,這極大地推動(dòng)了基因技術(shù)的發(fā)展。可是由于統(tǒng)計(jì)學(xué)的方法畢竟是有限的,在處理一些數(shù)據(jù)時(shí),并不能真實(shí)有效地反映出這些數(shù)據(jù)的確切含義,而且有時(shí)精確度也有待于提高。

單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)為DNA序列變異的基本形式。SNP不僅可以作為遺傳學(xué)標(biāo)記,通過連鎖或關(guān)聯(lián)分析定位疾病易感基因,而且有些SNP本身就可以導(dǎo)致疾病,SNP對(duì)疾病的早期風(fēng)險(xiǎn)評(píng)估、早期診斷、預(yù)防和治療等各方面均有巨大的應(yīng)用價(jià)值[7]。為了探求人類的基因庫中NSNPS(Novel SNPs)的變化規(guī)律,文獻(xiàn)[1]中用了隨機(jī)排序算法,將每一次排序所得的NSNP數(shù)量進(jìn)行平均化,最后用STATA軟件擬合出來一條曲線,擬合的確定系數(shù)98.3%。本文為了進(jìn)一步提高曲線的擬合可信度,分別采用matlab和spss對(duì)于NSNP進(jìn)行了4種模型的預(yù)測,4種模型中有3個(gè)確定系數(shù)都在99.8%左右。本文進(jìn)一步引入灰色關(guān)聯(lián)評(píng)價(jià)方法,在3個(gè)確定系數(shù)都是99.8%的曲線中再擬合出一個(gè)最優(yōu)的曲線。結(jié)果表明該方法對(duì)提高擬合曲線精確度有明顯的效果。

1 模型建立與問題描述

本文采取了排序算法[1]對(duì)于44個(gè)人全基因組外顯子上的SNP進(jìn)行了研究。本文采用R軟件中隨機(jī)排序算法對(duì)44個(gè)隨機(jī)數(shù)進(jìn)行1000次全排列,如表1。

表1 44個(gè)全基因組外顯子SNP序列一次隨機(jī)排列表

在此基礎(chǔ)上,將這44個(gè)全基因組上的NSNP和合并后的NSNP進(jìn)行對(duì)比,每次對(duì)比都刪除重復(fù)的NSNP,最后對(duì)1000次結(jié)果求平均數(shù)。對(duì)比后的數(shù)據(jù)序列如表2所示。該表中數(shù)據(jù)包括44個(gè)基因組每次的NSNPs數(shù),每個(gè)基因組中NSNPs的1000對(duì)比后的平均數(shù)。

表2 NSNP匯總表

表2中的平均值和基因組數(shù)作成曲線如圖1:

圖1 44個(gè)基因組中NSNP變化趨勢圖

為了對(duì)NSNP的數(shù)量進(jìn)行預(yù)測,在這里我們采取了擬合曲線的方法,圖2是分別用matlab和spss軟件擬合的幾條曲線。

圖24 種模型的擬合圖

從圖2可以看出,幾條擬合曲線都比較理想。他們的確定系數(shù)如下:雖然這四條曲線和原曲線的差別相當(dāng)小,但其與原曲線的區(qū)分度依然值得提高。本文采用灰色關(guān)聯(lián)評(píng)價(jià)方法以得到一條最能精確表達(dá)原曲線的函數(shù)。

2 方法提出與數(shù)據(jù)處理

灰色關(guān)聯(lián)分析的基本思想是根據(jù)序列曲線的集合形狀的相似程度來判斷其聯(lián)系是否緊密。曲線越接近,相應(yīng)序列之間的關(guān)聯(lián)度也就越大[8]。進(jìn)行灰色關(guān)聯(lián)評(píng)價(jià)的步驟如下:

首先,選取一條序列為參考序列,在這里我們采取NSNPS數(shù)這條原序列為參考序列。

X0=(X0(1),X0(2),X0(3)…X0(43),X0(44))=(3272.98,2768.01,2586.54…1489.43,1482.77)將其余四條曲線也分別變換成數(shù)字序列形式:令matlab擬合的冪曲線1:

X1=(X1(1),X1(2),X1(3)…X1(43),X1(44))=(3257.00,2824.79,2599.06,…,1504.19,1497.10)

令matlab擬合的冪曲線2:

X2=(X2(1),X2(2),X2(3)…X2(43),X2(44))=(3230.3,2819.79,2601.64,…,1495.08,1487.58)

令spss擬合的冪曲線:

X3=(X3(1),X3(2),X3(3)…X3(43),X3(44))=(3273.36,2835.83,2607353,…,1502.67,1495.54)

令spss擬合的對(duì)數(shù)曲線:

X4=X4(1),X4(2),X4(3)…X4(43),X4(44)=(3068.63,2771.09,2597.05,…,1454.13,1444.27)

其次,對(duì)于X0,X1,X2,X3,X4這5個(gè)數(shù)列進(jìn)行無量綱化。在這里采取均值像法:

xi(k)d=無量綱化的5個(gè)序列如表3。

表3 無量綱化的五個(gè)序列

幾種灰色關(guān)聯(lián)度的公式如下:[9]

(1)灰色絕對(duì)關(guān)聯(lián)公式為:

(2)灰色相對(duì)關(guān)聯(lián)度公式為:

其中(n)是xi(n)初值像的始點(diǎn)零化像。

(3)灰綜合關(guān)聯(lián)度公式為:

(4)灰色相似關(guān)聯(lián)度公式為:

灰色系統(tǒng)理論建模系統(tǒng)3.0是一套用Visual Basic6.0開發(fā)的第一套基于Windows視窗界面的灰色系統(tǒng)建模軟件。[9]這套軟件極大地簡化了數(shù)據(jù)輸入中的繁瑣過程,便利了灰色關(guān)聯(lián)度的計(jì)算。

最后,將表3中的經(jīng)過無量綱化的數(shù)據(jù)導(dǎo)入到灰色系統(tǒng)建模軟件中,分別得出了4條曲線和原NSNP曲線的灰色關(guān)聯(lián)度,如表4所示:

表4 4種灰色關(guān)聯(lián)度對(duì)比表

由表4可見,四種灰色關(guān)聯(lián)度中X3與X0都是最大的,也就是說用SPSS軟件擬合的冪曲線是最優(yōu)曲線,方程為:Y=3273.356X-0.207。在這四種灰色關(guān)聯(lián)度中,灰色相似關(guān)聯(lián)度區(qū)分度最高,這也符合了灰色相似關(guān)聯(lián)度的基本思想:根據(jù)曲線幾何形狀來判斷不同序列之間的聯(lián)系是否緊密。

3 結(jié)論

為了探求44個(gè)全基因組上NSNP出現(xiàn)的規(guī)律,我們采取了擬合的方法,有利于對(duì)于更多數(shù)量的基因出現(xiàn)時(shí)對(duì)NSNP進(jìn)行預(yù)測。文獻(xiàn)[1]中采取的是STATA軟件,最后的確定系數(shù)是98.3%,并沒有達(dá)到最優(yōu)的擬合效果。本文用matlab和SPSS擬合,并用灰色關(guān)聯(lián)決策進(jìn)行最后擬合比選,確定系數(shù)大于99.8%。可見采取多種軟件進(jìn)行擬合,并用灰色關(guān)聯(lián)決策理論進(jìn)行最后的擬合比選的這種決策思想,為基因變異數(shù)量的預(yù)測提供了一個(gè)很有開創(chuàng)性的方法。

[1]Kimberly Pelak,Kevin V,Shianna,et al.The Characterization of Twen?ty Sequenced Human Genomes[Z].PLoS Genet 6(9):e1001111.doi:10.1371/journal.pgen.1001111.

[2]Li H,Durbin R.Fast and Accurate Short Read Alignment with Bur?rows-Wheeler Transform[J].Bioinformatics,2009,25.

[3]Li-Juan,Zhang,Zhou-Jun,Li,Huo-Wang,Chenand,Jian Wen.Mini?mum Redundancy Gene Selection Based on Grey Relational Analysis[J].Computer Science2006,4265.

[4]崔立志,劉思峰,李致平,崔杰.一種新的灰色相似關(guān)聯(lián)度模型及其應(yīng)用[M].統(tǒng)計(jì)與決策,2010,(7).

[5]黨耀國,劉思峰.灰色斜率關(guān)聯(lián)度的改進(jìn)[J].中國工程科學(xué),2004,6(3).

[6]謝乃明,劉思峰.幾類關(guān)聯(lián)度的平行性和一致性[J].系統(tǒng)工程,2007,25(8).

[7]張小燕,胡木林,周才秀,王忠,陳沁.中風(fēng)易感性與候選基因SNP位點(diǎn)關(guān)聯(lián)研究[J].生物技術(shù)通報(bào),2008,(增刊).

[8]鄧聚龍.灰理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002.

[9]劉思峰,黨耀國,方志耕,謝乃明.灰色系統(tǒng)理論及應(yīng)用[M].北京:科學(xué)出版社,2010.

[10]寧宣熙,劉思峰.管理預(yù)測與決策方法[M].北京:科學(xué)出版社,2008.

猜你喜歡
關(guān)聯(lián)
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
船山與宋學(xué)關(guān)聯(lián)的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
新制度關(guān)聯(lián)、組織控制與社會(huì)組織的倡導(dǎo)行為
奇趣搭配
基于廣義關(guān)聯(lián)聚類圖的分層關(guān)聯(lián)多目標(biāo)跟蹤
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫(yī)學(xué)與因明學(xué)之間的關(guān)聯(lián)
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監(jiān)測數(shù)據(jù)的關(guān)聯(lián)負(fù)選擇分步識(shí)別算法
主站蜘蛛池模板: 国产理论最新国产精品视频| h视频在线播放| 欧美www在线观看| 国产精品一区二区无码免费看片| 国产精品无码AⅤ在线观看播放| 天堂中文在线资源| 97国产精品视频人人做人人爱| 五月婷婷激情四射| 91年精品国产福利线观看久久| 国产v欧美v日韩v综合精品| 亚洲美女一区二区三区| 思思热精品在线8| 久久福利网| 欧美a在线视频| 22sihu国产精品视频影视资讯| 久久亚洲国产一区二区| 国产亚洲视频播放9000| 欧美a√在线| 国产日韩欧美在线视频免费观看| 99视频在线精品免费观看6| 一级毛片免费不卡在线视频| 久久人妻系列无码一区| 中美日韩在线网免费毛片视频| 亚洲欧美日韩高清综合678| 亚洲免费毛片| a欧美在线| 亚洲综合婷婷激情| 国产91精品最新在线播放| 找国产毛片看| 欧美一级夜夜爽www| 亚洲精品在线影院| 九色国产在线| 国产福利拍拍拍| 人妻91无码色偷偷色噜噜噜| 亚洲中久无码永久在线观看软件 | 久无码久无码av无码| 日韩高清中文字幕| 2021精品国产自在现线看| 乱系列中文字幕在线视频| 538国产视频| 一本大道无码高清| 亚洲精品色AV无码看| 日本人又色又爽的视频| 久久黄色一级片| 欧美亚洲日韩中文| 亚洲国产日韩一区| 亚洲第一天堂无码专区| 热伊人99re久久精品最新地| 99热这里只有精品在线观看| 黄色福利在线| 香蕉色综合| 在线免费观看a视频| 亚洲人成网站色7777| 网友自拍视频精品区| 国产h视频在线观看视频| www成人国产在线观看网站| 亚洲性一区| 国产波多野结衣中文在线播放 | 亚洲精品视频在线观看视频| 亚洲人成网址| 亚洲区第一页| 欧美国产日韩另类| 无码中文字幕精品推荐| 婷婷午夜影院| 久久综合色视频| 精品久久久久久中文字幕女 | 无码国产偷倩在线播放老年人| 久久无码高潮喷水| 免费aa毛片| 免费不卡在线观看av| 国产成人超碰无码| 91精品国产一区| 久久鸭综合久久国产| 暴力调教一区二区三区| 国产成人高清精品免费软件| 99re视频在线| 国产精品999在线| 国产三级精品三级在线观看| 一本一本大道香蕉久在线播放| 99热免费在线| 人妻中文久热无码丝袜| 国产乱子伦精品视频|