999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

灰色關(guān)聯(lián)決策在NSNP曲線擬合中的應(yīng)用

2012-07-24 09:35:38郭曉龍
統(tǒng)計(jì)與決策 2012年20期
關(guān)鍵詞:關(guān)聯(lián)

邱 路,蔣 艷,郭曉龍

(上海理工大學(xué) 管理學(xué)院,上海 200093)

0 引言

近些年來,隨著人類全基因技術(shù)發(fā)生了迅猛的發(fā)展,分析研究基因變異以及基因讀取的軟件和算法也越來越先進(jìn)[1][2]。其中以生物統(tǒng)計(jì)學(xué)的發(fā)展最為明顯,對(duì)于龐雜的生物數(shù)據(jù)進(jìn)行匯總,并且對(duì)其進(jìn)行計(jì)算研究,最后得出一些有利于科學(xué)家進(jìn)行進(jìn)一步研究的素材,這極大地推動(dòng)了基因技術(shù)的發(fā)展。可是由于統(tǒng)計(jì)學(xué)的方法畢竟是有限的,在處理一些數(shù)據(jù)時(shí),并不能真實(shí)有效地反映出這些數(shù)據(jù)的確切含義,而且有時(shí)精確度也有待于提高。

單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)為DNA序列變異的基本形式。SNP不僅可以作為遺傳學(xué)標(biāo)記,通過連鎖或關(guān)聯(lián)分析定位疾病易感基因,而且有些SNP本身就可以導(dǎo)致疾病,SNP對(duì)疾病的早期風(fēng)險(xiǎn)評(píng)估、早期診斷、預(yù)防和治療等各方面均有巨大的應(yīng)用價(jià)值[7]。為了探求人類的基因庫中NSNPS(Novel SNPs)的變化規(guī)律,文獻(xiàn)[1]中用了隨機(jī)排序算法,將每一次排序所得的NSNP數(shù)量進(jìn)行平均化,最后用STATA軟件擬合出來一條曲線,擬合的確定系數(shù)98.3%。本文為了進(jìn)一步提高曲線的擬合可信度,分別采用matlab和spss對(duì)于NSNP進(jìn)行了4種模型的預(yù)測,4種模型中有3個(gè)確定系數(shù)都在99.8%左右。本文進(jìn)一步引入灰色關(guān)聯(lián)評(píng)價(jià)方法,在3個(gè)確定系數(shù)都是99.8%的曲線中再擬合出一個(gè)最優(yōu)的曲線。結(jié)果表明該方法對(duì)提高擬合曲線精確度有明顯的效果。

1 模型建立與問題描述

本文采取了排序算法[1]對(duì)于44個(gè)人全基因組外顯子上的SNP進(jìn)行了研究。本文采用R軟件中隨機(jī)排序算法對(duì)44個(gè)隨機(jī)數(shù)進(jìn)行1000次全排列,如表1。

表1 44個(gè)全基因組外顯子SNP序列一次隨機(jī)排列表

在此基礎(chǔ)上,將這44個(gè)全基因組上的NSNP和合并后的NSNP進(jìn)行對(duì)比,每次對(duì)比都刪除重復(fù)的NSNP,最后對(duì)1000次結(jié)果求平均數(shù)。對(duì)比后的數(shù)據(jù)序列如表2所示。該表中數(shù)據(jù)包括44個(gè)基因組每次的NSNPs數(shù),每個(gè)基因組中NSNPs的1000對(duì)比后的平均數(shù)。

表2 NSNP匯總表

表2中的平均值和基因組數(shù)作成曲線如圖1:

圖1 44個(gè)基因組中NSNP變化趨勢圖

為了對(duì)NSNP的數(shù)量進(jìn)行預(yù)測,在這里我們采取了擬合曲線的方法,圖2是分別用matlab和spss軟件擬合的幾條曲線。

圖24 種模型的擬合圖

從圖2可以看出,幾條擬合曲線都比較理想。他們的確定系數(shù)如下:雖然這四條曲線和原曲線的差別相當(dāng)小,但其與原曲線的區(qū)分度依然值得提高。本文采用灰色關(guān)聯(lián)評(píng)價(jià)方法以得到一條最能精確表達(dá)原曲線的函數(shù)。

2 方法提出與數(shù)據(jù)處理

灰色關(guān)聯(lián)分析的基本思想是根據(jù)序列曲線的集合形狀的相似程度來判斷其聯(lián)系是否緊密。曲線越接近,相應(yīng)序列之間的關(guān)聯(lián)度也就越大[8]。進(jìn)行灰色關(guān)聯(lián)評(píng)價(jià)的步驟如下:

首先,選取一條序列為參考序列,在這里我們采取NSNPS數(shù)這條原序列為參考序列。

X0=(X0(1),X0(2),X0(3)…X0(43),X0(44))=(3272.98,2768.01,2586.54…1489.43,1482.77)將其余四條曲線也分別變換成數(shù)字序列形式:令matlab擬合的冪曲線1:

X1=(X1(1),X1(2),X1(3)…X1(43),X1(44))=(3257.00,2824.79,2599.06,…,1504.19,1497.10)

令matlab擬合的冪曲線2:

X2=(X2(1),X2(2),X2(3)…X2(43),X2(44))=(3230.3,2819.79,2601.64,…,1495.08,1487.58)

令spss擬合的冪曲線:

X3=(X3(1),X3(2),X3(3)…X3(43),X3(44))=(3273.36,2835.83,2607353,…,1502.67,1495.54)

令spss擬合的對(duì)數(shù)曲線:

X4=X4(1),X4(2),X4(3)…X4(43),X4(44)=(3068.63,2771.09,2597.05,…,1454.13,1444.27)

其次,對(duì)于X0,X1,X2,X3,X4這5個(gè)數(shù)列進(jìn)行無量綱化。在這里采取均值像法:

xi(k)d=無量綱化的5個(gè)序列如表3。

表3 無量綱化的五個(gè)序列

幾種灰色關(guān)聯(lián)度的公式如下:[9]

(1)灰色絕對(duì)關(guān)聯(lián)公式為:

(2)灰色相對(duì)關(guān)聯(lián)度公式為:

其中(n)是xi(n)初值像的始點(diǎn)零化像。

(3)灰綜合關(guān)聯(lián)度公式為:

(4)灰色相似關(guān)聯(lián)度公式為:

灰色系統(tǒng)理論建模系統(tǒng)3.0是一套用Visual Basic6.0開發(fā)的第一套基于Windows視窗界面的灰色系統(tǒng)建模軟件。[9]這套軟件極大地簡化了數(shù)據(jù)輸入中的繁瑣過程,便利了灰色關(guān)聯(lián)度的計(jì)算。

最后,將表3中的經(jīng)過無量綱化的數(shù)據(jù)導(dǎo)入到灰色系統(tǒng)建模軟件中,分別得出了4條曲線和原NSNP曲線的灰色關(guān)聯(lián)度,如表4所示:

表4 4種灰色關(guān)聯(lián)度對(duì)比表

由表4可見,四種灰色關(guān)聯(lián)度中X3與X0都是最大的,也就是說用SPSS軟件擬合的冪曲線是最優(yōu)曲線,方程為:Y=3273.356X-0.207。在這四種灰色關(guān)聯(lián)度中,灰色相似關(guān)聯(lián)度區(qū)分度最高,這也符合了灰色相似關(guān)聯(lián)度的基本思想:根據(jù)曲線幾何形狀來判斷不同序列之間的聯(lián)系是否緊密。

3 結(jié)論

為了探求44個(gè)全基因組上NSNP出現(xiàn)的規(guī)律,我們采取了擬合的方法,有利于對(duì)于更多數(shù)量的基因出現(xiàn)時(shí)對(duì)NSNP進(jìn)行預(yù)測。文獻(xiàn)[1]中采取的是STATA軟件,最后的確定系數(shù)是98.3%,并沒有達(dá)到最優(yōu)的擬合效果。本文用matlab和SPSS擬合,并用灰色關(guān)聯(lián)決策進(jìn)行最后擬合比選,確定系數(shù)大于99.8%。可見采取多種軟件進(jìn)行擬合,并用灰色關(guān)聯(lián)決策理論進(jìn)行最后的擬合比選的這種決策思想,為基因變異數(shù)量的預(yù)測提供了一個(gè)很有開創(chuàng)性的方法。

[1]Kimberly Pelak,Kevin V,Shianna,et al.The Characterization of Twen?ty Sequenced Human Genomes[Z].PLoS Genet 6(9):e1001111.doi:10.1371/journal.pgen.1001111.

[2]Li H,Durbin R.Fast and Accurate Short Read Alignment with Bur?rows-Wheeler Transform[J].Bioinformatics,2009,25.

[3]Li-Juan,Zhang,Zhou-Jun,Li,Huo-Wang,Chenand,Jian Wen.Mini?mum Redundancy Gene Selection Based on Grey Relational Analysis[J].Computer Science2006,4265.

[4]崔立志,劉思峰,李致平,崔杰.一種新的灰色相似關(guān)聯(lián)度模型及其應(yīng)用[M].統(tǒng)計(jì)與決策,2010,(7).

[5]黨耀國,劉思峰.灰色斜率關(guān)聯(lián)度的改進(jìn)[J].中國工程科學(xué),2004,6(3).

[6]謝乃明,劉思峰.幾類關(guān)聯(lián)度的平行性和一致性[J].系統(tǒng)工程,2007,25(8).

[7]張小燕,胡木林,周才秀,王忠,陳沁.中風(fēng)易感性與候選基因SNP位點(diǎn)關(guān)聯(lián)研究[J].生物技術(shù)通報(bào),2008,(增刊).

[8]鄧聚龍.灰理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002.

[9]劉思峰,黨耀國,方志耕,謝乃明.灰色系統(tǒng)理論及應(yīng)用[M].北京:科學(xué)出版社,2010.

[10]寧宣熙,劉思峰.管理預(yù)測與決策方法[M].北京:科學(xué)出版社,2008.

猜你喜歡
關(guān)聯(lián)
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
船山與宋學(xué)關(guān)聯(lián)的再探討
原道(2020年2期)2020-12-21 05:47:06
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
新制度關(guān)聯(lián)、組織控制與社會(huì)組織的倡導(dǎo)行為
奇趣搭配
基于廣義關(guān)聯(lián)聚類圖的分層關(guān)聯(lián)多目標(biāo)跟蹤
智趣
讀者(2017年5期)2017-02-15 18:04:18
探討藏醫(yī)學(xué)與因明學(xué)之間的關(guān)聯(lián)
西藏科技(2016年5期)2016-09-26 12:16:39
GPS異常監(jiān)測數(shù)據(jù)的關(guān)聯(lián)負(fù)選擇分步識(shí)別算法
主站蜘蛛池模板: 国产精品视频观看裸模| 日本人又色又爽的视频| 久久天天躁狠狠躁夜夜2020一| 日韩美毛片| 黄色网址免费在线| 老司机aⅴ在线精品导航| 欧美中文一区| 手机在线免费毛片| 国产av一码二码三码无码| 中文字幕在线观看日本| 国产AV无码专区亚洲A∨毛片| 精品久久久无码专区中文字幕| 国产在线视频福利资源站| 日韩国产高清无码| 免费一级毛片完整版在线看| 在线中文字幕网| 天堂在线视频精品| 久久男人资源站| 欧美一级99在线观看国产| 在线国产你懂的| 欧美日韩综合网| 天天爽免费视频| 一本一道波多野结衣av黑人在线| 亚洲无线国产观看| 毛片网站免费在线观看| 色综合热无码热国产| 久久综合AV免费观看| 亚洲人成人无码www| 国产成人午夜福利免费无码r| 国产真实乱了在线播放| 国产精品女主播| 久草中文网| 欧美日韩激情在线| 日韩欧美中文| 九九久久精品国产av片囯产区| 97se亚洲| 美女一级免费毛片| 免费a级毛片18以上观看精品| 亚洲无限乱码一二三四区| 日日碰狠狠添天天爽| 666精品国产精品亚洲| 99久久99视频| 国产凹凸视频在线观看| 精品一區二區久久久久久久網站| 亚洲成在线观看| 一区二区影院| 欧美日韩福利| 91精品人妻互换| 国产国拍精品视频免费看| 国产白浆在线观看| 中文字幕人成乱码熟女免费| 日本手机在线视频| 国产AV无码专区亚洲精品网站| 无码一区中文字幕| 精品视频福利| 国产69精品久久久久孕妇大杂乱 | 四虎在线高清无码| 中文字幕调教一区二区视频| 亚洲人成电影在线播放| 尤物亚洲最大AV无码网站| 97国内精品久久久久不卡| 国产亚洲美日韩AV中文字幕无码成人| 欧美伊人色综合久久天天| 国产在线视频欧美亚综合| 91免费观看视频| 在线日韩一区二区| 丝袜无码一区二区三区| 青青热久免费精品视频6| 永久免费无码日韩视频| 久久国语对白| 欧美人与牲动交a欧美精品| 无码免费视频| 狠狠v日韩v欧美v| 中文字幕资源站| 久久性视频| 欧美色香蕉| 中文字幕在线不卡视频| 亚洲天堂在线免费| 99免费视频观看| 在线亚洲精品自拍| 精品三级网站| 国产爽爽视频|