999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工神經(jīng)網(wǎng)絡(luò)-紫外光譜法短串聯(lián)重復序列基因分型檢測

2011-04-12 00:00:00汪雪嬌牟紅元魯輝豆興茹邱婷謝洪平
分析化學 2011年11期

摘 要 以STR基因座D16S539中的總核心重復串數(shù)相差較小的10-11, 10-12, 11-11和10-13基因型為研究對象,以紫外光譜為判別變量,建立了以人工神經(jīng)網(wǎng)絡(luò)(ANN)提取富信息變量為基礎(chǔ)的ANN基因分型方法。在優(yōu)化條件下,對4個基因型樣本進行了聚合酶鏈式反應擴增,以擴增樣本在200~310 nm范圍內(nèi)的檢測光譜進行預處理和偶合的ANN-ANN網(wǎng)絡(luò)優(yōu)化。結(jié)果表明,提取富信息變量和基因分型的ANN的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)分別為391-50-391和50-6-4,該結(jié)構(gòu)下的判別模型的校正相對均方根誤差(RMS)和預測RMS分別是0.0279和0.0418,模型表現(xiàn)出了良好的穩(wěn)健性和100%的基因型正確預測率。成功實現(xiàn)了基于紫外光譜對STR基因型的快速、簡單和低成本檢測。

關(guān)鍵詞 短串聯(lián)重復序列; 紫外光譜; 人工神經(jīng)網(wǎng)絡(luò); 基因分型

1 引 言

短串聯(lián)重復序列(STR)是一類廣泛分布在人和動物基因組中的DNA重復序列片段,STR的核心序列為2~6 bp,呈串聯(lián)重復排列,重復15~30次左右,其總長度一般位于100~400 bp之間,多位于基因編碼區(qū)附近、基因內(nèi)含子和非翻譯區(qū)。按孟德爾規(guī)律呈顯性遺傳[1]。常見的STR形式有二核苷酸重復(CA)n, (GA)n, (AA)n, (GG)n,三核苷酸重復(CAG)n, (CGG)n和四核苷酸重復(GATA)n, (AGAT)n等。據(jù)估計,人類基因組約有50萬個STR位點。STR具有種類多、分布廣、多態(tài)信息量大、雜合度高、片段較短、易于聚合酶鏈式反應(Polymerase chain reaction,PCR)擴增等優(yōu)點[2],因而在人類學、生命科學和醫(yī)學等領(lǐng)域得到廣泛應用[3~5]。目前,STR基因型的檢測常采用凝膠電泳法[6,7]、毛細管電泳法[8~10]、微芯片電泳法[11,12]、和基因測序[13~15]等方法,這些方法可以較準確地對STR基因型進行檢測,但通常需要較為復雜的樣品前處理(如分離、純化)或PCR引物標記(如熒光標記、放射線標記)。對于STR基因型質(zhì)譜檢測法[16,17], 雖然不需要標記,但儀器較為昂貴。結(jié)合化學模式識別的近紅外光譜法實現(xiàn)了一次PCR擴增、無需分離純化、無需熒光標記、低成本的基因型快速檢測[18]。但是,在光譜分析方法中,近紅外光譜法的應用廣譜性相對較低。本研究以STR的紫外光譜(UVS)為識別變量,采用人工神經(jīng)網(wǎng)絡(luò)(ANN)化學模式識別方法,建立了不同STR基因型的判別模型。

2 實驗部分

2.1 儀器與試劑

PTC-225型PCR擴增儀(美國Bio-Rad公司); POWER BC6003En型電泳儀(上海申能博彩生物科技有限公司); GeneGenius凝膠成像系統(tǒng)(英國Syngene公司); 離心機(日本Tomy公司); 移液器(德國Eppendorf公司); 微型混合器(上海滬西儀器廠); UV2401型紫外分光光度計(日本Shimazdu公司)。

Taq DNA 聚合酶(美國Fermentas公司); PCR引物(PAGE級,金思特科技有限公司); 瓊脂糖(LP0028A, 英國Oxoid公司); 溴化乙錠(Sangon生物公司); 人血液樣本(蘇州大學司法鑒定所); 其它試劑均為分析純,所有溶液由滅菌去離子水配制。

2.2 基因組DNA的提取

按Chelex100法 [19] 提取基因組DNA。取6名以EDTA抗凝的D16S539基因座已知基因型的受試者的全血0.2~1.5 mL于離心管中,滴加紅細胞裂解液1 mL,以10000 r/min離心5 min;棄去上清液,加入磷酸鹽緩沖液1 mL,離心;棄去上清液,重復上述過程1次。加入5% Chelex100懸浮液0.2 mL,懸浮細胞核,在56 ℃保溫30 min;在沸水浴中保溫8 min,立即置于-20 ℃冰箱保存?zhèn)溆谩?/p>

2.3 PCR擴增

3 人工神經(jīng)網(wǎng)絡(luò)模型的建立

人工神經(jīng)網(wǎng)絡(luò)是一種模擬人腦神經(jīng)網(wǎng)絡(luò)行為特征,以數(shù)學網(wǎng)絡(luò)拓撲結(jié)構(gòu)為理論基礎(chǔ),進行分布式并行信息處理的算法數(shù)學模型[20]。其中,誤差反向傳播算法(BP)可分為兩個階段:正向傳播和反向傳播。正向為構(gòu)造非線性的數(shù)學模型過程,而反向是進行網(wǎng)絡(luò)中權(quán)重的修正。在不斷的學習和修正過程中,使網(wǎng)絡(luò)的學習誤差達到最小。本研究采用誤差反向傳播算法的ANN(BPANN)方法,以紫外光譜為識別變量,建立D16S539基因座的10-11,10-12, 11-11和11-13基因型的分類判別模型,實現(xiàn)簡單、快速、低成本地分型檢測STR的4種基因型。

以紫外光譜為BPANN的輸入變量和目標變量,利用隱含層神經(jīng)元提取富信息,并以該信息為另一個BPANN的輸入變量,建立基因型的分類模型,即前一個BPANN為富信息提取的ANN(RIE-ANN),后一個則為判別模型建立的ANN(DMB-ANN)。在DMB-ANN中,對于10-12, 11-11, 10-11和11-13基因型的目標變量分別為(1,0,0,0), (0,1,0,0), (0,0,1,0)和(0,0,0,1)。對于10-11基因型的33個樣本,隨機選擇24個為校正樣本,其余9個為預測樣本,而其它3個基因型均為34個樣本。每個基因型隨機選擇10個樣本構(gòu)成預測集,其余樣本構(gòu)成校正集。在210~280 nm波長范圍內(nèi),每個樣本的量測光譜共有781個數(shù)據(jù)點,以“每隔一點取一點”的方法,得391個數(shù)據(jù)點,代表樣本的量測光譜,作為RIE-ANN輸入層神經(jīng)元。優(yōu)化的最佳網(wǎng)絡(luò)結(jié)構(gòu):RIE-ANN為391-50-391,DMB-ANN為50-6-4。對于建立的分類模型,相對于基因型的目標變量,校正集的相對均方根誤差(RMS)為0.0275,預測集RMS為0.0418,預測準確率達到100%。ANN算法來自Matlab(V6.0)工具箱,其它計算程序在Matlab(V6.0)環(huán)境下自行編寫。

4 結(jié)果與討論

4.1 光譜預處理

光譜的變化由基因型差異、被測樣本組成和濃度產(chǎn)生。為了使光譜的變化主要由基因型的差異所決定,需要消除同一基因型不同樣本間的濃度差異。以10-11基因型的樣本的紫外光譜為例(見圖1),相同基因型樣本的光譜存在明顯差異,表明樣本間有濃度差異,為了消除這種差異對以基因型差異為主的判別模型的影響,本研究對每個樣本光譜均進行了濃度歸一化處理,使得同一基因型樣本的光譜差異性顯著減小。同時,在圖1的300 nm以上的無信息區(qū)域,其光譜存在明顯的基線漂移(圖1內(nèi)插圖),對于同一基因型的樣本光譜的這種差異也會嚴重影響模式識別模型對基因型差異的判別,對其進行了基線漂移校正,使所有樣本在無信息區(qū)域的光譜均值均等于零,有效消除了此漂移。

但是,尚存在極小的光譜差異,可能是因為被測樣本純度為達到100%。雖然這種差異不可能消除,但通過PCR擴增條件的優(yōu)化而保證了該差異的最小化。同時,為了使各次擴增的操作差異也包含在模型中,對每個基因型樣本平行擴增,每次獲得18個樣本,共獲得測試樣本36個。

4.2 BPANN提取富信息

紫外光譜數(shù)據(jù)通常由極多的數(shù)據(jù)點構(gòu)成,如果將這些數(shù)據(jù)點都作為模式判別的ANN網(wǎng)絡(luò)輸入變量,則神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)龐大,太多的輸入神經(jīng)元易于造成過擬合,并使迭代時間過長。因此有必要對紫外光譜數(shù)據(jù)進行降維處理,提取富信息,再以富信息變量建立ANN判別模型。本研究以RIE-ANN提取量測光譜的富信息,作為DMB-ANN的輸入變量,建立了判別模型,兩個網(wǎng)絡(luò)隱含層的神經(jīng)元數(shù)通過試差法優(yōu)化。

對于每個樣本的量測光譜,由于在210~280 nm范波長圍內(nèi)有781個波長點,數(shù)據(jù)量較大,為了不丟失信息,采用了“每隔一點取一點”的方法,得到了391個量測數(shù)據(jù)點。若將以391個量測光譜數(shù)據(jù)直接用于建立基因型的判別模型,相對于本研究使用的24個校正樣本,這個變量數(shù)遠遠大于樣本數(shù),極易于出現(xiàn)過擬合。為了避免這種現(xiàn)象,本研究利用RIE-ANN,將391個量測光譜數(shù)據(jù)作為輸入層變量,同時將這些變量作為目標輸出變量,即網(wǎng)絡(luò)結(jié)構(gòu)為391-m-391,數(shù)據(jù)量遠遠小于391的m個隱含層變量即為提取的富信息變量。以此富信息變量作為基因型的判別變量建立判別模型,即在建立判別模型的DMB-ANN中,采用網(wǎng)絡(luò)結(jié)構(gòu)m-n-4,其中隱含層神經(jīng)元為n個。

設(shè)定RIE-ANN的目標誤差為均方誤差(MSE)0.0005(應小于DMB-ANN的目標誤差),最大循環(huán)500次,最小梯度10-6,隨機初始化權(quán)重。隱含層的激發(fā)函數(shù)選用S型函數(shù),輸出層的激發(fā)函數(shù)為線性函數(shù)。實驗表明,隱含層神經(jīng)元數(shù)目在30~100較為適宜,分別對隱含層的神經(jīng)元數(shù)為30, 40, 50, 60, 70, 80, 90和100進行了優(yōu)化。由于本研究建立的基因型判別模型實際上是RIE-ANN與DMB-ANN兩個ANN的偶合,網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)m和n即為模型參數(shù),可采用“預測準確率、較小的類內(nèi)距和較大的類間距”為標準,優(yōu)化獲取該參數(shù)。

4.3 ANN-ANN對STR的4種基因型的判別能力

以RIE-ANN提取的m個富信息變量為建立判別模型的DMB-ANN的輸入變量,網(wǎng)絡(luò)結(jié)構(gòu)為m-n-4,其中4個目標輸出變量為基因型的表達變量,即D16S539基因座的10-12, 11-11, 10-11和11-13基因型的模式表達變量分別為(1,0,0,0), (0,1,0,0), (0,0,1,0)和(0,0,0,1)。以分類預測率和模型穩(wěn)健性為基礎(chǔ),優(yōu)化DMB-ANN網(wǎng)絡(luò),并選擇RIE-ANN的最佳隱含層神經(jīng)元數(shù)。本研究選用Levenberg-Marquardt算法,隱含層的激發(fā)函數(shù)選S型函數(shù),輸出層的激發(fā)函數(shù)為線性函數(shù),建立判別模型,其目標優(yōu)化參數(shù)為:目標誤差MSE為0.001、最大循環(huán)次數(shù)500和最小梯度10-6。對于初步試探的模型參數(shù)m[30, 100]和n[2, 10],以預測集的相對均方根誤差RMS最小為標準,分別以步長 Δm=10和 Δm=1進行全局優(yōu)化。預測集RMS 0.0418為上述范圍內(nèi)的最小值,此時校正集的RMS為0.0275,模型參數(shù)m=50, m=6, 該模型對基因型的預測準確率達到100%(表1)。從表1可見,判別模型對基因型的預測準確率較高,基因型表達變量的預測范圍[0.8177, 1.0000] 和[0.0000, 0.2318]分別與目標表達變量1和0非常接近,兩者之間有明顯差異,不存在類間重疊,表明模型能夠準確判別基因型。由于預測集與校正集的RMS相差較小,后者略小于前者,預示著校正模型不存在過訓練現(xiàn)象,從三維表達圖也證明了此現(xiàn)象。

5 結(jié) 論

對于STR不同基因型的紫外光譜的強相似性,本研究以偶合ANN-ANN的網(wǎng)絡(luò)為基礎(chǔ),提取光譜富信息和建立基因分型的判別模型。以模型穩(wěn)健性為前提、最小預測RMS對應的ANN-ANN即為最優(yōu)網(wǎng)絡(luò)。研究表明,用于壓縮變量的ANN的最佳網(wǎng)絡(luò)結(jié)構(gòu)是391-50-391,用于分類的ANN的最佳網(wǎng)絡(luò)結(jié)構(gòu)是50-6-4,由此建立的模型表現(xiàn)出了良好的穩(wěn)健性和100%的正確判別率。實現(xiàn)了對PCR擴增樣本在不經(jīng)分離提純等預處理條件下的快速、簡單、低成本的紫外光譜基因型判別。

References

1 Alford R L, Hammond H A, Coto I, Caskey C T. Am. J. Hum. Genet., 1994, 55(1): 190~195

2 Hao F, Jia Y C. Geno. Prot. Bioinfo., 2007, 5(1): 7~14

3 Lev A Z, Peter A U, Cengiz C, Manfred K, Bharti M, Toomas K, Rosaria S, Fulvio C, Giovanni D, Gabriella S, Geoffrey K C, Rene J H, Kiau K Y, David G, Ivailo T, Marcus W F, Luba K. Am. J. Hum. Genet., 2004, 74(1): 50~61

4 Asamura H, Tsukada K, Ota M, Sakai H, Takayanagi K, Kobayashi K, Saito S, Fukushima H. Int. Congr. Ser., 2006, 1288: 610~612

5 Matthias G, Tanja S Y. Forensic. Sci. Int., 2000, 113: 43~46

6 Riad A B, Lihadh I A, Uzma J, Mohamed S A, Nurekamal, A D, Abdulbari B, Valsamma E, Bruce B. Electrophoresis, 1997, 18(9): 1637~1640

7 Victoria L, Carmela P, Christopher P, Francisco B, Angel C, Denise S C, Patrick L. Electrophoresis, 1998, 19(10): 1566~1572

8 Stephanie H I Y, Peng L, Nadia D B, Susan A G, Richard A M. Anal. Chem., 2009, 81(1): 210~217

9 LIU Yong, WANG Rong, GAO Lan, JIA Zheng-Ping, XIN Xiao-Ting, XIE Hua, MA Jun(劉 勇, 王 榮, 高 嵐, 賈正平, 辛曉婷, 謝 華, 馬 駿). Chinese J. Anal. Chem.(分析化學), 2009, 37(10): 1494~1498

10 Stephanie H I Y, Tae S S, Cecelia A C, Susan A G, Thomas N C, Jeff D B, Richard A M. Electrophoresis, 2008, 29(11): 2251~2259

11 Stephanie H I Y, Peng L, Nadia D B, Susan A G, Richard A M. Anal. Chem., 2009, 81(1): 210~217

12 Yi N S. Electrophoresis, 2006, 27(19): 3703~3711

13 Wei M H, Kwang J H, Cheng Y C. Taiwanese. J. Obstet. Gynecol., 2005, 44(1): 52~56

14 Antonio B, Maria J A, Manuela A N, Zarapuz L, Blanco L , García-Sánchez F, Vicario J L. Hum Immunol, 2005, 66(8): 903~911

15 ZHANG Xiao-Dan, WU Hai-Ping, CHEN Zhi-Yao, ZHOU Guo-Hua(張曉丹, 武海萍, 陳之遙, 周國華). Chinese J. Anal. Chem.(分析化學), 2009, 37(8): 1107~1112

16 Herbert O, Walther P, Roswitha M, Christian G H. Anal. Chem., 2001, 73(21): 5109~5115

17 Allison P N, James C H, David C M. Anal. Chem., 2001, 73(18): 4514~4521

18 Yuan G L, Ren L, Gao Y Z, Wang W P, E X, Xie H P. Anal. Chim. Acta., 2009, 28(11): 1245~1249

19 Sweet D, Lorente M, Valenzuela A, Lorente J A, Alvarez J C. Forensic Sci. Int., 1996, 83(3): 167~177

20 PANG Tao-Tao, YAO Jian-Bin, DU Li-Ming(龐濤濤, 姚建斌,杜黎明). Sepctroscopy and Spectral Analysis(光譜學與光譜分析), 2007, 27(7): 1336~1339

Genotyping of Short Tandem Repeat Based on Ultraviolet Spectroscopy

Combined with Artificial Neural Network

WANG Xue-Jiao, MOU Hong-Yuan, LU Hui, DOU Xing-Ru, QIU Ting, XIE Hong-Ping*

(College of Pharmaceutical Sciences, Soochow University, Suzhou 215123)

Abstract Taking genotypes 10-11, 11-11, 10-12 and 10-13 of short tandem repeat (STR) locus D16S539 commonly used in forensic medicine as study objects, an ANN genotyping method was developed based on ultraviolet spectra of the measured samples and another ANN was used to extract the variables of rich information. Under the optimal conditions, each of the genotypes was amplified. The ultraviolet spectra of the samples that were produced by polymerase chain reaction, which was measured at length range of 200-310 nm, were pretreated and optimized by coupled ANN-ANN. The results showed that the best network structures of the rich information extraction ANN and the discriminant model built ANN were 391-50-391 and 50-6-4, respectively. The root mean square error for the training and the prediction samples sets was obtained to be 0.0279 and 0.0418. It was indicated that the models had a good ability of the robustness and big discriminating power for the prediction samples (the accuracy was 100%). The detection of STR genotypes by UVS was rapid, simple and low-cost.

Keywords Short tandem repeat; Ultraviolet spectroscopy; Artificial neural network; Genotyping

主站蜘蛛池模板: 欧美一级大片在线观看| 波多野结衣一级毛片| 18禁高潮出水呻吟娇喘蜜芽| 伊人久久婷婷五月综合97色| 国产免费人成视频网| 看你懂的巨臀中文字幕一区二区| 538国产在线| 免费国产黄线在线观看| 午夜激情福利视频| 亚洲天堂日本| 免费一级无码在线网站| 亚欧成人无码AV在线播放| 亚洲国产日韩一区| 国产午夜人做人免费视频中文 | 黄片一区二区三区| 亚洲精品无码日韩国产不卡| 亚洲91在线精品| 2022精品国偷自产免费观看| 女人18毛片一级毛片在线| 激情综合婷婷丁香五月尤物| 亚洲人成高清| 国产成人乱无码视频| 国内精品久久久久久久久久影视 | 国产综合网站| 亚洲欧美成aⅴ人在线观看| 日韩无码白| 熟女视频91| 在线视频亚洲欧美| 久久美女精品国产精品亚洲| 国产精品毛片一区视频播| 国产自无码视频在线观看| 免费va国产在线观看| 久久情精品国产品免费| 欧美区一区| 男人天堂伊人网| 欧美乱妇高清无乱码免费| 国产高清无码麻豆精品| a在线亚洲男人的天堂试看| 中文字幕伦视频| 中文字幕2区| 99热在线只有精品| 国产欧美视频在线观看| 国模极品一区二区三区| 国产成人午夜福利免费无码r| 区国产精品搜索视频| 亚洲国产高清精品线久久| 精品久久777| 亚洲男女天堂| 亚洲色无码专线精品观看| 亚洲无码电影| 狠狠干综合| 欧美不卡视频在线观看| 色亚洲激情综合精品无码视频 | 成人日韩精品| 91口爆吞精国产对白第三集 | 精品夜恋影院亚洲欧洲| 午夜影院a级片| 久久一色本道亚洲| 97超爽成人免费视频在线播放| 91无码网站| 欧美色丁香| 国内精自线i品一区202| 亚洲天堂色色人体| 亚洲欧美日韩视频一区| 精品无码人妻一区二区| 久久情精品国产品免费| 无码在线激情片| 在线国产欧美| 天天摸天天操免费播放小视频| 国产18在线| 亚洲VA中文字幕| 视频一本大道香蕉久在线播放| 国产乱码精品一区二区三区中文 | 日韩精品高清自在线| 成人午夜久久| 最新亚洲av女人的天堂| 欧美成人在线免费| 色婷婷在线播放| 国产第二十一页| 久久九九热视频| 亚洲精品无码专区在线观看| 3D动漫精品啪啪一区二区下载|