999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于主動分析的基因芯片圖像網格定位

2016-12-07 05:46:44李鐵軍邵桂芳上官亞力吳順祥
廈門大學學報(自然科學版) 2016年6期
關鍵詞:分析方法

李鐵軍,孫 躍,邵桂芳,上官亞力,吳順祥

(1.重慶大學自動化學院,重慶400044;2.廈門大學航空航天學院,福建廈門361005)

基于主動分析的基因芯片圖像網格定位

李鐵軍1,孫 躍1,邵桂芳2*,上官亞力2,吳順祥2

(1.重慶大學自動化學院,重慶400044;2.廈門大學航空航天學院,福建廈門361005)

基因芯片圖像處理對解讀成千上萬個基因點的雜交信息,建立可信疾病預測具有重要的意義,其分析的可靠性和準確性將直接影響到芯片的推廣與使用.而基因芯片制備過程復雜,圖像種類多樣,單一的網格定位方法無法滿足各種類型基因芯片圖像處理的需求.在分析現有網格定位方法的基礎上,基于“仿人”思想,將認知科學的主動分析引入到圖像處理中,提出通過自主感知來明確基因芯片圖像處理過程中不確定性因素的存在及其程度,并采取相應方法來降低或消除不確定因素的影響.最后通過6個數據集上的384幅網格圖像實驗,證明所提出的自動對比度增強和自適應網格定位調整方法無需參數輸入和人工干預,能較大程度提高網格定位準確率.

基因芯片;圖像處理;網格定位

重大疾病(如癌癥)的預防與控制是世界各國面臨的重大科技難題[1].例如,全球每年大約有100萬新發大腸癌病例,至少50萬患者死亡,而中國大腸癌發病率以4.71%的速度逐年遞增[2].傳統的儀器檢測篩查方法具有介入性、單疾病、費用高和周期長等諸多缺點.20世紀90年代發展來的基因芯片(cDNA microarray)以高通量、微型化、自動化及低成本等優點成為后基因組時代最重要的基因檢測工具之一,能夠有效地應用于基因測序、生物學研究和疾病預防與控制[3].包括《Science》和《Nature》在內的國際權威刊物近年來發表了大量應用基因芯片進行癌癥預防與控制的研究成果.基因芯片分析包含樣本采集、芯片制備、掃描成像、圖像處理、數據分析和生物學應用等[4],如圖1所示.

基因芯片的圖像處理是提取基因表達水平信息的關鍵步驟,其準確性和可靠性將直接影響基因表達譜數據的有效性,并最終決定生物學分析和病理分析的成敗.因此,基因芯片圖像處理對解讀成千上萬個基因點的雜交信息,建立可信疾病預測具有重要的意義,其分析的可靠性和準確性將直接影響到芯片的推廣與使用.基因芯片圖像處理包括圖像增強、網格定位、基因點分割和信息點提取4個步驟[5],其目的是提取基因表達譜數據,建立基因與其對應功能的關聯,用于后續基因數據分析.基因芯片圖像處理是以整個芯片為單位的(每張芯片可能包含12×4或4×4個子網格,每個子網格又包含22×22、40×40或14×18個基因點不等),即輸入是2幅基因芯片圖像(對應熒光標記Cy3和Cy5),輸出是芯片里每一個基因點的表達值,一次輸出結果可能包含23 232或12 096個基因點不等(與不同芯片制備公司相關).由于基因芯片圖像處理過程存在眾多不確定性,如芯片制作過程復雜(會帶來操作失誤或儀器誤差),圖像質量多變(會出現噪聲等級不同、基因點形態各異和基因點分布疏密不一),圖像分析方法多樣等,對基因芯片圖像處理造成巨大挑戰.

針對網格定位問題,以完全自動化處理為目標,其算法經歷了如下發展歷程(如圖2所示):

1)Angulo等[5]將二維圖像處理問題轉換為一維信號處理,提出一種最簡單快速的形態學投影法,但該方法容易受噪聲影響;

2)Katzer等[6]提出馬爾科夫隨機場法,該方法需要輸入網格的行列參數;

圖1 基因芯片分析流程圖Fig.1 The flowchart for cDNA microarray analysis

圖2 網格定位方法發展趨勢Fig.2 Development trend of gridding methods

3)齊飛等[7]和Ceccarelli等[8]通過高斯混合模型和貝葉斯推理方式辨識參數來實現網格定位,但需要有參考模板;

4)Rueda等[9]和Zacharia等[10]將網格定位問題轉化為優化問題,提出分別利用爬山法和遺傳算法來求解,該類方法比較耗時并且受算法初始參數設置影響;

5)很多學者[11-20]考慮在算法內加入最優閾值搜索功能,提出一系列具有自適應調節能力的完全自動處理方法.

雖然不斷有各種網格定位方法涌現,但由于基因芯片圖像的復雜不確定性,導致每種方法都無法取得精確結果.因此,本研究在分析基因芯片圖像特點的基礎上,依據近5年來從事基因芯片圖像處理研究的經驗,分析了影響其結果的原因,并引入“仿人”思想,建立基于主動分析的網格定位方法.該方法能基于四階矩進行圖像自動對比度自動感知與增強,并利用最大內間方差法(Otsu)進行閾值的自動獲取,初步實現網格定位后,依據結果的統計分析進行自調整.在6個數據集上通過對比本文方法與投影法[5]和最大類間方差方法[16]的網格定位效果,證明了主動分析引入的有效性和必要性.

1 網格定位方法

1.1基因芯片圖像分析

基因芯片圖像具有顯著不同于其他圖像處理問題的特點,決定了其處理分析的不確定性.這些特點主要有:

1)全局性,即關注每個基因點區域.不同于人臉識別和目標檢測等問題,由于基因點相對均勻地分布在圖像中的每一個區域,所以整幅圖像都是算法關注的焦點.

2)多樣性,算法要同時處理多個芯片、多個網格或多個基因點,但是不同芯片、不同網格或不同基因點上的圖像都存在各種動態變化的特點.

3)精確性,要求結果完全準確.基因芯片圖像處理,不是根據特征去尋找圖像中的某個目標或區域,而是提取每一個基因點上的信息,來精確地估計基因表達水平.

近5年的研究實踐表明[16,21],造成基因芯片圖像處理結果不確定的來源雖然可能是多方面的,但可以分為以下兩個層面:

1)數據層面,即圖像質量,與實驗設備、實驗設計及材料等有關,如針對不同病癥、不同病人群體,采用不同技術不同手段制備的基因芯片.由于芯片制備廠商不同,以及芯片制備過程中的取樣、標記、雜交條件和掃描儀器等帶來的誤差影響,導致實際基因芯片圖像質量各異,圖3展示了部分具有不同質量的子網格圖像和基因點圖像.這些質量差異可以從以下3個方面來看:

(i)基因芯片層面.(a)分布各異,即每個芯片圖像包含的子網格數不同,每個子網格包含的基因點數也不同;(b)分辨率各異,即芯片圖像和基因點均具有不同的分辨率,如一幅基因芯片圖像大小為4 325像素×11 388像素,其基因點大概為25像素×25像素.

圖3 子網格及各類基因點示意Fig.3 Examples of sub-grids and spots

(ii)子網格角度.(a)基因點分布疏密不一,有的基因點排列非常緊湊,網格定位時容易壓到基因點邊緣,而有的基因點分布很稀疏,容易受噪聲影響;(b)噪聲等級不同,有的包含少量噪聲,有的包含大量噪聲;(c)噪聲類型也不同,如塊狀噪聲、彗星尾噪聲等,而且噪聲有些是和基因點混在一起的,導致基因點無法分割或影響其表達值計算;(d)缺失基因點比例不同;(e)有時會存在傾斜,整個子網格傾斜或部分基因點區域傾斜.

(iii)基因點自身.(a)基因點形態各異,其基本形態可能因基因芯片制備公司的不同,有圓形、方形和三角形等;(b)即使基本形態固定,也會有峰形、火山形、半月形、斷裂形和環形等變化;(c)基因點粘連,有些基因點可能會連在一起,導致無法分割.

上述眾多不確定因素可能會同時發生在一次處理過程中,造成基因芯片圖像質量動態變化,導致基因芯片圖像處理精度低.

2)方法層面.研究者采用的不同圖像處理算法,具有局限適應性(適用于某類圖像或某種處理)等差異,難以適應基因芯片圖像處理的復雜過程,增加了基因芯片圖像處理的難度.基因芯片圖像處理具有串行分級特性,即前面步驟是后面的基礎,其誤差會向后累積,使得僅采用單一方法來解決全局處理具有極大的挑戰性.同時,已有的圖像處理方法在某些方面表現出獨特的優勢是值得借鑒的.

與基因芯片數據的復雜性形成鮮明對比的是,現有的圖像處理方法只能針對單個或若干個問題,盡可能地提升處理過程的單一目標或者多個目標的準確率,而不適用于其他問題或其他圖像區域,無法滿足基因芯片圖像處理的特殊要求.

我們認為,想從根本上防止或降低基因芯片圖像處理中的不確定性,僅改進或提高局部算法的性能是不夠的.提高基因芯片圖像處理精確性的有效辦法應該是結合實際問題的特點,對造成結果不確定的內在原因進行深入挖掘和分析,有針對性的采取方法進行處理,即不同問題不同對待,實現從“被動分析”到“主動處理”的轉變.

1.2網格定位的主動分析

主動分析網格定位框架如圖4所示.

為實現主動分析,基因芯片網格定位主要包括3個環節:1)自適應對比度增強,根據圖像自身數據感知其對比度情況,并進行增強;2)網格定位,依據自適應閾值方法進行分割;3)網格定位結果的自調整,即依據分割結果的統計分析,自動判斷分割結果正確與否,并進行調整.

圖4 網格定位主動分析框架Fig.4 The active analysis flowchart for gridding

1.3自適應對比度增強

因為基因芯片圖像普遍存在對比度較低現象,并且低對比度對網格定位影響較大.為此,本研究引入四階矩來建立圖像對比度自動感應與增強算法[21].設含有N個像素點的基因芯片圖像灰度值可用f(x,y)表示,首先將二維圖像信號轉換為一維列信號x= f(:),再通過下式得到自動增強后的圖像g(x,y):

上述操作有如下優點:1)不需要任何參數輸入; 2)自適應實現對比度增強;3)可大幅度提高基因芯片圖像處理精度;4)適應性廣,可以適用于各種類型基因芯片圖像.

1.4網格定位結果自調整

由于采用任何網格定位方法,都無法達到100%準確率,為此研究提出網格定位結果的自調整,即統計分析網格定位結果,得到每個網格圖像的網格線平均間距,計算每根網格線誤差及方差,從而判斷該網格線定位正確與否,并進行調整.

以水平網格定位為例,hj代表網格定位獲取的垂直方向網格線坐標,p為垂直方向網格線數,可統計出網格線間距并得到其平均距離從而計算網格線誤差和方差

1)der(m)<0,|der(m-1)|<ε,|der(m+1)|<ε,多出來一條線,如圖5(a)所示;

2)der(m)>0,|der(m-1)|<ε,|der(m+1)|<ε,少了一條線,如圖5(b)所示;

3)畫錯了位置der(m)>0,der(m+1)>0或der(m)>0,der(m+1)<0,如圖5(c)所示.

其中,ε用于描述示網格線間距與平均網格線間距之間的差異程度,取值為如前所述平均網格間距和網格線方差dmse是根據每次網格定位結果自動統計出來的,故ε無需人工設置.

圖5 網格線分割錯誤示意Fig.5 Examples of wrong gridding lines

2 實驗分析

為驗證本研究方法的有效性,分別在來自6個不同數據集的基因芯片圖像上進行了對比實驗(Stanford Microarray Database,SMD;University of California,San Francisco,UCSF;Gene Expression Omnibus,GEO;Computational Cancer Genomics group of the Swiss Institute of Bioinformatics,SIB; Joe DeRisi′s individual tiff files;Baylor College of Medicine,BCM)[16].圖6給出了在加入主動分析前后基于形態學硬閾值和Otsu自適應閾值的網格定位準確率對比情況.

圖6 加入主動分析前后的網格定位準確率對比Fig.6 Comparison of gridding accuracy when applied active analysis or not

可以看出主動分析的引入較大程度提高網格定位準確率,GEO和SMD數據集準確率提高最大.此外,Otsu自適應閾值網格定位比基于形態學的硬閾值具有更高準確率.并且在6個數據集上,GEO和SMD準確率相對較低,主要原因是其圖像對比度普遍很低.圖7展示了GEO數據集下網格定位效果,可以看出受低對比度及噪聲影響,只有在引入主動分析的Otsu網格定位方法上才取得了準確定位.

SIB數據集上的網格定位準確率也比較低,主要是其基因點分布比較稀疏,使得網格定位很容易受噪聲影響,如圖8所示,只有引入主動分析的Otsu網格定位方法取得了準確定位.

而圖9展示了BCM數據集圖像網格定位結果,由于該數據集基因點比較密集,分辨率較大,因此,即使有噪聲影響,各種方法也都能取得準確定位.換句話說,就是主動分析對BCM數據集的作用比較小.

圖7 GEO數據集網格定位示例Fig.7 Examples of gridding on GEO data set

圖8 SIB數據集網格定位示例Fig.8 Examples of gridding on SIB data set

圖10給出了UCSF數據集圖像網格定位結果,由于該數據集原始圖像對比度很低,在引入主動分析,特別是對比度增強后,網格定位準確率明顯提高.

3 結 論

基因芯片圖像的網格定位對基因點表達譜分析具有重要作用,而基因芯片圖像獲取過程復雜,圖像類型多樣,導致網格定位方法準確率不高.此外,目前大多數網格定位方法僅考慮了圖像去噪的預處理.為此,本研究在分析導致基因芯片圖像網格定位準確率不高的原因及現有網格定位方法發展的基礎上,提出引入主動分析,即通過對圖像自身數據的挖掘分析,進行自動增強處理.通過在來自6個數據集的不同類型基因芯片圖像上對比實驗,證明了引入主動分析的有效性.本研究提出的主動分析方法不需要人工干預及參數輸入,可以適應各類圖像,準確率也較未加入主動分析方法有較大提高.后續工作將針對噪聲等級進行自動分析,并建立快速有效的去噪方法.

圖9 BCM數據集網格定位示例Fig.9 Examples of gridding on BCM data set

圖10 UCSF數據集網格定位示例Fig.10 Examples of gridding on UCSF data set

[1] 夏俊芳,劉箐.生物芯片應用概述[J].生物技術通報,2010 (7):73-77.

[2] 王媛媛.大腸癌干細胞基因表達譜特點及其信號通路的篩選鑒定[D].廣州:南方醫科大學,2011:1-9.

[3] 博思數據研究中心.2011—2015年中國生物芯片行業深度調研與投資前景研究報告[R/OL].[2011-03-01] [2015-11-15].http:∥www.bosidata.com/dianzi1103/ V2504375TQ.html.

[4] BAJCSY P.An overview of DNA Microarray image requirements for automated processing[C]∥Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Los Alamitos: IEEE,2005:147-149.

[5] ANGULO J,SERRA J.Automatic analysis of DNA microarray images using mathematical morphology[J]. Bioinformatics,2003,19(5):553-562.

[6] DEMIRKAYA O,ASYALI M H,SHOUKRI M M.Segmentation of cDNA microarray spots using markov random field modeling[J].Bioinformatics,2005,21(13): 2994-3000.

[7] QI F,LUO Y,HU D.Recognition of perspectively distorted planar grids[J].Pattern Recognition Letters, 2006,27(14):1725-1731.

[8] CECCARELLI M,ANTONIOL G.A deformable grid matching approach for microarray images[J].IEEE Transactions on Image Processing,2006,15(10): 3178-3188.

[9] RUEDA L,VIDYADHARAN V.A hill-climbing approach for automatic gridding of cDNA microarray images[J].IEEE Transactions on Computational Biology and Bioinformatics,2006,3(1):72-83.

[10] ZACHARIA E,MAROULIS D.An original genetic approach to the fully automatic gridding of microarray images[J].IEEE Transaction on Medical Imaging,2008, 27(6):805-813.

[11] WANG Y,MA M,ZHANG K,et al.A hierarchical refinement algorithm for fully automatic gridding in spotted DNA microarray image processing[J].Information Sciences,2008,177(4):1123-1135.

[12] BARIAMIS D,IAKOVIDIS D,MAROULIS D.M3G: maximum margin microarray gridding[J].BMC Bioinformatics,2010,11:49.

[13] RUEDA L,REZAEIAN I.A fully automatic gridding method for cDNA microarray images[J].BMC Bioinformatics,2011,12(113):1-17.

[14] DEEPA J,TESSAMMA T.A new gridding technique forhigh density microarray images using intensity projection profile of best sub image[J].Computer Engineering and Intelligent Systems,2013,4(1):7-18.

[15] FOUAD I A,MABROUK M S,SHARAWY A A.A new method to grid noisy cdna microarray images utilizing denoising techniques[J].International Journal of Computer Applications,2013,63(9):36-44.

[16] SHAO G F,YANG F,ZHANG Q,et al.Using the maximum between-class variance for automatic gridding of cdna microarray images[J].IEEE/ACM Transactions on Computational Biology and Bioinformatics,2013,10 (1):181-192.

[17] THAMARAIMANALAN P,DHINESH K D,NIRMALAKUMARI K.Effective gridding and segmentation for microarray images[J].International Journal of Computer Science and Mobile Computing,2014,3(2): 353-360.

[18] AHMAD M M,JAMBEK A B,MASHOR M Y.A study on microarray image gridding techniques for DNA analysis[C]∥2ndInternational Conference on Electronic Design.Penang:IEEE,2014:171-175.

[19] HARIKIRAN J,AVINASH B,LAKSHMI P V,et al. Automatic gridding method for microarray images[J]. Journal of Theoretical and Applied Information Technology,2014,65(1):235-241.

[20] BELEAN B,TEREBES R,BOT A.Low-complexity PDE-based approach for automatic microarray image processing[J].Medical and Biological Engineering and Computing,2015,53(2):99-110.

[21] SHAO G F,LI T J,ZUO W D,et al.A combinational clustering based method for cDNA microarray image segmentation[J].PLoS ONE,2015,10(8):1-23.

An Active Analysis Method for Microarray Image Gridding

LI Tiejun1,SUN Yue1,SHAO Guifang2*,SHANGGUAN Yali2,WU Shunxiang2

(1.School of Automation,Chongqing University,Chongqing 400044,China; 2.School of Aerospace Engineering,Xiamen University,Xiamen 361005,China)

Image processing is a key aspect of cDNA microarrays analysis and the aim of the whole experimental procedure is to obtain meaningful biological conclusions,which depend on the accuracy of this stage.Unfortunately,because the complicated hybridization procedure of microarrays will result in dynamic changing of microarray image quality,results of existing methods can not meet the need of overall accuracy and batch processing.Therefore,through analyzing the current gridding methods and inspired by the human simulated theory,we introduce the active analysis into image processing.First,via autonomous perception,we make sure the existence and degree of uncertainty factors in image processing procedure.Then we reduce or eliminate the affection by adopting corresponding methods.Finally,experiments on 384 sub-grids drawn from six different data sets prove that the effectiveness of the proposed automatic contrast enhancement method and gridding result self-adjusting.In addition,the proposed method needs no human intervention and parameter setting,and can improve the gridding accuracy to a large extent.

microarray;image processing;gridding

TP 391.41

A

0438-0479(2016)06-0888-07

10.6043/j.issn.0438-0479.201511006

2015-11-04 錄用日期:2016-06-28

國家自然科學基金(61403318);福建省自然科學基金(2013J01255)

gfshao@xmu.edu.cn

李鐵軍,孫躍,邵桂芳,等.基于主動分析的基因芯片圖像網格定位[J].廈門大學學報(自然科學版),2016,55(6): 888-894.

LI T J,SUN Y,SHAO G F,et al.An active analysis method for microarray image gridding[J].Journal of Xiamen University(Natural Science),2016,55(6):888-894.(in Chinese)

猜你喜歡
分析方法
隱蔽失效適航要求符合性驗證分析
學習方法
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 欧美日在线观看| 欧美福利在线观看| 国产一区二区三区在线观看免费| 最新日本中文字幕| 日韩精品成人在线| 激情综合五月网| 免费福利视频网站| 国产亚洲精品无码专| 99久久婷婷国产综合精| 国产女人在线视频| 超清无码熟妇人妻AV在线绿巨人| 亚洲毛片一级带毛片基地| 99精品久久精品| 久久a毛片| 中文字幕色在线| 人人爽人人爽人人片| 日韩久草视频| 国产一级做美女做受视频| 色色中文字幕| 久久99国产乱子伦精品免| 日韩免费毛片| 99热这里只有精品久久免费| 欧洲精品视频在线观看| 亚洲网综合| 欧美日韩导航| 免费人成黄页在线观看国产| 国产va在线观看免费| 日韩精品无码免费一区二区三区| 国产成人精品视频一区二区电影 | 国产第八页| 日韩欧美国产中文| 日韩欧美91| 精品无码日韩国产不卡av| 国产亚洲高清在线精品99| 无码丝袜人妻| 亚洲精品国产成人7777| 99热亚洲精品6码| 色婷婷电影网| 亚洲欧美日韩高清综合678| 日韩123欧美字幕| 专干老肥熟女视频网站| 毛片在线区| 国产成人高清在线精品| 三区在线视频| 国产精品视频导航| 激情乱人伦| 久久综合九色综合97婷婷| 国产丝袜丝视频在线观看| av性天堂网| 亚洲视频免| 亚洲成aⅴ人在线观看| 欧美精品影院| 国产成人综合亚洲欧美在| 国产青榴视频| 日韩国产另类| 久久精品国产精品国产一区| 114级毛片免费观看| 亚洲天堂精品在线观看| 亚洲精选无码久久久| 国产swag在线观看| 国产亚洲欧美日韩在线观看一区二区| 精品久久久久成人码免费动漫| 国产午夜一级毛片| 青青草原国产| 波多野结衣第一页| 丁香六月激情综合| 四虎AV麻豆| 欧美亚洲一区二区三区导航| 国产成人禁片在线观看| 99伊人精品| 亚洲人成成无码网WWW| 伊人91视频| 97国产精品视频自在拍| 国产主播一区二区三区| 蜜芽一区二区国产精品| 小说区 亚洲 自拍 另类| 久久国产乱子伦视频无卡顿| 亚洲一区二区黄色| 亚洲首页在线观看| 91丨九色丨首页在线播放| 亚洲一区二区黄色| 亚洲日韩欧美在线观看|