魏潔 黃發忠 辛化梅



摘 要:二維凝膠圖像電泳過程中可能出現蛋白質點重疊和堆聚的現象,文章利用圖像處理與分析技術設計了一種有效重疊蛋白質點分離的算法。利用多邊形近似方法,將檢測到的蛋白質點邊緣轉化成數字邊界,對該數字邊界用多邊形進行有效近似,計算近似多邊形頂點對應的內角,通過閾值的設定,得到邊界上的凹點,對凹點進行匹配連線,從而實現對重疊蛋白質點的有效分割。
關鍵詞:凝膠圖像;重疊蛋白質點;多邊形近似;凹點;分割
引言
在二維凝膠圖像中,大量的蛋白質點以圓或者橢圓的形式存在,它們有著不同的大小,不同的蛋白質點有占有相同凝膠表面的趨勢,這就導致了一些點的部分重疊,從而形成難以分析的點重疊區[1],影響蛋白質點的準確檢測。利用數字圖像處理與分析技術設計一種有效的重疊蛋白質點分離算法,對提高蛋白質點檢測的精度和可信度具有重要的意義。
現有的蛋白質點檢測方法主要可以分為基于模型、基于分割以及基于特定新理論的檢測方法。其中基于模型的方法是采用某種數學模型,如高斯函數和擴散函數,擬合蛋白質點的灰度值,從而得到蛋白質點的邊界和體積,實現蛋白質點的檢測[2]。基于分割的方法是將凝膠圖像分成多個小區域,每個區域理論上只包含一個蛋白質點[3]。基于特定新理論的檢測方法,如基于水平集的檢測方法,利用這一數學理論對能量函數進行極小值求解的曲線演化過程,最終獲得目標輪廓邊緣從而進行蛋白質點檢測[4]。已有的蛋白質點檢測方法未能很好的分離重疊蛋白質點,文章提出一種基于最小周長多邊形近似[5](Minimum Perimeter Polygon,MPP)的重疊蛋白質點分割方法,用逼近蛋白質點數字邊界的多邊形來近似表示蛋白質點邊界,再利用凹點匹配對得到的近似多邊形的頂點進行匹配連線,達到有效分離重疊蛋白質點的效果。
1 基于區域跟蹤的蛋白質點預分割方法
區域跟蹤能給出二值圖像中所有物體的內邊界和外邊界,在圖像中尋找滿足某種檢測準則的點,將其全部鄰點進行檢查,將具有相似屬性如強度,灰度級,紋理顏色等的相鄰點及該點全部合并,從而產生小塊目標區域。然后檢查該區域的全部鄰點,并把滿足該檢驗準則的點并入該區域,經過迭代過程,直到處理完每個像素,形成不同的區域[6]。
基于區域跟蹤算法,首先對圖像1-(a)進行預處理并得到其二值圖像,遍歷該二值圖像,標記第一個像素塊的第一個前景像素(i,j);對該像素八鄰域逆時針搜索,若搜索到前景像素,則將(i,j)更新為(i',j'),進行標記;不斷執行上步直到再次遇見該像素塊的第一個前景像素;繼續遍歷圖像,直到處理完整幅圖像,得到圖1-(b)。
通過區域跟蹤方法得到凝膠蛋白質點的初始外圍輪廓信息,為后續重疊點的分離奠定了基礎。
2 重疊蛋白點的判別
其中,L表示檢測得到的蛋白質邊界的周長,用邊緣相鄰像素間距離之和表示;S表示檢測得到的蛋白質點的面積,可以用該區域內像素個數來表示。
對于蛋白質點重疊現象,可以分為三種情況:(1)單向雙點重疊,兩個蛋白質點相互重疊;(2)單向多點重疊,多個蛋白質點沿同一方向重疊;(3)多向重疊,蛋白質相互重疊部分的中心兩兩連線或其延長線組成一個多邊形。
3 基于MPP算法的重疊蛋白質點分割
3.1 基于MPP算法的多邊形近似方法
在重疊蛋白質點的判別中,我們已經將重疊蛋白質點區域提取出來,下一步需要對其進一步分離。
數字邊界可以用多邊形近似來逼近,多邊形的計算可以用多邊形邊的線性關系來表示,這樣有利于得到一個區域的近似值。多邊形與鏈碼及邊界分段表示相比,具有更強抗噪聲的能力,當邊界上的點數與多邊形的線段點數相同時,多邊形能準確的表達邊界。利用多邊形近似不僅用最少的線段來表示邊界,而且能夠表達原圖像邊界的本質形狀。
利用周長最小的多邊形近似表示邊界[8],將邊界看作是介于多邊形內外界墻之間的有彈性的線。當它在內外界限的限制之下收縮緊繃的時候,就可以得到最小邊界,它使用單元條閉合了該區域。
3.2 凹點的判別
在凝膠圖像的判別中,重疊蛋白質點都有一個共同特征,就是重疊區域會存在凹陷[9],因此,通過判斷近似多邊形頂點內角的大小來作為進一步判斷蛋白質點是否發生重疊的分離依據。
近似多邊形每個頂點對應的內角大小可以通過該點與前后點分別連接得到的向量的夾角大小來表示,該點與前點組成的向量和與后點組成的向量的夾角大于180°時,該點為凹點,當該夾角小于180°時,該點為凸點。如圖3所示,I 為凸角對應凸點,II為為凹角對應凹點。
3.3 分離線的確定
在得到蛋白質邊界的凹點之后,進行凹點的匹配,確定分離線[10],分割重疊蛋白質點。
當得到的凹點個數n=1時,判定該凹點為由噪聲引起的凹陷;對單向雙點重疊情況,只有一對凹點,直接連接兩個凹點;對單向多點重疊的情況,將凹點分別向中心軸線做投影,投影點距離最近,且對應凹點連線距離最短為匹配的凹點[11];對多向重疊情況,要結合蛋白質點本身是圓形或者橢圓形[3],并且遵循凹點連線的延長線兩兩相交的原則匹配凹點。
3.4 實驗結果及分析
從結果來看,圖7較圖1-(b)而言,分割更為準確,實現了蛋白質點中重疊部分的有效分割。文章分割方法有良好的抗噪性能,對于絕大多數重疊區域具有較好的分割效果,但對于極少數蛋白質點邊緣不規則,與之粘連的蛋白質點的點徑相當于其突起的情況,無法精確分離。改進的方法是在凹點檢測和匹配時結合蛋白質點的形狀、面積分布等進行匹配修正,尋找最匹配的點。
4 結束語
為了解決蛋白質點預分割之后,重疊蛋白質點的分離問題,提出了利用基于多邊形近似蛋白質點進而尋找匹配凹點,對重疊蛋白質點進行分離的的算法。實際情況中存在非常復雜的蛋白質點重疊現象,要準確分割所有重疊蛋白質點需要考慮蛋白質的生物性質,間距等更多參數,進一步的工作是尋找一種自適應的分離方法來分割重疊情況更加復雜的蛋白質點。
參考文獻
[1]Michalis Savelonas,Dimitris Maroulis,Eleftheria. segmentation of two-dimentional gel electrophoresis image containing overlapping spots [J].IEEE,2009.
[2]Serackis T, Kambhamettu C. An image analysis suite for spot detection and spot matching intwo-dimensional electrophoresis gels [J].Electrophoresis,2008,29(3):706-715.
[3]張超.基于模糊形態學和分水嶺的蛋白質點檢測方法研究[D].南昌航空大學.
[4]閆克裕.基于水平集的牛乳體細胞圖像分割[D].內蒙古農業大學,2008.
[5]J Sklansky,R L Chazin,B J Hansen. Minimum perimeter polygons of digitized silhuettes[J].IEEE Trans. Computers,1972.
[6]張德豐.詳解MATLAB數字圖像處理[M].電子工業大學出版社:260-268.
[7]傅蓉.細胞重疊與融合性圖像的分離與分割技術研究[D].南方醫科大學,2007.
[8]Gonzalez Rafael C,Woods Richard E. Digital image processing [M].電子工業出版社,2007.
[9]韋冬冬,趙豫紅.基于凹點匹配的重疊圖像分割算法[J].計算機與應用化學,2010,27(1):99-102.
[10]蘇娜,薛河儒.重疊牛乳體細胞判別和分割方法的研究[J].計算機工程,2011,37(7):231-233.
[11]劉偉華,隋青美.基于凹點搜索的重疊粉體顆粒的自動化分離算法[J].電子測量與儀器學報,2010,24(12):1095-1100.
作者簡介:魏潔(1988-),女,山東濰坊,山東師范大學碩士研究生,研究方向為信號與信息處理。
黃發忠,男,山東濟南,副教授,研究方向為信號與信息處理。
辛化梅,女,山東青島,博士,副教授,研究方向為信號與信息處理。