李周,滕奇志*,張余強
(1.四川大學(xué)電子信息學(xué)院圖像信息研究所,成都610065;2.成都西圖科技公司,成都 610024)
在石油地質(zhì)行業(yè)中,確定巖石中各礦物成分比例是薄片礦物鑒定的重要內(nèi)容[1],對巖石顆粒進行準確分割則是確定礦物成分的前提。在巖石薄片圖像中,顆粒表面紋理復(fù)雜,形狀各異,顆粒間差異不明顯,導(dǎo)致巖石顆粒圖像自動分割的難度較大。
不少學(xué)者對巖石顆粒圖像的自動分割進行了研究,如文獻[2]中B.Obara將巖石圖像轉(zhuǎn)換到不同的顏色空間,然后再進行閾值分割。文獻[3]中Gorsevski等使用了基于元胞自動機演化的邊緣檢測方法對巖石圖像進行分割。雖然已有較多的顆粒分割算法研究,但是能夠?qū)嶋H應(yīng)用的卻比較少。因為在自動分割之后,仍需要進行大量的人工交互,對巖石顆粒的分割結(jié)果進行修正,自動化程度不高。
文獻[4]中提到,巖石樣品中晶體存在消光特性,在不同正交偏光角度下,顆粒的亮度會發(fā)生變化,顆粒之間的邊界也能清晰地顯示出來,所以可以利用這種特性來輔助巖石顆粒的分割。以此為依據(jù),本文通過對采集到的不同正交偏光角度下的巖石薄片序列圖的分析處理,最終實現(xiàn)顆粒的自動分割。
采集巖石薄片圖像一般是通過在顯微鏡下利用投射單偏光來獲取圖像,但是由于單偏光下巖石薄片圖像中的顆粒缺乏清晰的輪廓,顆粒之間沒有良好的區(qū)分度,如圖 1(a)所示。
本文使用正交偏光系統(tǒng)下采集的序列圖進行圖像分割。正交偏光系統(tǒng)是在單偏光系統(tǒng)的基礎(chǔ)上再加上一個單偏光鏡,上、下偏光鏡振動方向相互垂直,將巖石薄片放在上、下偏光鏡之間的載物臺上,視域中將呈現(xiàn)一系列光學(xué)現(xiàn)象,如消光、干涉色等[6]。采用自主研制的偏光圖像采集裝置,每旋轉(zhuǎn)正交偏光鏡15°獲取一幅圖像,總共旋轉(zhuǎn)120°,一共采集9張序列圖像。圖1(b)(c)(d)為其中 0°,60°,90°角度的 3 張圖像,可以看出,正交偏光圖像中的巖石顆粒清晰,但是由于顆粒的消光現(xiàn)象,在單張正交偏光圖中并不能把所有顆粒都顯示出來。

圖1 單偏光圖像和不同角度下的正交偏光圖像
利用一組正交偏光序列圖像進行顆粒分割,比較直觀的做法是對每一幅偏光序列圖下的圖像進行分割,然后將多幅圖像的分割結(jié)果進行合并,得到最后的分割結(jié)果。但是通過實驗發(fā)現(xiàn),該做法存在這樣的問題:由于巖石圖像本身的復(fù)雜性和多樣性,分割中存在許多誤分割,對多幅圖像的處理圖進行疊加處理,容易將多幅圖像的錯誤分割結(jié)果相疊加。因此本文未選擇上述方法,而采用先將序列圖像疊加到一起,再做分割處理的方法。
不同的顆粒在正交偏光鏡下的明暗變化的趨勢不同,這種趨勢如果相同,則可以合理的認為是一個顆粒的概率較大[3],本文將偏光鏡下采集的不同序列圖像之間的變化差值累加后得到疊加圖像,如式(1)、式(2)所示:

本文對疊加后的圖像采用標記分水嶺方法進行顆粒分割,分水嶺分割[7]是一類目前使用最為廣泛的顆粒形態(tài)學(xué)分割方法。其中H-minima[8]是一種常見的標記選擇方法,采用梯度圖像中的區(qū)域極小值作為種子點[9],實現(xiàn)目標分割。本文根據(jù)文獻[10]選取方向測度的極小點作為標記種子點,將每個像素點的鄰域擴充到7×7,有效抑制了因為噪聲或者顆粒形狀不規(guī)則等因素而產(chǎn)生的多個虛假種子點,在一定程度上解決了基于梯度標記分水嶺分割方法產(chǎn)生的嚴重過分割現(xiàn)象。
如圖3為采用分水嶺分割后用隨機顏色填充顆粒,并將背景色置為黑色后的圖,由此可以清晰看出,基本所有的顆粒都被提取出來。但在部分區(qū)域,如圖3中的標記區(qū)域,仍存在過分割的現(xiàn)象。

圖2 正交偏光下采集的序列圖像的疊加圖像

圖3 分水嶺分割后的圖像

圖4 過分割的粘連區(qū)域
由圖3中標記可見,對于相毗鄰的顆粒,可能會出現(xiàn)將其中的顆粒過分割成為若干個小區(qū)域的現(xiàn)象。圖4是將這部分區(qū)域放大后以一定透明度附加到原本的顆粒上的圖像。如圖4(a)所示,由于右上角的顆粒被過分割,導(dǎo)致原本只有兩個顆粒的該區(qū)域被分割成多個區(qū)域。針對這種現(xiàn)象,本文首先對過分割的圖像區(qū)域進行角度,面積,位置特征提取,然后采用“自底向上”的AGNES層次聚類算法進行聚類,將該區(qū)域聚合為符合實際情況的分割效果。
以圖5中的兩個顆粒為例,標記上方顆粒為Grain-U,下方顆粒為Grain-D,其中Grain-U由于過分割導(dǎo)致被分成若干小的區(qū)域。

圖5 被過分割的兩個顆粒
本文從以下幾個方面來描述區(qū)域的特征:
(1)區(qū)域的角度特征
由于巖石顆粒正交偏光的周期消光性,正交偏光鏡下旋轉(zhuǎn)360°,顆粒會出現(xiàn)4次消光現(xiàn)象,每90°為一個周期[11]。如圖 6(a)(b)(c)(d):分別是在正交偏光0°,45°,60°,105°下的顆粒圖像,可見上下兩個顆粒在不同偏光角度下呈現(xiàn)出來的亮度是不一樣的,每個區(qū)域在一個周期內(nèi)都存在亮度的最小值和最大值,且不同顆粒的亮度峰值所在角度不同。圖6(e)是Grian-U中的區(qū)域亮度變化折線圖,由于共同的消光性,雖然被過分割為多個不同的區(qū)域,但其亮度變化的趨勢一樣,均在75°達到峰值;而未被過分割的Grian-D顆粒在60°時亮度達到峰值。
因此可以用該峰值的角度來表征該區(qū)域的角度特征,如式(3)所示:

其中θLmax表示該區(qū)域亮度達到峰值時的角度,以π/2為底對數(shù)據(jù)進行標準化操作,θ'為標準化之后的角度值。
(2)區(qū)域的面積特征
由于分水嶺的過分割現(xiàn)象,部分顆粒被分割成了許多小的區(qū)域。而這些小的區(qū)域的面積相對于其毗鄰顆粒的面積較小,具有相似性,因此面積可以作為聚類的一個特征,如式(4)所示:

S'代表該區(qū)域的相對面積的大小,Ssum表示過分割區(qū)域的總面積,S為當前區(qū)域的面積。
(3)區(qū)域的位置特征
由圖5(b)可以看出,Grian-U過分割區(qū)域的重心坐標相對集中,而Grian-D的重心坐標距離其他區(qū)域的相對較遠。因此可以用區(qū)域的重心點坐標來表征該區(qū)域所在的位置,如式(5)所示:

(X',Y')代表當前區(qū)域重心坐標的相對位置。其中W、H分別表示圖像的寬和高,(X,Y)為當前區(qū)域的重心坐標。

圖6 同一顆粒不同角度的明暗變化
根據(jù)公式(3)(4)(5)計算后的特征量值都被限定到[0,1]之間,從而組成一個四維的特征向量V={θ',S',X',Y'}.
本文采用“自底向上”AGNES層次聚類算法,在不同層次對數(shù)據(jù)進行劃分,從而形成樹形的聚類結(jié)構(gòu)[12]。先將過分割區(qū)域內(nèi)所有的單個區(qū)域看成一個初始聚類簇,然后找出距離最近的兩個簇進行合并,該過程不斷重復(fù),直至達到終止聚類個數(shù)。本文計算簇間距離使用average linkage距離,簇間距離等于兩組對象之間的平均距離。給定聚類簇Ci和Cj,其距離定義為:

其中d(Ci,Cj)表示不同簇Ci和Cj之間的距離,dist(Vp,Vq)是兩個區(qū)域p和q之間的歐氏加權(quán)距離,Vpi表示這個區(qū)域在i分量的特征值,ωi表示在i分量的權(quán)值。經(jīng)大量試驗,區(qū)域的角度特征和面積特征在聚類作用中比重較大,取亮度權(quán)重和面積權(quán)重ω1=ω2=5;坐標位置權(quán)重ω3=ω4=3。
為了得到符合實際的聚類個數(shù),在使用層次聚類的過程中,每一次兩個相近簇合并后,需要對該次合并的有效性進行判斷,即衡量當前聚類的有效性。首先定義層次聚類中的成本函數(shù)為:

其中,k是簇的個數(shù),x表示簇中的數(shù)據(jù),Ti是第i個簇中元素的集合;Ci表示第i個簇的中心,m為當前簇中的元素個數(shù)。成本函數(shù)是各個簇畸變程度之和,若簇內(nèi)部的成員彼此間越緊湊則畸變程度越小,反之,若簇內(nèi)部的成員彼此間越分散則畸變程度越大。
根據(jù)文獻[13],可以通過肘部法則來估計聚類數(shù)量。肘部法會把不同k值的成本函數(shù)值反映在曲線上。隨著k值的增大,每個簇中包含的樣本數(shù)會減少,樣本離其中心會更近,因此平均畸變程度會減小。但是,隨著k值繼續(xù)增大,平均畸變程度的改善效果會不斷減低。當Jk減少緩慢時,就認為即使進一步增大聚類數(shù),畸變程度的改善效果也并不能增強,則此時的這個“肘點”對應(yīng)的k值就是最佳聚類數(shù)目,如圖7(a)。上述出現(xiàn)明顯“肘部”的情況比較常見,但是Jk值的變化也可能比較平緩沒有明顯的拐點,如圖7(b),這時可以認為該區(qū)域最終聚為一類。

圖7 J隨k值的變化曲線
本文設(shè)定當聚類數(shù)小于設(shè)定數(shù)kmax時,即當k取k=1,2,…,kmax,計算其成本函數(shù)。根據(jù)計算的結(jié)果得到Jk值變化對應(yīng)的k值,則此k值就為最終的聚類個數(shù),如果隨著聚類數(shù)目的減小,Jk的變化幅度始終相當,變化曲線上沒有明顯的拐點,則把這個區(qū)域歸為一類。
聚類過程為:首先設(shè)定一個過分割區(qū)域內(nèi)的所有區(qū)域各為一簇,根據(jù)公式(6)計算所有簇間距離,將距離最近的兩個簇合并,然后更新整個簇的個數(shù);再計算新的簇之間的距離,根據(jù)距離最近原則再合并兩個簇,如此反復(fù)。當簇個數(shù)小于等于設(shè)定值kmax后,開始計算其成本函數(shù) Jk,并保存每次更新的簇的結(jié)果,直到最終聚為一類。
每合并一簇后計算每次變化的幅度:

計算ηk的平均值kavg,比較每次聚類后當前幅度值與平均值的大小,若滿足ηk≥δ×kavg,則判斷其為“肘部”,對應(yīng)的k值即為最佳聚類個數(shù),k值對應(yīng)的聚類結(jié)果即為最終結(jié)果。如果均不滿足,即不存在明顯“肘部”,此時k取1,聚為一類。經(jīng)過試驗,當設(shè)定δ=2時,聚類結(jié)果較符合實際情況。
將同一類區(qū)域填充為同一種顏色,根據(jù)上述算法,圖5的最終聚類圖如圖8所示:

圖8 Grain-U和Grain-D最終聚類圖
再分別對圖4中的過分割區(qū)域進行聚類,結(jié)果如圖9所示,可以看出,本文算法成功將過分區(qū)域聚類為符合實際情況的結(jié)果。
本文對二組實際拍攝的偏光序列圖進行顆粒分割,并與文獻[6]中的顆粒分割方法算法進行對比。
顆粒分割結(jié)果如圖10所示,其中:(a)(d)分別為兩組偏光序列圖進行差分疊加后的圖像;(b)(e)分別為通過文獻[6]中SRM算法分割后的效果圖;(c)(f)分別為本文方法對顆粒的分割效果圖。文獻[6]中先對每一張圖片進行分割后再合并,提取到的顆粒比較多,但是過分割現(xiàn)象嚴重。本文中先將序列圖合并后再進行分割,并且對過分割區(qū)域進行聚類合并,過分割現(xiàn)象得到很好的抑制,使得結(jié)果較于文獻[6]的方法更符合實際需求。
本文討論了一種正交偏光圖像序列圖的顆粒分割算法,首先采集不同偏光角度下的序列圖,對序列圖進行疊加融合后再基于分水嶺算法分割將目標顆粒提??;然后對過分割區(qū)域提取角度、面積、位置等特征;最后通過AGNES聚類算法將過分割的顆粒聚類到一起,從而完成顆粒的分割提取。

圖9 過分區(qū)域聚類后效果圖

圖10 文獻[3]算法以及本文算法對比效果圖
實驗結(jié)果顯示,本文算法通過先分離后聚合的方式,成功將過分割的區(qū)域融合。但對于沒有在分水嶺階段中沒有提取到的顆粒,本文算法不能將其分割出來,可在這方面繼續(xù)加以研究。
[1]徐耀鑒.巖石學(xué)[M].北京:地質(zhì)出版社,2007.
[2]Obara B.A New Algorithm Using Image Colour System Transformation for Rock Grain Segmentation[J].Mineralogy and Petrology,2007,91(3-4):271-285.
[3]Gorsevski P V,Onasch C M,Farver J R,et al.Detecting Grain Boundaries in Deformed Rocks Using a Cellular Automata Approach[J].Computers&Geosciences,2012,42(3):136-142.
[4]楊宗瑞.基于偏光序列圖像的巖石顆粒分割及礦物分[D].四川大學(xué),2014
[5]Gorsevski P V,Onasch C M,Farver J R,et al.Detecting Grain Boundaries in Deformed Rocks Using a Cellular Automata Approach[J].Computers&Geosciences,2012,42(3):136-142.
[6]吳擁,蘇桂芬,滕奇志,等.巖石薄片正交偏光圖像的顆粒分割方法[J].科學(xué)技術(shù)與工程,2013,13(31):9201-9206.
[7]Beucher S,Meyer F.Segmentation:The Watershed Transformation.Mathematical Morphology in Image Processing[J].Optical Engineering,1993,34(5):433-481.
[8]Chanho J,Changick K.Segmenting Clustered Nuclei Using H-minima Transform-based Marker Extraction and Contour Parameterization[J].IEEE Transactions on Bio-medical Engineering,2010,57(10):2600-4.
[9]Li B,Pan M,Wu Z.An Improved Segmentation of High Spatial Resolution Remote Sensing Image Using Marker-based Watershed Algorithm[C].International Conference on Geoinformatics.IEEE,2012:1-5.
[10]楊海軍,梁德群,畢勝.基于圖象方向性信息測度的圖象象素分類[J].中國圖象圖形學(xué)報,2001,6(5):429-433.
[11]Fueten F,Goodchild J S.Quartz C-axes Orientation Determination Using The Rotating Polarizer Microscope[J].Journal of Structural Geology,2001,23(6-7):895-902.
[12]周志華.機器學(xué)習(xí)[M].清華大學(xué)出版社,2016.
[13]Bholowalia P,Kumar A.EBK-Means:A Clustering Technique based on Elbow Method and K-means in WSN[J].International Journal of Computer Applications,2014.