魏雨
(西安培華學院 智能科學與信息工程學院,陜西 西安 710125)
隨著科學技術以及現代工業技術的不斷進步,能源對于人類生活乃至社會發展變得尤為重要。尤其進入21世紀以來,我國對于石油天然氣的需求量在不斷地增長。然而隨著油氣的不斷開采,目前已進入深層開采時代,大量的油氣資源存儲在致密或低滲的巖石中,開發難度較大。
深入地球更深部位,擴大地層深處油氣資源,不僅對建設我國能源安全的資源基礎具有重大的現實和戰略意義,也是加強我國油氣勘探開發力度的現實領域。我國深部油氣資源豐富,勘探開發程度低,深部頁巖氣等資源潛力巨大,勘探開發前景廣闊,是當前和今后的重點研究方向。加強對深部油氣地層機理、分布規律和深部流體流動機理的研究,開展基于地球物理的深層目標識別與預測、復雜地層條件高效鉆井、復雜油藏改造等關鍵技術的研究。對地下儲層進行準確評價描述,進而提高油氣開采效率,成為了目前的研究熱點。巖石薄片是由巖心取樣打磨制成,能直觀地對地下儲層特性進行描述。
以前人們對于巖石薄片的鑒定識別,通常是由專門的技術人員采用手工方式進行鑒別以及統計。利用偏光顯微鏡對巖石薄片進行觀測,分析其中的礦物組成成分以及對應的光化學性質。這種傳統的人工方式需要耗費大量的人力物力以及時間,不僅效率低,準確度也有限制,因此越來越多的專業研究人員開始致力于對巖石薄片的數字圖像的分析和鑒定。
巖性油氣儲藏層其形成過程是非常復雜的,其主要組成成分巖石顆粒之間因為強烈的壓實作用和膠結作用,它們之間彼此接觸極為緊密。再加上其形成后期的溶解作用,使得巖石顆粒與空隙之間的邊緣變得模糊難辨。在巖石薄片圖像中,大部分噪聲點都是由巖石顆粒溶解殘留物以及空隙中的自帶的物質產生的。在以往的巖石薄片邊緣提取與分割方法中,大部分是利用圖像的灰度信息以及相鄰像素之間的關聯關系進行的,但是對于信息量大復雜度高的圖像巖石顆粒分割以及空隙提取的效果較差。鑒于這樣的情況,在傳統處理方法的基礎上,相關專業人員提出了更優的巖石薄片分割算法。
2015年,徐永進等提出利用CT圖像層間相關性自動計算分割閾值進行目標分割,并以分割效果較好的幀為中心,進行自動區域生長修復,從而完善分割效果。2016年,張嘉凡等根據“物以類聚”的統計原理,按距離相近或相似程度對巖石CT圖像中的像素進行標定,從而實現圖像分割及量化。2018年,李周等對疊加序列圖像的融合圖后利用分水嶺法進行目標顆粒提取,然后使用AGNES法自底向上對過分割區域聚類,實現顆粒的自動分割。2018年,彭志偉等針對巖石薄片在固定可視范圍下的偏光序列圖,根據顏色以及亮度的變化特征對巖石薄片進行邊緣分割以及修復。2019年,鐘逸等提出了基于Fast-MBD變換的超像素算法用于巖石薄片圖像顆粒的自動分割。2020年,潘代玉等利用改進的SLIC算法進行巖石礦物顆粒邊緣分割。2020年,司晨冉等提出了一種基于Mask R-CNN和分水嶺算法的巖石顆粒圖像分割方法,避免過分割的同時防止細骨料區域出現欠分割。2021年,周恒等融合多尺度和多角度的特征表達提出了一種改進的C3相干算法。2022年,嚴良平等通過提取深度圖像與可見光圖像的隨機特征和顯著性特征,并根據多組隨機特征和顯著性特征得到多個分割預測結果,最后選擇最優分割結果。
綜上所述,目前巖石薄片圖像分割和識別的研究大多集中于巖石薄片單偏光圖像,主要存在兩方面的問題:一是對于凝膠填充不充分的溶蝕孔隙及雜基微孔隙的識別存在一定的局限性;二是現有辦法對于顏色差異不大的相鄰顆粒無法準確分割。那么,解決以上問題就成為當前的研究要點。
遺傳算法,簡稱GA,是一種計算模型。GA以Darwin的進化論為基礎,其核心思想是模擬自然界生物進化的過程,包括基因的選擇與遺傳。在實際使用中,遺傳算法通常被用來搜索得到問題的最優解。
遺傳算法從初代種群開始,按照自然界優勝劣汰和適者生存的自然法則,經過選擇、交叉和變異操作,逐代演化來產生出越來越優的結果。對于某一代的種群,先計算個體的適應度,然后再無規律地隨機選擇出若干個體,再對這些選擇出來的個體進行交叉和變異操作,得到新的后代種群。在整個操作中,完全遵照大自然中適者生存的法則,以及優勝劣汰的原則,一代又一代地逐步演變,最終得到對環境適應能力最好的個體,也就是問題的最優解。遺傳算法的操作過程跟自然進化非常類似,對于參數較多條件復雜的數學問題求解效果很好。
遺傳算法的三種遺傳算子:選擇,交叉,遺傳。
(1)選擇。選擇操作就是從某一代群體中選擇出一部分個體組成新的下一代,選擇的依賴條件是適應度。簡單來說,就是優勝劣汰。換句話說,對于某個個體而言,它的適應度越高,那么它被選中的幾率就越大。這里以輪盤賭法為例,假如某個種群中個體的數量是,對于個體來說,它的適應度表示為f,那么個體被選取的概率就是P,P的表達式如式(1)所示:

對于某個種群,其中每個個體被選中的概率是定的。若某個體被選中的概率大,那么它被選中的機會就多,它所攜帶的遺傳基因就有很大可能性在種群中擴散開來;反過來,若個體被選中的概率比較小,那么其極大可能會被淘汰掉。
(2)交叉。為了產生新個體,通常從前代種群中隨機選擇兩個個體作為雙親樣本,通過雙親染色體的交換組合,產生兩個新的染色體作為后代,此過程稱為交叉或者重組。一般情況下,最多使用的是單點交叉算子,也就是在配對的染色上隨機選擇一個位置,然后兩個染色體在該交叉位置處進行基因的變換,執行過程如圖1所示。

圖1 單點交叉算子流程圖
如圖2所示,雙親A和B,經過單點交叉變為A'和B'。

圖2 交叉算子示例
(3)變異。為了保證遺傳算法不陷入局部尋優保證得到的是全局最優解,在進化過程中要進行變異操作。使用最多的是單點變異。比如某個基因的二進制編碼為10101,對第4個基因進行單點變異,由“0”變為“1”,最終的基因變為10111,如圖3所示。

圖3 變異算子示例
對上一代群體經過選擇操作、交叉操作和變異操作,最終得到下一代群體。
巖石薄片是一種特別薄的小巖片,首先需要在巖石樣本上,以垂直層理方向切取,然后將小巖片磨成薄片。為了要在偏光顯微鏡下觀察,所以必須足夠薄,薄到光線可以穿透,一般的標準巖石薄片厚度為0.03毫米。
巖石薄片圖像,是將巖石薄片放置在偏光顯微鏡載物臺上使用高清攝像頭拍攝而成的圖像。
巖石薄片鑒定,就是將制成的巖石薄片放在偏光顯微鏡下,通過觀察薄片中礦物質的結構以及其結晶特征,從而確定巖石中礦物的組成成分以及光學特性。另外,通過分析薄片中礦物的形成順序,推斷巖石的成因和類型,最終得到薄片樣本中巖石的名稱。目前,巖石薄片的鑒定識別通常用于油氣儲層的勘探與評價、環境保護、以及水利勘測等領域。
最大類間方差法(OSTU)是在20世紀70年代由一名日本學者提出的,是一種可以自動尋找合適的閾值的方法。OSTU一般用來做灰度圖像的聚類處理,經過聚類后圖像會被劃分為兩部分,前景部分和背景部分,前景也稱為目標。OSTU利用直方圖來計算最優的類內方差。前景部分圖像和背景部分圖像的類內方差越大,則說明二者之間的相似性越小,即劃分的準確性就越大。
OSTU的原理是:存在某圖像A,假定當前閾值是TH,在圖像A中前景部分的像素占總圖像像素的比例為,前景部分的平均像素灰度值為;背景部分的像素占總圖像像素的比例為,背景部分的平均像素灰度值為,前景部分與背景部分之間的方差表示為,整幅圖像的平均灰度為。
假設圖像A的大小為×,整幅圖像中灰度值小于閾值TH的像素數量是NUM,灰度值大于閾值TH的像素數量是NUM,則存在:

采用遍歷法,當前景部分與背景部分之間的方差為最大時,此時所對應的閾值TH就是最優閾值。
(1)適應度函數:OSTU全局算法。
(2)選擇算法:輪盤賭選擇算法。
輪盤賭選擇法的過程如下:
1)計算出種群中每個個體的適應度P。
2)計算每個個體的累積概率Q。
3)產生0到1閉區間內的一個的隨機數,若<,則選1,否則選,使得Q<Q成立。
4)將步驟2)、3)重復次即可。
(3)交叉算法:利用單點交叉,取小于0.7的隨機概率。
(4)終止條件:進化代數5 000。
(5)交叉概率:直方圖中各灰度的概率。
(6)變異概率,一般取0.001~0.1。
本文分割算法流程如圖4所示。

圖4 本文分割算法流程圖
步驟1:讀取巖石薄片原圖像,將BGR圖轉為灰度圖。
步驟2:計算巖石薄片圖像的直方圖;將各灰度值的概率作為選擇操作中的適應度,產生第一代種群。
步驟3:計算當前代的適應度函數。
步驟4:用輪盤賭法,按照一定概率從上一代種群中選擇出若干個體,組成下一代的種群。
步驟5:對新種群進行交叉處理。
步驟6:對新種群進行變異處理。
步驟7:轉到步驟3執行,直到設定的執行次數完成。
本文采用長慶油田的50張巖石薄片進行了實驗,同時對這50張薄片圖像還采用最大熵閾值分割算法和迭代閾值分割算法進行了處理,對所有巖石薄片圖像的三種算法的處理結果進行比較,本文列出了其中四張巖石薄片圖像的處理結果,如圖5至圖9所示。

圖5 巖石薄片原圖

圖6 直方圖

圖7 最大熵閾值分割結果

圖8 迭代閾值分割結果

圖9 本文算法分割結果
以圖5中的巖石薄片1為例,對巖石薄片1進行人工分割標記,將巖石薄片1分割為6類,而本文算法將巖石薄片1分割為5類,準確率達83%,結果如圖10所示。同時,對圖5中四張巖石薄片圖像進行人工手動標記,結果與本文算法分割結果進行比對,如表1所示。

圖10 巖石薄片1分割結果

表1 不同分割算法準確率比較
由表1可知,相比最大熵閾值分割結果和迭代閾值分割結果,本文分割算法的準確率高,平均準確率達90%以上。
本文提出的巖石薄片圖像分割方法,先使用原始巖石薄片圖像生成直方圖,再結合GA算法自動獲取適當的圖像分割閾值。為驗證本文算法的分割效果,采用50張長慶油田的巖石薄片圖像進行了分割實驗,本文算法的分割準確率可以達到90%以上。結果表明,通過大量巖石薄片圖像的直方圖信息,能夠實現巖石薄片圖像的分割閾值的自動選取。但是由于所采用的巖石薄片圖像樣本較少,因此仍舊有一定的誤差,并且隨著圖像內容復雜度的提升,GA算法需要更長的時間以及更豐富的特征才能達到預期的效果。因此下一步的工作會針對這兩方面做一些改進,以期望得到更好的分割效果并適應于更多的巖石圖像種類。