王靖翔 張皓森 楊龍 姚澤民



摘要:巖石樣本識(shí)別是油氣勘探中的基礎(chǔ)且重要的環(huán)節(jié),現(xiàn)有的巖石樣本的識(shí)別方法有重磁、測(cè)井等方法,而基于深度學(xué)習(xí)的圖像識(shí)別技術(shù)并沒有廣泛應(yīng)用于油氣勘探之中。因此,本文提出一種基于深度學(xué)習(xí)的巖石樣本識(shí)別方法,通過建立巖石樣本自動(dòng)識(shí)別分類模型以完成巖石樣本的智能識(shí)別與分類,首先利用編碼技術(shù)、數(shù)據(jù)增強(qiáng)技術(shù)和級(jí)聯(lián)分類器技術(shù)對(duì)圖像進(jìn)行預(yù)處理,其次構(gòu)造卷積神經(jīng)網(wǎng)絡(luò)(CNN, convolutional neural network)對(duì)巖石樣本的進(jìn)行優(yōu)化訓(xùn)練,最后測(cè)試結(jié)果表明巖石樣本識(shí)別率達(dá)到95%左右。研究思路和結(jié)果可為油氣勘探巖石樣本識(shí)別提供了一種新的實(shí)踐思路辦法,同時(shí)也為其他相關(guān)領(lǐng)域起到一定的理論指導(dǎo)意義。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);數(shù)據(jù)增強(qiáng)技術(shù);級(jí)聯(lián)分類器
一、CNN神經(jīng)網(wǎng)絡(luò)的建立——數(shù)據(jù)集與數(shù)據(jù)預(yù)處理
卷積神經(jīng)網(wǎng)絡(luò)可以看作由特征提取和模式識(shí)別組合而成。特征提取由卷積層和池化層(子采樣層)組合形成。卷積層使用卷積核對(duì)上一層的輸出圖像進(jìn)行卷積操作,卷積核類似于圖像處理中所使用的“窗口”,一個(gè)卷積核作用于一張圖像,經(jīng)過卷積可以得到一張?zhí)卣鲌D,卷積操作是卷積核和輸入圖像上相應(yīng)大小的區(qū)域進(jìn)行卷積運(yùn)算,并以一定步長作用于整張圖像,一張圖像可以使用多個(gè)卷積核,提取多個(gè)特征。池化層將經(jīng)過卷積的的圖像進(jìn)行下采樣操作,去除圖像的多余信息。模式識(shí)別層是傳統(tǒng)的分類器,通常為多層感知器。圖像經(jīng)過卷積和降采樣操作后得到原始圖像的特征,將這些特征轉(zhuǎn)化為一維向量的形式再通過全連接的方式作為模式識(shí)別部分的輸入,使得整個(gè)網(wǎng)絡(luò)達(dá)到識(shí)別分類的目的。圖1為單張圖像單個(gè)卷積核示例。
關(guān)于卷積層,假設(shè)卷積是一次移動(dòng)一個(gè)像素來卷積的,那么首先我們對(duì)輸入的左上角3x3局部和卷積核卷積,即各個(gè)位置的元素相乘再相加,在每個(gè)位置加上偏置得到輸出矩陣S。
同理,如果輸入的是對(duì)應(yīng)RGB的彩色圖像等多維度的圖像,即是三個(gè)分布對(duì)應(yīng)R,G和B的矩陣則同時(shí)輸出三個(gè)矩陣,如果把上面的卷積過程用數(shù)學(xué)公式表達(dá)出來就是
其中為輸入矩陣的個(gè)數(shù),或者是張量的最后一維的維數(shù)。代表第個(gè)輸入矩陣。代表卷積核的第個(gè)子卷積核矩陣。即卷積核W對(duì)應(yīng)的輸出矩陣的對(duì)應(yīng)位置元素的值。
卷積神經(jīng)網(wǎng)絡(luò) S 的訓(xùn)練類似于 BP 算法,分為前向傳播和反向傳播 2 個(gè)過程。
前向傳播:
從訓(xùn)練數(shù)據(jù)集中隨機(jī)選取樣本(X,Yp) ,其中 X 表示待輸入圖像,Yp表示圖像實(shí)際類別。
通過卷積神經(jīng)網(wǎng)絡(luò)的逐層計(jì)算,輸出得到測(cè)試類別 Op。其中網(wǎng)絡(luò)執(zhí)行的計(jì)算為交替執(zhí)行的卷積與下采樣操作,輸出結(jié)果可表示為
其中,表示第n層網(wǎng)絡(luò)的激活函數(shù),表示第n層的卷積核或下采樣矩陣。表示本次迭代輸入的原始圖像。
反向傳播:
(1)計(jì)算實(shí)際輸出:與相應(yīng)的理想輸出的差;
(2)使用極小化誤差的方法反向傳播調(diào)整各權(quán)值矩陣。
對(duì)于本文中所使用的卷積神經(jīng)網(wǎng)絡(luò)中的卷積層,步長均為2,邊緣填充方式均為SAME。對(duì)于池化層,步長均為2.輸入層為預(yù)處理后的299x299格式圖像,第一層卷積層(C1)使用11x11的卷積核,卷積核數(shù)量為36。卷積得到的36張?zhí)卣鲌D傳入5x5窗口大小的池化層(P1)。P1輸出后傳入使用48個(gè)7x7卷積核的第二層卷積層(C2)。卷積得到的48張?zhí)卣鲌D傳入3x3窗口大小的池化層(P2),第三層卷積層(C3)以P2的輸出作為輸入,利用64個(gè)3x3的卷積核進(jìn)行卷積操作,得到64張?zhí)卣鲌D后繼續(xù)進(jìn)入第四層卷積層(C4),C4使用64個(gè)3x3卷積層對(duì)輸入進(jìn)行卷積,得到64張?zhí)卣鲌D后傳入窗口大小為3x3的池化層(P3),將輸出展平成一維向量后傳入層寬為1024的全連接層,最后通過softmax分類器輸出預(yù)測(cè)概率分布。
二、問題一實(shí)驗(yàn)及結(jié)果分析
1、數(shù)據(jù)集與數(shù)據(jù)預(yù)處理
題給數(shù)據(jù)集分為自然狀態(tài)下巖石照片和巖石樣品的照片,自然狀態(tài)下巖石照片共289張,巖石樣品照片共26張。每張照片的像素為4096x3000的大尺寸照片。針對(duì)問題一我們選擇自然狀態(tài)下照片用于訓(xùn)練。
為減少模型參數(shù),降低計(jì)算量,我們將原圖片壓縮為500x500格式的RGB圖,利用Python中的CV2和NUMPY模塊對(duì)照片進(jìn)行預(yù)處理,將其轉(zhuǎn)化為三通道灰度圖像,以便于卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算。
2、級(jí)聯(lián)分類器的變形和加權(quán)預(yù)測(cè)
級(jí)聯(lián)分類器的策略是,將若干個(gè)強(qiáng)分類器由簡單到復(fù)雜排列,希望經(jīng)過訓(xùn)練使每個(gè)強(qiáng)分類器都有較高檢測(cè)率,而誤識(shí)率可以放低。當(dāng)識(shí)別一張巖石圖片時(shí),首先在言照片上截取幾個(gè)部分,再分別對(duì)各部分進(jìn)行預(yù)測(cè),最后的預(yù)測(cè)結(jié)果由強(qiáng)分類器加權(quán)得出。
其中,每張照片截取N塊后,其權(quán)重為:
3、實(shí)驗(yàn)結(jié)果分析
為了深入了解模型對(duì)巖石類別的識(shí)別能力,分析模型識(shí)別能力和數(shù)據(jù)之間的關(guān)聯(lián),我們分別對(duì)每一個(gè)類別進(jìn)行預(yù)測(cè),得出模型對(duì)特定類別的識(shí)別能力如下。
其中,c為深灰色粉砂質(zhì)泥巖,f為灰色泥質(zhì)粉砂巖,對(duì)比預(yù)測(cè)結(jié)果后,我們發(fā)現(xiàn)灰色泥質(zhì)粉砂巖幾乎全部錯(cuò)誤的識(shí)別為深灰色泥巖。針對(duì)模型無法分辨灰色泥質(zhì)粉砂巖和深灰色泥巖的問題,我們先將二者的標(biāo)簽改為一致,再利用原模型將這兩種巖質(zhì)從樣本中剝離出來,再重新設(shè)計(jì)新的神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行二分類,以更好的識(shí)別這兩種巖質(zhì)。
參考文獻(xiàn)
[1] 朱丹丹,王洪喜,王建華,王冠偉.基于圖像處理的粗糙邊緣盲孔圓度誤差測(cè)量[J].工具技術(shù),2021,55(04):91-95.
[2] 王杰,晏鵬程,何小海,滕奇志.基于深度學(xué)習(xí)的巖石薄片正交偏光圖像多曝光融合算法[J].長江信息通信,2021,34(03):47-51.