楊曉倩 張萍 熊振東 陶忠瑞 陳一帆 陳華














摘要:隨著我國油氣勘探技術的發展,裂縫性儲積層在油氣的勘探開發中發揮著越來越重要的作用。現有的裂縫識別仍然局限于人工分割裂縫部分再進行分類,沒法從整個油井地下的成像測井圖像中檢測出裂縫的存在。該文針對測井數據和圖像資料,研究了裂縫經Hough變換后的正弦曲線特性,由此人工制造了大量圖像代替成像數據進行標注,并應用目標檢測相關知識,使用YOLOv3訓練模型,通過fine-tuning基于ImageNet的預訓練模型,對測試集進行目標檢測,不僅加快了收斂的速度,其在抽樣的測試集中還能夠有效地識別出一些裂縫;同時,制造了帶有不同程度噪音的測試集再進行檢測,可知本文的模型允許曲線帶有一定范圍內的噪聲。最后,該文提出了進一步的研究思路,指出可以應用領域生成網絡的思想,且對于不同類型的裂縫,可以考慮看作多個種類的目標檢測問題,進一步進行分類研究。
關鍵詞:裂縫識別;目標檢測;YOLO;遷移學習
中圖分類號:TP391? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)36-0032-05
開放科學(資源服務)標識碼(OSID):
1 引言
一直以來,裂縫性儲層都是勘探的難點和重點,裂縫的導流程度對油氣井的產出情況有很大的影響,在采油過程中,裂縫和半裂縫的識別是非常重要的。地質勘探工作中,反映裂縫信息較多的是成像測井圖像,傳統的人工拾取裂縫的方法工作量大,且存在較大誤差,所以需要提出一種智能提取裂縫,且對其進行準確識別的方法。
目前,在測井裂縫識別方面,與智能裂縫識別相關的研究成果很少。傳統的測井裂縫識別方法[1]很難找到定量分析方法,近年出現了一些使用智能算法及數字圖像處理方法進行裂縫識別的成果:在裂縫提取中,使用改進蟻群算法[2],使用Roberts算子[3]等,此外還有快速霍夫變換、數學形態學[4]、張量投票方法等圖像分割方法。
然而,現有的方法都基于人為捕捉裂縫的前提,再對手動選取的圖像進行識別,這種應用依舊存在著巨大的工作量要求,且高度依賴于人工判斷。并且,目前的算法都具有大數據量的要求,然而在實際的勘探開發工程中,勘探任務難以開展,采集數據尤為艱難。因此,需要一種基于目標檢測的方法,從成像測井圖像中識別出裂縫的存在,并且能夠基于小樣本得到一個較好的效果。于是,本文基于這一問題展開了研究。
2 數據集的預處理
2.1 裂縫數據集的特征
針對電成像測井圖像的測井裂縫識別,主要原理是先對數據進行圖像處理,再進行裂縫信息的提取分析工作。文獻[5-6]使用Hough變換做自動識別。在成像測井圖像的平面展開圖上,測井裂縫一般都是正弦曲線形狀,Hough 變換最初是用來檢測直線的,所以賴富強[5]提出用改進的 Hough 變換來進行裂縫識別。
根據正弦曲線的一般方程公式(1):
[y=Asin(ωx-β)+y0]? ? ? ? ? ? ? ? ? ? ? ? (1)
其中,是式子里的自變量,y是因變量。A作為振幅,ω是角頻率,β是初相位,y0是中線(基線)。將成像測井信息進行處理,可以得到 A、ω、β和 y0這幾個參數,從而得到了裂縫的曲線表達式。如圖1所示,利用改進的Hough 變換可以較好地識別出經過預處理以后的圖像中的裂縫。
基于這一原理,本文假定測井裂縫圖像都能處理成帶一定范圍內噪聲的正弦曲線圖像,因此,可以考慮隨機生成一組正弦曲線作為數據集使用。
2.2 裂縫數據集制備
1)數據集介紹
本文使用的數據集是VOC2007格式的標準數據集,具體格式見圖2。
Images這一文件夾存儲全部的訓練圖片樣本數據,ImageSets這個文件夾存儲4個文本文檔格式的文件,分別存儲記錄了所有訓練圖片數據、測試圖片數據、驗證圖片數據的圖片樣本名稱,Annotations存儲了與圖片對應的.xml格式的標注數據,labels這一文件夾存儲可以直接使用的標注數據,samples文件夾存儲了需要檢測的數據。
2)圖像生成
通過公式(2)[7]來生成模擬的裂縫圖像:
[y=128π×tanθ×cos(128π×(x+1))+257-128π×tanθ+n]? ? ? ? ? ? ? ? ? (2)
其中,[θ]是裂縫傾角,[n]是隨機噪聲。通過修改粗細、傾角等參數,隨機生成了1000張圖片作為數據集,選取其中幾張如圖3。
3)數據標注
通過數據標注工具labelimg生成.xml格式的標注數據。標注圖像和xml文件分別見圖4和圖5。
將數據集及其標注放至對應位置,隨機將數據集劃分為訓練集:驗證集 = 9:1的比例。
4)數據增強
深層神經網絡一般是需要大量數據以獲得較好結果,因為它依賴于能足以概括一個事物不同角度的數據集量。由于地質構造運動的復雜性,地層中的裂縫形態各異,尤其是經歷了板塊擠壓后,裂縫普遍會發生旋轉、擴張等現象,而僅僅1000張圖像顯然無法概括所有情況,為了改善數據有限的問題,采用數據增強的方法,增強樣本多樣性、提高模型魯棒性、避免過擬合。
在計算機視覺這一領域中,典型的數據增強的方式有翻轉、旋轉、縮放、隨機裁剪或補零、色彩抖動、加噪聲等。本文通過在訓練模型的過程中對圖像進行翻轉、改變光照強度等操作,即一種在線增強的方式,操作如圖6。
3 數據集目標檢測YOLOv3
目標檢測,也叫目標提取,就是事先給定一個圖像,進行分割和識別。目標檢測過程需要包含此目標在該圖像中的位置數據信息和分類標簽信息。本文所描述的平均精度特別適合于我們的算法預測目標和類的位置。同時,該平均精度可以用于評價模型定位、目標監控和分割的性能等。
YOLOv3是一種速度和準確率都能達到較高水平的目標檢測模型,使用Darknet-53網絡結構(含53個卷積層),在多尺度、小物體檢測中都有著不凡的表現。
3.1 YOLOv3算法原理
1)特征提取器
YOLOv3[8]的網絡結構如圖7所示。
2)邊界框檢測
YOLOv3用anchor boxex來選定邊界框,過程見圖8。每個邊界框預測4個坐標:[tx,ty,tw,th]。如果目標單元距離圖像左上角的邊距是[(cx,cy)]且對應圖像邊界框的寬和高為[pw,ph],那么網絡的預測為公式(3):
[bx=σ(tx)+cxby=σ(ty)+cybw=pwetwbh=pheth]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (3)
YOLOv3使用邏輯回歸預測每個邊界框的目標與真實目標的符合程度。本文系統將忽略符合度未達到一定閾值的物體,設定閾值為0.5。
3.2 預訓練模型的遷移
對于小樣本數據,為了更快更有效地提取特征,需要基于大量數據的預訓練參數來初始化。本文的訓練是用ImageNet數據集訓練[10],初始值為首次訓練得到的權重值,然后繼續訓練,不斷對參數進行微調。在Imagenet數據集上預訓練的模型的參數從微調開始就效果很好,接近最佳值,所以比直接從自制的訓練集上開始訓練再做微調得到的模型效果更好。因此,微調可以有效地減少迭代次數,使收斂更快。
4 算法實現及結果分析
4.1 模型訓練
我們使用yolov3-tiny預訓練模型,該模型保存了yolov3的前15層卷積層的參數。
模型的四種評估度量如表1所示。
運行時間為1.236h,可以看出,遷移預訓練的模型比從頭訓練更快收斂。
4.2 邊界框預測
1)使用測試機預測邊界框
使用原本劃分的測試集預測邊框,檢測結果如圖9。
而在輸出中,也存在著預測圖10中邊界框的情況。
在本文看來,這是因為訓練集中出現了大量的只有一部分的曲線,這是因為在數據生成時的范圍設置使某種形態的圖像偏多,導致模型泛化能力受到影響。
2)重新生成不同程度噪聲的數據預測邊界框
在正弦曲線上加以一個隨機噪聲,不斷加大噪聲進行裂縫檢測,效果如圖11。
由此可見,本文建立的模型能檢測出帶有一定范圍內噪聲的裂縫曲線,具有一定的魯棒性。這是因為本文的預訓練模型基于包含各種種類的標準數據集,其參數容許樣本存在多樣性,因此大大提升了泛化能力。
5 模型改進
5.1 不同種類裂縫的識別
地質勘探中,裂縫也有嚴格的分類[11],基于這一分類,可以延伸出許多工作:對于勘探開發工作而言,誘導縫是測量儀器在鉆測時壓裂地層時產生的,不具有指示意義,反而會誤導判斷,被稱為“假縫”,因此需要鑒別出天然裂縫與誘導縫,捕捉對地層分析有利的信息;若在檢測出裂縫的基礎上,需要識別出裂縫類型,則原問題變為多目標檢測問題。由于正弦曲線的波長等參數中包含著與傾角有關的信息,可作出不同角度的裂縫圖像,進行不同形態裂縫的識別。
5.2 領域生成網絡
在本文初步的試探性工作下,通過最簡單的遷移學習fine-tuning已經能看出其對于處理小樣本數據的優勢。而在遷移學習中,對于類別空間不共享但任務相似的源域與目標域,可以使用領域生成網絡[12]的方法進行模型訓練。
而目前的DANN是進行了非深度遷移,本文認為,如果將特征提取器替換為Darknet-53,則可以提取源域的深層特征,由于基于正弦曲線的生成方法有能力制作出一個規模大的數據集,因此可以視作源域,而用成像測井裂縫圖像作Hough變換后的曲線作為目標域,通過調整特征提取器的層數,進行試探性研究,探究這兩者究竟在第幾層時會發生負遷移,以做出合理地修正。
5.3 類別不平衡
在實際地質勘探開發過程中,裂縫的類別是不平衡的,這主要是因為地質的構造運動通常會傾向于同一個運動模式,所以訓練模型可能會側重于樣本中數量較大的一類,這樣模型的泛化能力就會降低,上文以F范數評價得到的效果并不好,一定程度上也是因為裂縫識別的模型過分側重于某一形狀,這亦是一種潛在的不平衡。
而在后續做不同種類裂縫檢測時,這一現象會更為明顯。首先,在生成數據集時,應先控制范圍,使數據集符合自然界中的不平衡現象,再對該現象進行處理。
不平衡數據的處理方法有重采樣、欠采樣、平衡抽樣、代價敏感學習等。而綜合考慮本問題中小樣本+不平衡的特點,可以考慮選用生成式對抗網絡[13]。
6 總結
裂縫經Hough變換后,皆可化為帶一定噪聲的正弦曲線,這一特性給予了人工繪制數據集一個有力的依據,也一定程度上克服了在現階段裂縫識別上最大的問題:不可能采集到大量的數據以訓練模型。這簡化了數據采集工作,節約了大量的人力資本。
本文通過fine-tuning基于標準數據集的YOLOv3 tiny預訓練模型,對測試集進行目標檢測,從結果中可以看出,使用預訓練的參數來初始化網絡,不僅加快了收斂的速度,還能夠有效地識別出一些裂縫。對于帶有不同程度噪音的測試集再進行檢測,也能識別出一部分,即該模型具備著一定的魯棒性,這也是因為基于標準數據集的模型容許輸入樣本的多樣性,因此大大提高了泛化能力。
最后,后續的研究可以將領域生成網絡改造成深度遷移,共享人造數據集于裂縫處理后的數據集之間的深層特征,以試探性研究其兩者之間的遷移。該工作有望解決許多問題,如將已有數據的陸相成因油田油藏遷移到很難采集數據以至于幾乎沒有數據的海相成因油藏中,或將某地區的油藏數據應用于新開發的油藏數據中,等等。
參考文獻:
[1] 高霞,謝慶賓.儲層裂縫識別與評價方法新進展[J].地球物理學進展,2007,22(5):1460-1465.
[2] 彭誠,鄒長春.基于改進蟻群算法的成像測井裂縫自動提取方法[J].計算機工程,2015,41(8):196-201.
[3] 田金文,高謙,杜擁軍,等.基于井壁成像測井圖像的溶洞自動檢測方法[J].江漢石油學院學報,1999,21(2):20-22.
[4] 秦巍,陳秀峰.成像測井井壁圖像裂縫自動識別[J].測井技術,2001,25(1):64-69,81.
[5] 賴富強.電成像測井處理及解釋方法研究[D].青島:中國石油大學,2011.
[6] 劉文斌.火山巖儲層縫洞測井自動識別和定量評價[D].長春:吉林大學,2017.
[7] 杜小強,劉鑫,薛志波,等.基于深度學習的電成像測井裂縫自動識別方法初探[J].化工管理,2019(24):204-205.
[8] Redmon J,Farhadi A.YOLOv3:an incremental improvement[EB/OL].2018
[9] Redmon J,Farhadi A.YOLO9000:better,faster,stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).July 21-26,2017,Honolulu,HI,USA.IEEE,2017:6517-6525.
[10] Zhou Z W,Sodha V,Siddiquee M M R,et al.Models genesis:generic autodidactic models for 3D medical image analysis[EB/OL].2019
[11] 周燦燦,楊春頂.砂巖裂縫的成因及其常規測井資料綜合識別技術研究[J].石油地球物理勘探,2003,38(4):425-430,462.
[12] Ganin Y,Ustinova E,Ajakan H,et al.Domain-adversarial training of neural networks[M]//Domain Adaptation in Computer Vision Applications.Cham:Springer International Publishing,2017:189-209.
[13] Goodfellow I.NIPS 2016 tutorial:generative adversarial networks[EB/OL].2016:arXiv:1701.00160[cs.LG].https://arxiv.org/abs/1701.00160.
【通聯編輯:唐一東】