王婷婷,孫振軒,戴金龍,姜基露,趙萬春
1.東北石油大學電氣信息工程學院,黑龍江 大慶 163318
2.東北石油大學非常規油氣研究院,黑龍江 大慶 163318
巖性信息的識別分類對油氣儲層分類評價具有重要意義[1]。常規方法通過鉆井或巖屑錄井等方式獲取巖心,根據巖心分析巖性信息[2-5]。這些方式存在價格高昂、誤差較大、后續實驗分析復雜等問題,使得根據測井資料識別巖性信息備受關注[6-7]。
油氣勘探開發的物理測井資料能夠充分展示地層信息,具有全方位、高分辨率、信息量大、復雜程度高的特點[8]。研究人員嘗試將交會圖技術作為分析測井曲線的主要方法[9-10]。隨著油氣勘探開發規模的擴大和儲層復雜度的提高,研究發現交會圖技術無法完全揭示測井數據中可能存在的關系,測井解釋同樣依靠測井分析專家的經驗[11-12]。近年來隨著計算機算力的增強以及人工智能的發展,機器學習在分析復雜數據中表現出巨大的優勢,可以最大程度地減少人為干擾所導致的偏差[13-14]。機器學習應用于巖性分類的常見算法包括支持向量機(support vector machine, SVM)、決策樹、人工神經網絡(ANN)、樸素貝葉斯統計方法等[15-18]。傳統機器學習算法對數據量要求巨大,而常規測井數據珍貴,無法滿足機器學習的大規模訓練,導致訓練效果不佳[19]。機器學習在訓練時,任何新的數據或經驗都可能導致錯誤結果輸出。在巖性識別方面,由于測井數據變化多樣以及每組數據包含眾多的類,機器學習在訓練單組測井數據時,無法實現多種分類輸出,且在識別分類時容易忽略巖石沉積演化過程中巖石類型轉移階次的問題,無法提取深度方向上數據與數據之間的信息,導致無法準確分類巖石序列或出現儲層中不存在的巖石序列。
相對其他機器學習算法而言,深度學習作為機器學習的一個全新領域,經過近幾年的快速發展,在算法和理論上日趨成熟,同時也融合了部分其他機器學習算法,使深度學習應用更加廣泛,效果更加優秀。隨著AlexNet、Visual Geometry Group、GoogleNet、ResNet等深度學習網絡的崛起[20-23],單組測井數據實現多分類問題得以解決,同時在深度方向加強了數據與數據之間的聯系。
本文采用深度學習網絡中的U-Net。U-Net具有良好的去噪性能,且對數據量小、數據信息豐富的數據,表現出較好的分類效果[24]。基于測井數據和U-Net的自身特點,研究發現測井數據分類存在以下問題:1)常規測井數據量少,無法滿足機器學習大規模訓練;2)機器學習算法忽略了測井數據在深度方向的聯系;3)U-Net在自上而下特征提取的過程中,忽略高級通道對低級通道的影響,而導致巖性分類性能較差;4)U-Net在特征提取過程中因為最大池化等問題會造成特征“退化”;5)測井數據變化復雜,而U-Net結構簡單,容易忽略數據所包含的關鍵信息。
針對以上問題,本文基于U-Net提出一種適用于測井數據的網絡結構:特征注意力融合網絡(feature attention fusion Unet, FAF-Unet),分別從通道方向和卷積方向添加殘差塊與通道注意力機制。FAF-Unet針對U-Net處理測井數據時的問題擬做如下改善:1)在下采樣過程中添加殘差塊來減少“退化”現象;2)將特征提取的高級通道信息與低級特征結合,增加部分低級特征通道的權重,提高巖性分類性能;3)為了提高網絡對關鍵信息的提取,特別提出特征注意力融合(FAF)模塊。
U-Net具有分類以及分割的作用,相比于普通分類網絡,它是一種可以進行多分類的語義分割網絡。由于測井曲線數據的特點,U-Net成為本文基礎網絡。本文特征提取網絡處理的數據為一維測井數據。在處理曲線類數據時,Oh等[25]用U-Net處理一維Electrocardiogram(ECG)數據。U-Net網絡主要采用卷積神經網絡(CNN),CNN對噪聲具有魯棒性,因此即使在數據嘈雜的情況下也能夠提取有用的預測變量[26]。U-Net最初應用于生物醫學領域,可以用少量的數據集訓練達到較為理想的分類結果,這在數據量相對有限的領域作用巨大。
U-Net產生于FCN(fully convolutional networks)[27]。與FCN相比,U-Net具有更加完善的解碼器以及跳躍結構。其主要框架由特征提取網絡、特征融合網絡和跳躍連接構成。特征提取網絡主要作用為得到抽象語義特征。在特征提取過程中,數據特征具有從低級特征到高級特征的特點。而特征融合過程與特征提取過程相反,數據特征具有從高級特征到低級特征的特點,原因是在上采樣過程中融合了下采樣所產生的數據特征。由于上采樣部分與下采樣部分對稱,形成了U型結構,故稱為U-Net。U-Net具有較強的抗干擾能力,但在特征提取過程中存在信息丟失的情況[28]。
眾多研究表明,在深度卷積神經網絡中,添加注意力機制能夠顯著提高CNN的性能[29],且注意力機制可以更好地解決上下文特征關聯度差的問題[30]。在U-Net模型中添加注意力機制,可以篩選出與分類結果相關程度大的信息。注意力機制可以在特征提取時自動獲取與分類結果相關的特征并抑制不重要的特征,從而有效提高巖性分類效果。注意力機制類似于專家分析數據,從大量因素中篩選出決定性因素。注意力機制主要包括通道注意力機制和空間注意力機制,本文采用數據格式為一維數據,主要采用通道注意力機制。
通道注意力機制更注重通道間的信息,本文的輸入數據為一維8通道輸入數據,包括聲波(AC)、自然伽馬(GR)、井徑(CAL)、自然電位(SP)、深側向電阻率(RLLD)、淺側向電阻率(RLLS),密度(DEN)、光電吸收截面指數(PEF)。有效通道注意力網絡(efficient channel attention net, ECA-Net)(圖1)是SE-Net(squeeze-and-excitation net)的一種改進形式,可以說是通道注意力機制的一種實現形式。其核心思想是卷積操作具有良好的跨通道獲取信息的能力,能夠在一定程度上彌補SE-Net降維所帶來的缺陷。
傳統U-Net在跳躍連接中直接將低級特征與上采樣進行融合。低級特征通道所包含的權重并不相同,在直接與上采樣融合的過程中忽視了對分類產生作用的關鍵通道。本文一維8通道輸入數據,數據與數據之間的聯系決定了分類效果,通過特征注意力融合網絡幫助提升關鍵通道權重。
本文基于U-Net提出了FAF-Unet,其是基于測井數據識別儲層巖性的網絡,結構如圖2所示。FAF-Unet模型集成了殘差卷積和注意力機制,殘差塊可以更好地保留深度方向低級特征的數據,而通道注意力機制可以彌補豎向卷積時忽略橫向通道之間聯系的問題。具體為,首先,為了減少更多特征信息的損失,在網絡模型編碼器部分采用殘差卷積模塊,能夠避免模型“退化”帶來的問題。其次,在卷積的過程中,根據測井數據深度方向進行卷積(圖3)。最后,在模型跳躍連接部分添加ECA機制,有效獲取通道之間的特征信息。

圖2 FAF-Unet模型

圖3 卷積方向結構圖
本文分析U-Net模型的缺陷,設計FAF模塊,將高級特征獲取的通道信息與低級特征融合,彌補低級通道對重要信息關注度不夠的缺陷,使網絡的高級特征通道指導網絡的低級特征通道,從而達到獲取更多語義和細節特征信息的目的。將深層通道特征的細節信息和淺層通道特征的語義信息拼接融合可以有效緩解網絡模型錯檢、漏檢等問題。在整個模型中,使用通道注意力機制的特征提取層,將輸出特征使用全局平均池化,保持1×1×C通道,使用大小為k的卷積核在1×1×C的全局描述特征圖上做一維卷積,并調整通道數與低級特征通道數相等,以捕獲跨通道局部交互信息。對以上得到的結果,通過Sigmoid函數將其映射到0~1之間。k個近鄰通道共享權重,以及通過一維卷積實現卷積操作。
(1)
w=σ[C1Dk(y)]。
(2)

令Fl為下采樣過程中第l層的特征,使用通道注意力機制得到特征向量VC,高級特征通道注意力機制以及與低級特征輸出Hout特征融合過程如下:
(3)
(4)

FAF-Unet模型(式(4))等號右側為上采樣過程,主要進行網絡的特征融合。將數據恢復成原來的數據尺寸,并通過歸一化指數函數給輸出類別進行打分。圖4中左側每行為類別,顏色越深代表相應類別的分值更高,右側為分數最高的分類結果。

圖4 模型輸出示意圖
數據集采為松遼盆地中央坳陷區龍虎泡油田地層的測井數據。龍虎泡油田位于黑龍江省大慶市杜爾伯特蒙古族自治縣境內[31-32],西鄰敖古拉油田,東鄰哈爾溫油田,北為金騰油田,南接龍南油田。區內地勢平坦,海拔在140~160 m之間。龍虎泡地帶(圖5)位于中央坳陷區的龍虎泡階地,東部、南部緊鄰齊家—古龍凹陷,總體為一東高西低的單斜構造[32],東部、西部以及東北部為單斜構造,北部構造比較簡單。

圖5 松遼盆地中央坳陷區龍虎泡油田A區塊高三組頂面構造
本實驗的實驗配置及實驗參數設置包括:計算機硬件配置為NVIDIA GeForce RTX 2080 Ti(GPU),Intel(R) Xeon(R) CPU E5-2678 v3@2.50 GHz處理器,軟件試驗環境配置為Ubuntu18.04操作系統,深度學習框架采用Tensorflow2.6,編程語言為python3.7以及numpy1.17.0等庫。
本文特征提取網絡改為處理一維測井數據,數據集包含20口井測數據,共160 000個分類數據。從井口數據中將8種選中的數據排列成二維矩陣,初步形成160張尺寸為8×1 000的原始測井數據,數據集均采用有效儲層數據。根據專家分析以及實際巖柱分析,將測井數據制作成與之對應的實際標簽。總共分為5類:粉砂巖、泥質粉砂巖、粉砂質泥巖、泥巖、油頁巖。由于儲層巖性沉積演化和測井數據的形態特征具有特殊意義,在對測井數據進行處理時需要對測井資料進行深度校正、數據增強和降噪處理,以保證每組數據處在同一深度。訓練時采用單GPU,利用Adam網絡優化算法,一共訓練100次迭代次數,網絡訓練每批次為2,衰減底數設置為0.92,初始學習率設置為10-4,采用遷移學習策略獲得網絡預訓練權重,根據不同對比實驗超參數設置略有調整。
數據集經過校正處理,在很大程度上消除了外部因素所產生的噪聲影響。通過對儲層巖性和測井資料的分析[31],篩選出8項測井參數(SP、PEF、DEN、AC、CAL、RLLD、RLLS、GR)進行敏感性分析,這8項測井資料對不同巖性均表現出不同的敏感性。此外,深感應電阻率測井(RILD)與中感應電阻率測井(RILM)更多應用于劃分滲透層,能夠快速直觀地判斷油、水層,但與本文劃分儲層巖性不具有相關性,因此沒有考慮在內。本文采用的是深度學習算法,如果在現場實測中有更多關于儲層巖性分類的測井曲線,將更加有利于深度學習算法的訓練。
以龍虎泡油田龍-26井為例,對5種巖性做箱形圖進行分析,結果如圖6所示:1)密度測井對泥巖敏感程度高,與其他巖性沒有重疊部分,在識別其他巖性時效果較差(圖6b),而淺側向電阻率對識別泥巖與粉砂質泥巖效果較好(圖6f),因此泥巖和粉砂質泥巖可以用密度-淺側向電阻率來劃分;2)聲波時差測井與自然伽馬測井對油頁巖識別效果較好,且自然伽馬測井對泥巖類與砂巖類分類效果較好(圖6c、g);3)自然電位測井能夠區分粉砂巖(圖6a),同時粉砂巖中泥質含量較低,自然伽馬測井值較低,因此自然電位測井與自然伽馬測井在劃分粉砂巖時具有良好的效果。由于測井數據的復雜性,箱形圖展示的測井數據會出現部分異常值,異常值的出現主要對極值范圍產生影響,對整體的敏感性分析影響較小。

ft(英尺)、in(英寸)為非法定計量單位,1 ft=0.3048 m,1 in=0.0254 m,下同。
根據真實測井數據,對不同測井數據與不同巖性之間進行敏感性分析,并統計敏感性分布在20%~80%之間的測井數據,結果如表1與表2所示。分析圖6、表1、表2可以得出:1)常規測井數據在解釋儲層巖石巖性上具有重要的參考作用;2)由于巖石沉積演化,以及巖性與巖性間的相互影響,每組測井數據在箱形圖分析上都表現出不同程度的重疊情況,需要多組特征的測井數據協同分析;3)不同巖性對不同測井參數敏感性不同,單一測井數據只能對巖性大類進行初步劃分,只有通過更多通道特征的測井數據綜合分析,才能實現對巖性進行精細劃分。

表1 松遼盆地中央坳陷區龍虎泡油田不同巖性參數響應特征對比(敏感性為20%~80%)
本文通過召回率和準確率兩個方面評價FAF-Unet的性能。
1)召回率指分類過程中真陽性在實際標簽為陽性樣本中的占比:
(5)
式中:R為召回率;NTP和NFN分別為真陽性和假陰性樣本的數量。
2)準確率指分類過程中真陽性在判斷為陽性樣本中的占比:
(6)
式中:P為準確率;NFP為假陽性樣本的數量。
本文通過混淆矩陣分別對比了SVM、決策樹、U-Net、添加ECA機制的U-Net(ECA-Unet)、添加殘差塊的U-Net(Res-Unet)以及同時添加ECA機制和殘差塊的FAF-Unet 等6種方法的巖性識別情況,結果如圖7所示。表3、表4以表格形式對比了6種方法的準確率和召回率。

表4 松遼盆地中央坳陷區龍虎泡油田不同方法的巖性識別召回率
SVM方法結果受數據噪聲影響較大,因此該實驗數據集經過平滑去噪處理以確保實驗結果的可靠性。決策樹方法純葉節點會導致模型復雜,容易引起過擬合而影響實驗結果,本文訓練中主要采用提前終止的方法來防止過擬合情況的發生,保證實驗結果的可靠性。控制卷積核的大小對實驗結果至關重要,卷積核的大小可以直接影響網絡特征提取能力,U-Net采用的卷積核大小為3×1,而Res-Unet、ECA-Unet、FAF-Unet均在U-Net基礎上改進創新。
SVM方法在測井數據預測識別時,對特征較為明顯的油頁巖效果較好,預測準確率為70.01%(圖7a、表3),召回率為78.65%(表4),召回效果強于準確率。決策樹方法對泥巖預測效果較好,預測準確率為76.03%(圖7b、表3),召回率為68.47%(表4)。SVM方法和決策樹方法準確率在55.10%~76.03%之間(表3),召回率在56.52%~78.65%之間(表4),波動范圍較大,而且對巖性變化不明顯的儲層巖性識別效果較差,不適合識別粉砂質泥巖、粉砂巖和泥質粉砂巖。
U-Net方法對于測井數據識別分類效果相比于SVM方法與決策樹方法有所提升,U-Net具有與機器學習不同的特征提取方式和特征融合方式,可以最大程度地提取數據間的內在信息。U-Net方法對5種巖性識別的準確率、召回率均在70.00%以上(分別為71.13%~78.06%(表3)和73.20%~76.60%(表4))。相比于SVM方法和決策樹方法,U-Net方法魯棒性更強,但在準確率與召回率方面并沒有表現出突出的優勢,這是由于下采樣過程中的池化、dropout等步驟導致部分特征喪失。Res-Unet方法和ECA-Unet方法在識別5種巖性時準確率和召回率比U-Net方法有所提升,FAF-Unet方法提升效果更顯著,其準確率和召回率均達到89.00%以上。相比于U-Net方法,FAF-Unet方法對5種巖性的識別準確率分別提升了13.92%、19.97%、11.99%、18.90%、14.29%(表3),召回率分別提升了17.40%、13.60%、16.06%、18.64%、14.32%(表4)。FAF-Unet方法的準確率和召回率均高于其他方法,其中,與SVM、決策樹、U-Net相比,FAF-Unet識別巖性的平均準確率分別提高了24.65%、27.79%、16.01%,平均召回率分別提高了24.25%、27.46%、16.00%。
不同方法的巖性識別結果對比如圖8所示。可以看出,FAF-Unet與真實標簽匹配程度更高,預測的準確率更高。

圖8 松遼盆地中央坳陷區龍虎泡油田測井數據及不同方法巖性識別結果對比
1)FAF-Unet方法能夠有效識別巖石沉積序列,有助于提升儲層巖性識別效果。通過添加特征注意力融合模塊與殘差模塊,解決了普通模型在特征提取時造成特征信息丟失的問題,使網絡能夠有效捕捉巖性與測井數據之間的內在關系,增加模型魯棒性。
2)FAF-Unet具有良好的泛化能力,通過引入殘差模塊與通道注意力機制,自動提取測井數據序列間的信息,提升巖性識別精度,保證了特征信息傳遞的完整性。
3)與SVM、決策樹、U-Net相比,FAF-Unet識別巖性的平均準確率分別提高了24.65%、27.79%、16.01%,平均召回率分別提高了24.25%、27.46%、16.00%,準確率與召回率均達到89.00%以上,能夠在實際油藏生產中得到更好的應用。