999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習方法的數字巖芯電導率預測

2020-07-15 05:04:04晨,陳
計算機技術與發展 2020年7期
關鍵詞:模型

郭 晨,陳 龍

(長安大學 信息工程學院,陜西 西安 710064)

0 引 言

數字巖石物理(digital rock physics,DRP)是近些年興起的一種計算巖石物理的方法。通過CT掃描技術對巖石樣本進行三維成像,建立能模擬巖石孔隙空間分布的數字化巖芯數據,在此基礎上進行數值模擬,計算巖石等效物理參數[1]。數字巖石物理包含數字巖芯模型建立和等效物理場模擬兩個大的部分,其數字巖芯微觀結構可見,微觀影響因素可控,能進行多物理場模擬,相比較實驗巖石物理而言,這種分析方法較為精確且效率高[2]。數字巖石物理可廣泛應用在模擬流動性[3]、滲透性[4]、電特性[2]、聲學[5]及彈性[6]等領域。其中巖芯的電特性對于確定巖性,劃分油水層、確定油水飽和度等物理參數具有重要參考作用。然而在實際應用中,由于CT掃描得到的巖芯三維數據龐大,對其進行精確物理場數值計算時耗費資源巨大。為了提高數字化分析方法的效率,本研究將機器學習方法創新性地應用到了數字巖石物理之中。機器學習就是通過編碼使得計算機具有像人一樣的學習能力,進而對新的數據進行預測[7]。本研究的目標為:通過機器學習模型對標定電導率的巖芯數據進行特征化學習,最終免去復雜耗時的物理場數值計算,直接通過巖芯數據預測其電導率。傳統的機器學習算法有K近鄰算法、決策樹、線性回歸、支持向量機、樸素貝葉斯分類器和邏輯回歸等,而神經網絡是一種特殊的機器學習方法,被廣泛應用于圖像分類、目標檢測、語音識別、圖像和語音生成等方面[8]。目前神經網絡相較于傳統機器學習方法而言,其性能最優,但它也需要更多的數據,可解釋性差,且計算成本高,因此兩者是各有所長。在本研究中傳統的機器學習方法和神經網絡都被應用到巖芯電導率預測方面,通過學習巖石的幾何特征、圖像空間分布與電特性的映射關系等,最終達到優化預測效果、降低計算開銷的目的。

1 數據處理

在研究中使用了400×400×400體素的貝雷亞砂巖巖芯(Berea Sandstone)。巖芯圖像是三維二進制數據,在三維空間中,單個位置的數值為1或0,分別代表巖石固體或空隙。為了獲得足夠多的實驗巖芯樣本,實驗中對數字巖芯圖像進行子樣截取。由于考慮到巖芯的幾何特性和計算資源,該實驗采用64×64×64作為截取尺寸。研究使用了一個“移動立方體取樣器”的方法對原始圖像進行子取樣[9]。以貝雷亞砂巖巖芯圖像上沿著XYZ各個正方向每次移動24個單位進行子樣截取,子樣與子樣之間可能會有重合部分。最終實驗共獲得了3 375個體素64×64×64尺寸的巖芯樣本。取樣后使用有限元的方法計算出每個巖芯樣本的電導率,用電導率作為機器學習的目標。

2 特征提取

2.1 Minkowski泛函

Minkowski泛函是幾何形態特征的統計量。對于n維空間,有n+1個的Minkowski測量量。3維圖像具有4個Minkowski測量量,分別是體積(V)、表面積(S)、平均積分曲率(平均寬度)(M)和歐拉特性(X)[10]。歐拉特性又常稱作高斯曲率積分,公式如下:

V=V(y)

其中,r1(s)表示表面上的最大曲率,r2(s)表示表面上的最小曲率。Minkowski泛函可以綜合反映巖石幾何參數,如孔隙度、比表面積、顆粒的圓度等[11]。巖芯幾何特性直接影響到巖芯的電特性。因此使用Minkowski泛函在預測巖芯電導率上展示出更好的優勢。為了更直觀地表現巖芯樣本的幾何特征,將體積轉為孔隙率(空隙體積/總體積),表面積轉換為比表面積(面積/體積)。實驗中巖芯樣本的孔隙率、比表面積、平均曲率積分和歐拉特性是由三維二元分割圖像中直接計算獲得。

2.2 三維二元分割圖像

三維二元分割巖芯圖像作為卷積神經網絡的輸入。實驗巖芯的體素為64×64×64,單個空間位置上的數值為1或0。實驗中將原為0到1的數值區間投影到-1到1的區間。具體操作是將原來圖像上的0替換成-1。

3 方 法

3.1 機器學習

機器學習(machine learning,ML)是通過算法使得計算機具有學習能力,從歷史數據中學習規律,進而預測新的數據。機器學習的步驟主要分為選擇數據、搭建模型、驗證模型、測試模型、使用模型、優化模型。

3.2 集成學習

集成學習(ensemble learning)是一種學習算法,它構造一組分類器,通過對預測進行(加權)表決來對新的數據進行分類[12]。常見的集成技術有Bagging、Boosting和Stacking。

3.2.1 加權平均法

加權平均法:

加權平均法是一種集成策略。通過模型訓練可以得到多個不同的學習器,加權平均法是對每個使用的學習器的結果賦予不同的權值,實現結果的融合。對于驗證結果較好的學習器賦高權值,而驗證結果較差的學習器賦低權值,在賦值的同時保證總權值為1[13]。

3.2.2 堆疊法

Stacking不使用瑣碎的函數(如硬投票,加權平均)執行集成,而是訓練一個學習器來執行這個集成的過程。在Stacking中個體學習器被稱為初級學習器,而用于結合的學習器稱為次級學習器。Stacking先從初始數據集訓練出初級學習器,將初級學習器的輸出當作特征構成新數據集,利用新數據集再訓練次級學習器[14]。Stacking使用的初級學習器可以是同一種算法,也可以是不同的算法。

3.3 多層神經網絡(MNN)

多層神經網絡包含輸入層、隱含層和輸出層,結構如圖1所示。每一層的神經元與下一層神經元都相互連接,同層神經元不連接。對于多層神經網絡一般采用誤差逆傳播來更新權值[15]。

圖1 神經網絡結構

3.4 3D卷積神經網絡(3DCNN)

3D卷積神經網絡是一種深度神經網絡,主要包括卷積層、子采樣層和全連接層。在卷積層中實現卷積操作。使用卷積核進行卷積運算,卷積核的大小是遠小于圖像矩陣的。具體操作是對于圖像矩陣的每一個像素計算它周圍像素與卷積核的乘積。為了避免維數災難,通常在卷積層之后用一個子采樣層來降低特征維數。全連接層是一種下一層的每一個神經元都與上一層的每個神經元相連接的網絡結構。卷積神經網絡通過卷積層、子采樣層和全連接層組合的框架降低計算成本,防止過擬合,且提高了圖像識別的準確性。

三維卷積如圖2所示。

圖2 三維卷積

4 模型搭建與訓練

4.1 集成學習基礎學習器算法選取

本研究按4∶1的比例將數據劃分成訓練數據和測試數據。訓練數據用于訓練模型,測試數據用于最后測試模型性能。在訓練中,以歸一化后Minkowski參數作為輸入特征,以巖芯電導率為輸出目標,按不同的機器學習算法訓練多個學習器。同時,用五折疊交叉驗證來驗證模型性能。該實驗使用了線性回歸(LinearRegression)、嶺回歸(RidgeRegression)、Lasso回歸(Lasso)、隨機森林回歸(RandomForestRegressor)、梯度提升回歸(GradientBoostingRegressor)、支持向量回歸機(SVR)、線性支持向量回歸機(LinearSVR)、彈性網絡(ElasticNet)、隨機梯度下降回歸(SGDRegressor)、貝葉斯嶺回歸(BayesianRidge)、核嶺回歸(KernelRidge)、極端隨機森林回歸(ExtraTreesRegressor)、極限梯度提高回歸(XGBRegressor)等算法來搭建基礎學習器。

4.2 加權平均模型集成

表1給出了不同算法搭建出的學習器的性能對比,最終選定了按LinearRegression、GradientBoostingRegressor、KernelRidge、XGBRegressor算法搭建的模型為基礎學習器。接著對各個模型進行參數調優,以求得更好的性能。最后按0.2,0.2,0.3和0.3的權值賦予各個學習器,進行加權平均,集成一個新的學習器。

表1 各機器學習方法性能對比

4.3 Stacking模型集成

在Stacking的策略中,仍使用LinearRegression、GradientBoostingRegressor、KernelRidge、XGBRegressor算法搭建初級學習器,選擇了LinearRegression算法搭建次級學習器。訓練中用初始訓練數據集訓練第一層初級學習器,產生新的數據集訓練第二層的次級學習器,第一層初級學習器的輸出是第二層次級學習器的輸入特征,同時原始標簽仍被作為新數據集的標簽。

4.4 多層神經網絡(MNN)和三維卷積神經網絡(3DCNN)搭建訓練

以Minkowski參數為輸入特征搭建多層神經網絡,以三維二值分割圖像為輸入特征搭建一個三維卷積神經網絡。兩個模型都使用均方根誤差(RMSE)作為損失函數,Adam作為優化器來進行模型訓練。實驗將數據按3∶1∶1將數據集劃分成訓練集,驗證集和測試集。訓練集用于模型權重更新,驗證集用于驗證模型效果和提早結束訓練,防止過度擬合,測試集用于評估最終模型效果。

5 結果與分析

表2總結了不同學習模型訓練集和測試集的平均絕對百分比誤差(MAPE)。如預期一致,一般情況下學習模型訓練集上的MAPE小于測試集上的MAPE。兩種集成方式加權平均模型和Stacking模型均在預測效果上比單一機器學習方法有提升。對于多層神經網絡而言,其預測效果與傳統的機器學習方法效果并無大異。使用三維圖像的3DCNN比使用幾何參數的學習模型預測效果要好,這表明卷積操作比幾何參數更好地捕獲到巖芯的特征。

表2 各模型測試性能對比

6 結束語

文中提出了機器學習的方法在實驗巖芯電導率的預測,其預測結果達到了較好的準確性。研究結果證明機器學習在巖石物理領域的強大潛力,為數字巖芯電導率的研究提供了可供參考的新方法。同時實驗對比表明卷積神經網絡比幾何參數學習模型對數字巖芯電導率預測效果更優。計劃在下一步研究中采用更深更復雜的卷積網絡結構以謀求更好的效果,但幾何參數仍然具有潛力,將添加更多的幾何參數。在研究中初始樣本只有一個巖芯樣本,子采樣的方式可能會導致圖像和圖像之間關聯度強,造成實驗誤差。為了解決該問題,可能會采用對抗生成網絡生成樣本或者收集更多的巖芯樣本。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 色婷婷电影网| 日韩黄色精品| 污网站在线观看视频| 青青青草国产| 97视频免费在线观看| 欧美激情一区二区三区成人| 婷婷激情五月网| 亚洲最黄视频| 一区二区自拍| 在线播放国产一区| 国产一区免费在线观看| 国产精品自拍合集| 大香网伊人久久综合网2020| 欧美亚洲日韩中文| 青青草a国产免费观看| 中文字幕在线永久在线视频2020| 国产免费一级精品视频| 久久精品66| 成人av手机在线观看| 狠狠综合久久久久综| 农村乱人伦一区二区| 欧美一区二区啪啪| 任我操在线视频| 三区在线视频| 热九九精品| 国产乱子精品一区二区在线观看| 亚洲日韩精品伊甸| 日本精品影院| 日韩东京热无码人妻| 亚洲人成人无码www| 青青青伊人色综合久久| 国产成人亚洲精品蜜芽影院| 免费观看成人久久网免费观看| 午夜精品福利影院| 成人午夜免费观看| 亚洲天堂首页| 久久五月视频| 亚洲视频三级| 欧美精品v| 国产福利在线观看精品| 免费在线观看av| 国产一级α片| 色婷婷色丁香| 亚洲成在线观看| 午夜视频在线观看区二区| 国产91特黄特色A级毛片| 中国毛片网| 国产网站免费观看| 欧美日本中文| 亚洲成a人片| 午夜色综合| 在线日本国产成人免费的| 极品国产一区二区三区| 国产精品私拍在线爆乳| 影音先锋亚洲无码| 亚洲精品无码在线播放网站| 国产成人免费高清AⅤ| a免费毛片在线播放| 国产成人福利在线| 亚洲免费黄色网| 欧美日本激情| 欧美在线视频不卡| 粉嫩国产白浆在线观看| 欧美精品成人| 九九香蕉视频| 日韩欧美综合在线制服| 99久久精品国产自免费| 欧美亚洲网| 欧美亚洲国产精品久久蜜芽| 日本三区视频| 在线观看欧美国产| 激情综合网址| 在线观看亚洲天堂| 欧美天堂在线| 欧美一级色视频| 亚洲va在线观看| 中文无码毛片又爽又刺激| 婷婷午夜影院| 啪啪啪亚洲无码| 国产亚洲视频免费播放| 亚洲国产精品日韩av专区| 亚洲色中色|