999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

距離權重改進的Pearson相關系數及應用

2019-12-05 07:26:26韓堅舟王小玄范立紅
石油地球物理勘探 2019年6期

韓 晟 韓堅舟 趙 璇 王小玄 范立紅 梅 杰

(①中國石油華北油田勘探開發研究院,河北任丘 062550; ②中國石油華北油田第五采油廠,河北辛集 052360;③中國石油集團渤海鉆探工程有限公司第二錄井分公司,河北任丘 062552)

0 引言

相關系數是一種定量描述兩組隨機變量的統計學相關性的指標。相關系數的計算方法有很多種,其中比較經典的有Pearson[1]、Spearman[2]和Kendall[3]等相關系數法。這些計算方法都有其適用范圍: Pearson相關系數適用于二元高斯分布; Spearman和Kendall相關系數適用于非線性分布[4]。雖然計算過程不同,但是以上三種相關系數有相似性,它們都可以抽象為廣義相關系數[5],即通過比較數組中的每個數對以確定兩組數據整體間的相關程度。

相關系數在油氣勘探中應用最多的是數據優選,如利用有效性開展屬性優選[6-7]、地球化學取樣中的多自由度分析[8]、烴源巖的預測[9]等。同時,還有學者將相關系數應用到多種數據的聯合預測[10]和磁法勘探的低緯度化極算法[11]中。

在地球物理學中應用相關系數的基本原理是不同地球物理參數的同源性[12],即在一片區域觀測的不同類型的物理量(重、磁、電、震、測井數據等)是同一套地質體的不同響應。所以,研究不同數據的相關性的大小有助于優選出與地質體有關的變量,從而揭示地質體與觀測量之間關系的規律。

在油氣勘探領域,變量常受多種因素影響,因而兩組變量的相關情況比較復雜。為了盡量減少影響,可以選擇計算地理位置較近點(兩組特定變量)的相關性。當兩個取樣點的地理位置較近時,它們受同一因素影響的可能性更高,因此比較地理位置較近的樣點更有助于控制變量數目。為了研究數據在空間分布上的特征,本文在廣義相關系數的基礎上,引入空間權重的概念,在比較每組數據時加入與空間距離有關的權重改進比較結果。在空間數據學中,有應用類似的權重計算空間自相關的方法,比如Moran自相關[13]和Geary自相關[14],前者經過宋馬林等[15]改進也可以應用到非網格型數據的相關計算中。

如果將廣義相關系數看作一種全局相關系數,那么這種距離權重改進的相關系數則是一種局部相關系數。本文將詳細說明局部相關系數的原理及其性質,并利用模擬數據和實際數據檢驗該相關系數的應用效果。

1 原理

假設有兩組隨機變量X和Y,它們各自經歷了n次獨立觀測。Xi和Yi表示第i次觀測值, (xi,yi)是第i次觀測的大地坐標。

1.1 廣義相關系數

Pearson、Spearman、Kendall相關系數都可以抽象為以下計算模式[4,16]

(1)

如果aij=Xj-Xi、bij=Yj-Yi,式(1)為Pearson相關系數計算公式;

如果aij=Pj-Pi、bij=Qj-Qi,P為X在本組變量中的序次,Q為Y在本組變量中的序次,此時式(1)為Spearman相關系數計算公式;

如果aij=sgn(Xj-Xi)、bij=sgn(Yj-Yi),sgn(·)表示符號函數,此時式(1)為Kendall相關系數計算公式。

式(1)說明了這三種相關系數的計算方法都可以看成是比較隨機變量中的每一組數對后再求和的形式。每組數對的比較都會給計算結果貢獻一個值,最后求和是為了得到各個數對的比較結果的整體趨勢。

廣義相關系數的取值范圍為[-1,1]。當相關系數的絕對值越大,說明兩組隨機變量的相關性越強。符號為正時稱為正相關,即一組變量隨著另一組變量的增大而增大;符號為負時稱為負相關,即一組變量隨著另一組變量的增大而減小。

1.2 距離權重

如果應用具地理意義的距離權重,需要符合“地理上距離越近的事物關聯性越強”[17]這一條地理學第一定律,即權重矩陣與數對之間的距離為負相關,也說是說,兩點間的距離越近,權重越大。這里僅討論一種比較簡單的距離權重選取方式

(2)

(3)

式中:λij為距離權重,值域為[0,1];dij為i與j點之間的距離;σ為搜索半徑(距離閾值)。式(2)、式(3)表明,只比較兩點之間的距離小于一定值的點,且在這個距離范圍內賦予各點等權重。

1.3 距離權重改進的Pearson相關系數

若計算兩組數據在空間上的相關情況,需將空間(距離)權重引入到相關計算中。以Pearson相關系數為模板

(4)

將Pearson相關系數結合空間權重推廣到空間內

I′=

(5)

式(4)為Pearson相關系數,該式通過比較數據中的每組數對,再累加求和,從而體現數據的整體趨勢(單調性)。

式(4)的核心是(Xj-Xi)(Yj-Yi),即比較數據中任意一個數對的X變量和Y變量,并將其結果相乘。如果數對(Xj-Xi)與(Yj-Yi)異號,則說明X較大值對應Y的較小值(或X較小值對應Y的較大值);如果數對(Xj-Xi)與(Yj-Yi)同號,則說明X的較大值對應Y的較大值(或X的較小值對應Y的較小值)。分子通過兩次求和計算以統計數據中每組數對的符號異、同性。如果這組數據具有單調性,則每組數對的比較結果(Xj-Xi)(Yj-Yi)出現同一種符號的數量多,此時累加求和的結果的絕對值就大。而當(Xj-Xi)(Yj-Yi)出現不同符號的數量越多時,則累加求和的結果越接近0。

式(4)的分母可以看作是這組數據的(Xj-Xi)與(Yj-Yi)分別求均方根、再相乘的形式。分母并不影響式(4)的符號,只是將分子的結果進行歸一化。

通過(Xj-Xi)(Yj-Yi)可以看出,Pearson相關系數只比較了數據中的X和Y變量,但沒有考慮不同數據的取樣的位置。

式(5)表示,在比較每組數對時,將其結果乘以相應的距離權重,最后再求和計算。權重的取值總為正,它只改變每組比較結果的取值大小,而不改變符號。需要注意的是雖然權重不影響每組數對的符號,但是最后的匯總結果的符號會受權重影響。

式(5)的取值范圍為[-1,1]。由于距離權重的各向同性,可以將加權后的數據比較看成兩組新數據做比較,所以式(5)的取值范圍和Pearson相關系數的取值范圍相同。當距離權重全部相同時,式(5)退化為Pearson相關系數計算公式(式(4))。

1.4 局部相關系數

Pearson相關系數不考慮數據取樣點遠近,比較全部數據的X與Y變量的相關性;而距離權重改進的相關系數突出了距離較近的取樣點的X與Y變量的相關性,針對每個樣點來說,比較了該樣點附近的樣點。因此,在空間上Pearson相關系數是平等考慮所有樣點的“全局相關系數”,而距離加權的相關系數是一種突出局部相關性的“局部相關變量”。

1.5 距離—相關性頻譜

局部相關系數雖然能體現距離較近樣點的相關性(圖1a),但是需要人工確定搜索半徑。搜索半徑決定了樣點的個數,因此在很大程度上影響了局部相關系數的大小。

為了解決人工選擇搜索半徑的困難,可以將搜索半徑作為一個變化值,并以固定步長為增量,計算該組數據樣點之間最小距離到最大距離內所有搜索半徑的局部相關系數。將每個搜索半徑對應其局部相關系數做成一張折線圖,這張圖即為距離—相關性頻譜(圖1b)。

通過距離—相關性頻譜圖,所有搜索半徑下的局部相關系數得以展示。然后可以通過分析折線圖挖掘兩組數據被距離關系掩蓋的相關性,并研究在不同尺度下兩組數據相關性的變化規律。

圖1 取樣點位置(a)及局部相關性頻譜(b) 數據來源于表1

綜上所述,距離權重改進前、后的相關系數主要不同之處有:改進前相關系數是所有樣點都參與計算,每個數對對結果的影響相同,最終結果為一個數值;而距離權重改進后相關系數計算時,距離較近的數對對結果的影響大,體現最終結果的是距離—相關性頻譜圖,反映的是很少樣點的相關性。

2 模擬數據測試

為了測試改進后相關系數的效果,應用二維模擬數據(表1)進行檢驗。

該模擬數據的目的是體現局部相關系數的重要性。由于Pearson相關系數在計算時對每個數據的采樣點賦予相等權重,而且最后的結果也僅是一個取值范圍[-1,1]的數值。這就使得可能在小范圍內存在相關性的兩組數據被大范圍內的非相關性掩蓋。

該模擬數據由周期函數加隨機噪聲構成,模仿在空間上周期出現的數據,如地質構造、井距與產量關系等類似數據。

表1 模擬數據

表1中x與y是地理位置,X與Y變量無單位。距離權重選用式(2)。圖1a展示了數據取樣點的地理位置,圖1b為采用不同的搜索半徑得到的局部相關系數的折線圖。這種研究空間內相關性變化趨勢的曲線類似于克里金插值中用到的變差函數[18],也是一種距離和某種屬性的距離頻譜。

根據斜率,圖1b中的曲線可以大致分為三個階段:第一階段,搜索半徑從0到100,曲線的下降速度快,這說明這組模擬數據在小范圍內相關關系不穩定,隨著數據點個數的增多,相關性快速降低;第二階段,搜索半徑從100到300,曲線下降速度變慢,這說明在中等范圍內可以維持一定的相關性;第三階段,搜索半徑從300到600,曲線較為平緩,這說明在大范圍內數據呈現穩定的相關性,相關系數隨著半徑的變大不會出現較大的變化。當包含全部樣點時,曲線收斂為Pearson相關系數。

局部相關和全局相關的差別可以通過圖2說明。圖2a是全局相關視角下X與Y兩變量的交會圖,從中很難發現X與Y變量的相關性。利用相同的兩組數據,先通過數據點的空間位置對數據進行分組(以距離100為閾值),將距離較近的樣點分為一組;再將X變量在每組內歸一化,最后再制做與Y變量的交會圖,即可得到圖2b。該圖為局部相關視角下的交會圖,可以清楚地發現兩組變量的相關性。從相關系數上來看,搜索半徑為100的局部相關系數為0.4;而未改進的Pearson(全局)相關系數為0.21,可見全局相關系數掩蓋了數據的局部相關性。

圖2 全局相關與局部相關比較(a)全局相關系數視角下的交會圖; (b)局部相關系數視角下的交會圖 數據來源于表1

3 應用效果

實際資料來自沁水盆地南部某區塊,有若干生產井,三維地震勘探覆蓋全區。山西組3號煤層為主要產氣層之一,由北東向南西方向逐漸變?。豁敯迥鄮r較為發育,煤層氣封存條件較好;煤層主要受燕山期和喜山期運動影響而發育裂縫,該煤層的產氣量受裂縫和煤的厚度影響較大。

表2為該區塊井點的數據資料,井位坐標相對位置關系見圖3。日產氣量為統計的實際信息。方位各向異性由疊前地震數據計算而得,煤厚度由儲層參數反演而得,應力由疊后地震數據根據構造和速度場計算而得。通過方位各向異性、厚度和應力三種數據的篩選與融合以獲得和日產氣量相關性較高的融合數據。

首先,計算方位各向異性(圖3a)、厚度(圖3c)和應力(圖3e)三組數據和日產氣量的全局相關系數。方位各向異性的全局相關系數為0.28;煤厚度的全局相關系數為0.53; 應力的全局相關系數為-0.52。從全局相關系數看,應該選用煤厚度與應力融合以預測日產氣量,圖4c為其融合結果。

下面介紹用距離權重改進后的Pearson相關系數方法優選數據。

圖3b是方位各向異性與日產氣量的局部相關頻譜。方位各向異性是一種微裂縫(煤層中的割理縫)的指示標志。因為較大的比表面積和較小的孔隙度,一般認為割理縫有利于煤層氣的儲存。從圖3b可以看出,在使用小搜索半徑時,日產氣量與方位各向異性有比較弱的負相關性;而當搜索半徑比較大時,這兩組數據又有比較弱的正相關性,這一點與前人的認識相符。因為兩組數據的較弱的相關性,所以不用方位各向異性進行下一步的預測工作。

從圖3d可以看出,在考察鄰近某口井一定范圍內的井時,也就是在小范圍內,原生煤厚度與日產氣量的相關性不明顯。但如果從整體上考察,原生煤厚度與日產氣量的相關性達到了0.5以上。

表2 山西組3號煤層井點數據

從圖3f可以看出,當搜索半徑在10個點左右時,局部相關系數為0.26;當搜索半徑較大時,全局相關系數為-0.52。這種現象說明,應力和產氣量在小范圍內正相關,應力越大對產氣有利;但在大范圍內為負相關,應力越大越不利于產氣。這種現象的原因可能是,在小尺度下應力越大越容易形成小規模裂隙,此時有利于煤層氣賦存;而在大范圍內,應力越大越容易形成大規模裂縫,會導致煤層氣逸散,此時不利于煤層氣的賦存[19]。

以上三種地球物理參數和產氣量的距離加權相關性研究結果表明,這三種地球物理參數各有其特點。應力在小尺度范圍與產氣量相關性好,而原生煤厚度在大尺度范圍與產氣量相關性強。因此在應用屬性融合進行產氣預測時,可以使用不同尺度的空間濾波,取應力的較高頻部分(局部特征)和煤層厚度的較低頻部分(背景場)進行融合,以達到最好的效果。這種分尺度研究數據的方法,陳文浩等[20]在變差函數的估算中曾經應用。

圖4a展示了用改進優選方法的融合平面圖。從圖4b可以看出融合后在搜索半徑為12時即可到達0.3的相關程度,而且在大搜索半徑上仍然保持較高的相關程度。與應用未改進方法優選再融合的結果圖4c、圖4d比較,利用本文方法優選指導融合的結果在各個尺度上的相關性均優于按Pearson相關方法指導的融合結果。通過其他開發井進行檢驗,本文方法的結果的產氣量吻合率更高。

圖4 煤層厚度與應力屬性空間頻率濾波后融合屬性及其與日產氣量的局部相關性頻譜 本文改進相關方法篩選的融合平面圖(a)及其與日產氣量的局部相關性頻譜(b); Pearson相關方法篩選的融合平面圖(c)及其與日產氣量的局部相關性頻譜(d)

4 結論

(1)距離權重改進的相關系數具有計算兩組變量局部空間相關性的作用,可以用于挖掘被距離關系掩蓋的相關性。

(2)在選擇空間權重的函數類型之后,多數情況下并不清楚數據在多大的搜索半徑內具有相關性。如果搜索半徑是一個固定值,則其對應的局部相關系數僅代表在這個搜索范圍內的相關系數。因此,把搜索半徑當成一個自變量,計算不同搜索半徑下的相關性,并以折線圖(距離-相關性頻譜)表示。通過折線圖的變化特征可以分析這兩組變量在空間分布下的相關性。

(3) 局部相關變量和距離-相關性頻譜具有指導數據優選和數據融合的作用。

主站蜘蛛池模板: 精品福利视频网| 国产精品美女自慰喷水| 午夜视频www| 成年人视频一区二区| 精品精品国产高清A毛片| 午夜少妇精品视频小电影| 四虎综合网| 99尹人香蕉国产免费天天拍| 日本欧美中文字幕精品亚洲| 全部免费毛片免费播放| 经典三级久久| 天天操天天噜| 乱人伦99久久| 麻豆精品国产自产在线| 国产精品污视频| 国产亚洲一区二区三区在线| 国产制服丝袜91在线| 国产免费久久精品99re丫丫一| a级毛片在线免费| 黄网站欧美内射| 一级全黄毛片| www.youjizz.com久久| 久久国产高潮流白浆免费观看| 日韩无码视频专区| 青青草原国产一区二区| 国产99精品视频| 尤物特级无码毛片免费| 国内精品久久久久久久久久影视| 在线免费观看a视频| 日韩欧美国产精品| 日韩a在线观看免费观看| 国产精品无码翘臀在线看纯欲| 亚洲区第一页| 中文字幕日韩丝袜一区| 日韩激情成人| 亚洲欧美在线精品一区二区| 孕妇高潮太爽了在线观看免费| 欧美专区日韩专区| 欧美一级99在线观看国产| 999在线免费视频| 婷婷亚洲视频| 欧美成人第一页| 国产色图在线观看| 精品国产aⅴ一区二区三区 | a级毛片在线免费观看| 欧美国产在线看| 在线中文字幕日韩| 青青热久麻豆精品视频在线观看| 国产精品第页| 亚洲日韩第九十九页| 亚洲乱码视频| 91啪在线| 91破解版在线亚洲| 亚洲国产成人综合精品2020| 欧美日韩中文国产va另类| 91福利国产成人精品导航| 国产波多野结衣中文在线播放| 国产最新无码专区在线| 国产浮力第一页永久地址| 91原创视频在线| 国产精品30p| 亚洲午夜18| 中文字幕有乳无码| 亚洲第一黄色网| 午夜精品一区二区蜜桃| 高清免费毛片| 国产成人永久免费视频| 欧洲欧美人成免费全部视频 | 精品国产免费第一区二区三区日韩| 婷婷丁香在线观看| 99视频精品全国免费品| 成人福利在线视频| 亚洲天堂精品视频| 伊人婷婷色香五月综合缴缴情| 在线日韩一区二区| 就去色综合| 真实国产精品vr专区| 亚洲精品第一页不卡| 黄片一区二区三区| 亚洲免费播放| 91精品情国产情侣高潮对白蜜| 国产SUV精品一区二区6|