廣州軟件學院 李慧斯 李映瑤 姚月敏 魏文鋒
顏色模型目前在煙葉級別分類、醫藥衛生技術、農產品檢驗、人臉檢測等不同領域有其運用價值。該文對收集到的巖石石油樣本圖像進行預處理,利用HSV顏色模型提取圖像中符合特征的部分,設計計算樣本巖石數據的含油量占比的算法。通過對比不同顏色模型的特點,選定適合本文研究的HSV顏色模型作為取值基準,再利用巖石含油部分呈現黃色、綠色發光的特征,對巖石樣本圖像黃綠發光部分進行特征提取,二值化處理后對其進行遍歷判斷像素值,最后計算出黃綠發光部分在其巖石樣本圖像中的占比,得出最終的巖石石油含量百分比,完成算法設計,為巖石石油含油勘探提供參考。
1981年中國能源局發布了中國石油行業石油含油級別的標準劃分(SY 5364—89)[1],規定了熒光檢測的方法屬于本國對巖石含油的一套標準。2013年,程媛媛、管繼騰等發表了《基于毛管模型的含油儲層巖石激發極化特性》[2],基于儲層巖石聯毛管,構建了一種新型的毛管模型,促進石油物理勘測效率。2016年,中國石油天然氣股份有限公司對巖石含油量測定方法及配套裝置申請了國家專利[3],參考油巖礦石物樣本的三維熒光光譜強度原理并將其利用到發明中[4]。雖然我國在巖石含油量方面的研究已經被石油勘探行業所使用,但是由于我國引入國外的技術時間較晚,所以與外國石油勘探技術相比仍有一定的差距。顏色模型目前在不同領域的都具有一定的運用價值,但在巖石石油含油量計算領域比較少應用。為此,該文就顏色模型應用于巖石石油含量計算進行研究。
本研究對多個巖石樣本網站進行比較,考慮數據的可靠性、真實性等問題,確定將第九屆泰迪杯全國大學生數據挖掘競賽B題的巖石巖心(含油)圖片數據作為本研究的數據源。樣本數據格式有兩種,分別是BMP及JPG。其中,BMP格式的圖片大小為4096×3000 DPI,此類照片沒有明顯的背景,對實驗的影響較小;JPG格式的圖片大小為2048×2448 DPI,此類照片有明顯的藍黑色背景,且發光部分相對不明顯,對巖石含油量占比計算的影響較大,因此數據預處理部分將針對此部分圖像進行圖像分割等一系列操作。
通過上述數據觀察對JPG格式的樣本數據進行處理,首先對樣本進行降噪處理,模糊圖像中巖石的細節特征,接著對樣本圖像進行4×4的圖像切割,最后對切割好的樣本以巖石占75%為準則(即將巖石占圖像少于75%的4×4樣本剔除)進行樣本圖像清洗,得到最終的研究巖本數據。
所收集到的巖石圖片數據屬于高分辨率圖像,圖像內包含了較多的紋理信息,對實驗成本造成浪費,所以決定用高斯濾波器對樣本圖片進行處理。高斯濾波器是一種線性平滑濾波,其功能是消除高斯噪音,經常被用于圖像處理噪點抑制噪波點[5]。經過高斯濾波器處理后,數據圖像內存在的細節信息模糊。
樣本數據為JPG格式圖像,由一些碎石組成,存在藍黑色背景,所以對該類圖片進行圖像分割使得樣本數據干擾性減少,還可以增加有效樣本數據本身的信息量。對原有數據圖像進行分割是在不損害原有巖石巖性的基礎之上,讓數據增大,避免圖像遭到破壞。利用OpenCV對樣本圖像進行分割,提高算法的準確率。
對數據圖像進行4×4的圖像分割后,每一張巖石樣本數據平均切割為16張樣本,使得每張圖片可以達到統一的寬高,有利于建立實用性更強的算法。在不損害巖石整體特征的基礎上,去除臟數據。為盡可能地確保數據地有效性,本實驗選擇將樣本數據中黑藍色背景占整張圖片75%的圖像進行去除。
算法的設計首先對比了兩種顏色模型,最終選取HSV顏色模型作為本實驗的標準模型,接著根據HSV標準顏色取值范圍經過調參確定了本實驗的黃綠發光部分HSV取值范圍,然后對樣本進行RGB色彩空間的轉換并對其進行遍歷最后計算出巖石含油占比。
顏色模型即在某個以三維向量表示的色彩空間中某一可見光的子集,通常情況下,沒有一種顏色模型是能夠表示所有可見光的[6]。常見的顏色模型有NTSC、HSV、RGB、HSK YcbCr、CIECMY/CMYK等[6]。
巖石樣本數據是在紫外線照射下拍攝的,巖石含油部分在此條件照射下具有發光的特征,呈現綠色熒光及黃色熒光的部分即巖石含油部分。
首先RGB顏色模型是一種依賴于成像儀器的顏色模型,不同的設備對同種顏色的RGB值呈現效果不同,其次同一部設備在不同的時間條件下呈現的RGB值也不相同。最后,RGB顏色模型的范圍從(0,0,0)白色到(255,255,255)黑色,但是黃色及綠色發光部分的取值,并不能呈現出一個準確的范圍,不適合用來提取圖片中黃綠發光部分。而HSV顏色模型,該模型是由色調、飽和度、明度作為參數,相較于其他顏色模型,與人眼對顏色呈現的標準較符合,因此,HSV顏色模型可以更好的反映人類對顏色的感知[7],因此本實驗選擇HSV顏色模型作為衡量巖石發熒光部分的標準。
石油在紫外線照射下具有發光特征,即熒光燈下拍攝的相片中綠色或黃色部分是含油的,可見黃色和綠色的HSV范圍會決定后面提取的質量,所以將進行多次調整參數實驗,將每次的效果和原本的熒光圖進行對比,選取效果最好的一組參數。
通常情況下,首先,為了保證色彩空間的圖像處理的有效性,樣本圖像都是在HSV色彩空間中處理的,其次,對于常見的顏色所對應的HSV極值分量需要擁有一個準確嚴謹的范圍[7]。
根據HSV基礎顏色分量范圍,提取的黃色及綠色范圍如表1所示。

表1 黃色綠色HSV值取值范圍Tab.1 The HSV range of color yellow and green
接著根據上表取值范圍,在范圍內設定參數進行實驗對比,并尋找最合適發光特征的參數范圍。

圖2 不同參數下效果的對比 2Fig.2 Comparison of result based on different parameters 2
如圖1-圖3所示,經過三次調參實驗可知,第一組參數狀態下存在非原數據發光部分,實驗結果比實際情況的數值偏大;第二組參數狀態下所識別的發光部分少于原數據的黃綠發光部分;第三組參數狀態下所識別的發光部分與現實圖中所存在的黃綠發光部分較符合,是最適合作為實驗參數的一組。最后選擇了如表2所示的HSV取值范圍作為本次研究的基礎。

圖1 不同參數下效果的對比 1Fig.1 Comparison of result based on different parameters 1

圖3 不同參數下效果對比 3Fig.3 Comparison of result based on different parameters 3

表2 黃綠色HSV取值范圍Tab.2 The HSV range of color yellow and green
將實驗標準以HSV色彩空間為標準,需要將所有的樣本圖片轉化為HSV圖像,樣本圖像的三維坐標,RGB顏色模型的參數是Red、Green、Blue,而HSV顏色模型的三維坐標則是(H,S,V),首先將RGB顏色模型中的值轉換到[0,1]之間,算法如式(1)所示。

然后再分別對H、S、V的值進行計算(公式如式(2)所示),若最終計算的H<0,則將該值加上360,最終得到色相。

提取到的范圍內的黃綠發光部分像素圖,首先進行灰度處理,接著將圖像進行二值化處理,使得樣本內含信息量大大減少,最終以黑白圖的形式進行展示,使得檢驗物體的輪廓更為鮮明,方便后期面積占比的計算。將圖像中黃、綠色部分以白色呈現,其余部分以黑色呈現,方便計算樣圖像中黃、綠色發光部分(即巖石含油部分)的占比。
將遍歷每張黑白的像素值,計算白色部分的像素值占整張圖片像素值的占比(即黃色或綠色部分占總巖石面積的百分比)。

使用HSV顏色模型作為衡量黃綠色發光部分的標準,對樣本數據圖像黃色及綠色部分進行提取,并將提取出來的部分進行二值化處理。對經過處理的二值圖進行遍歷提取出黃綠發光部分圖像按照像素再次進行遍歷,計算得出汽油部分占原圖像(巖石)的像素點個數,設計出了一個合適計算巖石含有面積百分比含量的算法。
油氣面積占比=油氣部分像素點個數/原圖像像素點個數
如表3所示為部分計算結果,平均的巖石含油面積占比為0.25%。

表3 巖石含油面積計算結果Tab.3 Calculation results of oil-bearing area of rock
本研究主要圍繞巖石石油含量的問題所展開,計算樣本巖石含油面積百分比含量。將巖石在黑暗空間下,利用紫外線照射,巖石含石油部分呈現黃色及綠色發光的特征,通過HSV色彩空間對黃、綠兩色的色相、飽和度、明度的取值范圍界定。為更加準確地提取出黃綠發光的色彩,經過多次實驗對比,在標準黃綠顏色的取值范圍內縮小了色相、飽和度、明度的取值范圍,即黃色發光部分數值范圍為[26,43,46]至[34,255,255];綠色發光部分數值范圍為[35,100,100]至[77,255,255]。對樣本中以RGB顏色模型為基準的圖像進行轉換,并將這部分圖像以黑白圖像的方式呈現,二值化處理后進行遍歷判斷像素值,計算黑白像素占比,得出最終的巖石石油含量,完成算法的設計。
引用
[1]SY 5364-1989,巖石含油級別的劃分[S].
[2]程媛媛,關繼騰,王殿生.基于毛管模型的含油儲層巖石激發極化特性[J].石油地球物理勘探,2013,48(3):467-473+506+331.
[3]田華,劉可禹,魯雪松,等.巖石含油量測定方法及裝置:中國, CN201610791513.8[P].2020-11-06.
[4]王陽恩,徐大海,陳奇.基于激光誘導擊穿光譜的巖石含油級別判斷方法:中國,CN201610242042.5[P].2016-08-17.
[5]張文清,肖厚元,王眾,等.基于雙核高斯濾波的PSP圖像去噪[J].電子測試,2022(1):39-42.
[6]姚敏.數字圖像處理[M].北京:機械工業出版社,2017.
[7]王明遷,李丹陽,郝威凱,等.基于HSV顏色模型的圖像識別技術研究[J].科技資訊,2020,18(35):1-2+8.