,,
(長江大學電子信息學院,湖北 荊州 434023) (長江大學地球物理與石油資源學院,湖北 武漢 430100)
針對地震勘探數據壓縮的JPEG 2000算法改進
張正炳,楊順遼,徐鋒濤桂志先
(長江大學電子信息學院,湖北荊州434023) (長江大學地球物理與石油資源學院,湖北武漢430100)
為減輕海量地震數據給地震勘探的遠程質量監督所帶來的巨大壓力,對靜止圖像壓縮標準JPEG2000算法進行了適當改進:去掉了原編碼算法中用于均值調整的預處理和用于色彩處理的分量間變換2個部分及其在解碼器中的對應部分,改進了數據輸入輸出的動態范圍和編解碼器所能表示的數據動態范圍,使其與地震數據的大動態范圍相匹配。利用改進后的算法對地震數據進行壓縮試驗,結果表明,對疊前數據壓縮5倍以下時,信噪比高于42dB,效果較好,對疊后數據壓縮15倍以下時,信噪比高于30dB。
地震數據壓縮,JPEG2000,地震勘探
地震勘探是目前最主要的油氣勘探方法,為了提髙地震資料的成像精度和分辨率,利用超萬道地震儀器來實施兩寬一高(寬頻寬方位高密度)和多波多分量勘探,使得地震勘探數據量呈爆炸性增長,無論是地震儀器采集的數據還是處理中的道集數據都達到TB級,是名副其實的海量數據。在采集方面,利用一套無線地震數據采集系統GSR,每天采集的數據達到2TB左右[1]。新疆油田近年來在準噶爾盆地瑪湖地區部署的多塊高密度三維勘探中,MC井區三維面元12.5m×12.5m,炮道密度806.4萬道/km2,采集的數據高達60TB[2]。在處理方面,以方位各向異性分析為核心的OVT(炮檢距向量片)域疊前地震屬性分析,充分利用疊前地震資料蘊含的地質信息和流體信息,可更有效地進行儲層預測,是寬方位高密度地震勘探的配套技術。將利用OVT技術處理得到的疊前地震道集稱為OVT道集,則一個中型地震工區的OVT道集總數據量可達5~10TB[3]。另據統計,在過去數年間,單位勘探面積的地震數據量增長超過了35倍,單個地震數據體的規模也已超過100TB[4]。
海量數據給地震勘探數據的傳輸、處理和存儲提出了嚴峻挑戰。海量數據給地震數據的存儲所帶來的主要問題是要占用極大的存儲空間,從而增加存儲成本;給傳輸所帶來的主要問題是極大地增加了傳輸帶寬需求,同時也增加了傳輸時間。而海量地震數據的傳輸又不可避免,這是因為在地震勘探的數據采集與處理過程中,常常需要從邊遠地區、海上甚至國外通過衛星或其他途徑傳輸到基地進行處理[5,6];在地震資料處理和解釋過程中,也經常需要在工作站之間通過局域網傳輸數據[6]。更嚴重的是,因數據量太大、傳輸時間過長往往會導致網絡斷線而必須重傳,甚至可能完成不了完整的數據傳輸,以致所接收到的數據無法使用,這給跨國或跨探區作業的地震勘探質量監督帶來了困難。因此,海量地震數據在存儲、傳輸和處理過程中迫切需要壓縮。
地震勘探數據壓縮方法按照有無信息丟失可分為無損壓縮和有損壓縮2大類。無損壓縮方法能保證解壓數據與原始數據完全一樣,因此特別適合于對解壓后還需要做進一步處理的地震數據進行壓縮,但其壓縮效率低,一般壓縮倍數在2倍左右。有損壓縮在允許有少量信息損失的情況下可以獲得高倍壓縮,該方法壓縮倍數較高,但存在信息丟失。
JPEG2000算法[7]是JPEG[8]的升級版本,支持圖像數據的有損和無損壓縮,壓縮率比JPEG高約30%,實現了圖像的漸進傳輸,支持感興趣區域編碼,并采用離散小波變換(DWT)克服了JPEG采用離散余弦變換(DCT)導致在高倍壓縮時方塊效應明顯的缺點,在靜態醫學圖像壓縮[9]、遙感影像壓縮[10]、無線圖像傳輸[11]、地震數據準無損壓縮[12]和圖像聯合壓縮加密[13]等許多方面得到應用。但由于JPEG2000是針對小動態范圍的圖像數據而設計的,不能直接用于超大動態范圍的地震數據有損壓縮,所以對JPEG2000核心算法進行適當改進后用于地震勘探數據壓縮,對于在跨國或跨探區作業的地震勘探質量監督中降低遠程數據傳輸帶寬要求和有效縮短傳輸時間,從而降低數據傳輸成本具有重要實際意義。
JPEG2000算法的核心編解碼結構[7]如圖1所示,由編碼器和解碼器所構成。其中,編碼器由預處理、正向分量間變換、正向分量內變換、量化、Tier-1編碼器、Tier-2編碼器和位率控制等7部分組成;解碼器對應地由后處理、反向分量內變換、反向分量間變換、反量化、Tier-1譯碼器、Tier-2譯碼器等6部分組成。由于解碼是編碼的逆過程,所以解碼器中的每個組成部分的運算都分別與編碼器中的對應部分相逆。

圖1 JPEG2000算法編解碼結構
在圖1中,預處理和后處理互為逆過程,是針對像素值為無符號整數的圖像數據而設計的,目的是為了將均值非零的原始數據調整成均值為零的數據,以利于有效編碼。正向分量間變換和反向分量間變換互為逆過程,是針對多分量的圖像數據(如R、G、B 3分量彩色圖像等)而設計的,目的是減少各分量間的冗余,以便提高壓縮倍數。正向分量內變換和反向分量內變換分別完成小波正變換和小波反變換,有Mallat分解算法和小波提升方案2種算法可選。Tier-1編碼器和Tier-2編碼器用于實現優化截斷嵌入塊編碼算法(EBCOT:Embedded Block Coding with Optimized Truncation),而Tier-1譯碼器和Tier-2譯碼器用于實現對應的解碼算法。
JPEG2000算法是針對圖像數據而設計的,而地震勘探數據與圖像數據之間存在很大差異,不能直接將JPEG2000用于地震數據壓縮,因此需要對其進行適當改進。為使JPEG2000算法適合于地震數據壓縮,對其進行改進的思路如下:
1)圖像數據一般是具有3個分量的彩色圖像數據,每個分量都是無符號整數,因此需要利用預處理將各分量變成均值為零的有符號數據;而地震勘探數據本身就是單分量、零均值的數據,因此不需進行預處理和正向分量間變換;
2)圖像數據的每個分量一般是8位的無符號整數,因此其表示范圍只是0~255,動態范圍很小;而地震勘探數據一般為使用24位模數轉換器采集、并用SEG-Y格式記錄的32位IBM浮點數,動態范圍非常大,遠遠大于圖像數據的動態范圍。但是,原始的JPEG2000編解碼算法只適合于壓縮較小動態范圍的圖像數據,而無法直接用于壓縮超大動態范圍地震數據。因此,必須擴大其可表示數據的動態范圍,以便與地震勘探數據的動態范圍相適應。
3)小波提升方案更適合于地震數據分解的優良特性。
根據改進思路對JPEG2000算法作如下改進:
1)刪除圖1中編碼器的預處理、正向分量間變換及其解碼器的對應部分;
2)采用提升方案進行小波正變換和反變換;
3)改進編解碼器所能表示的數據動態范圍以及原始數據輸入和重建數據輸出動態范圍,使其適應大動態范圍的地震勘探數據輸入、輸出和編解碼。

圖2 改進后的JPEG2000算法流程圖
改進后的JPEG2000算法流程如圖2所示。利用改進算法壓縮地震數據的過程是,首先對二維原始地震數據進行5層W5/3小波提升變換,以便將絕大部分能量集中在少數低頻子帶系數上;然后經過量化操作,去除一定的冗余信息;之后讓變換系數經過Tier-1編碼,利用8鄰域系數上下文對變換系數的重要性進行預測,經MQ算術編碼器得到編碼比特流;最后通過Tier-2編碼部分,將比特流分段形成多個質量層,根據預先所設定的壓縮比特率選擇丟棄最不重要的幾個質量層,以形成最終的壓縮數據。解壓縮是壓縮的逆過程,對壓縮數據解壓縮得到重建地震數據。
在地震數據壓縮方面,還沒有能夠反映因壓縮所產生的信息丟失對后續處理結果的影響程度的技術指標。目前,用于評價解壓數據質量的常用技術指標有信噪比、相對誤差、能量比、能量損失和重建精度等,而這些指標之間具有一定的關聯,因此,筆者選用目前用得較多的信噪比(SNR)作為評價解壓數據質量的技術指標。

表1 對疊前數據壓縮5~20倍和對疊后數據壓縮5~120倍的SNR
利用改進算法分別對512道、每道512樣點的SEG-Y格式疊前原始地震數據(其局部顯示見圖3)和疊后原始地震數據(其局部顯示見圖4)進行壓縮和解壓縮試驗,并將根據原始數據和解壓重建之間的差值計算得到的信噪比(SNR)作為衡量重建數據質量的技術指標。SNR值越大,表明重建數據的信息丟失越少,質量就越好。對疊前數據壓縮5~20倍和對疊后數據壓縮5~120倍的SNR如表1所示。由表1可見,在保持SNR值相近的情況下,對疊后數據的壓縮倍數遠高于疊前數據;而在保持壓縮倍數相同的情況下,疊后數據的SNR值遠高于疊前數據。該結果表明,疊前數據比疊后數據難以壓縮,主要原因是疊前數據是未經任何處理的野外采集數據,與經過濾波和疊加等系列處理后的疊后數據相比,其中含有更高的頻率成分和更多的噪聲。因此,在壓縮疊前數據的同時,對噪聲進行適當壓制既可提高壓縮倍數,又可突出有效信號,將為疊前數據壓縮方法的研究提供新的思路。

圖3 原始疊前數據
對疊前數據壓縮5倍(SNR=42.39dB)和15倍(SNR=12.3dB)后的解壓重構數據的對應局部顯示如圖5所示,與圖3對比可見,當壓縮倍數在15倍以下時,重建數據與原始數據的剖面顯示并無明顯差別。綜合分析表1、圖3、圖5和圖6的結果可知,當利用改進算法對疊前數據壓縮5倍以下時,信噪比可達42dB以上,保真度較高;但當壓縮倍數超過10倍以后,信噪比降到20dB以下,造成較大失真,筆者認為會對后續處理產生較大不利影響。當對疊前數據壓縮15倍時,其地震剖面顯示效果與原始數據并無明顯差異,故可用于地震勘探過程中的遠程質量監控。

圖4 原始疊后數據
對疊后數據壓縮20倍(SNR=25.1dB)和60倍(SNR=17.36dB)后的重構數據的對應局部顯示如6所示,與圖4對比可見,當壓縮倍數在60以下時,重建數據與原始數據的剖面顯示也無明顯差別。綜合分析表1、圖4、圖6的結果可知,當用改進算法對疊后數據壓縮15倍以下時,信噪比可達30dB以上,肉眼不能分辨重構結果與原始數據之間的差別,可以用于處理過程中的質量監督;但當壓縮倍數超過30以后,信噪比下降到20dB以下,造成較大失真,會對后續處理產生較大的不利影響。由于當壓縮倍數在60以下時,重建數據的剖面顯示與原始數據無明顯差異,所以仍然可以用于處理過程中的質量監督。

圖6 對原始疊后數據壓縮的重構結果
對JPEG2000算法進行了改進并將其用于疊前和疊后地震數據壓縮,試驗結果表明,對疊前數據壓縮5倍以下時,信噪比高于42dB,效果較好,對疊后數據壓縮15倍以下時,信噪比高于30dB。當需要對壓縮重建數據作后續處理時,壓縮倍數不宜太大,若只是用于質量監督,則可對疊前數據和疊后數據分別壓縮15倍和60倍左右。由于筆者所采用的信噪比與油氣分析結果沒有直接關聯而無法準確評價編解碼效果,因此在以后的研究中擬采用測井資料或過井剖面來協助分析壓縮失真對后期油氣分析的影響程度。
[1]聶明濤,張慕剛,丁冠東,等. GSR無線節點采集技術在地震勘探中的應用[J]. 石油管材與儀器,2016,2(4):68~71.
[2] 竇強峰,妥軍軍,蔣在超,等. 準噶爾盆地瑪湖地區高密度地震勘探中靜校正問題解決方法[J]. 新疆地質,2016,34(4):552~555.
[3] 詹仕凡,陳茂山,李磊,等. OVT域寬方位疊前地震屬性分析方法[J]. 石油地球物理勘探,2015,50(5):956~966.
[4] 文佳敏,趙長海,侯紅軍,等. GeoEast海量地震數據高效處理技術[J]. 石油工業計算機應用,2016,24(3):12~19.
[5] 馮占林,張學工,李衍達. 基于小波變換的地震勘探數據壓縮的工程分析[J]. 清華大學學報(自然科學版),2001, 41(4/5):170~173.
[6] 吳繼偉,孔祥茜,岳繼光. 地震數據的小波變換壓縮方法[J]. 電子技術應用,2006,(1):34~36.
[7] ISO/IEC JTC 1/SC 29/WG 1 N 2412,The JPEG-2000 Still Image Compression Standard[S].
[8] Pennebaker W B, Mitchell J L. JPEG still image data compression standard[M]. New York: Van Nostrand Reinhold, 1993.
[9] 衛俊霞,焦國華,高曉惠.基于JPEG2000 的靜態醫學圖像壓縮設計方案[J]. 計算機工程,2007,33(8):213~215.
[10] 盧 亮,吳善明,鄧術軍. 面向遙感影像的JPEG2000優化壓縮算法[J]. 計算機工程,2010,36(2):203~205,208.
[11] 劉錦楊,戚飛虎.一種基于JPEG2000的無線圖像傳輸方法[J]. 計算機工程,2004,30(13):140~142.
[12] 孫寰宇,武文波,楊志高.基于JPEG2000的地震數據準無損壓縮[J]. 計算機工程與應用,2005,41(16):185~188.
[13] 謝凱明,鄧家先,陳益剛. 基于JPEG2000的圖像聯合壓縮加密算法[J]. 計算機應用研究,2014,31(12):3695~3699.
[編輯]易國華
2017-08-19
張正炳(1961-),男,博士,教授,現主要從事數據壓縮方面的教學與研究工作,zhangzb@yangtzeu.edu.cn。
引著格式張正炳,楊順遼,徐鋒濤,等.針對地震勘探數據壓縮的JPEG 2000算法改進[J].長江大學學報(自科版),2017,14(21):1~6.
TP391
A
1673-1409(2017)21-0001-06