郁誠成,孫寶楠*,楊永增,連 展
(1.國家海洋局第一海洋研究所,山東青島266061; 2.青島海洋科學與技術國家實驗室區域海洋動力學與數值模擬功能實驗室,山東青島266237; 3.海洋環境與數值模擬國家海洋局重點實驗室,山東青島266061)
白冠統計物理模型的驗證
——I.二維等間距投影圖的數字化方法研制與應用
郁誠成1,2,3,孫寶楠1,2,3*,楊永增1,2,3,連 展1,2,3
(1.國家海洋局第一海洋研究所,山東青島266061; 2.青島海洋科學與技術國家實驗室區域海洋動力學與數值模擬功能實驗室,山東青島266237; 3.海洋環境與數值模擬國家海洋局重點實驗室,山東青島266061)
近幾十年以來,隨著海洋觀測技術的提高,海洋觀測數據大量增加,極大地推動了海洋研究的發展,但由于某些原因,部分數據只以圖像形式對外發布,很難獲取其原始數據,這給科研工作的及時開展帶來了諸多不便。本文基于MATLAB軟件的圖像和數據處理功能,提出了一種二維等間距投影圖像的數字化方法,可實現圖像信息快速準確的抓取,并以Levitus的全球海表溫度為例,驗證了數字化過程的可靠性。數字化結果與原始數據比較顯示,平均誤差為0.147℃,絕對平均誤差為0.215℃,均方根誤差為0.275℃,數字化結果與原始數據吻合較好。最后,本文將該方法應用到2001-02,2001-05,2001-08和2001-11衛星反演的白冠覆蓋率圖像中,所獲數字化結果將應用到下一步統計物理白冠模型的驗證工作中。
圖像處理;SST圖像數字化和檢驗;白冠圖像數字化;MATLAB軟件
近幾十年以來,海洋觀測技術發展迅速,特別是隨著衛星觀測技術的成熟,海洋數據大量增加,極大地推動了海洋研究的發展。很多類型的海洋數據可以通過網絡或其他方式直接獲取,但同時,還有一部分數據只以圖像的形式向外發布,很難直接獲得原始數據,比如不公開算法的衛星反演圖、人工繪制的歷史圖等。此類圖像大都具有非常重要的研究價值,但因其數據不易獲取給科研工作的開展帶來了極大的不便。隨著計算機技術的發展,人們發現圖像數字化方法可以解決這一問題。圖像數字化是將連續色調的模擬圖像經采樣量化后轉換成數字影像的過程。目前,常見的點、線圖形的數字化應用較為廣泛,但對于二維圖像沒有直接的工具可以對其數據進行抓取,相關文獻也鮮有報道,所以研究一種二維圖像的數字化方法并在將來形成一個可方便研究人員直接調用的程序包,就顯得格外有意義。
在以往的研究中,人們常用MATLAB軟件進行圖像的研究,因其具有圖像處理功能強大、功能全面、界面友好、開放性強等特點,不僅有助于提高研究效率,還有助于加快科研進展[1-3]。鄧巍等[4]利用MATLAB圖像工具箱實現了不同類型的圖像的處理;周廣芬等[5]利用MATLAB圖像處理工具箱對一維數據圖像進行了數據化;郭磊等[6]結合MATLAB圖像數值分析程序和專業位圖軟件PHOTOSHOP圖像操作模塊,實現了對一維潮位圖的數字化處理;崔紅等[7]利用MATLAB對尾流圖像進行了灰度變換、濾波等數字化處理,為尾流圖像進入信息化系統提供了基礎;夏長水和袁業立[8]對塘沽地區的SAR圖像進行了數字化,并應用到地形的反演研究中;王淑娟和張玉葉[9]以MODAS的SST數據為例,介紹了一種從索引圖像中提取數據的方法。宋瑋等[10]通過像素值對南沙雙子裙礁SAR和TM圖像進行了噪聲濾除和幾何校正處理。上述大部分研究中,或只對MATLAB在圖像處理中的功能做了介紹,沒有運用到圖像的數字化中;或只對一維數據圖像做了數字化處理和檢驗;鮮有實現將二維圖像轉化為實際數據的完整的方法討論、數字化展示以及相應的結果驗證。究其原因,二維圖像的量化過程(即色標顏色值與數據值的對應關系以及顏色值到數據值的轉換環節)較為復雜。同時二維圖像的投影種類繁多,按照投影的變形性質可以分為等角投影、等積投影和任意投影。其中等距投影是任意投影中比較特殊的投影,存在正軸投影中經線長度比為1,在斜軸或橫軸投影中垂直圈長度比為1的性質。本文將數字化方法應用于等間距投影的二維圖像,給出一個較為實用的二維等間距投影圖的數據獲取方法,并驗證數字化結果的可靠性,以期為此類問題提供一個有效的解決方案。
(李 燕 編輯)
1.1 數據介紹
Levitus[11-12]是由美國國家海洋數據中心(NODC)的海洋氣候實驗室制作的氣候態海洋數據,是目前國際上比較常用的數據資料。具有年平均、季節平均和月平均三種不同時間尺度,空間分辨率為1°,范圍覆蓋全球,垂直方向分為33層。本文實驗中使用的是1月月平均的全球海表溫度資料(圖1)。

圖1 Levitus全球1月月平均海表溫度圖Fig.1 Levitus monthly averaged sea surface temperature(SST)of January
1.2 方法介紹
MATLAB可以讀取圖像的RGB值,如果要獲取RGB對應的數據值,應將RGB顏色值與數據值的關系確定出來,通常這些關系包含在色標的內容中。本部分內容以Levitus的全球海表溫度為例,先將Levitus原始數據圖像化,得到RGB圖像,再從RGB顏色值與溫度數據值中找到一一對應關系,重現圖像的數據。將重現數據與原始數據做了誤差分析,得到了可靠的圖像信息。具體過程如下:
1)建立像素值與顏色值的對應關系
欲將圖像轉化為數據,需要知道每種顏色所對應的數據值的大小。所以,首先利用MATLAB將色標圖像讀入,以色標外邊框為界對圖像進行剔除,選取有效區域RGB數據,依次提取各個顏色值,再根據色標的下標確定每種顏色對應的數據值,得到顏色值和數據值的一一對應關系。以上處理過程函數為

輸入參數Filename為colorbar圖像名,val_init為colorbar第一個顏色所對應的數據值,val_delt為colorbar值的間隔。
輸出量cb是一個cell數組cb{[R G B],value},cb{N,1}為顏色值,cb{N,2}為對應的數據值。通過該功能函數建立了顏色值與數據值之間的一一對應關系。
2)顏色值到數據值的轉換
確定顏色值和數據值的關系后,為將圖像中的顏色值轉換到數據值做好了準備。首先讀入原始圖像,并將圖像的邊框及以外部分剔除,即只保留含有數據的最小矩形區域。值得注意的是,由于海洋和大氣數據圖像往往存在陸地區域,因此需從原始圖像中截取陸地區域圖像,同樣通過MATLAB來讀取代表陸地的顏色值,或直接給定輸入陸地的顏色值,這樣在數字化的過程中可以剔除陸地的像素點,只對海水點進行處理。
完成數據區域選取的處理,之后,就可以將原始圖像中含有數據的像素點,通過顏色值和數據值的一一對應關系,將原始圖片的顏色值轉換為數據值。有時因圖像本身原因或圖像采集過程,某些點的RGB值發生些許變化,無法與原色標中的RGB值相匹配,產生轉換不成功現象。為此采用CRESSMEN插值[13]進行轉換失敗點的數據補全。同時,若原始圖像中有等值線標注,等值線的顏色值不同于陸地點的顏色值又無法與色標中的顏色值匹配,等值線所在的像素點也會以插值的形式補全。最后,由于本次方法應用于等間距投影圖,將給定的坐標范圍均勻的分配到每個像素點上,就完成了像素點的坐標確定。以上處理過程函數為

輸入參數Picname為待提取數據圖像的圖像名;cb為上一函數的輸出量,即顏色值與數據值的對應關系;lon_range和lat_range分別為數據的經緯度范圍,如:lon_range=[90 270],lat_range[-45 45],表示經度范圍為90°到270°,緯度范圍為-45°到45°,可選輸入量varargin可以是陸地圖像或陸地顏色的RPG值。
輸出量包括result,mask,lon和lat。Result為M×N的數組,M和N分別為圖像的縱橫像素點數的個數,儲存各個點的數據值,若值為32 767,則該點為陸地點或缺測點,即無數據點;mask為M×N個像素點的水陸判別信息,1代表水點,0代表陸地點;lon(N)為橫向各個像素點的經度值,lat(M)為縱向各個像素點的緯度值。
圖2為數字化數據結果的再現圖,圖3為數字化方法的流程圖。

圖2 數字化結果再現圖Fig.2 Map based on digitized SST

圖3 數字化方法流程圖Fig.3 Flow chart of the digitization method
1.3 圖像數字化模型檢驗
圖4為原始數據與數字化結果的散點對比圖。可以看出數字化的提取結果與原始數據具有較好的一致性。圖中極個別點偏差較大,且相對于原始數據都偏小。原因在于這些點為水陸交界點,并且在數據提取中匹配失敗,是由插值補全得到,而由于陸地點的影響使所得數據變小。經計算,原始數據與再現數據平均誤差(ME)為0.147℃,絕對平均誤差(MAE)為0.215℃,均方根誤差(RMSE)為0.275℃,相關系數(R)為0.999 86,結果良好。故總體而言,通過本文的數字化方法提取的數據是可信的,可以運用到進一步的研究工作中。

圖4 Levitus原始數據與數字化結果的散點對比圖Fig.4 A scatter plot of Levitus SST and digitized SST
將該方法應用到全球月平均白冠覆蓋率圖像[14],此處只給出2001-02,2001-05,2001-08和2001-11(圖5a~5d)四個月份的原始圖像并給出相應月份的數據化結果再現圖像(圖5e~5h)。圖像原始數據是從衛星資料反演得到,其中包括SSM/I的海表面亮溫(TB)、大氣柱水汽含量(V)、云中液態水含量(L)數據、AVHRR的海表面溫度(TS)數據、WOA05的海表面鹽度(S)數據和QuikSCAT的海面10 m風場(U10)數據等。該反演方法較復雜,對于物理模型的驗證來說非常耗時。
按照上部分圖片的數字化方法,經過選取色標顏色值,建立顏色值與數據值對應關系,選取數據矩形區域,剔除陸地點,顏色值與數據值的轉換,經緯度的確定等一系列處理,最終的數據提取結果如圖5e~5h所示。從圖中可以發現,數字化再現圖像與原圖像的空間布局基本一致,數據大小基本吻合,提取結果較為滿意,實現了快速獲取圖像信息的功能。

圖5 由衛星數據反演得到(a~d)[14]和數字化再現(e~h)的2001-02,2001-05,2001-08和2001-11月平均全球白冠覆蓋率圖像Fig.5 Monthly average global whitecap coverage images in February,May,August,and November 2001 based on satellite measurements(a~d)[14]and digitized data(e~h)
本文的數字化方法能夠一站式的對圖像進行有效的數據提取,將圖像的像素值轉化為數據值。該數字化方法應用于等間距投影的二維圖像,并且主要針對因某些原因只向外提供圖像但沒有原始數據的情況,如原始數據具有較高研究價值的衛星圖像,繪制時間較早且原始數據丟失的圖像,人工繪制的歷史圖像等。該方法數字化過程包括色標的確定、待提取數據圖像的處理、數據提取和坐標確定等幾個步驟。
上述圖像數字化方法可為此類無法直接獲取的數據提供便捷的數字化,相對于圖像,數字化后得到的數據更具有靈活性。并且,若進行數字化的圖像包含的數據范圍較大,如全球范圍的數據,其原始數據的分辨率一般較低,而數字化過程中將數據范圍均勻分配到各個像素點上,對于一般分辨率的圖像,橫縱像素點個數相對較大,因此最后提取得到的數據分辨率相對與原始數據有所提高,而對于包含較小數據區域的圖像,原始數據分辨率相對較高,通過數字化提取的數據也能保持相當的分辨率。
同時本文對數字化提取結果的有效性進行了檢驗,原始數據與再現數據平均誤差為0.147℃,絕對平均誤差為0.215℃,均方根誤差為0.275℃,相關系數為0.999 86,檢驗結果較為滿意,可將數據運用到進一步的研究工作中以供后續分析使用。
目前上述提出的方法僅僅適用于空間等間距投影圖像,對于那些空間非等間距投影的圖像暫時無法取得令人滿意的結果,有必要對該類問題做進一步的研究。
[1] XU Z Y,LI J P.MATLAB and its application to digital image processing[J].Computer and Modernization,2003(4):64-65,69.許志影,李晉平.MATLAB及其在圖像處理中的應用[J].計算機與現代化,2003(4):64-65,69.
[2] TU W M,WEI Y G,SHI S M.Application of MATLAB to digital image processing[J].Microcomputer Information,2007,23(2X): 299-300.涂望明,魏友國,施少敏.MATLAB在數字圖像處理中的應用[J].微計算機信息,2007,23(2X):299-300.
[3] CHU Q Y.The application of MATIAB to image process[J].Information Technology&Informatization,2010(4):55-56.初青瑜. MATLAB在圖像處理中的應用[J].信息技術與信息化,2010(4):55-56.
[4] DENG W,DING W M,ZHANG H.Application of MATLABin figure image processing and analysis[J].Journal of Agricultural Mechanization Research,2006(6):194-198.鄧巍,丁為民,張浩.MATLAB在圖像處理和分析中的應用[J].農機化研究,2006(6):194-198.
[5] ZHOU G F,LI P,YANG J Y.Study of using the image processing toolbox of MATLAB to digitize graph[J].Journal of Hebei University of Science and Technology,2005,26(4):309-311,321.周廣芬,李鵬,楊久義.利用MATLAB圖像處理工具箱進行圖形數字化的研究[J].河北科技大學學報,2005,26(4):309-311,321.
[6] GUO L,HUANG F H,QIU J.Method and application of tide level digitizing by MATLABimage processing[J].Journal of Yangtze River Scientific Research Institute,2014,31(7):86-90.郭磊,黃鋒華,邱靜.基于MATLAB圖像處理的潮位數字化方法及應用[J].長江科學院院報,2014,31(7):86-90.
[7] CUI H,CHANG Y,ZHANG J S.Digital processing of wake images based on MATLAB[J].Acta Photonica Sinica,2010,39(12): 2274-2278.崔紅,常洋,張建生.基于MATLAB的尾流圖像數字化處理[J].光子學報,2010,39(12):2274-2278.
[8] XIA C S,YUAN Y L.Simulation and inversion study on the submarine topography in the Tanggu sea area using SAR images[J].Advances in Marine Science,2003,21(4):437-445.夏長水,袁業立.塘沽海區海底地形的SAR影像仿真與反演研究[J].海洋科學進展, 2003,21(4):437-445.
[9] WANG S J,ZHAGN Y Y.Extracted data from image by MATLAB[J].Science&Technology Information,2010(11):49-50.王淑娟,張玉葉.利用MATLAB從圖像中提取數據[J].科技信息,2010(11):49-50.
[10] SONG W,ZHANG J,JI G R,et al.Characteristic analysis of Nansha Shuangzi Reefs based on SAR and TM images[J].Advance in Marine Science,2004,22(Supp.1):177-181.宋瑋,張杰,姬光榮,等.基于SAR與TM圖像的南沙雙子群礁特征分析[J].海洋科學進展,2004,22(增1):177-181.
[11] DOU C E,LU J K,TIAN H J.Analysis of the seasonal characteristics of the upper layer water quality at South Yellow Sea based on LEVITUS94[J].Journal of Huaihai Institute of Technology(Natural Science),2010,19(3):84-88.竇長娥,路吉坤,田慧娟.基于LEVITUS94資料的南黃海上層水質季節變化特征分析[J].淮海工學院學報(自然科學版),2010,19(3):84-88.
[12] LEVITUS B S.World Ocean Atlas Vol 1-5[C]∥NOAA Atlas NESDIS.Washington D C:U.S.Department of Commerce,2010.
[13] CRESSMAN G P.An operational objective analysis system[J].Monthly Weather Review,1959,87(10):367-374.
[14] YU T.The Preliminary study of whitecap coverage estimated from routine satellite measurements over the global[D].Qingdao:Ocean University of China,2008:47-50.于婷.由衛星資料反演全球白冠覆蓋率的初步研究[D].青島:中國海洋大學,2008:47-50.
Validation of Statistical Physics Models for Whitecap:I.Development and Application of Digitization Technique of 2D Equidistant Projection Image
YU Cheng-cheng1,2,3,SUN Bao-nan1,2,3,YANG Yong-zeng1,2,3,LIAN Zhan1,2,3
(1.The First Institute of Oceanography,SOA,Qingdao 266061,China; 2.Laboratory for Regional Oceanography and Numerical Modeling,Qingdao National Laboratory for Marine Science and Technology,Qingdao 266237,China; 3.Key Laboratory of Marine Science and Numerical Modeling,SOA,Qingdao 266061,China)
In recent decades,with the rapid development of ocean observing technology,marine data has increased rapidly and given a big boost to the marine research.However,some of those data were published only in the form of images,which are difficult to get the original data,bringing a lot of inconvenience to research work.Basing on the image and data processing function of MATLAB software,we developed a digitization method for 2D equal-distant projection image.Utilize the global sea surface temperature (SST)from Levitus as an example,reliability of our digitization method is verified.Compared with the original SST,the average error of the digitized SST is 0.147℃,the averaged absolute error is 0.215℃, and the root mean square error is 0.275℃.The digitized SSTs agree well with the original data,and thus can be used for further study.Finally,the digitization method was applied to whitecap coverage in satellite image of February,May,August,and November 2001,and the digitized results will be further used in verification of a statistical physics model for whitecap simulation.
image processing;SST image digitization;whitecap image digitization;MATLAB software
August 25,2016
p731.22
A
1671-6647(2017)03-0362-07
10.3969/j.issn.1671-6647.2017.03.006
2016-08-25
國家高技術研究發展計劃項目——南海與周邊海域風浪流耦合同化精細化數值預報與信息服務系統(2013AA09A506);國家自然科學基金委員會-山東省人民政府聯合資助海洋科學研究中心項目——海洋環境動力學和數值模擬(U1406404);山東省自然科學基金項目——南海內波致跨等密度面湍流混合的數值模擬研究(2015ASKJ01);國家自然科學基金青年基金項目——南海北部溫躍層季節內變化特征及其與海洋渦旋的關系研究(41506037);國家海洋局中國-印尼海上合作基金子課題-青年基金項目——南海及其周邊海域內波致混合數值模擬研究(QY0516015)
郁誠成(1992-),男,浙江寧波人,碩士研究生,主要從事物理海洋學方面研究.E-mail:yucc@fio.org.cn
*通訊作者:孫寶楠(1984-),女,山東青島人,助理研究員,在職博士,主要從事物理海洋學方面研究.E-mail:sunbn@fio.org.cn