陳云波,王健,王勤珍
(昆明市測繪研究院,云南 昆明 650051)
隨著遙感技術與計算機技術的迅猛發展,現代遙感技術能夠動態、快速、準確地提供多種對地觀測數據。遙感數據以幾何級數的速度增長,數據越積越多,如何管理海量遙感數據,能夠從海量數據源中迅速地檢索到感興趣的區域,怎樣更好地為實際應用服務,是影像管理的熱點問題。
經有關資料表明[1],目前遙感影像數據管理方式主要有:①基于文件的管理方式;②基于文件與數據庫技術混合的管理方式;③關系型數據庫管理方式;④基于擴展對象關系型數據庫的管理方式;⑤面向對象數據庫管理方式。
這幾種建庫方式各有優缺點。基于文件的管理方式的缺點就是針對多用戶的數據共享與并發控制較為困難,同時很難保證數據的安全性。而基于文件與數據庫技術混合的管理方式較基于文件的管理方式在效率和存儲上有了一定程度的補償,但其缺點是元數據與文件備份分離,容易造成數據不一致,數據恢復較為困難。目前遙感影像最常用的就是關系型數據庫,但其無法實現基于內容的查詢。對象關系數據庫不僅有關系數據庫的特點,同時也能有效管理復雜數據,可以支持基于內容的查詢。面向對象數據庫管理不僅支持對象語義查詢,而且支持基于內容的查詢,但是由于影像數據本身的復雜性和系統開發的復雜性,因此使得這種數據庫管理技術較為困難。
遙感影像的尺度因子包含空間分辨率、光譜分辨率、時間分辨率等。昆明市測繪研究院有2005年的2.5 m的SPOT5的影像,2008、2009、2010年的 0.6 m的QuickBird影像、2011年的 0.5 m的GEOEYE影像以及2011年的 0.2 m的航飛影像數據,這里多尺度指的是空間分辨率。
由于在獲取的時候采用的傳感器不同,因此在很大程度上就形成了遙感影像的多樣性。目前,昆明市測繪研究院擁有的高分辨率的影像就有SPOT5,QuickBird,WorlDView,GeoEye以及數字航飛等不同影像源。
遙感影像的時空性包含統一傳感器在不同時期采集的影像,也包括不同傳感器在不同時期的遙感影像。昆明市測繪研究院的2005年~2011年期間的影像數據都是不同時期的數據。同時2008年、2009年的QuickBird影像就屬于不同時期統一傳感器的獲取的數據。遙感影像的時空性特點可以用來檢測整個城市發展的節奏、可以用它提供城市在不同時期發展的相關統計數據。
遙感影像含有幾乎所有地球表面地物的光譜信息,信息量很大。就遙感影像數據本身而言其數據量是很大的,因此,整個遙感影像的處理過程就是對海量數據的處理過程。昆明市測繪研究院擁有覆蓋整個昆明市域的2005年 2.5 m SPOT5影像共 2.1萬km2,2008年昆明市 0.6 m的QuickBird影像 3 800 km2,2009年昆明市的 0.6 m的QuickBird影像 2 100 km2,2010年安寧市QuickBird影像 2 664 km2,以及2011年昆明主城的 0.5 m的GeoEye影像 999 km2。2011年其他地州的 0.6 m的 QuickBird影像共2萬km2。同時還有0.2 m的航飛影像數據 1 748多km2,其數據量比0.6 m、0.5 m更大。在實際工作中一個縣1 600多km2的 0.6 m的QuickBird正射影像數據量就達78 G,可見將遙感數據稱為海量數據一點都不過分。
由于遙感影像的數據量巨大,因此在建庫時必須首先應考慮采用哪種壓縮技術,既不損失影像分辨率,同時又能保證操作效率高。最常見的壓縮格式有*.jp2,*.sid,*.ecw等幾種。這幾種壓縮技術比較如表1。

幾種壓縮格式比較 表1
壓縮后影像效果如圖1~圖4所示。
通過圖1~圖4及表1可以看出,當*ecw壓縮比為1∶20時,影像分辨率損失最低,同時數據量最小,因此,選擇*.ecw格式的壓縮技術。

圖1 Tiff格式

圖2 壓縮后jp2格式

圖3 壓縮后Sid格式

圖4 壓縮后ecw格式
一般來講,創建金字塔模型會增加約30%左右的存貯空間,但是對于 500 M以上的大數據量的遙感影像來講,建立遙感影像金字塔后數據的讀寫速度明顯提高,就目前的存儲技術,用這種犧牲空間存儲來提高運行效率的方式還是可取的。建立遙感影像金字塔,可采用分級建立金字塔。
整幅影像在數據庫中應進行分塊處理,這樣可以減少數據庫交互訪問的數量,提高數據加載和操作的效率。數據庫中同類型的影像應劃分成大小相同的影像塊,影像塊的大小決定計算機性能。影像塊不能過大也不能太小,太大,增加了不在查詢范圍內影像的數量,太小,在某種程度上雖然減少了冗余數據的讀取,但與此同時增加了讀寫操作的次數。因此在選擇影像分塊大小時應適中。據有關資料表明[2],用512×512作為塊大小,可以在普通的電腦上運行。
同時針對昆明市測繪研究院現有的遙感影像資料特點,在分塊時采用分級對待。對SPOT5影像、Quick-Bird影像以及 0.2 m的航飛影像數據應分類對待,分辨率不同的影像分塊的大小可以不同,但每塊影像的數據量要基本一致。
由于昆明市測繪研究院具有自2005年 2.5 m的SPOT5,2008、2009、2010、2011 年的和0.6 m 的 QuickBird影像以及部分 0.5 m的WorldView影像和 0.2 m航飛影像數據。擁有ArcGIS 9.2全套軟件以及Oracle 9i等相關軟件。因此在這里考慮選擇基于中間插件ArcGIS軟件的ArcSDE實現關系數據庫管理遙感影像數據。ArcSDE是用 Geodatabase 的概念來管理空間數據[3,4]。
(1)應用的數據結構
ArcSDE將柵格數據分解成幾個數據表。在ArcSDE中,遙感影像數據也分為元數據和影像數據本身。其中元數據存放在一組元數據標準,而遙感影像數據存放在二進制對象影像數據表中。
(2)數據存儲方式
ArcSDE有三個表來存儲遙感影像數據,即柵格數據塊表存貯原始數據,柵格波段數據表存儲波段元數據,柵格數據描述表存儲影像的描述信息,通過特定的字段將這幾個表聯系起來。
(3)影像數據的檢索方式
ArcSDE采用的是格網索引技術,將研究區劃分為若干塊,對每一格網進行編號。根據查詢對象的空間位置和形狀來判斷在那一格中。再根據屏幕的視野范圍來確定讀取金字塔數據,進而實現影像的檢索、查詢等操作。
格網索引算法[2]如圖5所示。

圖5 格網索引算法
其中 P1,P2,P3,P4 為當前視窗頂點,且P2,P3 的坐標分別為(PX2,PY2),(PX3,PY3),影像左下角的坐標為(XL,YL),影像分塊的大小為512×512,則格網索引的公式為:
行方向的起始塊號=(PX2-XL)/512;
列方向的起始塊號=(PY2-YL)/512;
行方向的終止塊號=(PX3-XL)/512
列方向的終止塊號=(PY3-YL)/512;
有上面公式可得視窗內所包含的數據塊,從而確定所查詢的數據塊,數據庫進而讀取相應的數據塊顯示。
(4)數據庫的運行與維護
ArcCatalog軟件實現對柵格數據進行索引、金字塔的建立、格式轉換、數據壓縮等操作。
本文詳述了遙感影像管理面臨的關鍵技術,結合單位實際情況提出來基于ArcSDE的中間件建庫是目前該單位較為適合的影像管理方式。同時得出以下幾點結論:
(1)遙感影像建庫必須解決海量數據能夠高效讀寫;
(2)遙感影像庫后期的維護才是重點,由于遙感影像數據量本身很大,在后期的維護、數據庫的備份將存在很多不可預見的問題。
[1]李宗華,彭明軍.基于關系數據庫技術的遙感影像數據建庫研究[J].武漢大學學報(信息科學版),2005(2).
[2]黃杰,劉仁義,劉南等.海量遙感影像管理與可視化系統的研究與實現[J].浙江大學學報(理學版),2008(6).
[3] 歐立業.遙感影像數據建庫技術比較研究[J].江西測繪,2007,增刊.
[4]張暢,劉強,戴昌禮等.大規模影像數據庫的設計與實現[J].測繪科學,2010,35(3).
[5]Zeiler M.Modeling Our World.Redlands:ESRI Press,2000.
[6]ESRI.Understanding ARCSDE:The RDBMS and GIS Itegration.Redlands:ESRI Press,2000.