摘要:為了實現對農業地質和生態地球化學調查的多種來源、多種類型的大量數據的有效管理和利用,文章在全面分析調查數據的情況和各層次的功能需求的基礎上,按照有關國家標準和數據庫設計原則,綜合應用數據庫、地理信息系統、遙感和網絡技術,采用規范化的數據庫設計流程,設計和實現了農業地質與生態地球化學調查數據庫。
關鍵詞:農業地質;生態地球化學;調查數據庫;數據庫設計
中圖分類號:P208
文獻標識碼:A
文章編號:1009-2374(2009)18-0102-02
近年來,各地紛紛組織實施了農業地質和生態地球化學調查。農業地質和生態地球化學調查綜合運用地質、地球化學、遙感等調查方法技術,開展農業地質與生態地球化學調查,將為區域國土資源規劃、管理、保護與合理開發,農業發展規劃、環境保護和污染整治、人居環境的改善和優化,生態環境建設和社會經濟可持續發展提供科學依據。
為了實現對農業地質與生態地球化學調查的多種來源、不同類型、海量數據的統一存儲管理,要綜合應用數據庫、GIS、RS和網絡技術,建立農業地質與生態地球化學調查數據庫。
一、需求分析
(一)數據分析
農業地質與生態地球化學調查,主要包括區域地球化學調查、區域地球化學評價、局部地球化學評價、綜合評價等不同層次的專題調查。每個專題又可以細分為不同的子專題,對區域范圍內的不同地質現象和情況進行調查和勘查,形成大量不同類型的數據。數據包括基礎地理、基礎地質、遙感影像三類背景數據和各個專題的子專題的數據等。按照數據類型,可以分為矢量數據、柵格數據、屬性數據、文檔數據等。
具體的數據情況如下:
1.基礎地理:各種比例尺的地理底圖數據,MapGis格式。
2.基礎地質:各種比例尺的基礎地質圖,MapGis格式。
3.遙感影像:各種比例尺的遙感影像,SPOT和ETM等格式。
4.生態地球化學調查評價數據:包括區域地球化學調查、區域地球化學評價、局部地球化學評價、綜合評價的各個子專題的數據,主要數據類型是野外調查數據和成果圖件數據。野外調查數據為Excel或Access表格形式,包括對土壤、近岸海域、水系、農田、城市等領域的調查樣本及分析測試數據;成果圖件為MapGis格式,包括土壤地球化學背景系列圖件、土壤質量評價系列圖件、各類污染物分布圖件等。
5.文檔數據:包括立項、總體設計、專題設計、實施、成果應用等各階段的文件、文檔(報告)、照片、多媒體及相關參照標準和政策法規等,格式主要是Word、Excel、Txt、JPEG、MPEG等。

(二)功能分析
農業地質與生態地球化學調查數據庫,要滿足以下幾個方面功能需求:
1.依據項目的專業特點,結合數據庫技術,對數據進行分析、整合,實現數據的統一存儲和有效管理。
2.為農業地質與生態地球化學調查各個調查評價專題和信息系統的研究、開發和應用提供數據支持。
3.為各種相關分析評價軟件提供數據支持。
4.為國土、農業、環保等部門的規劃決策、科研機構的研究應用、社會公眾的信息查詢提供基礎數據支撐。
二、數據庫設計
(一)總體結構
農業地質與生態地球化學調查數據庫建設,基于大型國產地理信息平臺MapGis和大型商業關系數據庫系統Oracle進行。在MapGis的GeoDatabase空間數據庫的支持下,利用Oracle提供的嚴格的數據存儲和操作的關系數據模型,將海量的農業地質和生態地球化學調查數據集中存儲管理。
由于系統涉及的數據來源廣、類型多、數據量大,要想有效地存儲、管理和使用數據,必須進行分類。按照數據來源的不同,將數據庫劃分為基礎地理、基礎地質、遙感影像區域地球化學調查等十多個不同的子數據庫。
整個數據庫的層次結構如下圖所示:
(二)數據庫設計
1.數據庫設計步驟。農業地質與生態地球化學調查數據庫建設,按照數據庫規范設計方法,綜合考慮農業地質與生態地球化學調查數據庫及應用系統開發目標及特點,將數據庫設計大致劃分為以下六個階段:需求分析、概要設計、邏輯設計、物理設計、數據庫實施、數據庫運行和維護。
2.概念設計。概念結構設計,是將現實世界的用戶需求轉化為概念模型。通常采用P.P.S.Chen于1976年提出的實體-關系聯系方法,用ER圖表示概念模型。概念設計通常有自頂向下,自底向上,逐步擴張和混合策略四種方法。
決定采用自底向上的設計方法,經過局部ER模型設計和全局ER模型設計兩個步驟將各個專題的需求轉化為ER模型。
3.邏輯設計。概念設計所得的概念模型,獨立于任何DBMS,與實現無關。邏輯結構設計就是將概念結構設計階段設計的ER模型,轉化為具體DBMS支持的數據模型相符的邏輯模型。通過概念模型轉換為關系模型、關系模型的優化、設計用戶子模式三個步驟,將ER模型轉換為Oracle關系數據模型。
4.物理設計。數據庫在物理設備上的存儲結構和存儲方法稱為數據庫的物理結構(內模式)。物理結構設計的目的,一是要提高數據庫的性能,滿足用戶的性能需求,二是有效的利用存儲空間。總之,就是為使數據庫系統在時間和空間上最優。(1)確定數據的存放位置。將遙感影像數據庫建立為固定大小,平均放置在Raid5的各個磁盤上,在讀取時通過多個磁盤同時讀取,提高物理I/O讀寫的效率及響應速度。其它的數據,如圖形數據、表格數據、索引數據、日志數據分別建立不同數據庫,并存儲于不同的磁盤空間中。(2)系統配置及優化。系統配置及優化工作一般在軟件系統開發完成后,根據測試結果進一步配置,并在后期用戶使用中,根據用戶對數據的調用頻率、系統瓶頸等參數進行。主要方法及過程如下:1)通過操作系統的一些工具檢查系統的狀態,采用更換高性能硬件設備、優化操作系統設置等方法來改進性能。2)編寫Oracle腳本,查找性能差的sql語句。占用系統資源特別大的Oracle的session及其執行的語句,并根據情況對其進行優化。3)對Oracle中訪問量頻繁的表,除建立索引外,還需把這些表分表空間存放以免訪問上產生熱點。4)改進存取方法,采取快速存取技術。把相同專題的數據集中存放在連續的物理塊中,以提高訪問速度。
(三)數據編碼
數據的分類編碼是對數據資料進行有效管理的重要一環,目的是節省計算機內存空間,便于用戶理解使用。地理屬性進入數據庫之前進行編碼是必要的,只有進行了正確的編碼,才能實現空間數據庫與屬性數據庫的正確連接。
本系統的數據采用三級分類,按照圖形數據、屬性數據等不同的類型,分別對圖層、圖元、數據表和數據庫等進行編碼。
三、實現方案
農業地質與生態地球化學調查數據庫建設工作,需要按照數據類型的不同,分別進行。
1.矢量數據。依次經過資料收集、資料數字化、內容正確性檢查、符號庫統一、分層正確性查檢、拓撲結構檢查、坐標系與投影方式的統一、數據入庫、數據測試等步驟,完成基礎和成果圖件數據的建庫工作。
2.屬性數據。依次經過資料收集、資料數字化、資料檢查、數據格式轉換、數據入庫、數據測試等步驟,完成屬性數據的建庫工作。
3.柵格數據。柵格數據經過影像解譯和圖像融合,然后入庫。
4.文檔數據。各類文檔資料,經過專題技術人員確認,建立起文檔對照表,然后入庫。
5.元數據。根據中國地質調查局發布的《地質調查元數據內容與結構標準》,結合各個專題的實際情況,專題技術人員填寫好8個元數據子集后,交由數據庫建庫人員入庫。
四、結語
農業地質與生態地球化學調查數據庫建設,按照國家有關標準的指導,依據數據庫規范化設計流程進行,力爭滿足政府決策、專題研究、社會信息服務等多個層次的要求。
參考文獻
[1]蔡子華,段學軍,李向遠,等.浙江省農業地質環境信息系統建設初探[J].資源調查與環境,2005,26(2).
[2]薩師煊,王珊.數據庫系統概論(第三版)[M].高等教育出版社,2000.
[3]秦子晗.農業地質信息數據庫的設計與實現[J].科技經濟市場,2007,(7).
[4]蔡子華,戴磊,段學軍.浙江省農業地質環境GIS設計與實現[M].地質出版社,2007.
作者簡介:黃鐵蘭(1981-),男,湖南湘潭人,廣東省地質調查院助理工程師,碩士,研究方向:地質、礦產數據庫、GIS應用系統。