孔媛媛 ,馬飛飛,路英川,蘇學影,楊玉霞
(1.武警黃金地質研究所,河北 廊坊065000;2.中國地質調查局發展研究中心,北京 100037;3.全國地質資料館,北京 100037)
地質資料是地質工作成果的重要載體,是地質找礦、勘查、地質災害評估的重要的信息資源。隨著計算機和網絡技術的發展,地質工作成果廣泛應用于各個領域。地質資料信息化建設以及地質資料資源共享顯得尤為重要。
隨著信息技術和網絡技術的廣泛應用,地質資料行業提出了多個與“地質資料服務中心、數據中心”內涵相類似的概念。近年來,全國地質資料館研發的“全國地質資料目錄服務中心”就是其中之一。全國地質資料館和絕大多數省級地質資料館資料目錄已通過互聯網公開向社會提供查詢服務,但囿于網絡現狀和保密管理的制約,目前全國地質資料目錄服務中心互聯網公開提供的主要是目錄層次的數據,地質資料數據中心的建設不盡人意。與此同時,全國地質資料目錄服務中心通過互聯網傳遞給用戶,由于計算機網絡分布的廣域性,網絡信息安全和版權問題制約了地質資料數據中心的安全發布。
黃金部隊是一支專業地質找礦部隊,以北京黃金指揮部為中心,下設三個總隊、研究所、教導大隊。三個總隊駐地分別在哈爾濱、廊坊、成都,三個總隊管轄十二個支隊級單位,服務資料分散、跨區域共享服務不足、服務渠道不暢通、館藏借閱為主、服務方式單一。長期以來,海量的地質資料數據資料沒有得到有效的利用,制約當前地質勘探與地理信息的應用。
隨著2011年黃金部隊任務調整和轉型,黃金部隊業務隸屬于國土資源部,在地質資料管理上逐步與地方地勘單位接軌。2012年,黃金部隊在全部隊開展了圖文數字化工作,積累多年的寶貴地質資料全面掃描數字化,建立了寶貴的海量地質資料數據庫。在此基礎上,基于與互聯網物理斷開的部隊專網、架設三級網絡,設計一套可行、可靠、有效的分布式系統,能夠整合分散數據、異構系統,提供不僅包括目錄瀏覽,同時可以在線借閱、在線下載、離線申請等多層次服務模式的資料目錄服務系統勢在必行。本文從黃金部隊地質資料管理的實際出發,以地質資料檔案著錄細則(DA/T23-2000)、地質資料電子目錄著錄格式規定(國土資發〔2012〕257號)、原始地質資料立卷規則(2008)、實物地質資料館藏管理技術要求為依據,分析了地質資料目錄數據項標準、對比了地質資料管理和地質資料匯交軟件的使用情況,提出了黃金部隊地質資料目錄服務系統建設的思路、總體框架、數據組織,對推動黃金部隊地質資料信息服務朝著集群化、產業化發展具有深遠意義。
地質資料目錄數據標準[1]依據地質資料檔案著錄細則(DA/T23-2000)、地質資料電子目錄著錄格式規定(國土資發〔2012〕257號)、原始地質資料立卷規則(2008)、實物地質資料館藏管理技術要求。地質資料檔案著錄細則(DA/T23-2000)規定了地質資料目錄項分9個大項,35個目錄。2001年國土資源部發布的地質資料電子目錄著錄格式規定(國土資發〔2012〕257號)規定了成果地質資料目錄數據庫建設的標準。規定了25個目錄項。2008年實施的原始地質資料立卷規則(2008)規定了原始地質資料的歸檔范圍、歸檔細則。包括卷內文件的分類、編目、立卷歸檔的原則,該標準明確了12個文件目錄項。實物地質資料館藏管理技術要求2010年11月正式實施,適應于實物地質資料的管理工作,該文件規定了實物地質資料是以項目或者礦權為一個整體來進行管理的。著錄層次為案卷級、部分為文件級,包括鉆孔巖心、標本、薄片、光片等實物資料相關內容。
地質資料的目錄數據分為案卷級和文件級的目錄數據,通過對案卷級目錄項進行了對比。得出地質資料檔案著錄細則(DA/T23-2000)、地質資料電子目錄著錄格式規定(國土資發〔2012〕257號)、實物地質資料館藏管理技術要求共同擁有的目錄項12項。即:題名、密級、保管期限、形成單位、保護期、其他存放形式資料保存單位、地點、起始經緯度、內容摘要、檔案館代號、檔號、行政區劃代碼、主題詞、關鍵詞。對于文件級目錄,進行了對比分析,文中4個標準中共有的目錄項有12個:件號、檔號、文件題名、文件類型、密級、完成人、完成時間、完成單位、載體數量、載體單位、載體類型、規格。分析對比標準規范的案卷級目錄項、和文件級目錄項對地質資料目錄服務系統的底層數據組織具有基礎性意義。
黃金部隊14個基層資料保管單位分布全國各地,數據分散保存、地質資料目錄管理與服務體系建設滯后,缺乏統一管理的平臺,對于地質資料分布、總量很難做到資料的快速定位。同時由于各個基層單位參與的項目分布不同,在資料匯交的階段分別匯交到不同的省館館藏機構或各大區地質調查局,在原先各省館針對資料管理和匯交都開發了自己的軟件,所以我部基層館藏機構的數據格式和目錄也是五花八門。每年雖然也匯交到北京黃金指揮部,但是只是作為一個成果存檔,格式和目錄也沒有統一要求。這對下一步實現各基層單位資料的數據共享,帶來了很大的困難。
針對各基層單位在地質資料管理和著錄使用的軟件進行了分類,不外乎各大區匯交和各省館館藏機構的管理軟件。主要分為著錄和管理兩大類。著錄系統主要有成果地質資料目錄數據庫錄入系統、成果地質資料電子文件制作EDMaker、涉密地質資料清理。2012年研發的EDMaker2012軟件是集成了資料的著錄、匯交以及涉密清理,綜合了原始、成果、實物地質資料的匯交。地質資料管理系統主要包括地質資料業務管理信息系統、全國地質資料匯交監管平臺、省館自主研發地質資料管理系統等。
黃金部隊地質資料目錄服務系統是以面向黃金部隊內部各個單位服務為宗旨,以聯動式共享機制,搭建快捷、實用、靈活的地質資料目錄集群服務框架,由傳統的信息匯集向信息共享服務轉型,主要遵循以下原則。
1)數據分散、服務共享的原則。由于黃金部隊以北京黃金指揮部為主中心,下設哈爾濱、廊坊、成都三個總隊以及研究所四個分中心,三個總隊各自管轄三個地域不同的支隊。數據量大,且分散分布,該系統結合基層單位是資料的保存單位,負責資料的管理和發布,通過分布式服務技術,搭建統一的服務平臺,共享數據資源。
2)部署簡單、服務管理便捷的原則。黃金部隊地質資料目錄服務系統采用分布式服務技術,在主中心和四個分中心分布部署。各個分中心因地域距離較遠,系統在研發的過程中,考慮適應不同軟硬件環境,易于部署和管理。通過目錄數據的聯合編目、目錄數據的更新和服務,給用戶提供簡單便捷的服務。
3)快速檢索、服務模式多樣的原則。地質資料的作用主要體現在服務和應用,該系統針對地質資料的類型不同,分為公開和非公開,非公開又根據保密期的長短進行了區分,所以用戶在提交服務申請時,系統會根據資料的類型的不同,提供多樣化的服務模式。對于非公開的數據,系統提供地質資料的存檔位置并以目錄形式提供服務,也可以申請下載,定制申請需求;對于公開服務的數據可提供在線瀏覽和下載;多樣化的服務模式,用戶可以在最短的時間內查閱到所需資料的位置,并根據需要辦理借閱、下載等手續,大大縮短了資料借閱的時間,節省了時間和人力。
黃金部隊地質資料目錄服務系統運行的網絡環境,首先是單位機關(支隊、總隊或指揮部)的局域網,然后是在授權條件下通過局域網登錄到黃金部隊的專網,實現對其它單位應用系統的訪問。系統運行結構的設計,是指采用何種結構模式解決網絡環境下的表示層對應用邏輯層及數據層的訪問。本系統運行結構中,采用了以Browse/Server為主,集中式運行模式為輔的混合網絡結構模式。對各業務處室,由于辦公地點分布地域廣、人員素質差異較大,系統提供B/S模式。這種胖服務器,瘦客戶端的運行模式下,主要命令執行、數據計算都在服務器上完成,而且應用程序也安裝在服務器,客戶機幾乎是零安裝零維護。
系統由三個邏輯層組成:數據層、業務對象層和客戶層。數據層[2]SQL數據庫,位于系統的底層。數據層主要處理業務對象層對數據提出的請求和存儲地質資料目錄數據。業務對象層是關鍵層、核心層,它主要處理如何訪問數據、如何請求數據分發到客戶層。客戶層提供應用接口給客戶,借助Web瀏覽器與后臺數據庫交互,實現地質資料信息查詢和數據的維護。
本系統主要以黃金部隊專網為基礎,在黃金指揮部、三個總隊以及14個支隊級單位部署。其中,在指揮部部署目錄中心服務系統。通過目錄中心服務系統的前臺子系統。為目錄訪問用戶提供目錄查詢、瀏覽等服務。系統維護人員通過地質資料目錄中心服務系統對地質資料目錄數據進行管理,并連接3個總隊級和14個支隊級地質資料中心。通過Web Service方式通信,獲得分布式存儲的地質資料目錄。
在14個支隊級地質資料中心部署館藏單位系統,由各個館藏單位的系統維護人員對本地的地質資料目錄進行管理,包括數據的導入、更新、發布、定制等,同時通過Web Service與目錄服務中心的目錄中心服務系統通信,提供本地的地質資料目錄。
此外,在目錄服務中心和館藏單位部署運維管理系統,運維管理模塊貫穿目錄中心服務系統模塊和各分布式服務模塊,提供統一的用戶認證、服務狀態監控、服務量統計的功能。
黃金部隊地質資料目錄服務中心項目系統的建設整合[3]各個館藏機構目錄數據、地調系統目錄數據、行業系統目錄數據及其他地質資料目錄數據,開發多源異構地質資料目錄數據集成接口,實現黃金部隊地質資料目錄數據的集成管理。利用分布式數據集中與同步技術、發布與多元服務技術、少量數據檢索方案、分布式數據管理與統計技術及目錄服務產品制作方案為技術支撐,建設公益性地質資料目錄庫及商業性地質資料目錄庫,開發目錄數據集成與發布、委托查詢、目錄推送等多元服務、傳統、空間多元檢索、目錄專題服務產品生成及數據管理與統計等功能模塊。并通過以上功能模塊及分布式的地質資料目錄數據庫,支撐黃金部隊地質資料目錄服務中心對外提供多種目錄服務。同時在系統建設過程中,通過運行機制、標準規范、安全認證、用戶管理、權限管理及流程管理等多種方式,對系統運行的規范性、安全性進行控制,實現系統平穩、高效運行。
黃金部隊地質資料目錄服務系統由目錄數據中心系統(指揮部、總隊)、館藏單位服務系統(支隊)和統計身份認證系統三部分組成,如圖1所示。

圖1 系統功能結構圖
目錄數據中心系統(指揮部)主要包括前臺服務系統和后臺系統兩部分,其中前臺系統為用戶提供目錄瀏覽與查詢、地圖檢索及產品定制申請等數據服務,后臺管理系統為管理員用戶提供目錄數據同步、內容管理、分中心管理及運行監控等管理服務(圖2)。館藏單位目錄服務系統主要包括前臺服務系統和后臺系統兩部分,其中前臺系統為用戶提供目錄瀏覽與查詢、地圖檢索及產品定制申請等數據服務,后臺管理系統為管理員用戶提供目錄服務接口、目錄數據同步接口、目錄數據管理及運行監控等管理服務。統一身份認證系統[4]要為用戶提供用戶注冊、單點登錄、數據同步、角色管理及后臺配置相關功能,以支持系統安全平穩運行。

圖2 目錄系統數據庫架構
黃金部隊地質資料目錄服務系統是按照兩級體系架構設計研發的,分布是以北京黃金指揮部為主中心,以三個總隊、研究所的館藏為分中心,管理數據的組織。在各個基層館藏機構展開調研,總結目錄數據的格式,開發適合各種數據格式的數據接口,形成多元化的數據目錄集合,實現地質資料目錄服務系統提供有效的服務。館藏機構在數據目錄管理上,采用分布式服務技術,通過黃金部隊專網,統一發布到集成的分中心、主中心。分中心和主中心做好數據的同步更新。在服務模式上[5]據用戶需求,提供在線下載、離線申請等多樣化的服務模式。
在整合數據目錄格式的同時,要依據國家標準和行業標準規范,研究并制定適合目錄服務平臺的規范,例如數據訪問服務接口規范、地質資料目錄數據加工規范等。
北京黃金指揮部設定的主中心主要包括目錄數據集,通過黃金部隊專網,實時發布、實時更新。以哈爾濱、廊坊、成都為主的總隊分中心,主要通過支隊級館藏機構的服務發布,對公開數據和依申請公開的數據發布到各分中心,分中心再通過共享服務接口提供目錄瀏覽、目錄查詢、數據查詢、在線瀏覽、在線下載等多元化的服務模式。主中心對分中心實時發布的信息進行數據抽取、數據審核和數據集成,形成公開服務目錄數據庫和依申請公開的目錄數據庫,最后實現黃金部隊內部各個單位的目錄服務查詢。
本文通過研究分析黃金部隊地質資料管理和服務現狀,結合黃金部隊各個基層館藏機構的地質資料目錄數據實際,通過整合各種數據源,建立統一的數據標準規范,分析海量數據目錄檢索、在線下載、離線申請相關的多元化的資料服務模式技術的實現。重點從體系結構、架構設計、功能結構、數據庫設計等多方面進行了研究和探討,為下一步更好地為黃金部隊地質勘查、科研服務提供技術支持。
[1] 連健,王黔駒,許百泉,丁克永.我國地質資料目管理現狀分析及建議[J].中國礦業,2013,22(9):54-55.
[2] 溫雪茹,翟國平,李銀羅.地質資料目錄檢索服務系統的建設[J].國土資源信息化,2007(5):10-12.
[3] 馮錳.淺談成果地質資料目錄數據庫建立及利用[J].內蒙古地質,2002(3):35-37.
[4] 連健,王黔駒,顏世強.全國地質資料目錄服務中心總體設計研究[J].中國地質,2013,40(5):1675-1681.
[5] 卜小平,張翠光,趙亞利.全國地質資料數據中心建設方案初探[J].國土資源科技管理,2007,24(6):127-131.