史國萍,馬瑜宏,朱恒華,劉春華,郭晶,張貴麗,張華平,吳紅霞
(1.山東省國土測繪院,山東 濟南 250102;2.山東省地質調查院,山東 濟南 250014;3.山東省土地質量地球化學與污染防治工程技術研究中心,山東 濟南 250014)
地質鉆孔資料是地質工作形成的最重要基礎地質資料之一,是國家的寶貴財富[1-6]。隨著鉆孔資料在城市化建設、三維地質建模與可視化應用、深部找礦、防治地質災害等信息社會化服務領域的深入應用,鉆孔數據庫的建設要求也在不斷更新。
2001年,中國地質調查局發布了《固體礦產鉆孔數據庫工作指南》[7],該指南詳細規定了建立固體礦產鉆孔數據庫的數據采集原則、工作流程、編錄表格、數據內容、數據文件格式等內容。2013年,原國土資源部發布了《關于印發〈全國重要地質鉆孔數據庫建設工作技術要求(試行)〉的函》(國土資儲函〔2013〕37號)[8],對重要地質鉆孔數據采集的范圍、內容、格式、工作流程、質量控制等方面進行了規定。2015年,中國地質調查局發布了《城市地質調查數據庫結構規范》(DD2015—04)[9],其中對基礎地質鉆孔、工程地質鉆孔、水文地質鉆孔和地熱鉆孔的屬性表結構進行了規定與說明。本文在以上標準的指導下,結合鉆孔數據多源異構的特點,設計了既滿足項目實際需求、又能極大提高鉆孔數據使用效率的鉆孔數據庫結構,有效提升了本地區鉆孔數據的價值和信息化服務水平。
數據庫設計的目的是規范地質編錄數據[10-15],最大限度地發揮鉆孔數據的使用價值,滿足科研、生產和管理的需要。鉆孔數據庫的設計參照地質生產過程中所獲取的鉆孔資料信息和地質資料信息化需求進行。鉆孔數據內容主要包括鉆孔基本信息、地質巖性信息和試驗數據等,數據表有鉆孔綜合信息表、鉆孔彎曲信息表、鉆孔地層描述表、鉆孔標準化分層表等12張表,各表之間通過鉆孔統一編號這個共有關鍵字段建立關聯,數據項內容依據鉆孔原始資料記錄信息而定。
鉆孔數據庫采用通用的MS Access格式數據庫存儲。
鉆孔綜合信息表(表1)用來記錄鉆孔的基礎信息,主要參數包括鉆孔編號、鉆孔類型、鉆孔位置、孔口標高、鉆孔深度等信息。

表1 鉆孔綜合信息表
孔口坐標x、孔口坐標y、孔口經度和孔口緯度數據項參照鉆孔柱狀圖上的鉆孔坐標信息填寫,如果鉆孔孔口坐標x、孔口坐標y數據項填寫為空值,那么孔口經度和孔口緯度數據項不能為空,反之亦然。孔口經度(2000坐標系)、孔口緯度(2000坐標系)數據項填寫鉆孔原始坐標投影轉換至CGCS2000坐標系下的坐標值。
鉆孔彎曲信息表(表2)用來描述鉆孔的彎曲度信息,表示的是鉆孔的空間展布特征,主要參數包括鉆孔編號、孔深、天頂角和方位角等。其中天頂角表示鉆孔方向與垂直方向的夾角;方位角表示鉆孔水平投影方向與正北方向的夾角,正北向為0°,正南向為180°,沿順時針遞增,至360°為止。

表2 鉆孔彎曲信息表
鉆孔地層描述表(表3)用于記錄鉆孔分層信息的地質描述內容,包括地層厚度、地質代號、巖土名稱、巖土顏色、地層描述、風化程度等分層地質信息,鉆孔資料錄入人員按鉆孔柱狀圖上的記錄逐一填寫。

表3 鉆孔地層描述表
鉆孔標準化分層表(表4)用于記錄鉆孔分層信息標準化后的內容,鉆孔分層信息標準化處理人員依據《山東省城市地質調查技術要求(試行)》附錄C、附錄D制定的山東省三維地質模型分層標準與四級編碼對鉆孔地層描述逐層編碼。

表4 鉆孔標準化分層表
除以上4張鉆孔基本信息表以外,根據收集鉆孔柱狀圖的描述信息,鉆孔數據庫還設計了金屬礦產地質勘查孔地質測試分析結果表、非金屬礦產地質勘查孔地質測試分析結果表、水文地質勘查孔含水層段信息表、水文地質勘查孔水質測試信息表、抽水試驗結果信息表、工程地質勘查孔信息與數據表等6張鉆孔試驗信息表和水文地質勘查孔井管結構、水文地質勘查孔填礫止水結構等2張水文地質勘查孔的結構表。
鉆孔數據錄入工作應信息化、規范化,滿足地質大數據應用對鉆孔數據的需求[16-18],為此,本次工作編制了《鉆孔資料信息化入庫規范》,該規范規定了鉆孔資料的錄入內容、鉆孔數據的存放格式、數據表字段類型及長度、填寫要求、人員配置、工作流程等方面的內容。同時,也規定了鉆孔錄入數據的質量要求,以此規范鉆孔資料錄入的全過程,保障地質鉆孔數據錄入工作在統一規范的框架內正常有序的開展,確保該項工作的順利完成。
鉆孔數據錄入工作的流程如圖1所示。

圖1 工作流程圖
數據質量即數據的可靠性。鉆孔數據錄入人員較多,涉及資料量多且時間跨度大。在錄入過程中,由于鉆孔數據錄入人員操作失誤或專業知識欠缺、原始數據質量限制、資料重復利用等多方面的因素,會導致各種數據質量問題。因此,在鉆孔數據入庫過程中,應遵循以下原則:
(1)在建立鉆孔數據庫時,必須仔細核對原始數據源的準確性與完整性[19-20],確保準確無誤后,再將鉆孔的原始數據依次數字化。
(2)數據質量是衡量數據成果的重要指標。為保證數據的正確性和有效性,確保數據錄入質量,應嚴格執行數據錄入標準,數據錄入過程中錄入人員要根據錄入情況填寫工作日志。
(3)錄入人員應及時進行自檢、互檢,對自檢和互檢結果建立相應檢查記錄。數據錄入小組長進行抽檢工作,通過與原始地質資料進行比對,對錄入工作的整體質量進行控制,并建立相應檢查記錄。自檢、互檢和抽檢時如發現問題,應按要求及時修改。
(4)在數據采集的每一個環節都要進行數據質量檢查。檢查方式可采用人工檢查和軟件檢查相結合。
(1)在鉆孔數據庫建設初期就應充分考慮質量檢查及相關輔助軟件的開發工作。海量的數據檢查單獨依靠人工比對去完成是不現實的,應盡量降低人工檢查的工作量,充分挖掘各數據項之間的內部邏輯規律,通過開發計算機程序自動厘清數據項間的邏輯關系,高效提升數據庫的建設質量。
(2)各行業間鉆孔數據的共享程度低、重復利用率不高,應組織建立地質鉆孔資料統一匯交與共享服務機制,最大限度地提高地質鉆孔的使用效率和應用價值,避免資源浪費。
(3)數據更新給數據庫帶來源源不斷的生命力,應建立地質鉆孔資料長效更新機制,推進鉆孔數據建設工作常態化,深化地質鉆孔與信息化技術的深度融合,為地質大數據挖掘分析和綜合利用奠定基礎,更好地發揮基礎地質資料的有力支撐作用。