于貴華 杜克平 徐錫偉* 吳熙彥 王 銀
1)中國地震局地質研究所,活動構造與火山重點實驗室,北京 100029
2)北京師范大學地理學與遙感科學學院,北京 100875
3)寧夏回族自治區地震局,銀川 750001
地震是破壞性大、對人類生存安全危害最嚴重的突發性自然災害,活動斷層是地震災害之源。活動斷層探察是為達到有效減輕地震災害的基礎性行業科研工作。如何科學、快速地存儲、管理共享活動斷層探察過程中所獲得的大量科學事實數據,使其在地震災害防御、地震應急響應、地震監測、地震預測、現今大陸動力學研究、地震科技服務等方面充分發揮其基礎數據的作用,是隨著活動斷層探察工作的開展而亟待解決的重要問題。
國際上已建成了一些信息較全、開放性、便于使用的活動斷層數據庫。如美國地質調查局在互聯網上公布了2010年11月3日更新的全美范圍內的、最新的、多種方法確認的或推測的第四紀活動斷層、褶皺匯編數據庫①美國地質調查局活動斷層數據庫:http:∥geohazards.usgs.gov/cfusion/qfault/,2012.08.16。(Haller,2003;Kathleen et al.,2004);新西蘭地質與核科學學院(GNS)建成了新西蘭活動斷層數據庫②新西蘭活動斷層數據庫:http:∥data.gns.cri.nz/af/index.jsp,2012.08.16。。這些數據庫存儲了活動斷層調查的相關數據,包括斷層的分段形態、野外測量特點、槽探信息、年代測試結果等。同時存儲斷層重復活動的平均時間間隔,斷層滑動速率和最后一次活動時間等信息,用戶可通過網站(http:∥data.gns.cri.nz/af/index.jsp,2012.08.16)對活動斷層圖形、斷層性質、地震重復間隔、最近地震事件、滑動速率、地震的位移量等信息進行查詢。日本活動斷層研究中心(AFRC)也在網站(http:∥riodb02.ibase.aist.go.jp/activefault/index_e.html,2012.08.16)上發布了包括日本活動斷層幾何學和古地震相關研究結果信息的數據庫。總之,隨著地球科學及計算機科學的不斷深入發展,國際上的發達國家均已建立起一些開放的、便于使用的活動斷層數據庫。
中國在1996年初步建成了第一個單機版的活動構造數據庫(于貴華等,1996),基于國家“十五”重點科學工程《中國數字地震觀測網絡項目》6個業務系統之一的《中國地震活動斷層探測技術系統》即“活斷層探測與地震危險性評價”分項工程等工作的開展,以福州市活斷層信息管理系統(于貴華等,2006)為首,中國相繼建起了一系列活動斷層數據庫(柔潔等,2008;劉娜等,2009;葛孚剛等,2011)。在“中國地震活動斷層探測技術系統”項目建設過程中,在基于ArcGIS的地震活動斷層多源數據組織與管理等方面進行了一系列有益的探索(葛偉鵬等,2006;李策等,2008)。然而,由于多數城市活動斷層信息系統的建設滯后于城市活動斷層探測工作,且多數數據庫系統建設人員對活動斷層探測工作體系及活動斷層數據庫模板理解不夠深入,對不同來源數據坐標系統存在差異的數據轉換工作不恰當,數據庫關聯關系復雜、不易查找使用等多種原因,造成部分城市的活動斷層數據庫與活動斷層探測研究成果不配套,從數據庫中輸出的成果圖件與實際研究成果不符等問題。針對上述一系列問題,進一步強調活動斷層數據庫建設要與活動斷層探察工作同期開展,合理優化調整數據庫模板和成果制圖模板,加強數據庫工作培訓與檢測等一系列措施,以保障活動斷層數據庫建設的及時性、準確性與可用性,為數據共享、服務社會奠定基礎。
活動斷層是晚第四紀以來有過活動、未來仍有可能活動的斷層[DB/T 15-2009]。活動斷層探察的目標是查明斷層的活動性、活動參數、空間展布及深部構造特征。活動斷層探察的工作體系可分為前期準備、野外探察、分析總結等3大階段,每一階段數據庫建設的側重點有所不同。為方便數據庫模板使用,在要素集命名時增加了2位標識其在入庫工作流程中位置的前綴,第1位字母表示入庫階段,第2位數字表示每一工作階段中的入庫順序。以A開頭的部分主要存儲項目準備階段所需填寫的主要內容和部分資料的錄入條目,包括調查區、遙感資料、地球物理資料、工作區先期資料圖、地震資料;以B開頭的部分主要存儲項目實施過程中野外獲得的各項數據和資料信息,包括地質調查圖、地貌調查、鉆孔資料、樣品資料、地球物理、地球化學;以C開頭的部分主要存儲地震危險分析資料和成果圖相關信息,包括地質平面圖、剖面圖和繪圖信息等;以其他字母開頭的部分主要存儲項目過程中各類成果資料、原始資料、文檔數據等的信息。這樣使得初接觸數據庫模板的建庫人員也可以很輕松地找到各工作階段所要使用的要素類模板(圖1)。
前期準備階段主要是各類資料的收集,包括文章、報告、地形圖、各類地質圖、高分辨遙感數據及其解譯,野外踏勘與野外工作底圖編制等工作。針對這些工作,設計了活動斷層調查地區、基礎地理、遙感、地球物理場、地震、工作底圖等要素集與調查區的面狀資料關聯表、文獻資料庫、臺站與小震波形數據關聯表、強震與地表破裂關聯表、小震波形數據記錄表等屬性表(圖2)。

圖1 活動斷層探測各階段與數據庫模板、制圖模板對應關系圖Fig.1 Diagram showing the stages of active fault detection,and the corresponding database template and mapping template.
在活動斷層調查地區要素集中,針對活動斷層探察工作的不同研究范圍設計了面狀資料圖層,用于存儲收集到的各類已有面狀資料,工作區、目標區、主要活動斷層填圖區等面狀圖層;在基礎地理要素集中,針對工作區、目標區、主要活動斷層填圖區不同的工作底圖需求設計了1/1萬、1/5萬、1/25萬3種比例尺的基礎地理要素集,其中1/5萬、1/25萬基礎地理要素集組成方法參照國家測繪地理信息局發布的國家地理信息數據庫標準設計;在遙感要素集中,針對高分辨遙感數據收集及其解譯工作的需要設計了影像索引表、航衛片解譯線、航衛片解譯面等要素圖層;在地球物理場要素集中,針對地球物理場資料的收集與分析工作內容設計了水平形變、垂直形變、地殼厚度、重力場、航磁、重磁解譯線等要素圖層;在地震要素集中,針對地震資料收集與小震重新定位分析等工作的需要設計了1970年以前強震、1970年以來地震目錄、地震臺站、震源機制解、小震重新定位目錄等要素圖層;在工作底圖要素集中設計了1/1萬、1/5萬、1/25萬3種比例尺的地層、巖體、地質調查規劃要素圖層。
在這個階段的數據庫建設中要特別注意不同來源數據的坐標系統、投影方式等信息,做好數據轉換工作以保障數據庫是在同一參考系統下建設。并完成基于已收集資料庫的野外工作底圖的編制工作。

圖2 前期準備階段數據庫模板Fig.2 The database template of the preparatory stage.
野外探察階段的主要工作包括地質地貌調查與測量、樣品采集、鉆探、槽探、地球物理探測、地球化學探測等。針對這些工作,我們設計了地質調查、地貌測量、鉆探、樣品分析、地球物理探測、地球化學探測等數據集,在地質調查數據集中設計了地質地貌調查觀測點(可細化為斷層觀測點、地層觀測點、地貌觀測點等)、探槽、活動斷層、地貌(含地震地表破裂)、地質剖面、重點地名地物等圖層要素,并設計了地質調查工程表、地貌與地質調查點關聯表、地貌與地震地表破裂帶關聯表、探槽古地震事件、斷層段古地震事件與探槽關聯表、斷層段古地震事件、探槽與采樣工程關聯表等屬性表(圖3);在地貌測量數據集中設計了地貌測量基站點、地貌測量(點、線、面)、地貌測量切線等圖層要素,及地貌測量工程屬性表;在鉆探要素集中設計了收集鉆孔點、鉆孔點、跨斷層鉆探剖面線、跨斷層鉆探斷點等圖層要素,及鉆探工程屬性表;在樣品數據集中設計了采樣點層要素,及采樣工程表、樣品數據表、樣品測試結果表等屬性表;在地球物理探測數據集中設計了地球物理測點(含起點、拐點、終點、炮點)、地球物理測線(含收集測線及探測測線)、地球物理探測斷點等圖件要素,及地球物理探測工程表、地球物理探測數據表等屬性表;在地球化學探測數據集中設計了地球化學測點、地球化學測線、地球化學探測異常點、地球化學探測異常區段等圖層要素,及地球化學工程表、地球化學探測數據表等屬性表。
此階段的數據庫建設宜在野外活動斷層探察同期開展,可以對野外工作提供及時的數據可靠性檢測,及早發現問題、解決問題,提高野外工作質量。數據庫建設中必須注意野外數據采集設備的坐標系統設置,保障數據入庫的數據參照系的一致性。并完成基于活動斷層數據庫的野外實際材料圖的編制工作。

圖3 野外探察階段的數據庫模板Fig.3 The database template of the field exploration stage.
分析總結階段主要是處理地球物理、地球化學探測數據,分析隱伏斷層的斷點位置,研究活動斷層的深部構造環境及深淺構造關系等;對野外探測時采集的樣品進行分選、測試;總結地質調查測量工作成果,繪制成果圖件;編制分析鉆孔及鉆孔聯合剖面圖,分析地層層序及沉積旋回、編制分析槽探剖面圖,分析相關古地震事件及計算獲取斷層活動運動學參數;分析活動斷層地震危險性等。針對這一階段的主要工作,設計了1/1萬、1/5萬、1/25萬3種比例尺的地質數據集、輔助制圖數據集、地震危險性分析數據集、成果圖件表、成果報告表、大數據文件表、圖像檔案表、原始檔案表、報告檔案表、內部數據表等一系列屬性表(圖4)。

圖4 分析總結階段的數據庫模板Fig.4 The database template of the summing up stage.
在地質數據集中針對活動構造分析研究及成果圖編制需求,設計了斷層、褶皺、盆地、地貌(點、線、面)、地層等厚線、地層(線、面)、巖體(線、面)、隆起等圖層要素;在輔助制圖要素集中設計了用于存儲地層剖面圖信息的地層、斷層、地層接觸關系、地層描述面等圖層要素,及制圖輔助點、線、面、注記、接圖表分幅圖框等輔助制圖要素,用于記錄野外工作底圖、實際材料圖、活動斷層填圖、活動斷層分布圖、區域地震構造圖等成果圖件成圖時的一些輔助信息。地震危險性分析數據集中主要設計了用于存儲斷層地震危險性分析結果的地震區、帶,潛在震源區分布、地表強變形帶預測、斷層避讓帶等圖層要素。
這一階段的數據庫建設過程中首先要完成野外探測階段后續的室內分析成果,包括野外觀測、測量成果圖件、說明文本、樣品測試成果、古地震分析成果等信息的入庫工作;并根據分析結果最終修訂活動斷層的幾何位置、編制斷層分布圖及區域地震構造圖,處理成果及文檔數據、最終完成相應活動斷層數據庫建設工作。
活動構造數據庫建設一直以數據量大、工作繁瑣,且由于多數活動構造數據具有空間特征,在數據庫建設中必不可少的需要使用地理信息系統軟件,這使得地球科學專業人士常感到棘手而不愿參與活動構造數據庫建設,但是若僅由非地球科學專業的計算機從業人員完成全部活動構造數據庫建設,會因其活動構造等專業知識不足,而導致出現數據質量問題。為了解決這一難題,我們將數據庫模板以ArcGIS格式(圖5)、Excel格式(圖6)、數據字典等3種方式給出,其目的在于使開展活動斷層探測的專業人員可通過數據字典了解活動斷層數據庫的相關要素集、要素類內容及含義,并輕松地在Excel格式數據庫模板中填寫活動斷層探察相關的專業信息,然后由數據庫建設人員完成關聯關系、數據組織等內容的建設,再利用數據庫批量入庫軟件(圖7)完成數據入庫工作。

圖5 以ArcGIS格式給出的活動構造數據庫模板Fig.5 The active tectonic database template in ArcGIS format.

圖6 以Excel格式給出的數據庫模板Fig.6 The database template in Excel format.
活動構造數據庫批量入庫軟件的主要功能包括:規范要素ID,導入檔案數據,檢測并處理填入Excel格式模板上的數據的格式、邏輯關系等,將填入Excel格式模板上的屬性數據信息導入ArcGIS數據庫中,給出運行日志及數據檢查報告,便于錯誤定位及進一步修改完善數據庫。該入庫軟件的使用大大降低了入庫操作的難度,數據庫入庫人員可以不再去考慮數據庫中的許多命名規則、規范標準等,直接以地學工作者熟悉的方式在Excel表中填寫各類探測工作、構造幾何學、運動學信息,命名及數據的規范化均由入庫軟件統一處理,從而顯著提高了活動構造數據的入庫效率和質量。
活動構造數據庫建設的特色是:將活動構造數據庫建設的專業知識入庫工作化簡為在Excel上填寫專業信息表格,使得具有地球科學專業知識的活動斷層探測工作者可以直接參與數據庫建設,因此可達到保障數據庫的專業數據質量的目的;同時,與活動斷層探察同期開展數據庫建設有可能及時發現問題,分析出現數據不一致性等問題的原因,確定問題是出自基礎數據資料投影,還是GPS設備系統偏差,或是野外探測操作流程、室內數據處理流程等,進而有針對性地及早解決問題,最終可達到提高項目整體工作質量的目的。
數據質量的優劣是一個相對概念,并具有一定的針對性。衡量其優劣主要有以下幾個指標:誤差、數據的準確度、精度和不確定性。數據質量是數據整體性能的綜合體現。

圖7 活動構造數據庫批量數據入庫軟件界面Fig.7 Graphic user interface(GUI)of batch data input software for active tectonic database.
數據是數據庫的“血液”,是組成數據庫的重要元素。數據質量的優劣是活動構造數據庫成功與否的關鍵,直接影響到活動構造數據庫的經濟效益和社會效益,決定了活動構造數據庫應用的價值。活動構造數據庫具有空間特性、數據多源性、科學事實性等特征,因此在活動構造數據庫中必然包括空間數據、屬性數據、空間數據之間的關系以及空間數據與屬性數據之間的關聯。如若活動構造數據庫不能提供正確、可靠的信息,該數據庫也就失去了存在的價值。
活動構造數據庫數據源多種多樣,主要包括:1)地圖,這是系統最主要的數據源,因為地圖是地理數據的傳統描述形式,是具有共同參考坐標系統的點、線、面的二維平面形式的表示,內容豐富。圖上實體間的空間關系直觀,而且實體的類別和屬性可以用各種不同的符號加以識別和表示。2)遙感影像數據,這是一個極其重要的信息源。通過遙感影像可以快速、準確地獲得大面積的、綜合的各種專題信息,航天遙感影像還可以取得周期性的資料,這些都為活動構造信息系統提供了豐富的數據。3)實測、探測數據,包括GPS點位數據、差分GPS測量數據、鉆探數據、地球物理與地球化學探測數據等。4)數字數據,包括數字圖形數據和屬性數據。5)圖像數據,包括觀測點照片、鉆孔、探槽剖面等。6)文檔數據,包括各種文字檔案、成果報告等。
數據源質量問題指數據的采集和錄入中可能產生的誤差,建庫所需各種類型數據的可靠性和精度。從活動構造數據庫建設過程看,產生數據質量問題的主要因素有地圖和遙感數據等的誤差;由于數據庫建設人員對數據及數據間關系的理解、對數據庫模板的理解、數據入庫操作不慎等問題均會引起屬性數據誤差,以及文檔數據的錯誤等,圖形數字化前的預處理(張蘭鳳等,2007)、手扶跟蹤自動化的分辨率和矢量化精度。
為保障數據庫的數據質量,研發了與數據庫模板相應的活動構造數據庫質量檢測軟件(圖8)。

圖8 活動構造數據庫質量檢測軟件界面Fig.8 Graphic user interface(GUI)of data quality checking software for active tectonic database.
數據庫質量檢測軟件集成了對數據庫模板符合性,數據格式、ID規范性、域值范圍、關聯關系、必填字段、數據邏輯一致性,空間拓撲關系、斷層及產狀傾向檢查、文檔類數據處理、工作量統計等一系列數據檢測及統計功能。
為滿足城市活動斷層探測與活動斷層條帶狀填圖等工作的不同需求,軟件設置了通過用戶界面輸入6位城市代碼和3位項目編碼功能;針對斷層、地震地表破裂、空間關系、空間距離等具有相關關系的信息設置了主外鍵關聯關系檢測;針對斷層繪制過程中,經常會造成圖形中由起始和終點決定的斷層傾向和屬性中描述的斷層傾向不一致情況,考慮到傾向在制圖過程中和后續研究中起著非常重要的作用,專門設計了對傾向進行計算值與屬性值的對比檢測;針對數據庫、多表、多字段、空間關系等的計數與求和,設計了計算值與屬性值的對比檢測;針對具有實體含義的點與點、點與線、點與面、線與線、線與面、面與面之間的空間關系,如地質調查點與斷層觀測點、斷層觀測點與斷層線、地層觀測點與地層面等,設計了實體要素類之拓撲關系檢查;針對可定量計算距離的空間實體關系,如斷層觀測點與斷層,探槽采樣點與探槽點等,計算并給出了最近距離數值。針對一些關鍵性字段不可為空,或一組關鍵性字段不可同時為空等檢測;針對文檔類數據設計了對于大文件分塊入庫,從數據庫中批量導出時自動合并為入庫前大文件的功能,可以對比、統計文件是否相同并處理分塊文件等。
檢測結果依據問題嚴重程度劃分為錯誤級、警告級和信息級3個級別,并給出錯誤出現的位置在哪個要素集、要素類或屬性表中,錯誤的類型簡述等信息;錯誤級的問題一般是必須要進行數據庫相關要素核實修改的;警告級與信息級錯誤提示一般要核查、分析問題出現的原因,確定是否要對相關數據庫要素進行修改。
數據庫質量檢測軟件還具有對要素集個數、要素類個數、屬性表個數,內部數據量、要素個數等進行統計,并統計出入庫工作量情況,包括資料收集、野外工作點、探槽、鉆孔、各類測線、成果圖等。
通過軟件檢測可以快速了解數據庫建設的整體概貌及活動斷層探察的工作量等情況。
在軟件檢測的基礎上還要對從數據庫中依據系統制圖模板繪制出的野外工作底圖、實際材料圖、活動斷層研究成果圖進行專家檢測,確認其地學信息表達是否完整、準確。
此外,還要對照工作量表檢測數據入庫量是否與實際工作量匹配對應,抽檢數據庫屬性信息項填寫是否完整、可靠。
活動構造數據庫的數據量大,數據來源廣,數據采集的任務重,在數據庫建立過程中會出現許多人為和系統的誤差,甚至還有可能產生數據錯誤,最后采集入庫的數據如不能真實反映自然界中的活動構造事實,或數據不能保持一致性和完整性,那么所建立的數據庫則達不到建設的初衷。
數據庫模板是為了讓活動斷層建設者擁有一個統一的數據存儲規范,從而便于最終研究成果的統一分析、交流與共享,數據批量入庫軟件是為了提高數據入庫效率,數據質量檢測軟件是為了高效分析數據庫中數據格式、ID規范性、域值范圍、關聯關系、必填字段、數據邏輯一致性,空間拓撲關系、斷層及產狀傾向等方面的錯誤,并統計數據庫建設工作量。
通過活動構造數據庫的建設及數據庫質量的檢測可以發現問題,并分析產生數據問題的根源,進而可以從根本上解決數據錯誤問題。與活動斷層探察同期開展數據庫建設并及時進行數據庫檢測,可以及時發現問題,及時糾正不恰當的數據采集操作流程,校準提高野外測量儀器,提高測量數據精度;明確收集圖形的坐標系統、投影方式,正確設置數據化相關參數,提高數據采集精度;數據庫建設過程中自檢、他查、軟件檢測、與專家抽查相結合,做到數據質量問題早發現、精心分析、合理解決,從整體上提高活動斷層探察的工作質量。
葛孚剛,王冬雷,王志才,等.2011.山東省1︰20萬活斷層數據庫建設[J].土工基礎,25(3):64—67.
GE Fu-gang,WANG Dong-lei,WANG Zhi-cai,et al.2011.1︰200000-scale active fault database in Shandong Province[J].Soil Engineering and Foundation,25(3):64—67(in Chinese).
葛偉鵬,袁道陽,郭華.2006.對城市活斷層探測項目中地震地質數據建模的探討[J].西北地震學報,28(2):134—139.
GE Wei-peng,YUAN Dao-yang,GUO Hua.2006.Discussion on seismogeologic data modeling for urban active fault surveying project[J].Northwestern Seismological Journal,28(2):134—139(in Chinese).
李策,杜云艷,于貴華,等.2008.基于ArcGIS的地震活斷層多源數據組織與管理研究[J].地球信息科學,10(6):716—723.
LI Ce,DU Yun-yan,YU Gui-hua,et al.2008.A study on organizing and managing multi-source seismic active fault data based on ArcGIS [J].Ceo-information Science,10(6):716—723(in Chinese).
劉娜,張建國,毛燕,等.2009.活斷層數據庫在昆明市防震減災工作中的應用研究[J].地震研究,32(B12):503—506.
LIU Na,ZHANG Jian-guo,MAO Yan,et al.2009.Application of information database of active faults in Kunming′s earthquake preparedness and disaster reduction work[J].Journal of Seismological Research,32(B12):503—506(in Chinese).
柔潔,劉云華,傅長海.2008.烏魯木齊市活斷層數據庫在城市建設中的作用[J].內陸地震,22(3):193—202.
ROU Jie,LIU Yun-hua,FU Chang-hai.2008.The function of Urumqi City active fault database in urban construction[J].Inland Earthquake,22(3):193—202(in Chinese).
于貴華,鄧起東,鄔倫,等.1996.利用GIS系統建立中國活動斷裂信息咨詢分析系統[J].地震地質,18(2):156—160.
YU Gui-hua,DENG Qi-dong,WU Lun,et al.1996.Building Chinese active fault information system using GIS system[J].Seismology and Geology,18(2):156—160(in Chinese).
于貴華,徐錫偉,孫怡,等.2006,城市活斷層探測信息系統的設計與實現:以福州市活斷層信息管理系統為例[J].地震地質,28(4):656—662.
YU Gui-hua,XU Xi-wei,SUN Yi,et al.2006.Design and implement an urban active fault information management system[J].Seismology and Geology,28(4):656—662(in Chinese).
張蘭鳳,于貴華,李陳俠,等.2007.用ArcGIS實現利用1/20萬地質圖編繪1/25萬區域地震構造圖的方法[J].地震地質,29(2):412—417.
ZHANG Lan-feng,YU Gui-hua,LI Chen-xia,et al.2007.Compiling the 1︰250000 regional seismotectonic map using the 1︰200000 geologic maps with ArcGIS method[J].Seismology and Geology,29(2):412—417(in Chinese).
Haller K M.2003.Quaternary fault and fold database of the United States[A].In:CR USGS GOV,2003 Seattle Annual Meeting(November 2-5,2003),Paper No.175—6.
Kathleen M H,Michael N M,Richard L D,et al.2004.U S Quaternary fault and fold database released[J].EOS,Transactions,American Geophysical Union,85(22):218.doi:10.1029/2004EO220004.