黃靜莉
長春工程學院,吉林 長春 130021
基于Power Designer的三維工程地質數據倉庫模型構建
——以長春市中心區為例
黃靜莉
長春工程學院,吉林 長春 130021
論文以長春市地下空間的巖土體可利用性為研究主題,以勘察工程中提供的鉆孔數據及其相關信息為源數據,采用Power Designer16.1設計并實現了長春市中心區的三維工程地質數據倉庫的邏輯數據模型和物理數據模型。采用模型驅動架構的方式,利用反向工程技術從Access數據庫系統中將現存的數據結構抽取出來形成數據模型,結合研究主題建立了星型數據結構模型,并將生成的SQL腳本文件導入SQL Server2005中進行檢查修正后運行正常。
城市地下空間;工程地質鉆孔數據;三維工程地質數據倉庫;Power Designer
地理空間信息的數字化及其應用重點體現在兩個方面,一方面是大規模地存儲和快速調用海量的地理空間信息數據,一方面是地理空間數據的三維可視化及數據挖掘。因此,國外許多城市諸如紐約、倫敦、大阪等以及國內城市如上海、北京、廣州都進行過基于城市地質信息管理和三維可視化的城市三維地質信息系統的研究。
目前現有的工程地質數據主要存儲在理正工程地質勘察數據的Access工程備份數據庫中,這種傳統的工程地質數據庫是面向事務設計的,其主要作用是存儲工作期間產生的原始數據,繪制地質剖面,并提供簡單的查詢和分析。但是其數據存儲量非常小,且每個工程備份中只能存儲一個單一工程的勘察數據,因而不具有對某一宏觀主題的決策支持作用。除此之外,不同歷史時期、不同行業部門的勘察資料還具有勘察深度不同、試驗測試手段不同、土的定名不同、勘察標準不同、坐標系統不同、地層劃分不統一等特點。因此,區別于傳統的工程地質數據庫,三維工程地質數據倉庫的構建并不是簡單的數據匯總,而是通過對數據源的數據提取、數據集成、數據清洗和數據轉換實現對海量工程地質數據的集成管理,其目的是建立面向宏觀的城市地質信息管理的決策支持系統。
長春市中心區工程地質數據倉庫采用混合架構的方法,在概念模型、邏輯模型和物理模型的架構過程中存在由于用戶需要的反復迭代。其特點體現在以下幾個方面:①面向長春市中心區地下空間巖土體可利用性的研究主題;②由巖土工程勘察業務驅動;③松耦合、層次化;④采用維度模型的建模工具;⑤具有空間維。
論文的研究范圍為長春市中心區,其范圍為東經125°07′~125°30′;北緯43°44′~44°03′,總面積為380 km2。論文搜集了2006年至今的1 000多個有效的鉆孔數據,包含市政工程、道路工程、地鐵工程、及工民建工程方面的數據資料。
構建三維工程地質數據倉庫的應用需求模式包括[1-4]:淺層地下空間巖土體可利用性評價、中層地下空間巖土體可利用性評價、深層地下空間巖土體可利用性評價、行政區劃范圍內的地下空間可利用性評價、單項工程實際應用。
構建三維工程地質數據倉庫的源數據以表格的方式存儲在Access數據庫中,包括工程勘察數據、原位測試及土工試驗數據,表中的數據由沒有實體空間矢量信息的屬性數據組成。
源數據經過整理后裝載入三維工程地質數據倉庫中,被分離成兩種數據結構形式,即描述地層空間分布的空間數據和描述巖土體性狀的屬性數據兩大方面。其中,空間數據由工程地質勘察報告中的鉆孔數據和長春市地形圖數據提供,主要用于反映地形、地層及地下水分布狀況;屬性數據由工程地質勘察報告中的原位測試機土工實驗數據提供,主要用于反映地層巖性、巖土體的物理力學參數。
源數據的清理調整工作包括以下幾個方面:
(1)空間數據轉換:將描述鉆孔點位信息和鉆孔工程信息的表格、描述鉆孔中地層屬性信息和地層層面信息的表格轉換為描述地層信息的點實體,構成實體要素表。即將鉆孔信息與地層信息聯接起來,給每個地層層面高程附上空間坐標信息(X,Y),形成點(X,Y,Z)。
(2)屬性數據轉換:土工試驗數據和原位測試數據都屬于屬性數據,其中并不包含空間信息。將其讀取到屬性數據庫后,在其中加上地層編號,使之與相應的地層空間數據聯接。由于屬性數據規格不甚統一,因此在轉換過程中應該盡量保持源數據的格式。
(3)地層層面數據調整:按照長春市宏觀工程地質分布規律對地層劃分情況進行調整。其中,缺失地層按零厚度處理。對于劃分較細致的地層或微地貌地層,在不影響宏觀分析研究的前提下,應該進行地層合并調整。
(4)地層屬性數據調整:對于合并地層,其土工試驗、原位測試等試驗數據也應調整為經過加權平均后的統計參數,為后期評價計算提供合理可靠的統計數值。
(5)空間插值補齊鉆孔數據:對部分缺失鉆孔數據的區域,可通過鄰近區域的鉆孔數據插值,補齊空白區域的地層數據。
(6)對空間數據的粒度粗化處理:在宏觀分析背景下,同組工程數據的空間距離較近,造成了數據冗余,會影響數據挖掘分析的速度。因此,有必要對詳細數據進行粒度粗化處理,挑選具有空間代表性的數據即可。
為了體現數據的空間性,且減少數據冗余現象,三維工程地質數據倉庫以地層空間事實來描述地層的空間和屬性分布狀態。其度量即為描述地層分布的空間數據,包括空間數據坐標X、Y、Z三個數值,以及描屬于哪個地層層面的標識。
在三維工程地質數據倉庫中,把數據分為空間數據和屬性數據兩個部分,其中空間數據存放在事實表中,屬性數據分別存放在地層維表、勘探點信息維表、土工試驗維表和原位測試維表中。
(1)地層維:主要用于描述地層的屬性,包含兩個基本層次,分別是勘察野外記錄中對地層性質的基本描述以及勘察報告中對地層的特殊屬性給出的評價。其中勘察野外記錄層次的級別包括地層層號、成因年代、地層巖性、顏色、密實度、濕度、稠度、斷面狀態及含有物,勘察報告評價的級別包括包括地基承載力特征值、砂土液化、凍脹性、建筑場地類別。
(2)勘探點信息維:主要用于描述勘探工作的基本信息,包含三個基本層次,分別是工程所屬的行政區劃、工程信息以及工程中的鉆孔信息。其中行政區劃的級別為工程所屬行政區,工程信息的級別包括勘察單位、勘察編號、工程名稱、工程日期,鉆孔信息的級別勘探點類型、勘探點編號、鉆孔深度、地面高程、地下水類型、地下水埋深、地下水標高。
(3)土工試驗維:主要用于描述土工試驗數據,該維只包含一個層次,其級別分別包括含水率、濕重度、比重、孔隙比、塑限、液限、塑性指數、液性指數、飽和度、壓縮系數、壓縮模量、天然單軸抗壓強度、干燥單軸抗壓強度、飽和單軸抗壓強度、前期固結壓力、壓縮指數、回彈指數、有機質含量、粘聚力、內摩擦角。
(4))原位測試維:若按照雪花分層結構設計,原位測試維可以分為7個層次,即十字板、波速、標貫、旁壓、靜探、動探、載荷。然而為了查詢便利,可以按照星型結構直接將十字板表、波速表等原位測試表與事實表相連,成為各自獨立的維表。
采 用 模 型 驅 動 架 構(Model-driven Architecture,MDA)的方式來開發數據倉庫。根據Power designer16.1的反向工程功能,從運行系統中將現存的數據結構抽取出來形成數據模型,這樣可以加速數據倉庫的開發速度,減少數據倉庫設計和實現過程中的錯誤。
首先,安裝 ODBC(Open Database Connectivity)中的A ccess驅動,選擇系統DSN (Data Source Name),建立ODBC數據源。注意Access2007版本以前的數據庫文件為.mdb文件,Access2007為.accdb文件。然后,在Power Designer中通過正向工程生成一個新的物理數據模型,選擇數據庫(Database)并連接到ODBC數據源。最后在File中選取Reverse Engineer下的Database,將構建三維工程地質數據倉庫需要的表(主要包括與原位測試和土工試驗相關的表格)選中然后生成PDM,這樣就順利完成了對于理正工程地質數據庫的反向工程。該方法的優點是可以保證生成數據的邏輯數據模型與現有的關系數據庫一致。然而,其缺點是,中文注釋和表外鍵對應關系在某些情況不能夠還原(即只還原了字段,而索引關系沒有了)。
使用PowerDesigner建立多維模型可以采用三種方式:第一種是先建立概念模型CDM,然后由CDM生成PDM,其優點是便于檢查和調整設計中的錯誤;第二種是直接建立PDM多維模型,這使得模型在比較簡單時其建模速度相對快捷;第三種是由現有數據庫的PDM圖生成多維模型。論文采用第一種和第三種綜合設計的方法,即先設計LDM模型(在Power designer16.1中,沒有CDM的設計選擇,而是直接選擇LDM,然后再生成PDM,其步驟和原理跟第一種方法是一樣的)。然后將從Access反向工程導出的表格復制添加到新建的LDM中,這樣既保證了在數據抽取和加載時其數據的結構形式與原有數據的一致性,又能夠有針對性地建立符合主題需求的數據倉庫模型(圖1)。
將 Power designer中 的PDM打 開, 在Database中 的Generate Database中 選 擇Script Generate,導出生成SQL腳本。將該腳本在SQL Server2005中運行,檢查相關錯誤并修正后,運行正常。
對工程地質數據倉庫的查詢調用,主要分為以下兩種應用模式:
(1)關鍵詞查詢:關鍵詞查詢是工程地質數據倉庫中的基本查詢。比如查詢屬于某項工程的所有鉆孔數據,可以使用查詢語句select * from bore_ table where engineering=工程名稱。或者從相關的表格中查詢屬于某項工程的地層屬性數據,包括強度參數、水理參數、物理參數、變形參數等。比如查詢某項工程中包含的孔隙比參數, 可以使用查詢語句select zuobiao_ID, e from soiltest_table where zuobiao_ID in (select zuobiao_ID from bore_ table where engineering=工程名稱)。又比如查詢屬于第三層地層的具有統計意義的孔隙比參數,可以使用查詢語句select zuobiao_ID, e from soiltest_ table where zuobiao_ID in (select zuobiao_ID from zuobiao_table where H=3),將該查詢結果存儲為table1。在對地層屬性數據進行空間分析、統計和評價時,需要將屬性數據與空間坐標聯系起來,可以使用查詢語句select zuobiao_table.X, zuobiao_ table.Y, zuobiao_table.Z,table1.zuobiao_ID, table1.e from zuobiao_table inner join table1on zuobiao_table.zuobiao_ID= table1.zuobiao _ID,從而給屬性數據附加上空間坐標值(圖2)。

圖1 工程地質數據倉庫星型結構圖(PDM)Fig.1 The star chart of engineering geology data warehouse (PDM)

圖2 孔隙比與空間坐標的聯合查詢Fig.2 Conjunctive query of void ratio and space coordinates

圖3 地層層面坐標查詢Fig.3 Coordinate query of stratum
(2)內部數據調用:內部數據調用是基于繪圖需要而調用的某類特指數據。如在三維可視化工程地質建模時,需要調用研究區范圍內鉆孔深度大于30 m或鉆至基巖深度的鉆孔數據。可以從勘探點信息表中select bore_ID from bore_table where bore_ depth >= 30 或者從地層空間事實表中select bore_ ID from zuobiao_table where H_ID= 8。將符合這兩個查詢條件的鉆孔ID抽取出來并合并到table2中,并應用select distinct bore_IDfrom table2來去除重復項目,即為可用數據(圖3)。
由于鉆孔的地層分層情況不同,在繪制地層層面模型時,還需要按照其地理位置劃分成為伊通河以西及以東的數據集。由于伊通河以東的體育館附近為長春城市坐標原點,因此可以通過selec distinct bore_ID, X, Y, Z fromtable2whereX〉=0來選取東部數據。考慮到在伊通河附近存在有小范圍的地層波動,因此在該區域附近的地層是屬于哪種地貌單元的需要手動進行分析歸類。可以將手動分析調整后的東部數據集存儲為table3(圖4)。
調取的空間數據需要分別形成地層層面的點文件和井文件。對于點文件來說,每個地層層面的空間坐標信息都應該構成一個單獨的點文件,其中包含鉆孔_ID和坐標XYZ。比如從表table3和地層空間事實表中繼續聯合查詢屬于第一層地層的空間信息數據,可以采用查詢語句select bore_ID, X,Y, Z fromzuobiao_tablewhere H_ID=1and bore_ID in (select bore_ID from talbe3)。

圖4 東部區域坐標查詢Fig.4 Coordinate query of east area
對于井文件來說,其中分別包含鉆孔位置信息和鉆孔分層信息。如分別從地層空間事實表和勘探點信息表中查詢屬于某項工程的鉆孔_ID,鉆孔坐標、孔口高程、鉆孔深度等信息,并計算出地層分層厚度,匯總到table4中。然后從table4中查詢鉆孔位置信息,可以采用查詢語句select bore_ID, X,Y, altitude, bore_depth from table4。按照鉆孔_ID和地層_ID來排序的鉆孔分層信息的查詢可以采用語句 select bore_ID, H_ID, thickness from table4 order by bore_ID, H_ID(圖5)。
上述空間數據的查詢結果可以導出后存儲為txt文本,再導入GOCAD中生成三維可視化地質模型。
構建三維工程地質數據倉庫的目的是為了快速調用存儲于不同數據庫中、數據格式不統一的海量的城市地質空間數據。在現有工程地質勘察資料的基礎上,以城市地下空間巖土體可利用性為研究主題,對源數據進行清洗調整,獲得用于構建三維地質地層模型和決策分析的空間數據和屬性數據。該模型即能保證數據格式的統一性,又能快速建庫,清洗冗余數據,使得數據倉庫的數據抽取和存儲更為簡單。構建的三維工程地質數據倉庫模型在SQL Server2005中運行正常。其數據查詢和調用結果能夠為后期三維地質地層建模和城市地下空間巖土體可利用性評價體系提供有效數據。
[1] 童林旭.地下空間概論(一)[J].地下空間, 2004, 24(1):133
[2] Huang JL.Analysis and Evaluation of the available rock and soil mass in underground space in ChangChun,China.[J].GEOCHIMICA ET COSMOCHIMICA ACTA.2009, 73(13):A558-A558.
[3] Huang JL.Contemporary geo-space use and environment improvement.GEOCHIMICA ET COSMOCHIMICA ACTA.[J].2010, 74(12): A429-A429
[4] 黃靜莉,王清.城市地下空間巖土體的可利用性研究[J].煤炭技術.2011,30(10):110-112.
[5] 劉如九,張振山,柴天佑.一種通用的多數據庫間數據抽取方法及應用[J].北京交通大學學報,2008,32(4):14-18.
[6] 楊莉國,歐付娜,劉慶海等.數據倉庫相關技術研究綜述[J].電腦知識與技術.2011,7(10): 2234-2236.
[7] 郭 峰.數據倉庫技術在GIS決策支持中的應用[J].華中農業大學學報.2003,22(1):60-64.
[8] 葛 凡,祝玉華.空間數據倉庫綜述[J].許昌學院學報.2010,29(2): 81-83.
[9] 沙宗堯,空間數據倉庫體系結構框架的概念模型[J].地理空間信息.2008,6(1):18-21.
[10] 于煥菊,謝傳節,李云嶺等.中國華北地區地震空間數據倉庫的構建與分析[J].地球信息 科學.2006,8(3):88-93.
Three-dimensional engineering geology data warehouse constructed by Power Designer:In the case of the centre area in Changchun City
HUANG Jing-li
Changchun Institute of Technology, Changchun 130021, China
The Three-dimensional engineering geology data warehouse is constructed by Power Desinger16.1, with the rock and mass availability in urban underground space as the theme, and the borehole data of engineering investigation as the source data.Use the model-driven architecture method, reverse engineer the access data base, extract existed data model, combine research theme to construct the star data structure model.And check the SQL script in SQL Server2005,to ensure normal operation.
urban underground space; engineering geology borehole data; three-dimensional engineering geology data warehouse; Power Designer
P642.4;TP317.4
A
1001—2427(2015)04 - 132 -5
2015-08-05;
2015-12-17
黃靜莉(1982—),女,山西運城人,長春工程學院講師.