曹巧云,何望君,張福浩,劉 濤,劉紀平,4
(1. 蘭州交通大學測繪與地理信息學院,甘肅 蘭州 730070; 2. 中國測繪科學研究院,北京 100830; 3. 地理國情監測技術應用國家地方聯合工程研究中心,甘肅 蘭州 730070; 4. 武漢大學資源與環境科學學院,湖北 武漢 430079; 5. 甘肅省地理國情監測工程實驗室,甘肅 蘭州 730070)
隨著關系數據庫的發展迅速,全球數據量增長快,數據被不斷地生產出來,與此同時,人們對信息的要求越來越高[1];從海量數據中獲取隱藏的、有用的信息,導致數據管理人員對數據的查詢要求日趨繁瑣。數據立方體(DataCube)又稱多維數據集,是OLAP(on line transaction processing)系統的核心,為用戶數據構建了多維視圖,針對數據的查看和分析,用戶可以利用數據立方體技術從多個視角出發[2]。眾多的OLAP產品具有基于多維數組構建立方體模型的優勢,易于管理和查詢海量數據。
文獻[3]總結了每一維度就是數據觀測的每一個視角,政府部門從不同行政級別查看隨時間推移的GDP的變化,這是從政區角度來查看GDP,因此政區是一個維;許多領域中提出了包含諸如數據倉庫、數據挖掘、數據集成、OLAP等許多技術的商業智能(BI)的體系結構,它用于建立決策支持,優先考慮有效查詢大量歷史,清潔和整合數據[4];文獻[5—7]將文本概念加入立方體;文獻[7]針對數據和文本分別建立維度,利用倒排方法檢索對應的數據;文獻[8]提出基于流數據的概要立方體,實現任意組合的維度映射成唯一的數值,此方法提高索引的效率,但都對政務地圖數據的OLAP研究較少。目前許多統計數據是圍繞國家或政區開展,戰略分析需要空間視角,針對以上問題,結合數據立方體聯機可視化方法,從空間維探索政務統計與政務電子地圖的可視化方法。本方法推進政務電子地圖的管理和查詢的效率,同時在更多的角度上實現了對信息的理解和把握,提高了工作效率。
自20世紀60年代末關系型數據庫之父E.F.Codd提出關系型數據模型以來,關系型數據庫與OLAP得到了快速的發展[9]。加拿大拉瓦爾大學地理信息中心提供Spatial OLAP(SOLAP)作為支持快速簡便的時空分析,探索多維數據的工具,并提供一套可視化技術,如地圖、表格和圖表[10]。巴西聯邦伯南布哥大學信息中心提出了GOLAPA(地理在線分析處理架構),為用戶提供了查詢分析和地理數據以供決策支持所涉及的復雜性的抽象[11-12]。在將BI與GIS相結合的其他工具中,筆者引用Voss[13]提出的Cube View和Polaris,以便于觀察大量數據中的空間模式和時間趨勢。此外,文獻[14]開發了一個強大、易于訪問及用戶友好的Geo-BI地方治理基礎設施服務的解決方案。此外,有學者提出了一個可擴展的GISOLAP集成解決方案,它基于一個名為GeoCube的正式多維模型,支持地理維度和度量[15]。更重要的是,Pitts大學提出了OLAP-GIS工具[16]的開發,用于社區健康評估分析中的數值空間問題解決。文獻[17]提出支持地理維度和度量的GIS-OLAP集成解決方案,并提供交互式數據透視表和圖表顯示,有效地支持決策服務,GIS-OLAP技術核心是“維”這個概念[18],建立多維數據模型是進行GIS-OLAP分析的重要基礎。數據立方體作為GIS-OLAP系統的核心技術,用于數據分析和索引的技術架構,能夠對元數據進行任意多關鍵字實時索引,并且加快了數據的查詢和檢索。如何將OLAP技術應用到電子政務地圖,構建政務決策支持系統,利用電子政務綜合數據庫中存儲的大量數據建立正確的決策體系和決策支持模型,為各級政府的決策提供科學的依據,從而提高政府辦公效率、促進經濟發展,目前已成為我國政府越來越緊迫的一項工作。
政務地圖和數據立方體融合技術包括維度規范化表達、數據立方體構建和多維查詢3大技術,如圖1所示。首先,對空間(政區)進行規范化表達,實現空間(政區)維度的規范化;然后,對政區統計的指標數據進行數據立方體的構建,并對指標數據進行規范化管理;最后,結合OLAP技術,對多維政區和政區統計數據立方體進行聯機處理,實現政區地圖交互下的多維查詢可視化。
政區包括省、市、縣(區)、鄉鎮(街道)4個維度,利用屬性編輯技術對對省、市、縣(區)、鄉鎮(街道)地圖進行統一編碼,實現政區地圖的規范化維度表達。第一,利用地圖數據處理軟件,統一省、市、縣(區)、鄉鎮(街道)地圖數據的投影坐標,使地圖數據都在同一空間坐標下顯示;第二,利用數據編輯工具實現省、市、縣(區)、鄉鎮(街道)的統一編碼,如湖南省為43,實現對政區地圖的編碼管理;第三,利用數據立方體維度表達技術,對省、市、縣(區)、鄉鎮(街道)進行統一編碼管理,建立統一的時間、多級政區維度,形成省、市、縣(區)、鄉鎮(街道)4個維度,從而建立政區維度表。統一編碼的目的是實現政區的統一化管理,從地圖數據源中盡可能高效地管理所需要的地圖數據。
運用數據立方體技術,對政區和指標數據進行數據立方體的構建,形成政區統計數據立方體。①描述維度表,針對4個維度的政區數據,利用數據立方體維度構建方法,增加省、市、縣(區)、鄉鎮(街道)的編碼、名稱、描述等相關屬性,統一標準管理。②指標表的構建,根據現有省、市、縣(區)、鄉鎮(街道)的指標數據,構建人口表、GDP表、企業表等,通過統一的編碼實現與政區維度表的關聯。③數據轉換,將標準化處理后的政務維度數據和指標數據添加到數據倉庫之前,需對這些數據進行必要的轉換,轉換完畢的數據方可存放到相應的數據倉庫中。數據轉換方法有簡單變換(包括編碼字段的解碼、日期/時間格式轉換、數據類型的轉換)、集成(就是把來自于不用數據中得到的業務數據結合在一起,并將它們集成為一個緊密結合的數據模型)、聚集和概括(就是按照某些屬性匯總這些數據)。④添加到數據倉庫,數據轉換完成之后,將這些規范的數據添加到數據倉庫中。數據倉庫所需要加載的數據量很大,需采用標準的加載工具和共同的方法對加載的數據進行處理。提高數據加載的效率,從而也能夠將加載工具的定制最小化。
為了實現政區地圖的聯動查詢,采用數據立方體的多維分析技術,操作步驟包括鉆取、上卷、切片、切塊和旋轉。①鉆取:在空間(政區)維的不同層次間的變化,從頂層降到底層,拆分總數據到元數據。本文時間維上鉆查詢操作的結果就是日、周、月、季度、年,地區維上鉆查詢操作的結果就是鄉、縣、省、國。②上卷:從鄉鎮(街道)數據向省數據的聚合。③切片:選擇政區維中特定的指標值進行查詢或分析。④切塊:選擇空間(政區)維中特定區間的指標表數據進行查詢分析。⑤旋轉:政區維位置的互換,是行列的轉換。變換政區數據立方體維的角度,從不同的方向研究指標數據在維上的分布。
點擊政區實現地圖下鉆,并且通過多維查詢語言,獲取當前點擊政區數據集,實現數據立方體的自動下鉆。通過鉆取、上卷、切片、切塊及旋轉查詢操作,實現統計地圖和數據立方體雙向聯動,快速獲取數據并展示數據。
本次試驗選用全國作為研究區。試驗數據包括國家統計局統計年鑒獲取的2018年全國各省、市、縣的GDP數據,國家統計官方網站獲取的省、市、縣、鄉鎮2010年全國第六次人口普查數據,以及國家公共基礎地理信息平臺“天地圖”地圖數據和行政區劃數據。
實現全國、省級、市級、鄉鎮級的信息的可視化,利用網絡瀏覽器對地圖上的每個區域進行不同的顏色顯示,可以方便直觀地查看出相應的數據構成,并將相應地區的信息實時地顯示在右側的數據表中,方便具體地分析和處理,如圖2—圖3所示。
試驗結果分析發現:在地理信息應用政務電子地圖的平臺中,通過客戶端統計地圖的四色圖將不同區域的數據進行了統一表格化表達,實現了精細化、可配置的地理統計表達。方便使用者快速直觀地找到所需要的必要的數據信息。方便快捷地將政務地圖與數據立方體進行集成整合,滿足平臺查詢與分析的功能,提供靈活豐富的功能接口和智能化的界面操作,賦予了專題圖更加便捷的管理分析功能,通過少量開發工作即可實現電子政務地圖統計與數據立方體的集成和使用。
在眾多政務服務過程中,存在大量的政區統計信息,存在如空間、時間、行業、主題等多類型、多層次的維度統計方式,筆者建議在信息資源整合時建立統一的空間維度和時間維度,不僅強化維度描述的一致性,而且支持不同維度不同層面的靈活細分和匯總分析,滿足不同分析的需求。將傳統的政區地圖與空間數據立方體進行融合,在線統計并聯動顯示各級政區不同指標數量和分布,實現國家、省、市、縣、鄉鎮多級數據立方體下鉆和上卷操作,便于決策者快速瀏覽和分析區域發展現狀和分布格局,有利于開展綜合性政務數據空間對比和關聯分析。