張昕
(廣西交通設計集團有限公司 廣西南寧 530029)
測繪地理信息數(shù)據(jù)在國民經(jīng)濟建設發(fā)展中發(fā)揮著重要的作用,是地方資源調查、宏觀規(guī)劃、工程建設以及構建數(shù)字城市等工作的基礎。測繪地理信息數(shù)據(jù)的采集是以測繪學為基礎,通過對自然地理要素或者地表人工設施的形狀、大小、空間位置及其屬性等進行定量測定后,將形成的數(shù)據(jù)資源存入到測繪地理信息系統(tǒng)之中的過程。從過去的紙質地圖,到現(xiàn)如今的網(wǎng)絡地圖、手機導航以及未來的自動駕駛技術,都離不開測繪地理信息數(shù)據(jù)成果的技術支撐。因此,測繪數(shù)據(jù)資源已成為國民經(jīng)濟數(shù)據(jù)中極為重要的基礎性和戰(zhàn)略性資源,能夠為各級政府部門、各行業(yè)以及社會公眾等提供重要的數(shù)據(jù)支撐和服務[1]。
隨著計算機技術在各行各業(yè)不斷的深入運用,大數(shù)據(jù)已給我們的生活帶來了越來越多的福利,幫助各行各業(yè)向著自動化、智能化的方向發(fā)展。但目前測繪成果的開放利用程度與國民經(jīng)濟發(fā)展的信息化需求相比,仍然存在一定的差距。因此,將海量的測繪地理信息數(shù)據(jù)轉變?yōu)榭晒┤藗兪褂玫臏y繪地理信息服務,是測繪地理信息發(fā)展的趨勢,也對大數(shù)據(jù)技術在測繪地理信息專業(yè)中的運用提出了更高的要求[2]。
(1)數(shù)據(jù)量龐大、難以存儲
地理信息要素的數(shù)據(jù)采集,從最早期點、線、面的簡單三維,到現(xiàn)在一比一仿真的三維彩色點云,模型內容越來越豐富,數(shù)據(jù)大小的量級也發(fā)生了從KB到PB的變化。傳統(tǒng)的關系型數(shù)據(jù)庫由于在非結構化數(shù)據(jù)存儲方面存在先天不足,難以存儲和處理海量的測繪數(shù)據(jù),導致測繪成果長期保管和利用的需求無法滿足。
(2)測繪數(shù)據(jù)更新速度慢
由于測繪地理信息數(shù)據(jù)的采集,往往需要技術人員到野外進行實地勘測,原始測繪數(shù)據(jù)需要人工管理、保存,容易在野外發(fā)生丟失、損壞。另一方面,由于信息傳遞效率低,原始測繪數(shù)據(jù)無法及時移交內業(yè)處理,導致測繪數(shù)據(jù)更新周期長,開放給社會公眾利用的測繪成果往往現(xiàn)勢性較差,已不能滿足社會高速發(fā)展的需要。
(3)缺乏共建共享機制
由于測繪地理信息數(shù)據(jù)通常具有涉密的特性,導致大量的測繪成果往往局限于個別政府職能部門內部使用,難以實現(xiàn)數(shù)據(jù)的融合與共享。數(shù)據(jù)共享機制的缺乏,使得重復測繪和信息孤島的現(xiàn)象仍大量發(fā)生,不僅浪費了財政資金,同時也極大的限制了測繪成果服務社會化公共事業(yè)的能力。
(4)測繪資源分散,成果利用效率低
由于測繪地理信息資源過于分散,缺乏統(tǒng)一管理,導致測繪成果匯交制度難以執(zhí)行到位。加之缺少測繪地理信息數(shù)據(jù)存儲標準,不同測繪單位的成果數(shù)據(jù)不兼容、格式不統(tǒng)一、坐標系不一致、編碼不規(guī)范等問題仍普遍存在,測繪成果之間數(shù)據(jù)交換、協(xié)同開發(fā)利用的效率仍然較低。
測繪地理信息數(shù)據(jù)管理中存在的問題,歸根到底是因為傳統(tǒng)的數(shù)據(jù)管理和應用手段無法滿足當下人們對測繪地理信息數(shù)據(jù)深入利用的需求。因此需要運用現(xiàn)代數(shù)據(jù)管理技術,從基礎設施層、數(shù)據(jù)層、應用層三個層次,以及標準規(guī)范體系建設等方面著手建立測繪地理信息大數(shù)據(jù)平臺。運用大數(shù)據(jù)強大的共享及運算能力,可以有效地解決測繪地理信息數(shù)據(jù)存儲難、共享難、利用難等諸多問題,實現(xiàn)測繪成果向社會公共事業(yè)服務的轉型,其整體架構設計如圖1所示。
(1)基礎設施層
基礎設施層應以開放和云化為原則,向上層應用提供虛擬計算、文件存儲、數(shù)據(jù)庫、負載均衡等基礎設施的軟硬件和網(wǎng)絡服務,是整個大數(shù)據(jù)平臺當中的基石。由于測繪地理信息數(shù)據(jù)中包含各式各樣的結構化、非結構化以及半結構化的數(shù)據(jù),因此基礎設施層需要支持關系型數(shù)據(jù)庫、非關系型數(shù)據(jù)庫、文件數(shù)據(jù)庫的混合存儲,并具備將原始測繪數(shù)據(jù)匯聚形成數(shù)據(jù)湖的能力,為測繪地理信息數(shù)據(jù)從采集到存儲加工,再到最后的分析應用提供保障[3]。

圖1 測繪地理信息大數(shù)據(jù)平臺整體架構圖
(2)數(shù)據(jù)層
數(shù)據(jù)層負責將各類測繪地理信息數(shù)據(jù)進行存儲與管理,主要包含數(shù)據(jù)源層、數(shù)據(jù)整理層,以及數(shù)據(jù)存儲層三個層級。數(shù)據(jù)源層包含各類數(shù)據(jù)庫中保存的公路、水系、居民地、行政界限、自然地理要素等數(shù)據(jù),是大數(shù)據(jù)平臺的數(shù)據(jù)產(chǎn)生機構;數(shù)據(jù)整理層包括數(shù)據(jù)清洗、數(shù)據(jù)加工、數(shù)據(jù)預處理、數(shù)據(jù)加載、數(shù)據(jù)抽取等工作,將關系型數(shù)據(jù)庫中的原始測繪點、線、面數(shù)據(jù)向空間大數(shù)據(jù)池進行集成轉換;數(shù)據(jù)存儲層中存儲了整理后的數(shù)據(jù),包含各類數(shù)據(jù)集市和主題數(shù)據(jù)庫,可直接對接應用系統(tǒng),滿足各類應用的數(shù)據(jù)提取需求。
(3)應用層
應用層應根據(jù)測繪行業(yè)特點,對數(shù)據(jù)層提供的測繪地理信息數(shù)據(jù)再次進行加工整合,建立適用于各類應用系統(tǒng)的數(shù)據(jù)統(tǒng)計分析模型。該層需要通過Web方式向測繪行業(yè)人員以及社會公眾提供在線數(shù)據(jù)采集、實時數(shù)據(jù)查詢、計算、智能報表等多種服務,并提供豐富的接口供第三方系統(tǒng)集成調用。應用層還需要具備較強的可伸縮性和可擴展性,能夠快速響應用戶需求,并按需增減各類測繪數(shù)據(jù)服務。例如通過利用空間數(shù)據(jù)信息構建的“數(shù)字城市”模型,可以擴大城市建設范圍,為城市發(fā)展提供更多可利用的空間。
(4)標準規(guī)范體系
測繪地理信息大數(shù)據(jù)平臺建設的意義在于將各類測繪地理信息數(shù)據(jù)加工整合后,提取更多的數(shù)據(jù)內在價值。但如果各類數(shù)據(jù)格式不統(tǒng)一,選用的基準物不一致、將增加較大的數(shù)據(jù)清洗、整理、入庫難度,不利于數(shù)據(jù)的使用和分析。因此,為了最大限度提升數(shù)據(jù)應用的有效性及可靠性,應建立數(shù)據(jù)的采集規(guī)范和標準化存儲體系,在開展數(shù)據(jù)收集時重視收集數(shù)據(jù)的測繪基準信息,并在數(shù)據(jù)采集端對數(shù)據(jù)質量進行檢驗和校核,從而為后續(xù)投影變換,數(shù)據(jù)銜接打下良好基礎。
測繪地理信息大數(shù)據(jù)平臺為海量測繪數(shù)據(jù)的存儲、共享以及分析利用提供了切實可行的解決方案。在大數(shù)據(jù)時代,得數(shù)據(jù)者得天下,數(shù)據(jù)的高速流動為測繪地理信息行業(yè)提供了廣闊的發(fā)展空間,同時也對傳統(tǒng)的管理思維方式、方法手段進行了強烈的沖擊。我們要緊緊跟隨時代的浪潮,主動轉變,才能使測繪地理信息數(shù)據(jù)真正融入到各行各業(yè)以及人民生活之中,為社會進步創(chuàng)造更多的價值。