摘要:按目前形勢大數據庫的完善和提升,是國家戰略直接應用于航空航天、地球物理、資源勘探、土地動態監測、農牧漁業、智能化交通管等重多領域,測繪導航也正在逐漸過渡到具有現代意義的大數據庫時代。它特征是數據體量大、類別多、處理數據塊、準確率高等優勢。但面臨的問題也很凸現,導航大數據庫實時化、動態化、種類多樣化、數據網絡化、應用廣泛化、重組及擴展化的原因目前面臨的主要問題就是測繪導航大數據的思維還未完全轉變、體系尚未建立、標準規范不完善、缺少測繪導航大數據支撐系統、管控及數據挖掘不夠。現勢條件下,測繪導航大數據建設原則應該是“立足專業,著眼急需,突出壁壘,加大管控,規范標準,科技創新”。測繪導航事業發展至今天,從生產方式到數據應用,都發生了很多變化。我們需要結合測繪導航任務特點以及發展趨勢,通過政策統籌,打破行業、地域壁壘,建設健全共享機制,逐步建立完善大數據標準規范,建立區域乃至全國的測繪導航大數據體系。對測繪導航數據進行全流程管控,并培養一批具備有測繪大導航數據建設的高素質技術人才,共同迎接信息條件下測繪導航事業的數據時代。
前兩年,美國政府宣布投資2億美元拉動大數據庫相關產業,將大數據庫上升為國家戰略。這個戰略將數據定為“未來的新石油”。未來對數據的占有和控制甚至將成為陸、海、空權之外的另一種國家核心資產。大數據庫時代深入發展已經來臨。一方面,基于大數據的經濟快速發展。依托大數據的智能電網、智慧交通、智慧醫療、智慧環保、智慧城市正在興起,另一方面,測繪導航方式和生產模式發生了根本改變。測繪導航逐漸突破以往后臺理論與技術支持的地位,由靜態處理轉為實時服務,攜眾多服務產品逐漸走向前臺,并直接應用于航空航天、地球物理、資源勘探、土地動態監測、農牧漁業、智能化交通管理等眾多領域,測繪導航正在逐漸過渡到具有現代意義的大數據時代。
一、大數據的概念及特征
1.大數據概念
現代意義的“大數據”是在互聯網發展、傳感技術的廣泛應用下而產生的。是指具有數據大、類型多、價值密度不均衡、動態特征不一樣、應用處理特征不同等特點,并且無法用傳統數據工具對其內容進行抓取、管理和處理的信息集合。“大數據”雛形概念始于1970年哈佛大學關于材料、能源、信息是推動社會發展的3種基本資源的論述中。這也是美國在IT、信息資源等領域一家獨大的原因之一。大數據庫應用概念衍生于亞馬遜、Google等互聯網公司運營。隨著互聯網智能化,它在滿足需求的同時,也在創造新的需求。前者代表是Google,后者的典型則是Facebook。
2.大數據特征
具體表現在“4V”,即“Volume(量大)、Variety(類多)、Velocity(速度)、Veracity(準確性)。
首先是數據體量大。指大型數據集,由目前GB量級已經達到了TB量級。隨著信息時代發展,還將出現YB級(2的80次方)的數據量。預計2020年數據產出量將是2009年的44倍還多。
其次是數據類別多。數據種類和格式日漸豐富,已沖破了結構化數據范疇,越來越多的數據屬于非結構化和半結構化的數據。例如智慧城市的大數據庫類型,最常見的有文本、圖像、音頻、視頻等類型,還有位置、方位、時間和動力學信息等其他類型數據。
第三是數據處理速度快。在數據量極大的情況下,不同種類的海量數據進行交叉查詢、檢索、分析處理的技術,是數據核心技術之一。語義分析技術、圖文轉換技術、模式識別技術、空間分析技術等等,都在大數據庫快速分析時獲得應用。目前,源于統計學、計算機科學、應用數學和經濟學等領域的技術已經開始并應用于大數據庫快速整合、處理、分析和可視化大中。
第四是指準確率高。這里不是指數據準確性,而是通過數據處理、挖掘和預測,數據呈現出的事務本源性真實可靠。移動互聯、社交網絡、電子商務大大拓展了互聯網的疆界和應用領域。人們在享受便利的同時,也無償貢獻著自己的“數據”。在互聯網上是“處處行跡處處痕”。收集分析海量的各種類型數據,并快速獲取信息的能力,就是大數據技術魅力特征。
二、測繪導航大數據建設特點及面臨的問題
圍繞著信息戰、導航戰、指揮自動化、智能交通、智慧城市等應用的大數據建設已慢慢展開,測繪導航大數據體系特點越發凸顯。
1.測繪導航大數據庫建設特點
(1)測繪導航數據實時化、動態化。目前已綜合應用了航天、航空、地面和水上等一切可使用的對地觀測技術,如GNSS快速定位定向技術、航天航空遙感測技術等。實現了實時動態獲取測繪導航定位數據、重力數據和遙感影像和遙感影像數據以及其他有關數據。
(2)測繪導航數據種類多樣化。現在大規模的視頻傳感器與三維激光、陀螺慣導、GNSS導航、遙感影像、GIS、智能手機進行綜合,在人們最需要的地點和路徑上動態地、多方位地采集并發布包括位置、影像、聲音、視頻、移動方向、速度及重力加速度等多類型數據,將能極大地發揮測繪導航的優點,可提供綜合智慧服務。
(3)測繪導航數據網絡化。傳統測繪導航是測繪導航單元外業采集后,存儲于單機設備中,數據交換需要“面對面”交流。網絡應用將使數據從內部局域互聯網上信息發布的方向發展。測繪導航數據的查詢、傳輸、交換和服務全部在網絡進行,可實現“一站式”檢索、瀏覽和按權限下載,任何人在任何時候、任何地點都可能得到權限范圍內的測繪導航數據服務。
(4)測繪導航數據應用廣泛化。測繪導航數據應用對象的轉換,已從“內部”到“開放”,從“專業”到“公眾”。測繪導航數據從公益性、專業性測繪導航保障向整個社會產業體系的應用方向擴展。從面向軍隊、政府、專業領域擴大到面向社會公眾,按需求、分密級向企業事業單位和社會公眾提供數據。由此,測繪導航數據在諸多領域如環境監測與分析、災害監測預警與評估、城市管理、交通、物流等領域都發揮作用,測繪導航數據的應用真正實現社會化。
(5)測繪導航數據重組及擴展化。傳統測繪導航數據數據需々業型數據專家,例如GNSS數據處理需專業的處理軟件解算。但隨著各類型數據采集系統逐步建立,人們需求及關注度發生了改變。對海量數據尤其是對空間相關的數據進行重組、擴展分析和挖掘,才能提供深層的測繪導航多樣化信息服務。測繪導航功能也由圍繞數字產品的“生產”轉向圍繞空間信息的全方位“服務”,其價值將比單個數據集總合更大。如衛星導航地基增強系統數據結合交通信息數據、氣象信息數據、地圖信息將極大改變人生生活方式,成為智慧城市基礎支撐。
2.目前主要問題
(1)測繪導航大數據的思維還未完全轉變。盡管我們生活在大數據庫爆發時代,但傳統測繪導航作業模式仍然制約著思維模式。目光僅僅局限于數據本身以及數據本身所闡釋的主要現象。思維還是停留在樣本分析,還沒有關注全數據集分析;仍然執著于數據的精確性,而忽視數據的多樣性;仍然探求數據因果關系,而沒有關注或利用數據的相關關系。正如一些專家學者指出:“對于空間信息應用的發展,我們中同是不是也可以有更多創新的思維。我們一定要把它所有的數據都提取出來其中的信息,才能夠被普通人應用;我們是不是用非常形象地景象去傳遞出去,會使更多人理解,我覺得巾同需要更多的這種創新思維。”
(2)測繪導航大數據體系尚未建立。目前測繪導航數據采集和獲取具有現勢眭,數據應用存在區域性,存儲數據存在時效性,數據處理存在專業性。測繪導航數據一般是應用部門針對特定任務采集和獲取,利用專業數據處理方法分析局部數據精度及屬性特征。如各省CORS信息中心計算機生產CORS差分信息,沒有地圖數據、遙感數據、光學影像數據、雷達激光掃描數據等支持。數據依然按行業類別、地域、企業被隔離成一個個信息孤島,還沒形成測繪導航大數據所必需的“測繪導航云”,未建立一套行之有效的測繪導航大數據理論與技術,還未開展相關技術研究和理論創新,無法對各種不同類型數據的關聯技術研究和理論創新,無法對各種不同類型數據的關聯進行深度挖掘及利用。不解決測繪導航大數據體系問題,數字地球、智慧城市、智慧自動化等建設將大打折扣。
(3)測繪導航數據標準規范不完善。自2008年,各測繪導航單位都搭建數據信息中心,用于存儲測繪導航數據,每年生產任務產生大量數據,加之目前各地CORS系統、地基增強系統、遙感接收站等產生了海量的數據,這些數據沒有統一標準。南于政策、制度等限制,這些數據信息不能互聯互通,客觀上出現信息孤島。體現在實際工作中是“數據不知道從哪里要”“數據來了不知道是什么”“有了數據不知道怎么存”“來了數據不知道怎么用”“數據多了不知道怎么分析”,到T作結束數據也存在“放置或丟棄不用”等問題,導致數據重復性建設,資源浪費嚴重以及數據資源分布不均等現象,嚴重影響測繪導航保障工作的順利開展。
(4)缺少測繪導航大數據支撐系統。大數據建設不僅儀需要解決信息數理化,還要解決數據信息處理和預測:這需要建設落地的支撐大數據系統、數據存儲系統、數據管理和分析系統、共享服務平臺、安全保密系統等。目前,在測繪導航方面采用超站儀、衛星導航接收設備、慣導設備、激光測量裝置及其他傳感器影像、位置、地理信息、聲音、人員信息等進行了數據化。但在使用過程中,多數類型數據摒棄不用,僅僅存儲測繪導航相關信息,沒有搭建成規模的數據分析處理、匯交、共享、安全等急需的測繪導航大數據支撐系統。由于沒有分析預測支持,僅能獲得如位置、姿態、距離、時間等信息,但效益分析、未來預測等關注較高的內容無能為力,不能達到測繪導航保障真正水平。
(5)測繪導航大數據管控及數據挖掘不夠。面對以TB級、PB級計的海量導航觀測數據,我們面臨著“數據有多有少”的矛盾局面,一方面數據多到無法處理,另一方面用戶需要的信息又不多,致使無法快速及時地回答用戶問題。目前針對單一功能的數據處理能力已基本具備。例如衛星導航定位數據的處理已經實現了自動化、智能化和實時化,已使空間導航位達到米級、分米級乃至厘米級精度。但實際僅僅關注位置信息,更多社會需求還需知道基于位置信息的其他信息,如通過位置、影響等分析物流環境情況,為決策者提供支持。對測繪導航數據進行深度分析和挖掘,也是目。前測繪導航大數據未完全實現的功能。
(6)測繪導航大數據建設和管理人才短缺。制約測繪導航大數據建設,并為總部及領導機關提供輔助決策與態勢判斷的—個重要因素是人才短缺,尤其是缺少運用大數據提供決策支持的專業數據管理和分析師。專家預計,至2018年,美國大數據領域中深度分析人才缺口14~19萬。我國跟美國差距更大,測繪導航專業數據分析師與數據統計科學家幾乎沒有,需要通過培養和引進填補缺口,同時需要相當數量的專業技術人才進行適當的再培訓或改訓,支撐起測繪導航大數據建設。
三、測繪導航大數據設想思路
現勢條件下,測繪導航大數據建設原則應該是“立足專業,著眼急需,突出壁壘,加大管控,規范標準,科技創新”。
1.轉變觀念,構建測繪導航大數據體系
許多人已認識到測繪導航大數據體系建立會對戰場決策、政府決心起到積極影響。構建體系需要從數據采集、匯集、處理、分析、預測等方面著手,大力發展以傳感器技術、射頻識別(RFID)技術,導航定位技術、地理信息技術、圖像視頻技術等為基礎的感知能力,打破行業地域壁壘,信息共享,將多種時域、空域條件下戰場地理數據、導航視頻數據、地圖遙感影響數據等匯集形成空天—體化的空間數據庫,結合當前測繪導航應用特點以及發展趨勢,突破大數據關鍵技術,面向部隊、社會分布式測繪導航數據共享服務體系,解決信息孤島問題。
2.立足急需,加強數據管控能力
測繪導航數據數字化采集已經基本解決,加強測繪導航數據智能化管空時開展網絡化服務和社會化應用的重要保障。急需大數據建設規范標準,包括測繪導航數據結構、類型、倉庫、元數據、模型等,這是匯集與分析多元數據的基礎和根本。同時重點開展數據中間技術、空間數據倉庫的數據安全管控技術、信息安全技術、分布式空間數據庫技術攻關,大力發展具有自主知識產權的智能化測繪導航數據庫管理系統。然而,美國“棱鏡門”為我國信息安全敲響了警鐘,大數據時代許多數據應用涉及公民財產安全甚至國家安全,尤其是測繪導航大數據價值極高,因此信息安全問題成為測繪導航假設的首要難題。
3.技術突破,加強大數據能力建設
與騰訊擁有用戶關系數據和基于此產品的社交數據一樣,這些數據可分析人的生活和行為,從里面關聯、挖掘出政治、社會、文化、商業、健康等領域信息,甚至預測未來。基于測繪導航大數據的戰場感知、情報獲取等能力也離不開“測繪導航云技術”,主要研究基于測繪導航數據的虛擬化技術、N0sQL、實時流數據處理技術、智能分析技術等。
應在全國建設若干有特色的省級、帶動全系統測繪導航大數據匯集點。基于數據分析,帶動全系統測繪導航技術升級、生產組織的重構和測繪產品結構的調整,全面提升信息時代保障能力。重點發展以無人機導航遙感、地面移動測量等系統為主的機動、靈活測繪導航信息獲取與應急測繪導航保障技術;大力開展基于地基增強系統示范工程建設,應急測繪達導航數據挖掘預測技術,配置具有可視化及并行處理能力的大型數據匯集工廠,具備在網絡環境下自動流水線式處理的能力,以滿足多層次的測繪導航保障需求。
四、結論
測繪導航事業發展至今天,從生產方式到數據應用,都發生了很多變化。我們需要結合測繪導航任務特點以及發展趨勢,通過政策統籌,打破行業、地域壁壘,建設健全共享機制,逐步建立完善大數據標準規范,建立區域乃至全國的測繪導航大數據體系。對測繪導航數據進行全流程管控,并培養一批能適應測繪大導航數據建設需求的高素質技術人才,共同迎接信息條件下測繪導航事業大數據時代的到來。