李萍
成都雙流國際機場股份有限公司 四川成都 610000
大數據時代對民航統計工作提出了更高的要求。各單位要從根本上重視民航統計工作,做好統計數據獲取、管理、分析及應用等相關工作,應充分挖掘與利用“數據化”資源,為民航機場的戰略決策、經濟效益分析等奠定好堅實的基礎。機場不同的系統每天都在產生海量的數據,且每年都在快速增長。發揮大數據的技術優勢,對提高機場現代化水平,提升運行品質,促進機場持續健康發展意義重大。
大數據概述當今社會,“大數據”已經不再是令人陌生的一個詞匯,大數據技術越來越多地被人們提起,人們用它來描述信息化時代所產生的大量數據以及信息整合分析的一種技術手段。
大數據,指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。麥肯錫全球研究所給出的定義是,一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征[1]。
多種數據來源是大數據的主要特征之一。數據共享包含兩個層面,一是機場內部各部門各系統之間的數據共享,二是機場與外部單位的數據共享。要做機場大數據,首先要實現機場組織內部的數據共享。機場組織內部數據共享的必要性已是共識,目前機場有關生產運行的系統會通過數據總線(數據交換平臺)共享數據,也有直接通過數據接口方式實現數據共享的。機場普遍存在組織內部數據共享不足的現象。要做機場大數據,其次要實現機場與外部單位的數據共享。機場在民航業務鏈條中只是一個環節,在交通運輸領域只是一個點。機場的規劃建設、生產運行都離不開外部單位的信息數據,比如當地的經濟發展數據、人口數據、水文地質氣象數據、其他交通運輸數據等;比如民航空管、航空公司的航班數據、旅客數據、貨運數據等;比如駐場單位海關、檢驗檢疫、公安值班數據;比如前序航班和后續航班機場的運行情況數據等等。機場客觀上必須要獲得外部單位的數據,也應該為外部單位提供數據服務,比如為其他機場、航空公司、空管、駐場單位、機場商家、國家安全管理部門等提供服務。目前除了空管、航空公司、中國航信外,機場與外部單位數據共享程度低,共享方式一般是通過點對點的接口方式交換雙方需要的數據[2]。
隨著智慧機場建設的推進,機場信息弱電系統越來越多,規模越來越大,數據量快速增長。這些不斷增長的數據是機場大數據的主要來源,其質量也決定了大數據系統的可用性。
機場產生的數據,應當按照數據資產進行管理。在當前實踐中,機場普遍缺乏適應的數據資產管理能力,表現在:機場不知道自己有些什么數據,這些數據從何處產生,存儲在什么地方,如何定義,安全性如何,誰負責維護,怎么得到,誰在使用;數據很多,想要的數據卻找不到,同一個數據項量值不一致,同一個數據名代表的意義不一樣;數據質量差,數據的完整性、規范性、一致性、準確性、惟一性、時效性得不到保證;系統間數據接口復雜,數據流程過長,相互依賴性過高,數據重復處理現象增多。
數據資產管理一般包括三個層面的內容:首先是對數據資產的管控,讓數據準確、一致、完整、安全可控、沒有歧義、來源統一;其次是數據資產的應用,讓數據在使用過程中更為透明、易用、共享,應用與數據解耦,有利于數據驅動的應用軟件開發,促進數據升值;最后是對數據資產的運營,讓數據對外開放、分發、交換、共享,從而促進數據資產價值變現[3]。
數據應用是通過“加工”采集到的數據,產生新的數據,是大數據的目標。基于大數據的應用系統開發模式,是以數據為導向的,本質上是數據工程師主導、業務人員參與。這與傳統的業務應用系統開發模式不一樣,傳統的開發模式是以業務需求為導向的,本質上是業務人員主導、軟件工程師參與。大數據系統建設,基礎條件是要有數據,價值體現是對數據的應用能力。基于大數據典型的技術應用領域,有數據挖掘、模式識別、機器學習、深度學習、人工智能、專家系統、決策支持、推薦系統、計算廣告、虛擬現實、增強現實等等。這些技術在IT 領域是有區別的,在應用領域可以簡單歸為人工智能(AI)類應用。人工智能需要一個“學習”的過程,學習是通過大量的樣本數據“訓練”完成的。大數據為人工智能的發展提供了樣本數據條件,人工智能同時也提高了大數據的數據資產使用價值。
大數據架構下,數據資源在采集、存儲、應用、開放共享等環節都存在安全保護的要求,所以數據安全更為復雜。大數據架構下的安全保障,涉及到物理安全、系統安全、網絡安全、應用安全、數據安全、管理安全等方面,面臨計算機病毒、網絡入侵、網絡攻擊、自然災害(地震、水災、臺風等)事件、火災事件、恐怖襲擊事件、信息基礎設施故障事件等等的威脅,造成的后果有數據泄露、數據丟失、數據被篡改、系統服務中斷等。機場大數據建設,數據安全方面除了傳統保證措施外,技術方面應重點考慮的需求有數據的機密性、完整性、可信性、可用性、使用可控性等[4]。
當前,面對國際航空市場競爭壓力以及快速增長的航空運輸市場需求,迫切要求我國民航業迅速提升運營、分析決策及管理水平,而基于大數據技術的民航統計成為機場提升數據分析能力,提高數據預測水平,進而提供戰略決策支持的有效手段。