康永 劉偉平 汪福軍
(東部機場集團有限公司 江蘇省南京市 211106)
機場作為航班起降的空中港口,在現代交通運輸中發揮著重要作用。根據機場的實際運行情況,總結其具備“三多”的特點,即連接節點多、業務源頭多、交通方式多。以國內某樞紐機場為例,其擁有超過100 個航點,而運行的航線航路更多,涉及的航空公司也超過50 家,另外還有大量的駐場單位,包括海關、邊檢、公安、油料公司以及很多家貨代公司和商戶等,同時機場作為綜合交通的匯總地,需要融合各種交通數據,如地鐵、大巴、私家車、網約車等。由此可見,機場是一個集多種業務和數據于一身的復雜場景,然而由于各方信息化建設發展階段不同,數據標準也無法統一,在各自領域內形成了大量的數據孤島,有著數據標準不一致、數據格式不一致、數據質量不一致、各方數據協同困難等問題。
隨著城市交通網絡的逐步完善,機場作為城市的又一重大樞紐,成為空港經濟發展的核心。多方數據的交匯融合是協同發展和治理水平提升的基礎,而實際上,由于信息建設的水平不一導致數據交換的方式和能力無法統一,存在建設安全標準不一、工作量大等問題,急需統一架構設計和安全保障,建立數據交互的樞紐平臺,實現多源機構數據的收集,并能夠根據需求為各方提供數據服務。根據數據存儲位置和物理空間,樞紐機場主要數據接入場景分為兩種:一是物理位置在機場范圍內的公司和部門,例如機場各級部門、基地航空公司、海關、公安和各駐場單位等,可采取專線接入等方式,可交換機場運行核心的機密數據;二是物理位置遠離機場但仍需考慮數據交換的單位,例如通航機場、非基地航空公司、貨代公司和監管單位等。因此數據交換平臺需在基礎架構層考慮至少兩種網絡環境下的安全數據交換和管理。
私有云技術是基于企業的基礎網絡資源,使用虛擬化技術將實體資源虛擬為若干的虛擬資源,企業用戶在資源池中,根據企業本身業務需要,進行企業應用搭建。一方面,由于企業擁有基礎設施使用和維護權,企業可以獨立自主的控制應用的部署方式,并進行應用維護;另一方面由于企業網絡是相對獨立的,并不會與互聯網區域進行數據共享交換,對企業應用的獨立和數據的安全可以提供有效的保障。結合實際業務需求,私有云更適合機場在航班保障、安全防范等方面的需求,因此目前大部分樞紐機場均建設了企業級私有云平臺。
公有云是指由第三方供應商在互聯網環境通過虛擬化、云計算等原生技術,搭建共享資源池,用戶可以通過購買服務的方式,以比較低廉的價格購買云資源,快速完成業務應用搭建。公有云最大的優勢是無需用戶進行基礎環境維護,由第三方服務商進行基礎環境維護,因此會節省用戶大量維護的人力、物力資源。結合機場行業的實際情況,公有云環境在方案選型上,更適合搭建面向互聯網端的遠程數據服務應用,例如旅客服務、投訴咨詢等應用。
私有云具有地域安全優勢,但其服務區域具有一定的局限性,而公有云具有服務能力強,但其有數據保密和安全的擔憂。因此某樞紐機場提出建立基于混合云技術的數據共享平臺,充分發揮公有云和私有云各自的優勢。
考慮到外部單位受限于網絡和系統建設水平不一,無法跨區域跨網絡直接進行數據交互,為簡化鏈路對接快速響應,某機場確定了混合云模式的技術架構。核心數據存儲、加工部署在私有云,可實現資源的快速擴展同時保證數據的本地機密性;數據接入及管理平臺部署在公有云,可實現靈活的跨地域接入和各類云服務快速使用。所有外部數據均通過互聯網進行接入,通過多個區域實現數據的安全落地和使用。系統整體分為三大區域,在機場私有云平臺上劃分了數據中心區和數據交換區,公有云平臺上建設數據交換中心,具體部署結構如圖1所示。

圖1:數據共享平臺部署結構
私有云數據中心區部署于機場私有云內網環境,與其他網絡環境交互通過嚴格的訪問控制確保區域的安全性和獨立性。私有云數據中心承擔機場所有數據的清洗、分析、計算、監控任務,底層在私有云平臺上建設數據庫集群和數據倉庫集群,集群容量可快速動態伸縮。集群之上搭建工作流調度系統,實現數據交換的任務流程編排、資源分配、任務管控。此外,私有云數據中心提供數據生命周期管理,針對歷史數據進行歷史數據遷移和按需清理,有效節省云平臺成本和資源。通過每條數據的唯一ID 值,能夠查詢數據的源頭以及傳輸路徑,便于進行數據治理和分析。采用數據倉庫,建立多種主題模型,滿足不同類型數據的存儲和管理,并借助數據中臺實現數據的深加工并對外提供數據服務。
私有云數據交換區建立在機場私有云DMZ 區,通過嚴格的安全策略保證數據的進出安全。根據DMZ 區域管理規定,該區域內系統可與互聯網上公有云數據交換中心進行數據采集和上傳;但作為內網的緩沖區域,該區域無法直接訪問至內部數據中心,只能由內部定期主動發起請求進行數據交換,從而確保內網系統數據與互聯網環境的隔離。數據交換系統同時可實現各種作業管理、作業調度、作業監控等功能,是內、外部數據交互的橋梁和紐帶。
公有云數據中心部署在外網云廠商環境,底層基于彈性云計算服務和開放存儲服務建設,上層提供API 交換服務、MQ交換服務、WEB交換服務,并基于統一云服務引擎(ACE)對外提供服務。服務支持多源異構數據,提供數據統一協議格式轉換,以適配外部單位各種業務場景需要。公有云數據中心作為數據服務響應方和提供方,在響應私有云數據中心和外部單位的主動數據訪問請求時,配備了完整的安全訪問機制。具體到安全策略上,系統提供身份認證、數據校驗、權限配置、日志監控等功能,并實現數據訪問源白名單管理;組件防護上,系統提供云主機防護、DDOS 攻擊防護、安全態勢感知等功能。
基于混合云架構的數據共享平臺其總體功能架構如圖2所示。

圖2:數據共享平臺總體功能架構
在信息技術領域高速發展的今天,不同的區域、不同的系統之間的數據共享與交換越來越重要,而不同的業務系統之間的協議是異構的,通過業務無關性設計,可以在多源數據共享交換的前提下,實現一種與業務無關的通信協議制定,使開發者可以專注于業務部分。業務無關性是指系統數據接入接出的使用過程中,用戶無需額外考慮底層數據接口的物理實現、數據協議的兼容性、數據格式和數據標準的一致性,而是專注于數據應用層面的定義與配置。系統提供相關組件,自動實現用戶數據邏輯層面轉換成統一民航信息模型,物理層面轉換成統一通用數據協議,底層適配各類數據存儲和接口技術,實現數據存儲和訪問。相比傳統數據交換方案,業務無關性設計是一種新型數據融合方案,不再需要針對特定數據對接業務場景單獨開發,也不再需要每新增或變更一項業務,就針對輸入輸出數據協議或不同模型重新編寫程序。
盡管當前通用消息協議解決了多源異構系統場景下數據集成問題,但仍然面臨不同業務系統來源數據屬性或者維度數據重復、標準沖突、粒度不同等業務口徑不一致的情況。數據共享平臺在設計上采用業務解耦架構,不同業務系統和業務事件數據,都將基于這些統一標準的數據底座上,拆分構建各自的業務事實表,實現了業務數據標準的解耦,加快了各類業務的數據匯聚。
數據共享平臺在數據服務配置上充分考慮業務無關性設計,從數據底層庫表、服務共享內容到下游對象映射,都做到面向管理員的自由可配置。數據接入和共享接口服務配置項包括服務名稱、服務代碼、服務描述、綁定數據表、字段配置列表(主鍵配置、數據類型、字段名等)。系統管理員根據各用戶單位需求,初始化用戶名、密碼、用戶單位、數據服務項、IP 地址端口號等根據實際需求進行配置實施,從而達到“即插即用”的目標。
基于混合云技術的數據共享平臺在數據流向和存儲上更加復雜,非核心可公開的外部數據源上傳至公有云留存,核心機密數據存儲于私有云數據中心,通過DMZ 區域緩沖實現互聯網與內網的數據交互,確保數據傳輸的安全性。公有云數據交換中心、私有云DMZ 數據交換區、私有云數據中心區均采用不同的訪問策略,公有云數據交換平臺會預設置白名單訪問,僅接收前期預配置的用戶源地址請求,賬戶權限分配由系統管理員統一分配,各用戶數據權限粒度具體到表,訪問權限粒度具體到接口、導入,各賬戶根據權限上傳/查看相關數據。公有云數據交換平臺只允許本地DMZ 區數據交換系統主動發起請求至公有云端,公有云端返回對應數據;DMZ 區外網防火墻僅配置源地址轉換,互聯網側無法直接訪問私有云DMZ 區數據交換系統,降低本地受外網攻擊的可能。通過內網防火墻控制僅允許內網數據中心系統主動發起請求,獲取DMZ 區前端數據,不允許DMZ 區直接對內網數據中心發起主動請求,具體訪問控制如圖3所示。

圖3:數據交換平臺訪問控制
由于機場運行涉及航班安全和旅客出行等大量敏感數據,因此在系統設計上除了考慮系統的訪問控制以外,數據安全也是系統設計的重中之重。內網數據中心側主要存儲核心數據,可以實現對某些敏感信息(比如,身份證號、手機號、人像圖片等)通過脫敏規則進行數據的變形,實現隱私數據的可靠保護。在配置接口服務時,系統管理員設定表字段脫敏要求,數據共享過程中消息字段以脫敏數據傳輸。數據中心數據脫敏模塊可采用多種方式對數據進行脫敏使用,滿足不同業務數據使用的敏感性需求,比如靜態脫敏實現數據抽取后直接進行脫敏處理,后續數據與源數據無關,可隨意使用,動態脫敏在訪問敏感數據時進行數據脫敏,可后臺設置給不同用戶、角色、權限的脫敏方案,對于特定用戶獲取密鑰后可實現脫敏恢復等,滿足不同使用場景對數據脫敏的要求。
平臺通過建立數據中臺進行數據分析和計算,同時也可實現對敏感數據的復雜脫敏算法處理,在數據層和服務層中間建立計算層,部署數據加工計算組件,可以快速完成數據計算。基于歷史數據和實時數據,可在旅客、航班、物流、交通、資源等主題域進行實時分析,執行飛機時間預測、機場資源預測、安檢人流預測等數據挖掘及匯總展示,實時結果通過中臺API 服務形式提供出來,支持各新型業務,加速企業從數據到業務價值的過程。比如,在航班計算主題中,數據中臺通過獲取飛機實時發送的ADS-B 廣播數據,結合歷史數據精準計算出航班預達時間,并定時校正,可以為駐場單位的各種資源調配提供數據支撐。在旅客數據方面,通過數據中臺進行數據脫敏,同時也可為外部系統提供匯總數據和大屏集中展示,為機場管理人員提供輔助決策支撐,基于機場不同的數據主體進行劃分,如圖4所示。

圖4:機場數據中臺主題域劃分
公有云數據交換中心是與外部機構進行交互的窗口,平臺根據數據交換的情況支持多種方式接入,對于高吞吐大數據場景,支持異步MQ 接入,用于數據量大,對數據接收反饋要求不高的情況;支持常見消息隊列協議(RocketMQ、Kafka 等),支持系統解耦,可降低數據傳輸的性能壓力。對于低延遲強同步數據場景,支持同步API 接入,主要為各類信息系統服務,支持常見的REST 協議和SOAP 協議,用于數據量大、精度要求高的核心生產數據傳輸。而對于靈活可配置的數據場景,支持基于企業總線的Web 服務接入,主要用于實時性低,涉及人工錄入和導入的數據。
基于混合云環境和機場業務場景實際需要,制定云上云下數據鏈路策略,實現數據鏡像差異化同步。根據實際需求,針對不同業務實時性要求,主要劃分了三種場景:
(1)實時性業務,如航班滑行軌跡、保障任務巡檢等,私有云每隔10 秒發起數據同步,拉取公有云數據到本地合并后,立即推送到公有云環境。
(2)準實時性業務,如旅客行李托運、登機提醒等,私有云每隔1 分鐘發起數據同步,拉取公有云數據到本地合并后,定時1 分鐘推送到公有云環境。
(3)非實時性業務,如T+1 航班計劃發布、機位容量數據分析等,私有云在業務低峰期發起數據同步,拉取公有云數據到本地合并后,同樣在業務低峰期推送到公有云環境。
基于混合云技術的數據共享平臺的搭建,既解決了樞紐機場跨地區、跨資源數據共享交換的結構性問題,又保證了航班、旅客等核心業務數據的安全性,實現了樞紐機場數據的匯聚、共享,打破了數據壁壘,能夠充分發揮數據資產應有的價值。