鄧黎妮 陳昕然
摘 要:如何為每一位旅客提供更優質的服務是每一個機場人的使命。在新一輪的機場建設中,民航各建設單位也都紛紛投入大量人力物力打造智慧機場。本文介紹了在大數據時代的背景下,如何利用已有的、可以獲取的旅客數據,梳理旅客在機場的流程,并提取旅客特征。結合大數據思維和工具,了解旅客需求,為旅客提供更個性化的服務。這對智慧機場建設中旅客挖掘有一定價值和意義。關鍵詞:機場旅客;大數據;特征分析 1 引言近幾年,大數據和人工智能技術已逐漸融入人們的生活,并已成為科技行業最具價值的領域。在民用航空“十三五”發展規劃下,民航業發展也進入快車道,如何利用大數據和人工智能等前沿技術,為民航旅客提供一個安全、舒適、高效的航站區環境和飛行旅程,已經成為各大機場、航空公司的重要課題。而機場作為民航產業中的重要一環,只有不斷加深大數據與人工智能技術的運用與實踐,改革傳統業務與管理模式,才能從根本上提升機場運營的智能化水平,適應整個產業的發展。基于機器學習等先進算法的人工智能技術已經在多個領域發揮出積極的作用,相信在未來將承擔越來越多的社會分工。通過旅客以往的數據去了解旅客的需求[1][2],挖掘出旅客潛在的行為模式,不僅會為旅客帶來更好的體驗,也會為機場節省更多的人力和物力,最終為機場帶來更大的效益。例如將人臉識別[6]技術嵌入安檢信息系統,算法自動比對身份證照片,大大的提高驗證準確率及工作效率。2 旅客數據盡管民航信息化建設多年,已經形成了相當完備的信息網。然而各個部門之間的數據缺乏有效整合,形成了一個個的“數據孤島”,大量有價值的數據資源不能發揮更大作用。數據無法聯通、不能共享導致有效的技術方案得不到實施。機場是典型的服務型產業,旅客客流在時間和空間上表現出高集聚性。直接通過旅客在出行過境、安檢信息、場內互聯網行為數據進行分析,挖掘出用戶的不同行為特征。再利用機器學習中決策樹、SVM等分類算法[3]對旅客進行分類,以此來確定機場旅客市場的細分,進而針對不同旅客類別群體制定對應的服務、品牌策略等。首先需要解決數據源的問題,數據獲取途徑:1、旅客基礎信息、VIP旅客數據,旅客過安檢的數據;2、旅客通過微信關注或會員注冊,獲得用戶的ID信息;3、 通過小基站或wifi來對旅客的手機進行跟蹤,記錄其在候機樓軌跡和到商家的頻次和時間,對店鋪進行精準的數據采集;4、通過室內LBS定位及GPS定位,生成用戶的區域分布圖;5、通過候機樓監控視頻的數據;獲取數據后要進行數據的關聯整合,關聯的目的就在于從多維度收集旅客數據,刻畫完整的旅客畫像。通過數據關聯整合,對單一用戶進行標簽化整理,實現用戶精準描述。3 特征選擇特征選擇[4]的目的是從旅客的多個特征中抽取一些攜帶信息較多的特征來描述旅客,過濾掉那些攜帶特征信息量較少的特征。即是把非結構化的旅客信息表示成計算機能夠識別的向量,它為抽象、復雜的文本建立一個數學模型,用它來表示和描述旅客。分類器是通過訓練已知類別的向量發現各個類別中的特征分布模型,并通過大量已知類別向量對模型不斷進行測試、反饋、學習,提高模型性能,最后根據模型對待分類向量進行匹配,從而發現其所屬類別。4 機場旅客特征機場旅客分為進港和出港,旅客的基本信息、購票方式、機場消費情況、值機行為等數據可根據不同需求進一步細分。通過這些數據能快速的分析不同特征用戶的差異,同時檢驗出傳統機場市場細分能否有效的運用于大數據環境下機場用戶特征的研究。 根據旅客的基本信息和在候機樓的活動軌跡和行為特征,發現旅客的需求和偏好。機場旅客標簽,主要從五個方面進行闡述:1、基礎標簽:年齡段、性別、職業、職位、國籍、教育程度;2、乘機頻次標簽:常旅客、非常旅客、周期性乘機、非周期性乘機;3、候機樓消費喜好標簽:美食、購物;4、網頁瀏覽偏好:視頻、新聞;5、候機樓停留時間;從大數據角度研究機場用戶的行為特征,可以能挖掘出一些潛在的用戶群體,這些群體具有互聯網背景下的新特性,能快速適應新的乘機購物體驗。如文獻[5]關于機場的研究中,就用聚類分析挖掘出包含多個特征的七個用戶行為群。根據這樣的分類,能快速匹配出用戶的潛在需求,這也是大數據的優勢所在,對群體的分類會更加的詳細,明確,從而有利于機場更有針對性的做出相關策略。5 結束語從機場設施采集的旅客數據,不僅能給機場服務、商業提供支持,還可用于分析并做出實時的方案,為場內人力、物力的調度安排提供決策依據,甚至減少潛在的安全隱患,防止問題的發生。例如通過對通道口、登機口安裝傳感器和安全攝像頭捕獲人流數據進行統計分析,并將這些數據與來自控制塔的天氣數據和實時航班到達數據進行結合。根據這些數據可增加、減少安檢口,為登機口管理提供幫助,如自動打開最靠近中轉飛機的登機口、調度登機口人員。根據區域人流量,安排相關工作人員進行保潔和服務。有大數據的依托,大量費時費力的工作可無需人工干預,信息渠道更加高效便捷。參考文獻:[1] 鄭迅雷,陳加芬,萬濤.從互聯網用戶行為分析入手降低運營成本[J].鐵路通信信號工程技術.2008.06.[2] Magdalini Eirinaki, Miehalis Vazirgiannis: Web Mining for Web Personalization, ACM Transactions on internet Teclmology,Vol.3,No.1,February 2003,Pages 1-27.[3] 崔建明,劉建明.基于SVM算法的文本分類技術研究[J].計算機仿真.2013.02[4] Forman G.An extensive empirical study of feature selection metrics for text classification[J].Journal of Machine Learning Research.2003,3(1):1533-7928.[5] 劉攀.基于數據挖掘的航空公司客戶價值模型.華南理工大學,2010[6] 周桐. 基于PCA的人臉識別系統的設計與實現[D]. 哈爾濱工業大學自動化控制與設計系,2007.作者簡介:鄧黎妮(1989-)女,重慶人,助理工程師,研究方向:信息與通信工程