劉美 田大勇 王心安 張騰飛



【摘 ?要】根據航空公司運價的制定原理,利用現代計算機技術,結合國際慣例,以及實際的公務機票銷售數據,提出了大數據驅動下的公務機票運價監管平臺的整體架構設計,分析了監管平臺所包涵的主要模塊以及模塊之間的關系;探索了平臺對運價監管的方式,實現了方便公務旅客出行,規范了銷售公務機票的代理銷售行為,為節約國家財政資金,建設公務機票運價監管平臺提供了參考模型。
【關鍵詞】大數據;公務機票運價;監管平臺
一、引言
目前我國航空運輸市場存在兩類機票運價,一種是需旅客自己付費的普通運價,它包括公布運價和私有運價,公布運價分為公布的全價和折扣價,而私有運價也稱為特殊運價,只有符合特定條件的旅客才能購買,例如團體旅客;另一種是政府采購運價,簡稱GP運價,其主要為了滿足公務出行、處理公務的需求。根據財庫〔2014〕33號文件,國內航空公司按政府采購合同約定給予公務機票優惠。對于市場折扣機票,各航空公司按國內、國際機票各航班艙位的折扣票價給予9.5折優惠;對于市場全價機票,則分別給予全價票價的8.8折、8.5折優惠。它是在公布運價基礎上給予折扣的運價,它要比同一時段同一子艙位的普通運價要低。
然而,政府采購機票過程中,有購票人反饋政府采購渠道票價高于普通票價;或反饋無法購買到市場打折票等問題。同時由于航空客運票價的復雜性,具體包括銷售渠道的多樣性、子艙的復雜性等,國家清算中心對于政府采購運價的監管面臨監管的過程繁雜,難以全面實時監控、航空公司票價發布滯后和市場上出現了新的票價形式,很難實時識別真實價格等難題,導致其對公務機票采購的監管有限。因此,規范公務出差市場,建立公務機票運價監管平臺,監控違規銷售行為,切實為公務旅客提供和銷售低票價具有較強的現實意義。
二、構建公務機票運價監管平臺的理論基礎
民航業不是一個完全競爭的市場,政府對民航業的價格管理體系應該根據其定價的原理,利用現代計算機技術,結合國際慣例,進行的科學的監管,以發揮政府對市場的有效監管職能,進而避免財政資金的浪費[1]。
對政府采購機票運價進行監管,首先需要對關于航空公司運價的影響因素進行分析。眾多學者對運價組成進行了大量的定量研究,例如Borenstein(1989)[2]、Brueckner和Spiller(1992)[3]等通過回歸分析發現航空公司的運營投入、服務質量、航線網絡結構、航線距離影響航空公司機票的定價,肖俊極和唐昕(2009)發現航線特點、航空公司的品牌效應、航班特點均對民航機票價格折扣產生不同程度的影響[4]。
關于價格監管手段與方法,許多學者在其他領域進行了深入的探究,例如馮永晟等(2020)提出了一種動態響應機制,去識別哄抬價格行為,進而實現價格監管[5]。王星云(2020)認為引入大數據能夠推進價格監管制度優化,建立統一的價格信息數據庫,并在其基礎上開展價格信息公開、價格監測預測等大數據信息應用[6]。段琪斐等(2019)指出我國的電網監管制度應該以監管內容與監管時間為標準,同時引入強激勵機制和不確定調整機制[7]。
關于平臺之間產品價格比較的理論和實踐已經相當成熟,尤其在購物網站方面。邱磊(2012)設計了基于Web數據抽取的方法,通過集成各購物網站主頁的搜索功能,搜索用戶希望購買的商品,并將查詢到的結果進行比較并呈現給用戶的比價系統[8]。在對比機票價格方面,李祥儀(2016)基于開源的Heritrix和Lucene項目,設計并實現一款基于國內機票的比價系統,同時會給出用戶購票的跳轉鏈接[9]。
綜上所述,市場需求和競爭形勢是目前影響國內航空公司運價的主要因素。價格-需求之間的關系導致在不同季節、不同DOW(day of week)、甚至每一天的不同時刻機票的價格都是不相同的。對運價的監管應該基于運價的組成及其特點進行監管。同時,價格監管應順應智能化、網絡化的潮流,充分考慮網絡系統的安全性、靈活性和易維護性,借鑒其他領域在價格監管上成功事例,利用大數據、機器學習等方法推進價格監管平臺的優化,創新監管方式。
三、運價監管平臺的設計與實現方法
(一)系統目標與框架
運價系統,采用B/S架構,是一個較為全面的機票價格監管系統。用戶使用本系統可以獲得對機票運價進行和監管,與此同時,依據在運價監管過程中采集和存儲的海量運價數據,適時運用大數據分析、機器學習等技術,主動為公務人員在合理的時間范圍內提供性價比更高的公務機票(含返程機票智能推薦),提升公務出行人員的購票體驗。系統主要由兩大部分組成,第一部分是服務器端;第二部分是基于瀏覽器的客戶端。
1.服務器端
服務器端通過初始的設置條件確定URL種子,期間用戶可以根據需求設置相應的字段進行爬取相關的平臺機票信息儲存至數據庫中,形成外部運價數據源以及GP內部運價數據源。服務器還負責執行數據處理相關模塊、運價比對相關模塊,以及其他相關模塊。
2.客服端
監管人員查看并修改監管的規則以適應監督的需求。監管人員在Web頁面上打開相關的頁面,輸入新的約束性規則并確認。系統服務器在收到監管人員的請求后,更改爬取規則,進行數據收集。
監管人員通過瀏覽器查詢運價比對報告。在Web頁面上輸入相關的約束性條件,如:出發城市、達到城市、時間段等,然后進行提交。系統服務器在收到監管人員的請求后檢查索引和數據庫,為其返回相關的機票運價比對報告。
(二)系統的功能需求
系統的功能需求包含了Server端的功能、Client端的功能。
1.Server功能
系統采用B/S架構。Server功能主要為了實現以下需求功能:
(1)機票主題相關的搜索
系統的管理人員輸入初始的URL種子和爬取條件后,服務器通過網絡爬蟲可以抓取機票主題相關的數據。
(2)頁面解析與入庫
系統在網絡爬蟲抓取機票數據后,這些數據都是散落在Web頁面中的,Server端需要對頁面進行解析,去錯除重。最后把這些數據寫入不同的數據庫中,以便運價比對以及檢索。
(3)設置相關的運價比對規則
通過上述功能完成數據的爬取、入庫、索引建立后,系統管理員可以按照需求設置比對規則以進行運價比對。
(4)運價比對,并形成結果報告
根據管理員設置的規則進行運價比對,并形成相應的運價比對結果。
(5)緩存策略
系統在網絡爬蟲抓取機票數據過程儲存了大量的歷史信息,需要系統管理員按照需求設置緩存策略,以保證數據庫中有足夠的內存獲得新的數據,進行比對。
(6)面向客戶提供查詢
監管人員可以通過瀏覽器向服務器發送請求,設置相關的查詢規則,快速檢索相關的運價比對的結果。
(7)優化模塊
根據歷史數據監管的異常情況以及用戶的舉報信息對監管的航線、搜尋的時間、航空公司等條件做進一步的優化,以便更加精準的監管運價情況。
(8)預測模塊
采用機器學習、神經網絡等方法預測用戶查詢的機票價格在未來時間的變化趨勢。
2.Client端功能
系統采用的B/S架構,可以使用戶通過瀏覽器訪問Web服務器獲取所需數據,如圖1所示。主要有以下功能:
(1)基本的機票比價信息查詢
用戶可以通過輸入航空公司名稱、艙位、出發地、到達地的航線信息、出發日期等信息查詢運價的基本比對信息,具體流程功能如圖6所示。
(2)高級查詢
可以查詢未來一段時間的GP平臺上機票價格變化情況,什么時候最低,主動為公務人員在合理的時間范圍內提供性價比更高的公務機票(含返程機票智能推薦),提升公務出行人員的購票體驗。
(3)訂票接口跳轉
用戶在獲取到有用的機票信息,當想購買該機票時,可以點擊購買按鈕,系統會自動跳轉到該機票的發售站點,避免用戶再一次檢索。
(4)舉報功能
用戶可以根據實際經歷,在平臺上上傳外部運價低于內部運價的截屏,服務端接收信息,確認GP內部運價異常后,記錄儲存并發送該機票相關信息至優化模塊,加強精準監管。
(三)系統的關鍵業務流程
系統的關鍵業務流程主要由數據獲取流程、信息處理流程、監管流程以及監管優化流程組成,由數據獲取模塊、信息處理模塊、監管結果展示模塊等模塊完成,如下圖2所示。
1.數據獲取流程
為了實現系統的功能需求,首先需要確定目標站點以及根據需求設置抓取機票相關信息的規則,這被稱為系統的數據獲取,主要由數據獲取模塊完成。
目標數據的獲取主要是通過兩種方式,一種是通過爬蟲爬取目標站點所需的機票相關信息,然后儲存至數據庫進行配對比價,另一種方式是通過購買、資源置換或者是要求被監管的渠道提供的所需要的數據,比如可以向攜程、飛豬、航空公司等平臺購買或者資源置換,給與一定的政策支持后,可以要求對方提供所需要的數據。
系統的數據獲取流程具體步驟如圖3所示。首先,可以通過爬蟲的方式。在系統中輸入需要抓取機票數據的各個目標站點URL,然后設置爬取規則,例如設置爬取的航空公司、時間段、航線等。接著通過網絡爬蟲技術在目標頁面上進行原始數據的爬取。爬蟲爬取到的頁面原始數據需要按一定規則進行規范化,這稱為模板化原始數據,接著對模板化數據進行數據抽取,取得系統需要的數據如票價、航線、日期、報價站點等,儲存至數據庫。也可以通過購買、資源置換或者是要求被監管的渠道提供的所需要的數據存儲至數據庫,以待后續的使用。
2.信息處理流程
經過數據抓取后,數據庫中已存入了由不同站點提供的機票報價信息,但是,由于這些信息僅僅是對價格、航班、報價站點等內容的反映,不足以直接支撐系統需要實現的比價、預測等功能;另外一方面,可能存在數據重復、爬取不完整的情況,因此還需要對數據庫中的數據進行進一步的處理。
系統的信息處理流程如圖4所示。首先對數據庫中保存的抓取數據進行判斷,將重復信息或錯誤信息去除,這一步稱為數據清理;然后進行按照日期、航線、航空公司、艙位等信息匹配機票,進行運價的比較;最后通過一定的策略,對數據庫中的信息進行分析,得到各條航線在未來一段時間的報價趨勢,智能推薦給查詢人。
3.監管流程
采用被動和主動兩種方式進行運價監管。被動監管包括普通運價和特殊運價的機票。對普通機票的監管是指以公務機票出票、熱門航線查詢等行為節點或行為特征,作為觸發運價監管的觸發節點,被動啟動對市場上投放的同航線/航班/艙位相關的市場運價實時進行采集、轉換、存儲和比對,以增加運價監管的針對性和精確度。對特殊機票的監管是指在政府采購平臺上對團體機票或者特價機票在重點航線投放情況的監管,通過在購買的高峰時間階段性采集各平臺特殊機票的投放與否、投放數量以及投放價格的信息,儲存至數據庫進行比對,從而實現對特殊機票的被動監管。
主動監管為自動擴大或者縮小監管范圍。對于已經確定存在問題的航線/航班/艙位,根據學習的規則自動擴大監管范圍,例如加強對其他艙位的監管、同航線其他航班的監管、涉嫌航空公司的其他航線/航班/艙位的監管等。
同時,對數據庫中的運價比對信息進行匯總整理。對正常的結果,即GP內部運價低于外部運價,不進行長時間儲存,更新相關的航線、航空公司、起飛時間、航班等正常記錄次數。對于異常結果,即GP內部運價高于外部運價,長時間保存相關的信息,更新相關的航線、航空公司、起飛時間、航班等不正常記錄次數。然后把運價比對相關的信息傳遞給監管優化模塊,進行監管優化。最后,按照航線、航空公司、起飛時刻、艙位等劃分標準,進行監管結果報表不同細粒度度的輸出。輸出的報表應包含監管的樣本量、異常樣本比例,異常樣本特征分析等。
4.監管優化流程
根據歷史監管的結果以及用戶舉報信息,識別異常航班的特征,建立疑點航線/航班/艙位的實時監管列表,通過大數據分析、機器學習等方法預測下個周期可能出現的不合規機票信息并納入重點監管列表中,把被動觸發的方式切換為主動觸發,甚至全程跟蹤。
(四)系統的監管規則及實例分析
由于政府采購網站上所公布的票價種類繁多,涉及到不同日期、航線、航空公司、艙位,且監管平臺的監管能力有限,不能做到對所有類型票價的實時監管。為了使監管效果達到最優,以節約財政資金的政策初衷為目標,科學合理地篩選監管對象及分配監管力度。本文以監管2019年從北京出發的所有公務員購票記錄為例,確定重點監管航線、日期、航空公司以及艙位等規則。
1.監管流程
(1)確定重點監管的航線:各航線按照上一個監管周期內購買次數占總購買次數比重由高到低排列。選擇的航線為購買次數相對多,同時這些航線的累計購買次數占總體比重達到80%。接著按照航線的購買次數,確定相應的監管次數比重。以北京為出發地為例,累計購買次數占總體比重達到80%共有26條航線,如表1所示。然后按照其購買次數,確定相應的監管次數比重,例如北京-上海虹橋,分配監管次數為10.86%。
(2)確定不同月份監管權重:按照不同監管航線每月的購票記錄,確定不同月份的監管次數。以北京-成都為例,全年購票次數為14950次,一月份為762次,分配監管的次數比重為5.10%,如下表2所示。
(3)確定監管航空公司及艙位的權重:按照各航空公司艙位的購買次數占總購買次數比重由高到低排列,選擇購買次數多的航空公司及其對應的艙位,并使得選擇的航空公司艙位的累計購買次數占總體比重達到80%。以北京到成都航線為例,選擇的重點航空公司及其對應的艙位共14種情況,如下表3所示。
綜上,依據政府采購機票網站的購票流程,即輸入出行日期及出行起始城市后得到推薦的航班及艙位。首先將最大監管次數按照26條航線的公務出行購買比重進行分配,分別得到26條航線的監管比重;然后將26條航線的監管次數逐個按照月度購買次數的比重再次進行分配,分別得到每條航線每個月份的監管次數;最后將每條航線每個月份的監管力度均分到每個航司機器對應的艙位中。
參考文獻:
[1]沈毅.美國民航業價格規制改革經驗及啟示[J].商業時代,2006(14):82-83+92.
[2]Borenstein S. Hubs and high fares:dominance and market power in the U.S. airline industry. RAND Journal of Economics(RAND Journal of Economics). 20(3):344-365. 1989.
[3]Brueckner,J. K.,Dyer,N. J.,& Spiller,P. T.Fare determination in airline hub-and-spoke networks. RAND Journal of Economics(RAND Journal of Economics),23(3):309–333. 1992.
[4]肖俊極,唐昕.中國民航業價格競爭實證分析[J].南開經濟研究,2009(02):80-90.
[5]馮永晟,管世杰.重大突發事件下的哄抬價格與價格監管研究[J].價格月刊,2020(10):1-8.
[6]王星云.價格監管的大數據嵌入與工具優化[J].宏觀經濟管理,2020(02):66-72.
[7]段琪斐,吳珊,許光建.我國電網激勵性價格監管政策研究[J].經濟理論與經濟管理,2019(09):98-109.
[8]邱磊.基于Web的比價系統的研究與實現[D].復旦大學,2012.
[9]李祥儀.基于Heritrix和Lucene的國內機票比價系統的設計與實現[D].上海交通大學,2016