單晶晶,吳建軍,張晨,趙芳霞
(1.北京交通大學交通運輸學院,北京 100044;2.中國民航科學技術研究院,北京 100028)
經濟全球化推動著我國民航運輸業的不斷發展,同時,飛行安全問題也日益引起人們的關注。最近發生的MH370事件,在全球引起了對飛行事故的恐慌。目前我國在航空安全管理上與國際先進水平還有相當的差距,如何提高航空公司的安全服務水平,最大程度地降低事故率,是國內外人士都非常關心的問題[1]。民航事故的類型是錯綜復雜的,導致民航事故發生的因素也具有多樣性,但這并不表示導致空難事故發生的原因無跡可尋。對產生風險事故的風險因素做好科學的分析和預測,是保障人民生命財產安全以及推動航空業可持續發展的關鍵問題。
針對民航風險事故,國內外學者已經做了許多研究工作。2000年,Milan提出了風險、安全及其評價的基本概念和定義,依據總體行業指標和事故死亡率描述了造成飛機事故的主要原因是由于飛行器的過度使用及老化,并提出了一種量化風險和事故的方法[2]。Zhou等[3]構建了一個灰色關聯模型來分析民航不安全事件的各種誘發因素。Knecht[4]通過分析飛行員總的飛行小時數之間的關系,采用連續非線性模型預測了飛行事故發生率。Wong等[5]在分析了能見度、溫度和推動力等因素比例的基礎上進行了差異檢驗,并對事故的不同級別進行了風險量化。Gong等[6]提出了一種名為事故數的集成分析方法來識別重要的人為因素。國內學者王衍洋等[7]參考美國聯邦航空局的單一安全指數的計算方法,通過計算行業運行事故、事故征候、不安全事件的發生頻率及后果嚴重程度(死亡人數和受傷人數、直接經濟損失等),建立了一個新的安全指數評估模型。姚前、成媛等[8-10]綜合考慮了機場安全的影響因素,從行為人、機務、環境及組織管理4個影響機場安全的角度入手,構建了機場安全預警評價指標體系,并應用層次分析和模糊綜合評價方法進行分析,建立了民航企業不安全事件風險評估方法。金迪[11]運用灰色預測模型對不安全事件發生的可能性進行了預測,建立了安全風險的分析和評價模型,運用SHEL模型找出安全風險中所存在的危險源,通過運用計數抽檢程序、風險矩陣評價法和風險值評價法為風險控制措施的制定提供了依據。
對于民航業出現的各種風險因素,國內外學者從不同的角度進行了研究,并建立了相應的風險事故評價與預測模型。但以往的計算研究方法數據調查復雜性高、時效性低、可信度較低、模型計算復雜且精確度較低,已經不能滿足現實的要求。目前亟需一種分析簡單、數據獲取較為容易且實用性強的分析預測方法,為民航安全管理和決策提供參考依據。支持向量機(support vector machine,SVM)和徑向基(radical basis function,RBF)神經網絡模型的預測功能已經成功地應用在房地產價格、股票以及水華問題預測等許多方面,但在民航事故的預測方面尚未得到應用。本文在綜合參考現存各類研究成果的基礎上,采用了同比和環比加權組合的預測方法,此方法在預測中國消費價格指數[12](CPI)方面已被證明有較好的預測效果。在保證預測結果可行性與有效性的基礎上,本文建立了基于同比和環比的SVM和RBF神經網絡加權組合預測模型。
數據挖掘最重要的是數據源的科學性與合理性,本文所使用的數據均來自于北京市民航不安全事件研究所對全國民航歷年發生的不安全事件的統計。由于設備、技術等原因,早期記錄的數據出現部分的遺漏或者缺失,在可信度方面稍差。為了研究分析的準確性,我們選取分析的數據為2002年2月至2014年2月間的不安全事件,并對2014年2月和4月引起不安全事件的原因和飛行階段進行了短期預測。引起不安全事件原因和飛行階段所包含的因素可參見表1~2。
為提高預測準確率,本文將收集到的數據分為兩部分,并建立SVM和RBF神經網絡模型分別進行預測。
數據1:2002年2月至2012年2月間每年2月的數據作為同比基數,建立SVM預測模型,對2014年2月的事故進行同比預測;2013年1月至2014年1月這段時間中每月發生的事故數量作為環比基數,建立RBF神經網絡預測模型,對2014年2月事故進行環比預測。
數據2:2002年4月至2012年4月間每年4月的數據和2013年1月至2014年2月的數據對2014年4月發生的不安全事件進行預測。
鑒于單一預測模型在預測問題上存在的可靠性問題,本文應用一種組合預測模型——SVM和RBF神經網絡混合預測模型[13]。該模型能夠組合各單一模型的優點,進一步提高預測精度,為民航不安全事件的預測提供依據。
對數據1中的兩部分數據分別建立SVM和RBF神經網絡預測模型,將其預測結果分別加權求和作為最后的預測結果,即Yf=αY0+(1-α)Yp。其中Y0表示同比的預測結果,Yp表示環比的預測結果,Yf表示最后的預測結果,α表示權重,預測過程見圖1。

圖1 模型預測過程Fig.1 Prediction process of a model
SVM是Cortes等于1995年首先提出的,在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢,在函數擬合等其他機器學習問題中得到廣泛應用。SVM方法建立在結構風險最小化原理的基礎上,根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以期獲得最好的推廣能力[14]。根據SVM的以上特點,在前人研究的基礎上,本文采用了一種基于SVM的同比預測模型。
對不安全事故發生頻數的時間序列{X1,X2,X3,…,Xn}建模,其中前m個數據作為訓練樣本及進行參數估計,其余的數據用來驗證模型的有效性。輸入變量即為原因變量和飛行階段變量,輸出變量為不同事件類型對應的事故數量。在預測過程中,核函數選用高斯函數,參數設定分別為c=100(拉格朗日乘子上界)和ε=0.01(不敏感損失函數的參數),將訓練好的模型對未來民航不安全事件進行預測。
RBF神經網絡是一種性能良好的前饋型人工神經網絡,能夠逼近任意的非線性函數,具有良好的泛化能力,結構簡單,并有很快的學習收斂速度,已成功應用于非線性函數逼近、時間序列分析和系統建模等方面。網絡由輸入層、隱含層和輸出層組成,隱含層采用徑向基函數作為激勵函數[15]。網絡的輸入為(X1,X2,…,Xn),X1,X2,…,Xn代表不同類型的事故數量,是單變量時間序列輸入,中間層取20個神經元,輸出為(Y1,Y2…,Yn),即預測的對應類型的事故數量。對應輸入 Xi的實際輸出為:Y(Xi)= Σ wijφ(Xi,ti),其中φ(Xi,ti)為第i個隱單元的輸出ti為基函數的中心,徑向基函數wij為第j個隱含層到輸出層之間的權重。網絡的單層拓撲結構見圖2。
重復訓練網絡直到滿足誤差要求,將訓練好的網絡用于環比預測,能夠有效提高預測的精度。
(1)將2014年2月份的真實數據與模型預測值進行比較,考察模型的預測準確性。
(2)為了評價模型的預測性能,采用均方根誤差(root mean square error,RMSE)對預測效果進行評估,考察模型的逼近能力。其中xj表示預測值,n表示樣本的數量。

文中通過采用SVM、RBF神經網絡預測以及二者的組合預測結果的RMSE作對比,來考察組合模型的預測能力。
本文采用SVM和RBF神經網絡算法分別預測了2014年2月由不同事件原因及飛行階段引起的不安全事件的數量??紤]到實際情況中環比時間同預測時間非常接近,必然對預測的最后結果影響較大,因此設定環比預測的權重α=0.6,同比預測權重為1-α=0.4,預測結果如表1~2所示。

表1 2014年2月事件原因事故數量的預測結果Table 1 The Prediction result of accident causes in Feb.2014

表2 2014年2月飛行階段事故數量的預測結果Table 2 The prediction result of flight stages in Feb.2014
從表1~2中可以看出,模型預測結果與真實結果很接近,雖然有些局部的同比和環比預測數據同真實值也較近似,但從整體的預測趨勢來看,組合預測模型存在較大的優勢,說明在允許的誤差范圍內,這種預測方法是行之有效的。
圖3給出了由SVM、RBF神經網絡模型及組合模型預測結果的RMSE。

圖3 3種預測方法誤差對比圖Fig.3 Error comparison chart of three prediction methods
由圖3可見,組合模型都較單項預測模型進一步縮小了誤差,說明該組合預測方法明顯優于任一單項預測方法,對預測不安全事件的數量是行之有效的。
通過訓練好的模型2002至2012年間每年4月份的數據和2013年1月至2014年2月這段時間中每月發生的事故數量對2014年4月份進行了預測。事件原因及飛行階段系數數量預測結果見表3~4。

表3 2014年4月事件原因事故數量的預測結果Table 3 The prediction result of accident causes in Apr.2014

表4 2014年4月飛行階段事故數量的預測結果Table 4 The prediction result of flight stages in Apr.2014
對民航系統進行安全管理的核心之一就是對系統中存在的風險進行預測,以便找出對系統安全有影響的頻發事件,分析其可能導致的后果,制定出消除和控制危險的措施,防止或減輕災害對人與財產造成的損失。本文采用SVM和RBF神經網絡組合預測模型對民航不安全事件進行了預測,并將預測結果同真實值進行了比較,表明在允許的誤差范圍內,預測結果是較為精確的。此外還將3種預測方法的均方根誤差進行了對比,證明了有效性,同時提高預測的精度。使用訓練好的模型對2014年4月份的不安全事件進行預測,結果表明該研究對民航的風險管理具有很好的推廣性,為以后民航不安全事件的分析與預防奠定了理論基礎。但是組合模型的預測對小樣本數據是否同樣具有精確性,還需要做進一步的研究。
[1]劉剛.機場安全風險識別和評價預警問題研究[D].江蘇:南京航空航天大學,2008.
[2]NETJASOV F,JANIC M.A review of research on risk and safety modelling in civil aviation[J].Journal of Air Transport Management,2008,14(4):213 -220.
[3]ZHOU C C,HU D D.Research on inducement to accident/incident of civil aviation in southwest of China based on grey incidence analysis[J].Procedia Engineering,2012,45:942 -949.
[4]KNECHT W R.The“killing zone”revisited:Serial nonlinearities predict general aviation accident rates from pilot total flight hours[J].Accident Analysis& Prevention,2013,60:50-56.
[5]WONG D K Y,PITFIELD D E,CAVES R E,et al.Quantifying and characterising aviation accident risk factors[J].Journal of Air Transport Management,2006,12(6):352 -357.
[6]GONG L,ZHANG S,TANG P,et al.An integrated graphic-taxonomic-associative approach to analyze human factors in aviation accidents[J].Chinese Journal of Aeronautics,2014,27(2):226 -240.
[7]王衍洋,李敬,曹義華.中國民航安全評價方法研究[J].中國安全生產科學技術,2008,4(5):111-113.
[8]姚前.民航機場安全預警評價體系研究[J].交通標準化,2009(15):198-201.
[9]成媛.民用機場安全風險評估模式研究[D].天津:中國民航大學,2006.
[10]曾亮.多層次模糊評估法在民航不安全事件風險評估中的應用[J].中國安全科學學報,2008,18(1):131-138.
[11]金迪.航空公司運行不安全事件安全風險管理方法研究[D].上海:上海交通大學,2013.
[12]張健.SARIMA模型在預測中國 CPI中的應用[J].統計與決策,2011(5):28-30.
[13]徐富強,謝如龍,郝江鋒.基于神經網絡與SVM的組合預測模型——以房地產價格預測為例[J].巢湖學院學報,2012,14(6):1-7.
[14]李元誠,方廷健,于爾鏗.短期負荷預測的SVM方法研究[J].中國電機工程學報,2003,23(6):55-59.
[15]李曦,王青,萬云輝,等.基于 RBF神經網絡預測模型及其應用研究[J].泰山學院學報,2008(3):118-120.