趙鴻鐸,馬魯寬,唐 龍,李 萌,杜 浩
(1.同濟大學 道路與交通工程教育部重點實驗室,上海 201804; 2.中國民航機場建設集團有限公司,北京 100101;3.上海機場(集團)有限公司虹橋國際機場公司,上海 200335; 4.上海同科交通科技有限公司,上海 200092)
目前,機場道面管理系統[1-5]在機場得到廣泛應用,其核心功能和最終目標是輔助機場管理人員制定合理的道面維護計劃.因此,準確有效的道面維護決策模型成為機場道面管理系統的核心要素.
美國聯邦航空管理局(Federal Aviation Administration,FAA)以道面狀況指數(pavement condition index,PCI)為指標,提出了機場道面全壽命分析方法[6].但該方法的正確性依賴于道面性能預估模型.因此,研究者提出了一系列的道面性能預估模型和對應決策方法[7-11].然而,機場道面維修決策涉及方面廣、影響因素多、現場狀況復雜,大部分決策模型的工程應用性并不強,在實際工程中,主要還是依據專家知識和工程經驗進行決策[12].但是,專家知識和工程經驗法的決策過程難以在計算機中表達和實現,而且決策的正確性過于依賴決策者的工程經驗和業務水平,主觀不確定性極強[13],難以滿足機場道面管理系統智能化輔助決策的要求.
近年來,隨著數據挖掘的發展,基于數據挖掘的專家知識系統廣泛應用于交通工程領域[14].特別是針對公路路面管理,研究者們利用數據挖掘對專家經驗進行分析,建立了多個專家知識系統[15-17].例如,Sarasua和Jia探索了將地理信息系統(GIS)技術與數據挖掘、專家系統集成用于路面管理[18];Soibelman和Kim討論了通過數據挖掘來構建工程建設過程中的決策知識[19];Zhou等[13]對美國北卡羅來納州公路管理系統中的歷史數據進行挖掘,建立了路面維修決策樹并結合地理空間信息進行了優化.但如何利用數據挖掘分析現有的機場道面維護決策數據進而輔助機場道面進行維護決策的相關研究還較少.
鑒于此,本研究基于我國民用機場水泥道面歷史決策數據,考慮道面維護決策的影響因素,分析確定了民用機場水泥道面維護決策的屬性,歸納了民用機場常用水泥道面維修措施,進而利用數據挖掘中的C5.0決策樹算法訓練了決策樹,從而建立了民用機場水泥道面維護輔助決策模型,并開展了評價和應用[20].
數據挖掘(data mining,DM)指從大量數據中搜索隱藏于其中有特殊關系的信息和知識的過程,是數據庫知識發現的核心[21-22],如圖1所示.利用數據挖掘,研究者可以從已積累的機場水泥道面維護決策歷史數據中發現有意義的新的關系、趨勢和模式,實現該過程的基本方法是回歸學習[13].回歸學習可從大量的經驗數據中歸納抽取出一般的規則和模式,其涉及的算法大部分來自于機器學習(machine learning,ML)領域[22].目前,在回歸學習中,最新的分類算法是C5.0決策樹算法.C5.0由C4.5改進而成,其分類的依據是信息增益(information gain),根據信息增益最大的字段對樣本數據進行分割,此外,為了提高分類精度,需要對決策樹各葉子進行裁剪或合并,最后確定各葉子的最佳閾值.與C4.5相比,C5.0在分類過程中增加了Boosting算法,使得結果更加準確[23].本研究采用的算法即C5.0決策樹算法.

圖1 數據挖掘-數據庫知識發現的核心步驟Fig.1 Data mining-the core steps of database knowledge discovery
自2002年起,同濟大學依據相關機場道面評價管理規范[24]對國內多個民用機場開展了道面檢測和評價工作.根據檢測和評價結果,機場場道管理部門制定并實施了對應的維護措施.匯總上述機場道面檢測、評價和維護措施歷史數據,并對其按屬性分類,形成結構化數據表,如圖2所示.本研究選取其中26個民用機場的356組有效的水泥道面相關數據作為維護決策數據源,其特征如圖3所示.圖中,數字為對應屬性值的數據量,矩形大小代表對應屬性值的占比.
從道面功能分區來看,數據源對應的道面涵蓋了跑道、平滑道、聯絡道、機坪4大類,基本呈現平均分布;從所屬機場來看,主要包括支線機場、干線機場和國際樞紐機場,按照飛行區等級劃分,4D和4E級機場較多;從使用情況來看,大部分道面使用年限在5~20年左右,年起降架次一般在1~20萬左右;從道面厚度來看,道面板厚度在32~40 cm,差異較小;從道面性能來看,道面整體性能較高,PCI等級以優為主,結構性能基本都滿足使用要求,只有極少數道面結構承載力不滿足通航要求.

圖2 水泥道面維護決策數據結構Fig.2 Data structure of cement pavements maintenance decision-making

圖3 水泥道面維護決策數據源的數據分布特征Fig.3 Data distribution characteristics of cement pavement maintenance decision-making data source
在工程應用中,民用機場道面維護決策的影響因素根據來源可分為道面性能客觀因素和管理需求主觀因素;根據維修決策的影響關系,又可分為直接影響因素和間接影響因素,具體如圖4所示.根據圖4影響因素的劃分,在民用機場道面維護決策過程中,涉及的變量屬性對應可分為道面性能屬性和管理需求屬性.

圖4 民用機場水泥道面維護決策主要影響因素Fig.4 Key influential factors of civil airport cement pavements maintenance decision-making
3.1.1道面性能屬性
根據道面性能客觀影響因素,水泥道面性能屬性主要包括道面損壞狀況、道面結構性能和使用性能.其中,評價道面損壞狀況的指標為PCI,表征道面結構性能的指標主要包括道面等級序號(pavement classification number,PCN)、板底脫空率、接縫傳荷能力、道面剩余壽命和結構適應性厚度,評價道面使用性能的指標包括道面抗滑性能和道面平整度.據此,利用356組歷史維護決策數據,分析上述道面性能屬性評價指標間的關系,以確定最終的維護決策所需考慮的道面性能屬性及其評價指標.
(1) 道面損壞狀況
在維護決策屬性中,道面損壞狀況是最主要的道面性能屬性.PCI檢測方法簡單,且能有效表征道面的損壞狀況,因而長期以來被國內外學者選定為道面維護決策的重要參數.因此,本研究選擇PCI作為維護決策道面性能屬性的評價指標之一.
分析356組歷史決策數據,PCI與道面結構性能和使用性能評價指標間的相關性結果如表1.由表1可知,相關系數均小于0.3,表明PCI與道面結構性能和使用性能評價指標間基本不存在相關性,即除道面損壞狀況外,維護決策中仍需考慮道面結構性能和使用性能.

表1 PCI與道面結構性能和使用性能指標間的相關性Tab.1 Relationships between PCI and pavement structure performance (and service performance) variables
(2) 道面結構性能
分析356組歷史決策數據,道面結構性能指標間的相關性結果如表2.其中,鑒于數據源中道面結構適應性厚度差異較小,本研究并未考慮道面結構適應性厚度.

表2 道面結構性能指標間的相關性Tab.2 Correlation of pavement structure performance variables
由表2分析結果可知,PCN與剩余壽命中度相關,板底脫空率和接縫傳荷能力中度相關.此外,數據源中PCN與板底脫空率分布較為均勻.因此,為了減少后續模型構建的冗余數據,加快計算速度,本研究增選PCN和板底脫空率作為維護決策屬性中道面結構性能的評價指標.
(3) 道面使用性能
工程實踐中,道面抗滑維修一般采用道面除膠,該措施相對比較固定,因此本研究在維護決策屬性選擇時并未采用抗滑性能.道面平整度直接關系到乘客舒適度,當道面平整度無法滿足使用要求時,工程中一般采用道面加鋪措施進行維護,該措施能恢復道面平整度,同時能適當提高結構承載力;但該措施成本高、工程規模大、延誤影響大,其必要性和時機選擇非常重要,因而在決策時需要慎重考慮.因此,本研究選用道面平整度來評價道面使用性能.
3.1.2管理需求屬性
根據圖4道面管理需求主觀因素,本研究將維護決策屬性中的管理需求屬性劃分為可用資金、許用延誤、期望效益和工程安全.鑒于數據源中管理需求主觀因素數據缺失,本研究以管理需求主觀因素中的間接因素為依據,對356組歷史維護決策數據進行歸類,同時結合工程需要給出了管理需求屬性等級,并提出了相應的等級劃分標準,結果見表3~6.

表3 可用資金等級及建議劃分標準Tab.3 Available funding and proposed criteria

表4 許用延誤等級及建議劃分標準Tab.4 Allowable delay and proposed criteria
分析356組歷史維護決策數據,最終歸納了8類民用機場常用水泥道面維護措施,結果如表7所示.

表5 期望效益等級及建議劃分標準Tab.5 Expected benefit and proposed criteria

表6 工程安全等級及建議劃分標準Tab.6 Engineering safety rating and proposed criteria

表7 民用機場水泥道面維護措施分類Tab.7 Classifications of civil airport cement pavements maintenance measures
根據歸納的8類民用機場常用水泥道面維修措施以及8種屬性指標,訓練維護決策樹的輸入數據如表8所示.基于356組歷史維護數據,利用數據挖掘軟件Clementine實現C5.0決策樹算法.首先,本研究通過Clementine軟件的樣本集分割功能,取數據源的80%即285組數據作為訓練集;此外,修剪純度的置信度取值為75%,并采用了全局修剪的方法;最終,生成的決策樹如圖5所示.

表8 訓練維護決策樹的輸入數據表Tab.8 Input data table for training the maintenance decision-making tree
對比傳統專家經驗決策樹,本研究生成的決策樹主要有以下特點:
(1) 傳統決策樹為了應用方便,一般較簡潔,分枝數量少;而該決策樹分枝較多,其優點是更適合復雜道面決策問題,更接近工程實際,且能借助計算機實現決策過程,分枝過多并不影響工程應用.
(2) 傳統決策樹往往一個屬性指標只出現在一個分枝結點上,即只作為一次分枝標準;而在該決策樹中,板底脫空率、PCI等屬性指標多次出現在各個分枝結點上,被多次作為分枝標準重復使用,每次分枝都是單獨的迭代算法,不受前一次分枝影響.因此這種算法更能提高模型決策準確度.
(3) 傳統決策樹是基于專家經驗給出的,是一種基于力學-經驗法的總結,因此不存在違背常識理解的問題;而該決策樹完全基于經驗法訓練生成,其形狀完全取決于樣本數據特征,因此會出現一些難以理解的分枝.例如“28<脫空率<49,PCI≤86”,期望效益等級是按機場管理者要求的期望效益順序排列的,而其分枝標準卻是等級B和等級A、C、D,這顯然不符合工程常識.

1日常養護;2日常養護+注意板底脫空;3針對性修復;4更換嵌縫料+注意脫空觀測;5注漿修復;6針對性修復+注漿修復;7限制運行;8加鋪圖5 民用機場水泥道面維護決策樹Fig.5 Maintenance decision-making tree of civil airport cement pavements
綜上所述,由數據挖掘獲得的決策樹能滿足實際工程的復雜問題要求,且生成的決策規則可以在計算機中直接應用,從而實現了道面智能化輔助決策的目標.但這種方法是完全基于樣本數據特征的經驗法,決策樹分類結果有反常識性錯誤,需要結合工程實際給予修正.
為了評價本研究構建的民用機場水泥道面維護輔助決策模型的準確性,選擇訓練集外的20%數據源即71組數據作為檢驗集,輸入數據類型與訓練集相同,如表8所示.利用圖5生成的決策規則預測決策措施,并與實際決策措施進行對比,最終結果如表9所示.從整體上看,共發生了10個與實際決策不同的結果,即模型決策的準確性達到85.9%.進一步分析發現,在10個不同的決策結果中,涉及日常養護和針對性修復措施的結果共8個,這是由日常養護和針對性修復措施在維護決策中比較難以區分造成的.另外,由于日常養護和針對性修復措施對機場運行影響較小,上述決策結果的差異是可以被允許的.因此,本研究構建的水泥道面維護決策模型具有較高的準確性和應用價值.

表9 本研究與機場管理部門決策結果對比Tab.9 Comparison of decision-making between proposed model and airport management department
決策樹是從機場管理部門的決策數據中挖掘知識,并用于道面維護決策的.因此,一般情況下本研究基于C5.0決策樹算法構建的決策模型能為道面決策提供技術上合理可行的維護措施.但隨著數據源的變化,該方法構建的決策樹會發生變化,進而會得到不同的決策模型.例如,在本研究中,決策模型的決策樹是基于356組歷史決策數據得到的,如果擴大數據源、改變訓練集比例或者改變修剪純度的置信度,則會得到不同的決策樹.因而,通過數據挖掘得到的決策樹并非是完全準確的,其結果還需要進一步地修正.但是,在道面維護決策中應用數據挖掘的方法,能夠極大地提升大面積道面維護決策的效率,進而縮短項目周期;同時,對于大規模的道面網絡,該方法可以避免較多的人工決策失誤;此外,該方法形成的維護決策規則可以在計算機中實現,這為道面智能化輔助決策提供了可行的方案.
選取上海浦東國際機場部分道面(見表10),對其年度維護計劃進行輔助決策分析.

表10 選取的上海浦東國際機場道面(2005年修建)Tab.10 Selected pavements of Shanghai Pudong International Airport
根據上海浦東國際機場道面管理系統數據庫中存儲的道面檢測數據,得到道面性能屬性指標值;由2017年的機場相關信息數據,依據管理需求等級及建議劃分標準,可得到對應的道面管理需求屬性;最終決策屬性值如表11所示.利用本研究維護決策模型得到維護措施,結果如表12所示.8個區域的PCI均在98~100之間,用現有的以PCI為決策指標的決策模型開展決策,其結果基本無差異;相反,本研究決策模型充分考慮了除PCI外的道面結構性能和使用性能以及管理需求,表12中的決策結果更加符合工程實際.
考慮到工程實際,該決策結果并非最終的道面維護措施,道面管理者需要結合現場和航班情況,進一步確定維修措施以及施工時間,并以此對決策樹模型的決策結果進行修正.

表12 上海浦東國際機場道面維護決策結果Tab.12 Maintenance decision-making results for selected pavements of Shanghai Pudong International Airport
本研究基于我國26個民用機場水泥道面的356組歷史決策數據,分析確定了4種道面性能屬性和4種管理需求屬性,同時歸納了8類民用機場常用水泥道面維護措施,并利用數據挖掘中的C5.0決策樹算法訓練了決策樹,從而建立了民用機場水泥道面維護輔助決策模型,并對模型開展了評價和應用,結論如下:
(1) PCI與道面結構性能和使用性能評價指標間基本不存在相關性,維護決策模型中需考慮道面結構性能和使用性能屬性.
(2) 對于維護決策屬性,推薦PCI、PCN、板底脫空率和平整度作為道面性能屬性評價指標;建議管理需求屬性選用可用資金、許用延誤、期望效益和工程安全.
(3) 與傳統專家經驗決策樹相比,基于數據挖掘生成的決策樹更適合復雜道面決策問題,決策結果更接近工程實際,且能在計算機中實現智能化輔助決策.
(4) 本研究構建的決策模型準確率達85.9%,與原有模型相比,其決策結果較為合理,工程應用性較強.
本研究將數據挖掘應用于民用機場水泥道面維護決策中,為智能化輔助決策提供了可借鑒的方案,但限于歷史決策數據和數據挖掘方法的不足,后續仍需在決策數據積累、數據挖掘方法選擇和優化上做進一步研究,以提高決策模型的廣泛適用性.