999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聚類與SVR的地區(qū)支線航空客運(yùn)市場需求預(yù)測

2019-12-05 08:35:54徐夢瑤趙鳴李洋安洋張友浩
智能計算機(jī)與應(yīng)用 2019年5期

徐夢瑤 趙鳴 李洋 安洋 張友浩

摘 要:針對支線航空客運(yùn)市場需求預(yù)測問題,某些地區(qū)(如海南)缺少足夠的歷史數(shù)據(jù),難以建立準(zhǔn)確的預(yù)測模型。本文提出基于聚類與支持向量機(jī)回歸(Support Vector Regression,SVR)預(yù)測此類地區(qū)航空客運(yùn)市場需求的方法。首先,基于中國各個地區(qū)支線航空客運(yùn)市場需求的分布比,找出與海南分布比相似的地區(qū),再應(yīng)用系統(tǒng)聚類法在這些地區(qū)中找出與海南聚為一類的地區(qū),作為類比地區(qū)。然后,選擇類比地區(qū)的數(shù)據(jù)樣本,通過K-fold 交叉驗(yàn)證(K-fold Cross Validation,K-CV)尋優(yōu)SVR 參數(shù),得到預(yù)測模型。最后,預(yù)測了2018~2020年海南支線航空客運(yùn)市場需求,從而為其建設(shè)支線機(jī)場提供一定的決策參考和可靠的理論依據(jù),具有一定的現(xiàn)實(shí)意義和應(yīng)用價值。

關(guān)鍵詞: 支線航空;客運(yùn)市場需求;預(yù)測;系統(tǒng)聚類;SVR

【Abstract】 For predicting the market demand of regional air transportation for passengers, some regions (such as Hainan) lack enough available data to establish accurate prediction models. This paper proposes a method based on Clustering and Support Vector Regression (SVR) to predict the market demand of air transportation for passengers in such regions. Firstly, the paper finds the similar regions to Hainan in distribution ratio of the market demand, then compares Hainan with these regions which were clustered together. Secondly, the paper selects the data samples of the similar regions and forms a prediction model after getting the SVR parameters by K-fold Cross Validation (K-CV). Finally, the paper predicts the market demand of Hainan air transportation for passengers from 2018 to 2020. The results could provide theoretical support and guidance for constructing new regional airports, which is realistic and practical value to some extent.

【Key words】 ?regional aviation; passenger market demand; prediction; hierarchical cluster; SVR

0 引 言

中國民航局的相關(guān)資料顯示,從2011~2016 年,國內(nèi)支線航線網(wǎng)絡(luò)增加了27%,運(yùn)力增加了116%。預(yù)計到2020 年,支線航空客運(yùn)量將會突破1 億人次,其發(fā)展速度約為干線航空的兩倍[1]。國內(nèi)支線機(jī)場在綜合交通運(yùn)輸體系中發(fā)揮著越來越大的作用,因而為了抓住擴(kuò)建支

線機(jī)場數(shù)量的最佳有利時機(jī),并減少支線機(jī)場建設(shè)的盲目性,即需對地區(qū)支線航空客運(yùn)市場需求做出預(yù)測,提高針對性,同時也將對地區(qū)的支線機(jī)場建設(shè)和實(shí)際生產(chǎn)有著積極的指導(dǎo)意義。但是對于某些地區(qū),如果支線機(jī)場通航時間較短,幾乎無可用的歷史數(shù)據(jù),就使得支線航

空客運(yùn)市場需求的預(yù)測研究受到了一定的阻礙。

眾多學(xué)者已經(jīng)對這種缺少歷史數(shù)據(jù)支撐的客貨運(yùn)需求預(yù)測問題展開了大量研究。張娜等人[2]提出了先通過快速聚類找出與新建機(jī)場相似的機(jī)場,再利用相似機(jī)場的航空分擔(dān)率來預(yù)測新建機(jī)場客運(yùn)量的方法。悅慧等人[3]運(yùn)用動態(tài)聚類法找出與新建機(jī)場屬于同類的機(jī)場,基于同類機(jī)場的歷史數(shù)據(jù)構(gòu)建多元回歸模型,從而預(yù)測新建機(jī)場的客運(yùn)量。但由于航空客運(yùn)需求預(yù)測所受噪聲和影響因素較多,并且各因素對支線航空客運(yùn)市場需求的影響程度也不盡相同,這使得支線航空客運(yùn)市場需求預(yù)測具有高度非線性的特點(diǎn)。故簡單的多元線性回歸模型已經(jīng)不能滿足預(yù)測需求。羅建鋒等人[4]將機(jī)器學(xué)習(xí)的方法運(yùn)用在新建機(jī)場貨郵量預(yù)測上,即先利用相近周邊機(jī)場航空貨運(yùn)量占社會總貨運(yùn)量的比例關(guān)系,并結(jié)合本地區(qū)GDP與航空貨運(yùn)量、旅客吞吐量與航空貨郵量的比例關(guān)系進(jìn)行校核,從而擬合出新建機(jī)場航空貨郵量的歷史數(shù)據(jù),再將歷史數(shù)據(jù)帶入BP神經(jīng)網(wǎng)絡(luò),預(yù)測新建機(jī)場的貨郵量。BP神經(jīng)網(wǎng)絡(luò)方法雖然能很好地處理非線性問題,但對于航空客運(yùn)量預(yù)測這種影響因素較多且樣本量較小的預(yù)測問題仍具有較大局限性,其預(yù)測出的精度較低[5]。

支持向量機(jī)(Support Vector Machine,SVM)是VAPNIK提出的一種建立在統(tǒng)計學(xué)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小化原理基礎(chǔ)上的機(jī)器學(xué)習(xí)方法[6]。支持向量機(jī)回歸(Support Vector Regression, SVR)是由SVM 衍生得到的,在解決小樣本、非線性、高維度問題中顯示出了絕對的優(yōu)勢[7-8]。在SVR的應(yīng)用過程中,懲罰參數(shù)C與核函數(shù)參數(shù)g的選取對預(yù)測結(jié)果的影響很大,如何選取合適的參數(shù)成為問題的關(guān)鍵。趙靜等人[9]采用了K-fold交叉驗(yàn)證(K-fold Cross Validation,K-CV)模型選擇最優(yōu)參數(shù),提高了預(yù)測的精度。在前述研究的基礎(chǔ)上,本文提出基于聚類與SVR預(yù)測支線航空客運(yùn)市場需求的研究設(shè)計。

1 支持向量機(jī)回歸(SVR)的基本原理

2 海南支線航空客運(yùn)市場需求分析

2.1 研究方法與思路

本文對支線機(jī)場的界定需要滿足2 個條件,對此可闡述為:

(1)年旅客吞吐量占全國旅客總吞吐量的比例小于0.2%。

(2) 機(jī)場處于非國家中心城市、非省會城市,屬于非樞紐性機(jī)場[11]。

海南地區(qū)的支線機(jī)場現(xiàn)有瓊海博鰲機(jī)場和三沙永興機(jī)場,2 個支線機(jī)場都是2016 年通航,通航時間短,且缺乏歷史數(shù)據(jù)。對數(shù)據(jù)樣本缺乏或較少的通航地區(qū),如海南的支線航空客運(yùn)市場需求預(yù)測就轉(zhuǎn)化為對旅客吞吐量的預(yù)測,以整體把握該地區(qū)支線航空客運(yùn)市場未來的發(fā)展趨勢。

本文研究思路是:首先,基于全國和各地區(qū)支線機(jī)場旅客吞吐量,提出各個地區(qū)支線航空客運(yùn)市場需求的分布比。接著找出與海南分布比相似的地區(qū),再應(yīng)用系統(tǒng)聚類法在這些地區(qū)中求出與海南聚為一類的地區(qū),作為類比地區(qū)。然后,將選定地區(qū)的歷史值作為訓(xùn)練數(shù)據(jù),代入SVR 預(yù)測模型,通過K-CV 尋優(yōu)SVR 參數(shù),確定預(yù)測模型。最后,對海南的支線航空旅客吞吐量進(jìn)行預(yù)測,為其建設(shè)支線機(jī)場提供一定的決策參考。本文的技術(shù)研發(fā)路線如圖1所示。

2.2 類比地區(qū)的選擇

2.2.1 地區(qū)支線航空客運(yùn)市場需求分布比

中國幅員遼闊、地形地貌差異較大,不同的地域條件導(dǎo)致了中國支線機(jī)場分布的不均衡,也影響著機(jī)場旅客吞吐量。本文引入分布比的概念[12],定義了某地區(qū)支線航空客運(yùn)市場需求分布,即某地區(qū)支線機(jī)場旅客吞吐量與全國支線機(jī)場旅客吞吐量的比值。研究推得其數(shù)學(xué)公式可寫為:

γ=T地區(qū)T全國×100%.(6)

其中,γ 表示某地區(qū)支線航空客運(yùn)市場需求分布比; T地區(qū)表示某地區(qū)支線機(jī)場旅客吞吐量,單位為:人; T全國表示全國支線機(jī)場旅客吞吐量,單位為:人。

中國各個地區(qū)支線航空客運(yùn)市場需求分布比如圖2 所示。海南位于國內(nèi)中南地區(qū),由圖2可知,中南地區(qū)與西南地區(qū)的支線航空客運(yùn)需求基本處于相同水平,都在10%~23%之間。故從這2 個地區(qū)中選取貴州、四川、西藏、云南、重慶、廣東、廣西、海南、河南、湖北、湖南11 個省份作為類比樣本。

2.2.2 分布比相似地區(qū)的系統(tǒng)聚類

從影響支線航空客運(yùn)需求的人口、地區(qū)經(jīng)濟(jì)發(fā)展情況的角度來考慮,選擇人口密度、人均GDP、城鎮(zhèn)居民人均可支配收入、城鎮(zhèn)居民人均消費(fèi)支出4 個指標(biāo)作為聚類的評價指標(biāo)。選取2008~2017 年各地區(qū)指標(biāo)值的平均值作為樣本數(shù)據(jù)。用系統(tǒng)聚類法對樣本數(shù)據(jù)進(jìn)行聚類。由此得到的分布比相似地區(qū)的聚類樹圖即如圖3 所示。

由圖3可知,海南、廣西、四川聚為一類。由于廣西與海南同屬于中南地區(qū),且廣西與海南地理位置靠近,與海南的人口密度、人均GDP、城鎮(zhèn)居民人均可支配收入、城鎮(zhèn)居民人均消費(fèi)支出也非常相近。故最終選擇廣西作為海南的類比地區(qū)。

3 基于SVR的模型構(gòu)建與預(yù)測

3.1 模型構(gòu)建

因海南與廣西同屬一類,且廣西數(shù)據(jù)充足,將廣西的人口密度、人均GDP、城鎮(zhèn)居民人均可支配收入、城鎮(zhèn)居民人均消費(fèi)支出4組數(shù)據(jù)作為輸入特征值,年旅客吞吐總量作為輸出特征值。選擇廣西2008~2016年的9組數(shù)據(jù)作為SVR模型的訓(xùn)練樣本,2017年數(shù)據(jù)作為測試樣本。研發(fā)設(shè)計步驟可剖析分述如下。

(1)用Matlab中的mapminmax函數(shù)來對10組樣本數(shù)據(jù)進(jìn)行歸一化處理,防止特征值范圍過大或過小,影響模型的精確度。其中,歸一化的范圍為[-1,1]。

(2)選擇SVM的類型為ε-SVR,核函數(shù)選取精度較高的RBF函數(shù)[13-14]。設(shè)置ε-SVR中的損失函數(shù)p的值為0.1。

(3)采用K-CV(V=5,即將測試集分為5部分進(jìn)行交叉驗(yàn)證)的參數(shù)優(yōu)化方法選擇一組最優(yōu)參數(shù)(C=1 024,g=0.001 381 1),如圖4所示。

(4)將最佳參數(shù)(C,g)和訓(xùn)練樣本代入SVR中,并得到精度較高的SVR模型(MSE=0.007 745 6,R2=0.977 4)。運(yùn)行結(jié)果詳見圖5。

(5)基于測試樣本,對此模型進(jìn)行精度比較,并與多元線性回歸模型進(jìn)行對比,運(yùn)算對比結(jié)果見表1。

表1中展示了廣西樣本數(shù)據(jù)分別在SVR(RBF 核函數(shù))模型與多元線性回歸模型下的預(yù)測精度,由誤差平均值可以看出SVR(RBF 核函數(shù))模型的預(yù)測準(zhǔn)確率高于多元線性回歸模型,這也說明了SVR 模型在解決小樣本、非線性問題上占有優(yōu)勢。

3.2 海南支線航空旅客吞吐量預(yù)測

因缺少2018~2020 年份影響海南支線航空客運(yùn)市場需求因素的統(tǒng)計數(shù)據(jù),將根據(jù)2008~2017年海南省支線航空客運(yùn)市場需求影響因素統(tǒng)計數(shù)據(jù),建立海南地區(qū)支線航空客運(yùn)市場影響因素與年份間的一元線性關(guān)系,預(yù)測2018~2020 年影響因素的指標(biāo)值,運(yùn)算預(yù)測結(jié)果見表2。

將表2 中海南支線航空旅客吞吐量影響因素預(yù)測值作為輸入特征值,即可得到海南旅客吞吐量的輸出預(yù)測值,詳見表3。表3 表明了在已確定的SVR(RBF 核函數(shù))模型下海南2018~2020年支線航空旅客吞吐量預(yù)測值。

4 結(jié)束語

針對某些地區(qū)(如海南)缺少足夠的歷史數(shù)據(jù),難以建立航空客運(yùn)市場需求預(yù)測模型的問題,本文提出基于聚類與SVR預(yù)測支線航空客運(yùn)市場需求的方法。根據(jù)類比法的思想,首先,選取與海南地區(qū)機(jī)場旅客吞吐量分布比相似的地區(qū)(如貴州、四川、西藏等)進(jìn)行系統(tǒng)聚類,找出類比地區(qū)(廣西)。然后,選擇廣西省2008~2017年的數(shù)據(jù)樣本,通過K-CV尋優(yōu)SVR參數(shù)(C=1 024,g=0.001 381 1),得到預(yù)測模型。將此模型與多元線性回歸預(yù)測方法進(jìn)行精度比較,證明SVR (RBF核函數(shù))預(yù)測模型具有更好的預(yù)測效果。基于此模型,預(yù)測了2018~2020年海南支線航空旅客吞吐量,從而為其建設(shè)支線機(jī)場提供一定的決策參考和可靠的理論依據(jù),具有一定的現(xiàn)實(shí)意義和應(yīng)用價值。

參考文獻(xiàn)

[1]張一琛.支線航企如何"叫好又叫座"[J].大飛機(jī),2017(3):28-31.

[2]張娜,安然.基于快速聚類分析的航空分擔(dān)率模型在新建機(jī)場客運(yùn)量預(yù)測中的應(yīng)用[J].交通與計算機(jī),2008,26(4):116-119.

[3]悅慧,安然.多元回歸模型在新建機(jī)場客運(yùn)量預(yù)測中的應(yīng)用研究-基于動態(tài)聚類分析[J].現(xiàn)代商貿(mào)工業(yè),2010,22(20):13-15.

[4]羅建鋒,周凌云,李偉.基于BP神經(jīng)網(wǎng)絡(luò)的新建支線機(jī)場貨郵量綜合預(yù)測[J].江蘇商論,2012(2):47-49.

[5]曾鳴,林磊,程文明.基于LIBSVM和時間序列的區(qū)域貨運(yùn)量預(yù)測研究[J].計算機(jī)工程與應(yīng)用,2013,49(21):6-10.

[6]VAPNIK V N. The nature of statistical learning theory[M]. New York: Springer, 2000.

[7]ABDI M J, GIVEKI D. Automatic detection of erythemato-squamous diseases using PSO-SVM based on association rules[J]. Engineering Applications of Artificial Intelligence, 2013 , 26(1):603-608.

[8]LIU Zhiwen, CAO Hongrui, CHEN Xuefeng, et al. Multi-fault classification based on wavelet SVM with PSO algorithm to analyze vibration signals from rolling element bearings[J]. Neurocomputing, 2013,99:399-410.

[9]趙靜,王選倉,丁龍亭,等.基于灰色關(guān)聯(lián)度分析和支持向量機(jī)回歸的瀝青路面使用性能預(yù)測[J].重慶大學(xué)學(xué)報,2019,42(4):72-81.

[10]張文雅,范雨強(qiáng),韓華,等.基于交叉驗(yàn)證網(wǎng)格尋優(yōu)支持向量機(jī)的產(chǎn)品銷售預(yù)測[J].計算機(jī)系統(tǒng)應(yīng)用,2019,28(5):1-9.

[11]李飛行,宋一鑫,張權(quán).我國支線機(jī)場現(xiàn)狀分析及對策研究[J].交通運(yùn)輸研究,2018,4(4):61-68.

[12]周明妮. 新建支線機(jī)場通航可行性論證方法研究[D]. 西安:長安大學(xué),2011.

[13]AYDIN I, KARAKOSE M, AKIN E. A multi-objective artificial immune algorithm for parameter optimization in support vector machine[J]. Applied Soft Computing, 2011, 11(1):120-129.

[14]de CASTRO L N, von ZUBEN F J. Learning and optimization using the clonal selection principle[J]. IEEE Transactions on Evolutionary Computation, 2002,6(3): 239-251.

主站蜘蛛池模板: 91探花国产综合在线精品| 97成人在线视频| 四虎综合网| 日韩欧美国产三级| 国产麻豆永久视频| 国内精品视频在线| 亚洲三级成人| 欧美第九页| 国产手机在线ΑⅤ片无码观看| 2020国产精品视频| 久久综合一个色综合网| 国产SUV精品一区二区| 亚洲免费三区| 亚洲无码高清视频在线观看 | 国产黄色免费看| 国产美女免费| 国产男女免费完整版视频| 日韩精品久久久久久久电影蜜臀| 色久综合在线| 91精品最新国内在线播放| 亚洲中文字幕97久久精品少妇| 青青热久麻豆精品视频在线观看| 国产免费高清无需播放器| 色综合久久88色综合天天提莫 | 999国产精品永久免费视频精品久久| 尤物国产在线| 蜜芽国产尤物av尤物在线看| 综合色88| 亚洲精品国产综合99| 欧美日韩第二页| 啪啪国产视频| 国产精品免费入口视频| 亚洲欧美在线精品一区二区| 国产最新无码专区在线| 亚洲伦理一区二区| jizz国产在线| 一级毛片不卡片免费观看| 婷婷色中文网| 亚洲第一在线播放| 67194成是人免费无码| 丁香婷婷激情综合激情| 国产精品无码一二三视频| 国产一级在线观看www色 | 国产91导航| 国产成人精品三级| 久久这里只精品国产99热8| 亚洲浓毛av| 就去吻亚洲精品国产欧美| 在线毛片免费| 在线观看91香蕉国产免费| 亚洲av无码成人专区| 色呦呦手机在线精品| 欧美国产综合视频| 毛片在线播放网址| 老司机午夜精品网站在线观看| 国产女同自拍视频| 国产乱人免费视频| 国产xx在线观看| 被公侵犯人妻少妇一区二区三区| 波多野结衣在线一区二区| 欧美中文字幕第一页线路一| 亚洲成在线观看| 91精品国产自产在线老师啪l| 亚洲国产成人综合精品2020| 国产激爽大片高清在线观看| 国产91丝袜在线观看| 二级特黄绝大片免费视频大片| 日韩av在线直播| 欧美97色| 免费又爽又刺激高潮网址 | 免费毛片a| 一级香蕉人体视频| 亚洲精品自产拍在线观看APP| 免费A级毛片无码无遮挡| 欧美一区日韩一区中文字幕页| 久久综合色天堂av| 亚洲区第一页| 久久夜色精品国产嚕嚕亚洲av| 国产精品99久久久| 亚洲人成网站在线观看播放不卡| 国模在线视频一区二区三区| 欧美日韩一区二区三区四区在线观看 |