席殷飛,劉鐘鍇,楊佩云,郁 燁,張 奇,劉志遠
(東南大學交通學院,南京211189)
在當今移動互聯網的信息時代,智慧交通的發展給人們的生活帶來了巨大的便捷,大大改變了人們的出行習慣.以手機APP為主要服務平臺的新業態的網約車(Internet private hire vehicles,IPHV)出行方式逐漸滲透入城市傳統巡游式出租車服務市場,該新型商業服務模式為具有出行需求的用戶和具有出行服務資格的駕駛員提供了雙向信息溝通,通過整合供需信息在出行用戶與司機/車輛之間實現合理匹配,并提供有保障的出行乘車服務[1].就國內的出行服務市場而言,國家層面的相關部門也相繼制定了一系列的要求與政策.2017年9月,交通運輸部印發了《智慧交通讓出行更便捷行動方案(2017—2020年)》,以推動企業為主體的智慧交通出行信息服務體系建設,促進“互聯網+”便捷交通發展;2019年9月,中共中央、國務院正式印發《交通強國建設綱要》,明確提出要大力發展智慧交通,推動大數據、互聯網、人工智能等新技術與交通行業深度融合.
在移動互聯網快速發展大背景之下興起的網約車,按其具體運營類型可分為網約快車、網約出租車、網約順風車等.網約車的出現,一定程度上使我國傳統巡游式出租車市場普遍存在的“打車難”問題得到了緩解.根據中商產業研究院[2]發布的數據顯示,網約車用戶規模不斷擴大及用戶使用率的不斷增長,使得網約車成為城市居民出行需求中越來越重要的部分.一些互聯網科技公司較早在該類出行市場獲益,國內以“滴滴出行”“美團打車”為代表的打車軟件相繼上線并迅速發展,逐漸占領市場;而面臨轉型的車企在資本的驅使下,也逐漸涌向這個市場.2019年7月,一汽、東風、長安這3家車企聯合蘇寧、騰訊、阿里巴巴等共同打造了“T3出行”智慧出行平臺,采用定制化、智能化的新能源車輛,合規實體運營保障運力供給.與此同時,各類打車軟件逐漸轉向服務端優化,通過提升乘車體驗來增強用戶黏性,從而保障司機和用戶量的穩定增長.通過監管升級,市場逐漸規范,網約車在為公共交通提供良好補充的同時也為用戶提供個性化出行需求,有效節約社會資源.然而,網約車模式在給用戶提供快速便捷的出行服務的同時,傳統巡游出租車行業受到了沖擊,過多的車輛服務資源導致行業無序競爭和服務質量降低,交通擁堵加劇.此外,隨著駕駛員數量的增多以及乘車需求的快速增長,二者之間的供需矛盾日漸突出,減少車輛空載率與最大程度滿足乘客打車需求的資源配置平衡問題也日益凸顯.
因此,網約車出行需求的精準預測成為值得深入研究的課題.實現網約車出行需求的精準預測,能夠指向性地提高部分地區的運力,并引導用戶避開高峰與擁堵,進而提高乘客出行體驗質量,提高企業/司機的經濟收入和服務質量.可見,網約車出行需求的精準預測,是優化城市公共資源配置、提高運力和道路資源利用率的重要基礎,對促進新舊業態融合發展和維護行業穩定具有重要的意義.但是,網約車出行需求受到的隨機因素的影響較大,社會經濟水平、天氣因素、交通狀況、突發事件、區域土地利用情況等都會影響客流量.近年來,隨著感知技術和計算環境的成熟,各種大數據以及城市計算[3]等理念在城市中悄然而生.在這樣的背景下,有必要對網約車出行需求預測的文獻進行梳理,總結數據挖掘、城市計算等技術在交通出行領域的應用情況,分析既有研究的不足,提出潛在的研究方向.
本工作研究的網約車主要是指以網約快車、網約出租車為代表的網約車.本工作從為網約車用戶提供特定的智能化應用和服務的角度出發,解析網約車出行需求預測的關鍵問題.在分析網約車出行影響因素的基礎上,把網約車出行需求預測根據時間維度、事件維度進行分類,總結梳理各類研究方法.這里,時間維度的網約車出行需求預測的研究內容分為短期需求預測和長期需求預測;事件維度的網約車出行的需求預測研究內容分為已知活動事件下和未知活動事件下的乘車需求量預測.具體研究框架如圖1所示.

圖1 網約車出行需求預測的關鍵技術Fig.1 Key technologies of demand forecasting for IPHV
網約車出行的影響因素可以分為靜態因素和動態因素2類(見表1).

表1 網約車出行影響因素Table 1 Influence factors of choosing IPHV
靜態因素研究方面,林玉川[4]從乘客感知價值角度解釋了基于互聯網出行平臺的用戶行為;唐軍[5]認為城市的經濟增長速度、公共交通的服務水平、道路設施的發展、路網密度等都是城市網約車需求的重要影響因素;林園[6]通過調查問卷的形式對居民出行方式選擇行為進行建模與分析,并對各影響因素進行敏感性分析,包括年齡、職業、收入等;高永等[7]通過量化計算的方法研究了網約車這種新型出行方式對居民出行行為和道路資源的影響.
動態因素主要包括實時的訂單情況、交通擁堵、天氣情況等.王一帆[8]強調互聯網出行方式的普及性是影響客戶使用的根本原因,并運用調查數據和博弈論的方法得出了天氣狀況、叫車時段、出租車供需匹配情況是影響用戶選擇行為的重要因素的結論;黎景壯[9]通過對網約車需求量的變化規律和影響因素進行灰色關聯度分析,選取網約車歷史需求量、天氣類型和道路擁堵比例作為影響因子;賈興無[10]利用網約車歷史訂單數據,包括司機ID,用戶ID,訂單地點和時間,旅程起止點、時長、票價,指出居民出行與時間和空間有很大關系,但是未分析區域之間的相互影響.
一些學者還分析了出行者在不同情景下對網約車服務的需求選擇行為.Dawes[11]指出,參加社交類活動以及避免酒駕是出行者選擇網約車出行的主要原因之一.還有部分學者站在司機端的角度進行提供服務意愿分析,研究表明司機服務供給水平能夠間接地影響乘客的需求選擇行為.Farber[12]提到出租車司機會在參照收入水平達到之前就停止服務,并指出司機在雨天服務的積極性會降低,會造成雨天需求過剩的情況.
綜上,很多學者利用調查分析、量化計算的方法對靜態因素進行了深入剖析,結果表明該類因素主要出自于出行者個體,并涵蓋城市發展的固有特征.但是在動態因素方面,因時空的隨機性和多樣性,故無法定量化地將動態因素進行表征.同時,動態因素的數據來源也是多元化的[13].隨著交通基礎設施、數據采集設備的不斷完善和大數據技術的不斷推動,動態時空關聯的網約車出行方式選擇意向分析將是潛在的研究方向.
按照需求預測的時間維度,網約車出行需求預測可以分為短期需求預測(1 h以內)和長期需求預測2類.
網約車出行短期需求預測是指城市居民出行中對網約車的需求量的短時預測,屬于短時交通預測范疇.短時交通預測的模型與理論方法為網約車出行短期需求預測提供了方法基礎.因此,在介紹網約車需求預測方法之前,有必要對短時交通預測方法進行討論.
3.1.1 短時交通預測方法
城市交通系統是一個復雜系統,短時交通流受到各種因素的影響,包括土地利用情況、天氣條件、居民出行行為、人口變化等.短時交通預測的各種預測模型具有不同的預測精度和應用條件.短時交通預測方法主要分為4類:基于統計分析的預測、基于非線性理論的預測、智能預測以及組合預測模型.
基于統計分析的預測模型主要應用數理統計方法,并假設待預測的內容與歷史數據有相同的特征,主要的代表模型有歷史平均模型、時間序列模型以及卡爾曼濾波模型等.賀國光等[14]指出,20世紀六七十年代開始城市交通控制系統把一些成熟的數學預測模型用于短時交通流預測領域.時間序列模型是一種統計方法[15-17],較為經典的有自回歸整形滑動平均(autoregressive integrated moving average,ARIMA)模型.ARIMA模型適用于非平穩時間序列的預測,其基本思想是將原始序列進行差分平穩化處理,然后對隨機誤差項的現值和滯后值進行回歸分析.Kim等[17]結合自回歸移動平均模型預測的數據和歷史同一時段數據,建立了實時交通流預測模型.卡爾曼濾波模型是一種基于線性遞推的預測方法,能處理平穩與非平穩數據.王均等[18]基于卡爾曼濾波模型,結合分析城市環路交通特性,對短時交通流進行了預測;Chien等[19]利用紐約高速公路交通數據,采用卡爾曼濾波算法建立了路段和路徑的行程時間預測模型;楊高飛等[20]使用自回歸滑動平均模型與卡爾曼濾波模型對路段短時交通流量進行了預測,提高了單一模型的預測精度.
基于非線性理論的預測模型主要通過挖掘短時交通流非線性特點,來體現城市交通運行的隨機特性,有3種具有代表性的理論方法:小波分析方法、混沌理論與突變理論.小波分析方法將交通流時間序列進行分解,并分段預測,最后合成分析得到最終預測結果[21].曹征[22]在基于小波變換的短時交通流預測模型中加入指數平滑操作以提高預測的準確性;Disbro等[23]在交通領域引入混沌理論,表明該理論能夠提高預測模型的可靠性;張勇[24]通過對交通流時間序列的非線性檢驗,分析得到其混沌特征,提出了一種改進的單/多變量混沌時序預測方法,并通過仿真驗證了該方法的有效性.突變理論方法是利用實際交通流數據來標定突變理論模型,解釋交通流特性并實現交通流預測.Forbes等[25]在高速公路環境下,引入突變理論建立了短期交通流預測模型;唐鐵橋等[26]認為,交通流是一個動態過程,不能只考慮密度和流量,因此考慮時間因素,應用燕尾突變理論建立了交通流預測模型,結果證明該模型更符合現實.
智能預測模型主要采用“黑箱”式模式,自動歸納歷史數據規律進行預測,主要有非參數回歸預測、神經網絡模型、支持向量機(support vector machine,SVM)回歸預測等類型.非參數回歸預測模型從歷史數據中尋找預測點相似的“近鄰”,較適合應用在特殊事件情況下的交通流預測;Davis等[27]首次將近鄰非參數回歸算法應用在交通流預測領域;丁濤杰[28]基于出租車全球定位系統(global positioning system,GPS),利用非參數回歸模型估計出車輛實時速度.神經網絡模型通過模擬神經元組成結構,訓練大量歷史數據建立預測模型,并不斷調整模型參數.國外較早將單種神經網絡應用到交通流預測中,包括交通流3參數的預測等,預測效果較好[29-31].國內部分學者通過引入變異算子訓練優化BP(back propagation)神經網絡模型的參數,最終驗證該模型具有較好的擬合能力[32-33].SVM模型是通過訓練歷史樣本,求解2次規劃問題得到決策函數,從而進行預測.呂宏義[34]基于杭州市浮動車GPS數據,利用SVM回歸模型對路段平均速度進行短時預測;孫朝東等[35]利用改進的花授粉算法優化了SVM模型參數,繼而建立了交通流短時預測模型.
組合預測模型是指綜合采用2種及以上的模型進行預測,分為并行式預測和串聯式預測.并行式預測是指先使用多種模型分別預測,再利用數學運算的方法得到綜合預測結果;而串聯式預測是指將一種模型的預測結果作為另一種模型的前期輸入,通過銜接得到最終預測結果.這里,Voort等[36]將ARIMA時間序列模型和神經網絡結合;Yuan等[37]建立了小波模糊神經網絡預測模型;譚滿春等[38]建立了ARIMA與SVM相融合的組合模型,該類研究試驗結果表明組合模型的抗干擾能力較好.還有部分學者嘗試將其他領域較先進的模型引入交通預測領域,如Yu等[39]曾利用高斯混合模型所得參數建立了基于高階馬爾科夫鏈的預測模型;Tan等[40]建立了基于并行自縮放擬牛頓神經網絡預測模型,利用迭代更新實現了較好的預測效果;劉芹等[41]利用歷史數據和實時數據,引入了預測云模型,從而進行交通流預測.
現將預測模型分類、各自優缺點及適用條件進行總結,結果如表2所示.
通過上述對短時交通預測方法的分析可知,不同的預測模型有各自的優缺點,需要根據預測目標、預測類別選取合適的預測方法,其整體研究發展呈現如下幾個特點:
(1)預測精度高的模型,其計算量也較大;
(2)非線性模型可以更好地描述交通流特征;
(3)組合預測模型是目前的應用趨勢.
3.1.2 短期需求預測方法
在網約車出現之前,學者們主要針對傳統巡航式出租車的短期需求預測展開了大量研究.Moreira等[42]將泊松模型和自回歸移動平均(auto-regression and moving average,ARMA)模型相結合來預測幾個固定出租車站臺的乘車需求,但并沒有考慮各出租車站臺歷史數據之間的關聯性;林永杰等[43]通過分析出租車出行影響因子等變量之間的相關性,建立了基于人工神經網絡的短期需求預測模型,其預測精度高于傳統的自回歸滑動平均模型;王芮[44]利用濟南某園區出租車GPS數據,通過分析出租車交通需求的時空特性,建立了卡爾曼濾波-神經網絡組合預測模型,對園區內的出租車出行需求進行實時預測.

表2 短時交通預測方法Table 2 Short-term traffic prediction method
傳統巡航式出租車需求預測主要利用出租車GPS軌跡數據進行建模分析,針對網約車出行需求預測,已有學者提出引入訂單流量數據.Chiang等[45]提出了一種基于網格的高斯混合的生成模型,對網約車需求預測進行時空建模,這種方法能夠預測城市中各小區在不同時間間隔內的網約車需求量.但是這種模型主要存在2種缺陷:①工作日和周末分開處理訂單;②網約車的總需求量是由泊松模型預先決定的.當實時的網約車需求量快速變化時,這種方法可能會導致較大的預測誤差.前述研究無法對空間和時間的復雜非線性關系進行建模.近年來,一些學者結合了多種技術來模擬空間交互作用.例如Deng等[46]利用道路網絡上的矩陣因子分解捕獲到的道路連接區域之間的相關性來預測交通量;Tong等[47]也提出,通過對空間和時間相關性的正則化來平滑鄰近位置和時間點的預測差異;Nie[48]提出了一種新的基于區域劃分的長短時記憶神經網絡模型,用于網約車服務需求預測,該模型主要包括網格合并區域劃分和神經網絡的應用2個部分,在實際情況中此方法的預測精度較高,可以幫助網約車平臺調度車輛資源.
城市范圍內不同區域之間的出行特性存在較大的差異,網約車出行需求的時空依賴性非常復雜,盡管有些學者在考慮乘客需求時加入了時間、空間特性,預測精度還是不理想.得益于機器學習、深度學習等技術的成熟與發展,有學者提出了對空間相鄰區域之間的歐式相關性進行建模的方法.Yao等[49]提出了一種深度多視點時空網絡框架(deep multi-view spatial-temporal network,DMVST-Net)來模擬時空關系.該模型包括3個視圖:時間視圖(通過長短期記憶網絡(long short-term memory,LSTM)對未來需求值與近時間點的相關性進行建模)、空間視圖(通過局部CNN(convolutional neural network)對局部空間相關性進行建模)和語義視圖(對具有相似時間模式的區域之間的相關性進行建模).但是,有研究表明遠距離區域之間的非歐式成對關系對于預測的準確性也是至關重要的.對此,滴滴出行AILab研究團隊提出了一種新型深度學習模型,搭建時空多圖卷積網絡(spatiotemporal-multigraph convolution network,ST-MGCN)將區域之間的非歐幾里德相關性進行建模,并進一步建立了環境門控遞歸神經網絡(generalized regression neural network,CGRNN)對時間相關性進行建模,該模型對不同時間的歷史數據加以不同的權重進行分析[50].
總體來看,網約車出行短期需求預測主要采用大數據處理技術,基于數據驅動對網約車出行需求進行預測.所使用的研究數據主要包括城市POI(point of information)數據、天氣情況數據、車輛GPS定位數據、平臺訂單數據、道路狀況數據等,所采用的方法主要是神經網絡模型(見表3).深度學習在網約車出行短期需求預測中逐漸得到推廣,通過構建深度神經網絡模型來挖掘網約車用戶出行特征得到了眾多學者的青睞.在研究思路上,這方面的研究可以分為2類:①不考慮各區域之間的空間相互影響關系,根據乘車需求影響因素類型,將需求預測問題視為多維時序預測問題;②考慮空間相鄰區域之間的歐式相關性,將需求預測問題視為時空序列問題,其數據形態包括表格化數據和圖片數據.如何利用城市計算體系及考慮區域時空關聯性,對網約車出行短期需求進行精準預測是未來重要的研究方向之一.

表3 基于神經網絡的網約車出行短期需求預測模型Table 3 Short-term travel demand forecasting models for IPHV based on neural network
隨著人們出行習慣逐漸改變以及政策的引導,網約車出行在城市居民出行中的比例持續增長.網約車出行長期需求預測主要是指季度或年度需求總量預測,該類預測數據是城市車輛運力配置的基礎.同時,網約車整體管理需要遵循總量控制的原則,因為服務車輛資源的數量在一定程度上影響了網約車用戶的需求選擇,對網約車市場的供需平衡研究有著重要的意義.目前,專門針對網約車長期需求預測的研究很少.由于傳統巡游式出租車的相關研究對此具有借鑒意義,故對出租車長期需求預測的相關研究進行梳理.這方面的研究主要包括車輛服務資源與用戶需求之間的供需匹配度、城市車輛服務運力配置2個方面的內容.
在車輛服務資源供需匹配的研究中,部分學者采用不同類型的指標來評價匹配度.聶篤憲等[51]從時空角度建立了層次分析模型計算出租車供求匹配度,結果表明工作日的乘車需求和供求匹配程度均高于節假日,但該模型沒有考慮消費者的偏好、重大事件、異常氣候等條件;樊文壯等[52]構建了模糊綜合評價模型來評價重慶主城九區的出租車供求匹配度,該模型考慮了出租車宏觀資源因素、需求因素、供給因素,還考慮了社會經濟因素;張娟等[53]基于出租車運營數據,研究了出租車資源的供需匹配程度,該方法考慮了日常高峰與平峰、節假日等時間維度,城中與郊區等空間維度;劉嘉琪等[54]采用出租車的平均空載率、萬人擁有量、里程利用率等指標衡量出租車總體供需匹配程度,并指出人口越集中的地區更容易打到車.然而,上述供求匹配度計算模型沒有考慮乘客出行需求未被滿足的部分.之后,逯強等[55]以等待人數與等待車數的比值、乘客等車時長、司機搜尋到乘客等車時長為指標建立了供求匹配度模型,并通過分析同一區域不同時段供求匹配情況、不同區域相同時間段供求匹配情況,提出了用戶/司機補貼方案,但補貼方案沒有考慮車上乘客的滿意度.此外,也有學者提出建立短期模型,研究某一時刻的匹配度狀態,但是對于空間變量的定義仍屬于整體的宏觀量,而沒有真正實現“實時實地”層面的微觀分析.例如,朱家明等[56]運用層次分析、熵值、3次樣條插值等方法,建立了層次分析法(analytic hierarchy process,AHP)熵值賦權模型,綜合分析了上海市出租車的供求匹配度在不同區域、不同時段的變化.
在城市車輛運力配置方面,陳文龍[57]指出,運力規模較小則不能滿足出行需求,規模較大則會造成資源浪費,可見出租車規模會間接影響乘客預期等待時間要求,通過運力規模測算模型,為控制城市出租車數量提供決策支持.部分學者通過分析歷史數據得到出租車乘客整體需求,從而預估城市出租車量運力配置數目.例如Yang等[58]通過分析紐約市出租車乘客的不同時間段的乘車需求建立了整個城市的出租車需求模型;Daniel[59]基于紐約城市的出租車數據,論證了空駛出租車數量和乘客需求之間存在非彈性關系,通過計算每增加一輛車的邊際成本來確定城市出租車整體規模.另外,還有學者通過建立考慮多因素的綜合預測模型進行研究,如楊英俊等[60]提出基于小波神經網絡的城市出租車保有量預測模型,該模型考慮了人口、出行強度、出行需求、經濟發展水平等城市環境參數的影響.
事件維度的需求預測是從影響需求的特定事件出發,關注某個事件引發的需求.此類需求預測可分為已知事件下的出行需求預測研究和未知事件下的出行熱點區域預測2類.
許多能夠提前獲知的事件(如大型活動)容易引發大量交通需求,其在疏散時的交通供需矛盾尤為突出.這類事件結束后0.5~1.0 h是交通需求旺盛期[61],在活動結束20~35 min時交通量達到峰值[62].此類交通需求預測主要基于事件規模特征、城市交通、經濟情況以及國內外同類事件的經驗.John[63]以奧運會為例強調了大型活動中交通需求分析的重要性;Latoski等[64]從特殊活動事件帶來的交通吸引、交通疏散不同維度進行乘車需求分析,但并沒有對交通方式進行劃分,無法得到出租車的需求量;王曉光等[65]針對武漢市江灘篝火晚會結束后的人員疏散所引起的乘車需求進行了預測研究,基于4階段法對公交、私家車、出租車這3類出行方式進行交通分配,得到了出租車需求量;趙躍萍[66]將出行者細分為活動參與者(外地人員、本地人員)、工作人員、志愿者等,并根據出行者特征進行不同交通方式的需求預測.在以往的研究中,通常的預測流程包含如下2歩:①參考歷史數據,預估本地觀眾和外地觀眾的人數比例,利用趨勢外推法和恩格爾系數法(考慮門票價格、區域居民人均收入)得到本地各區交通量;②建立觀眾分布模型,得到各小區的人群分布,并將人流量轉化為車流量.在4階段法的基礎上,對交通需求預測方法進行改進.之后,將活動參與者進行分類,主要對觀眾出行方式進行預測,通過狀態轉移方程,將調查得到的交通方式占有率轉為新的比例,即得到出租車需求量[67].
如今,公眾出行理念發生了較大變化,網約車為大型活動等事件后的人員疏散提供了更加靈活、便利的交通方式.然而,既有研究側重于總體車流量的估計,并未對交通方式進行劃分,缺乏面向網約車出行方式的需求預測.另外,既有研究在預測過程中未能充分考慮消費者偏好、異常氣候等因素[68].
目前,專門面向網約車出行方式的出行熱點區域分析的研究較少,因此本工作對城市居民出行熱點區域分析的研究進行總結,內容包括數據源的選取、模型建立方法等.
由于數據源獲取技術的限制,故這方面的早期研究主要基于出租車GPS數據展開.Tseng等[69]基于出租車GPS數據,推斷道路之間的流量關系,建立了城市區域交通流量估計模型,為出行需求熱點區域預測研究提供依據;孫貴治[70]基于出租車GPS軌跡數據,采用隱馬爾可夫地圖匹配算法修正偏離實際路網的出租車軌跡點,并采用K-means聚類和系統聚類的組合模型以及DNN回歸算法實現了出行需求預測模型;陳紅麗[71]以出租車的GPS上下車軌跡點數據為基礎,利用DBSCAN(density-based spatial clustering of applications with noise)聚類算法進行聚類分析,接著使用ArcGIS平臺對聚類結果進行可視化,識別出城市居民出行的熱點區域,并建立熱點區域的吸引力指數,這不但可以進行交通出行評估,還能合理預測未來居民出行需求.該類研究中數據源比較單一,且使用的出租車GPS軌跡數據時間跨度十分有限,出行需求特征較少.
隨著數據源多樣性的發展,利用數據融合技術能夠對個體出行進行時空軌跡的精準刻畫,從而改善以往研究中出行熱點預測準確率不高的缺點[72-74].這是因為:①結合手機信令數據進行研究,如李追日[75]結合手機信令數據、出租車歷史/出行軌跡信息,建立了交通方式劃分及出行流量分配模型,推估出各個時間段研究區域的道路交通需求;②結合手機App數據進行研究,如鄧博[76]通過手機App獲取居民的出行軌跡數據,并結合社會經濟屬性數據,利用雙層停留點識別方法結合閾值法提取出行方式和出行目的信息;余琳玲[77]基于曲線擬合和道路拓撲結構相結合的聯合道路匹配算法,對用戶位置信息進行定位,并對手機應用的后臺業務特征信息進行解析、挖掘,結合行人的歷史出行軌跡,著眼于群體行為,進行出行方式的分析.③采用多源數據融合的方法,如張曉鵬[78]基于手機信令數據和相關的POI、天氣、路網等城市多源數據,使用Hadoop平臺和Map Reduce計算框架等大數據技術,對數據進行處理和分析,提出了一種基于時間序列特性和POI特征的城市區域聚類合并算法,保證了對用戶出行用車需求量預測的精準度;張凱[79]從出租車出行軌跡歷史數據和城市興趣點的數據中挖掘時空語義,設計并實現了一種基于時空聚類的自適應出行需求熱點預測的算法,對未來乘客出行需求熱點進行了預測,這類研究缺少對時空停留點更加精細的劃分,夜間熱點區域預測命中率較低,對于感知實時的路況以及突發事件帶來的影響也需完善.
近年來,國外以Uber為代表、國內以滴滴為代表的互聯網出行方式迅速發展,給傳統巡游式出租車行業帶來了挑戰.本研究系統綜述了網約車(主要指網約快車和網約出租車)的研究現狀,相關文獻主要涵蓋了網約車出行影響因素、時間維度的出行需求預測、事件維度的出行需求預測3個方面.總體來看,國外研究起步相對較早,在短時交通預測、車輛資源配置等方面均涌現出大量的數學模型及算法;而國內研究起步較晚,主要集中于面向傳統巡航式出租車的乘客需求熱點區域、供需匹配度等方面,針對網約車出行需求預測的定量分析的研究較少,其總結如下.
(1)在網約車出行需求影響因素方面.研究表明,網約車對預計候車時間和車內行駛時間比較敏感,天氣條件、交通狀況等帶來的候車時間不確定性的增大會減少該種方式的選擇概率.同時,網約車在出行費用上富有彈性,制定合理的出行費率對調節網約車的出行分擔比例有重要作用.
(2)在網約車出行短期需求預測方面.考慮到城市不同區域之間的出行需求有較大差異,區域級短期需求預測是重要任務,從時空維度綜合挖掘出網約車用戶歷史出行的特征是研究關鍵.相鄰區域空間、較遠區域空間之間的相互影響以及關聯性給網約車短期需求預測工作帶來了難度.
在網約車出行長期需求預測方面.城市范圍的車輛整體資源配置以及供需平衡研究是主要任務.如果整體服務車輛資源過少,則不能夠滿足出行需求;如果服務車輛資源過多,則會加劇交通擁堵.影響網約車資源配置的因素較多,如運營模式、司機招募條件、服務車輛資格等,目前的大部分研究主要是針對傳統模式的出租車,關于網約車的整體資源配置的研究較少.
(3)在事件維度的網約車出行需求預測方面.從事件本身出發的研究相對較少,對大型活動等能夠提前獲知的事件,其客流來源復雜,返程需求多樣化,往往對特定時間下的區域交通會產生較大影響.雖然網約車的靈活機動性能夠彌補公交班車疏散客流的不足,但網約車的提前調度時間、調度區域需要進行合理安排.此外,如何主動挖掘分析未知聚集性活動事件也有待于進一步研究.
國內外學者對網約車出行需求預測的關鍵技術進行了大量研究,并取得了較豐富的研究成果.然而,既有研究中尚存在如下幾點不足.
(1)對網約車出行需求的影響因素考慮不夠全面.交通需求系統是有人參與的、時變的、復雜的非線性大系統.這些影響因素的高度不確定性,不僅由自然因素(如季節、氣候因素等)造成的,還有人為因素(如大型活動和突發事件、乘客/駕駛員的心理狀態等)造成的.這些因素的不確定性較大,規律性不明顯,也是交通需求預測的難點.在網約車出行需求預測方面,既有研究主要從歷史數據中挖掘時空特性,沒有全面考慮當前交通環境、天氣環境等多方面因素對乘車需求的影響.
(2)在網約車出行需求預測過程中未能充分結合時空特性.城市計算的特點之一在于城市數據的多樣性,而多模態的數據是從不同的角度展示著城市的方方面面.在網約車需求預測問題中合理地使用多模態數據,可以讓預測模型獲取更多的信息,使得預測模型的性能更加完備.既有研究在網約車需求量預測過程中往往沒有充分結合時空特性,基于區域范圍的網約車出行需求預測任務是非歐式的,數據格式不再是矩陣,大部分既有研究中所使用的卷積神經網絡模型無法很好地應對此類問題,也難以明確區域之間的時空依賴性對預測精度的影響.
(3)大型事件下的網約車出行需求預測研究較少.城市組織大型活動后的大量人流往往很難在短時間內疏散,這很大一部分原因是周圍沒有可供乘坐的交通工具,而交通方式的選擇通常與城市客運交通結構的總體構成、多種交通方式的競爭和供應情況及大型活動時的交通管制方案有關.網約車作為較靈活的交通工具,往往在大型活動的交通中扮演重要角色,然而目前針對大型活動中網約車出行需求預測的研究還相對較少.
交通出行方式的千變萬化,背后都隱藏著一個不可逆轉的邏輯——智慧化,即在最少的人工干預下,通過技術讓出行更加高效便捷,并享受更多的增值服務.為了給網約車用戶提供更加精準且個性化的智能交通服務,網約車需求預測的進一步研究可以從以下幾個角度進行考慮.
(1)考慮互聯網出行方式下的乘客用車需求特性,結合大規模時空出行數據,建立在城市范圍內的網約車服務資源供需匹配度模型,進行車輛資源配置優化與城市運力計算.
(2)考慮應用人工特征工程或圖卷積網絡處理城市各區域之間關系的不規則性所造成的非歐式結構數據,令空間特征的抽取更加合理有效.
(3)研究大型活動下的網約車出行需求特性,建立相應的需求預測模型,明確因其而誘發的網約車出行需求的時空分布特性.