程國柱 周林芳 徐慧智
(東北林業大學交通學院1) 哈爾濱 150040) (河北水利電力學院交通工程學院2) 滄州 061001)
客流預測是城市軌道交通規劃的前導工作,目前,國內對客流預測研究包括影響因素分析和預測模型建立兩部分.Zhao等[1-3]的研究較為全面,包括基于車站和車站間的影響因素分析及快速公交系統中步行距離與乘客特征和車站的關系,但未考慮解釋變量對客流的貢獻率隨與車站的相對距離而變化.李俊芳等[4]考慮了距離車站不同圈層的人口對客流貢獻率的不同,且建立的BP神經網絡預測模型預測結果較好,但BP神經網絡的函數關系處于“黑箱”中,未對因變量與自變量的關系進行充分解釋.
國外對解釋變量與客流貢獻率關系的研究更為深入.Sohn等[5]發現七個解釋變量對客流量有顯著影響,并借助結構方程研究了解釋變量對自變量的影響及其之間的關系.Gutiérrez等[6]發現基于路網距離衰減模型建立的多元回歸模型具有更好的解釋能力.Geneidy 等[7]發現以1 259 m為半徑的范圍能夠覆蓋85%的乘客.Sung等[8]發現各解釋變量對客流量的影響分別在不同的距離閾值下達到最大.
在以往的研究中,對于車站服務范圍的確定多采用經驗值,且未考慮到隨到達地鐵車站距離的增加而導致的客流衰減的規律.為簡化問題,多采用直線距離代替乘客步行的實際路網距離.本文將在對哈爾濱地鐵乘客出行調查分析的基礎上,采用路網距離對車站服務范圍進行研究和采用地理加權回歸(geographic weighted regression, GWR)模型對車站客流量預測進行研究.
哈爾濱地鐵1號線自2013年開通以來,已運行5年,經過了3年客流培育期.對哈爾濱地鐵1號線各車站(除哈東站站和哈南站站,下同)客流量及乘客空間分布進行調查,調查時間為2017年12月26日—2018年1月12日的各工作日.由于1 d內,地鐵車站上、下車乘客量基本對稱,因此,僅調查了各車站平峰時段15 min內上車乘客量.并對乘客出發地點進行隨機問卷調查,運用百度地圖,得到出發點到對應地鐵車站的路網距離.
車站服務范圍確定后,在Arcgis10.0環境下,建立地鐵線路、車站、車站吸引范圍內不同土地利用類型建筑的矢量圖及乘客步行網絡數據集.用地性質由百度實景地圖查找獲得.坐標系統為Beijing_1954_3_Degree_GK_Zone_42投影坐標系,單位為m.
調查共得到927組地鐵乘客出行生成點信息,將數據以50為間隔,分為100~1 850 m,共36組.路網距離與乘客比例(表示步行到車站的距離大于某路網距離的乘客比例)的關系見圖1.

圖1 乘客比例與路網距離散點圖
由圖1可知,乘客比例隨路網距離增加呈現非線性衰減規律,在0~500 m路網距離內,乘客比例快速衰減,在500 m之外,衰減速度趨緩.在SPSS20.0環境下,選擇二次模型、三次模型、復合模型、增長模型、指數模型和Logistic模型對散點圖進行擬合.6種模型的擬合結果均通過0.01的顯著性水平檢驗.綜合考慮模型解釋能力及表達式簡潔性,選用復合模型表示乘客比例與路網距離的關系.在SPSS中對復合模型的初始表達式進行優化,得到乘客比例隨路網距離的衰減規律:
R=145.878·0.997NL
(1)
式中:R為大于某路網距離的地鐵乘客占全部地鐵乘客的比例,%;NL為地鐵乘客步行至相應地鐵車站的路網距離,m.
不同乘客覆蓋比例對應的車站服務范圍閾值及不同車站服務范圍閾值對應的乘客覆蓋比例,見表1.
由表1可知,隨著車站服務乘客比例的增大,乘客覆蓋比例增加相同數值所需的車站服務范圍的增加也越大,即車站服務范圍擴大所帶來的乘客比例增加的邊際效益在減小.根據文獻[9-10]可知,使用乘客覆蓋率為85%所對應的路網距離作為服務范圍閾值.距車站757 m路網距離內的乘客所占比例為85%,800 m路網距離內的乘客所占比例為86.81%.綜合考慮服務范圍閾值的代表性及其所能覆蓋的乘客比例,確定800 m路網距離為地鐵車站服務范圍.據此,哈爾濱地鐵1號線各車站的服務范圍見圖2.

表1 不同地鐵車站服務范圍對比

圖2 哈爾濱地鐵1號線車站服務范圍示意圖
在Arcgis環境下,建立地鐵線路、車站、車站吸引范圍內不同土地利用類型建筑的矢量圖及乘客步行網絡數據集.本文考慮行政管理、居住、教育文化、商業、休閑娛樂、醫療衛生6類土地利用類型,各建筑的具體土地利用屬性可由查找百度實景地圖獲得.
以哈爾濱地鐵1號線為例,在Arcgis環境中,采用Beijing_1954_3_Degree_GK_Zone_42投影坐標系建立的矢量圖及道路網絡數據集見圖3.

圖3 哈爾濱地鐵1號線矢量圖及道路網絡數據集
運用Arcgis的幾何計算功能,可以得到各個建筑物的占地面積,結合百度實景地圖,可以獲得各建筑的樓層數,最終得到各建筑的樓層面積,為
Ai=Si·fni
(2)
式中:Ai為建筑i的樓層面積;Si為建筑i的占地面積;fni為建筑i的樓層數.
在Arcgis中,建立乘客步行的道路網絡數據集,運用網絡分析功能即可得到各建筑與相應地鐵車站的路網距離.結合乘客比例依路網距離的衰減規律,定義建筑樓層面積與其到達地鐵車站路網距離對對應的乘客比例的乘積為加權樓層面積,為
MAi=1.45878·0.997NL·Ai
(3)
式中:MAi為面要素的加權樓層面積,m2.
客流預測研究方法包括四階段法和普通最小二乘法.四階段法雖應用廣泛,但需以大量的出行調查資料為基礎,需耗費大量的人力、物力、財力和時間,且四階段模型適用于對區域規模的范圍進行交通預測,而對于公共交通出行這一以車站服務范圍為對象的研究則不再適用.
基于最小二乘法的多元回歸模型使客流預測問題得到簡化,降低了預測成本,且各解釋變量能夠反映車站周圍環境和自身屬性對客流的影響.但多元回歸模型中各解釋變量的系數在各預測單元內均保持一致,忽略了變量對客流的影響存在地理空間的變化及特殊變量對個別區域的影響這兩個特征.
GWR模型適用于研究空間異質性問題,其從局部回歸和探索空間關系的角度對自變量和因變量的關系進行研究,能夠反映解釋變量隨空間變化而產生的對因變量影響的變化規律,改進了普通最小二乘法中解釋變量系數保持不變的缺點.在一條地鐵線路中,其周圍土地利用情況及車站自身屬性均處在變化中,因此,采用GWR模型能夠適用這種變化.
土地使用類型是乘客出行產生的核心因素,且不同土地使用類型決定了居民出行強度的差異,因此造成了地鐵乘客量的不同,如商業區的地鐵車站,一般其乘客量明顯更多.因此,將上述6種不同類型用地的加權樓層面積作為解釋變量.此外,以上變量僅從絕對量的角度對土地使用進行了衡量,沒有涉及土地使用多樣性對客流量的影響.因此引入土地使用多樣性指數[11],為
(4)
式中:LUDI為土地使用多樣性指數;pi為第i類用地的樓層面積占各類用地總樓層面積的比例,%;n為不同性質用地的類別數.
200 m范圍內接駁公交線路數、路網密度和車站可達性均可以從不同的角度衡量乘客到達車站的方便程度,因此,也將這3個變量作為解釋變量.其中,200 m范圍內接駁公交線路數主要用來衡量步行距離范圍之外的乘客選擇地鐵出行的方便程度;車站可達性用于衡量車站在線路中的中心度,其值大小在(0,1)之間,值越大,表示車站越靠近線路中心,而一般位于地鐵線路中間的車站客流量較大,為
(5)
式中:Aci為第i個地鐵車站的可達性指數;Ndi為第i個地鐵站點到其他各車站的路網距離之和,m.
GWR模型從局部回歸和探索空間關系的角度對自變量和因變量的關系進行研究,能夠降低甚至排除空間自相關的影響[12-13].GWR模型對每一個樣本都生成不同的回歸系數,為
(6)
式中:yi為車站i的上車乘客量,人;xij為車站i的解釋變量j;βij為車站i中解釋變量j的系數;βi0為截距;εi為殘差.
GWR模型進行局部回歸時,將考慮每個回歸樣本點其周圍樣本點的信息,并根據周圍樣本點與該樣本點的距離,對周圍樣本點的信息設定權重.權重計算有多種方法,其中,Gaussian函數法和bi-square法應用最廣泛,論文選用Gaussian函數法,為
(7)
式中:wij為車站j的變量相對于車站i的權重;dij為i、j兩車站的距離,m;b為帶寬.
在帶寬范圍內,各樣本點相對回歸樣本點的權重矩陣為
(8)
式中:W(i)為回歸樣本點i的權重矩陣.
根據加權最小二乘法可得到β(i)的估計向量,為
(9)
式中:
β(i)=(βi0,βi1,…,βin)
(10)
經過系數顯著性檢驗和方差膨脹因子檢驗,最終選取行政管理用地、商業用地、休閑用地、醫療衛生用地、土地使用多樣性和200 m范圍內接駁公交線路六個自變量.
在ArcGIS中,運用Arctool box中普通最小二乘法(ordinary least square, OLS)工具進行運算,結果見表2.由表2可知,各自變量系數均通過了0.05的顯著性檢驗,說明各自變量對地鐵上車乘客量具有顯著影響,且各自變量方差膨脹因子VIF均小于7.5,通過共線性檢驗.模型AdjustedR2為0.74,赤池信息變量AIC為413.72.

表2 自變量系數顯著性及方差膨脹因子檢驗結果
對以上變量進行莫蘭指數(Moran I)檢驗,結果見表3.檢驗結果表明,休閑用地和200 m范圍內接駁公交車線路對應的P值均小于0.1,兩個變量在空間上具有顯著地集聚性.說明雖然最小二乘回歸模型擬合優度較好,但可能存在偏態,穩定性差.

表3 解釋變量Moran I檢驗結果
將相同的自變量運用Arctool box中的GWR模型進行運算,結果顯示,GWR模型的AdjustedR2為0.81,大于OLS模型的0.74,AIC為399.01,小于OLS模型的413.72,且二者之差大于4,表明GWR模型較OLS模型有更優的適用性.各車站上車乘客量的實際值和預測值對比見表4.

表4 各車站上車乘客量觀察值和預測值對比
4類用地的系數在各車站的分布見圖4.

圖4 不同類型用地建筑的加權樓層面積的系數在各車站分布圖
由圖4可知,4個解釋變量的系數在各車站均為正值,說明4類用地的面積均和地鐵客流產生呈正相關.通過對比以上4個解釋變量系數的變化規律,發現行政管理用地加權面積和休閑娛樂用地加權面積的系數變化規律基本一致,均呈現由北向南逐漸減弱的趨勢 ;商業用地加權面積和醫療衛生用地加權面積的系數變化規律也基本一致,呈現由北向南逐漸增強的趨勢.對比4類土地使用類型在各車站的分布情況,說明并非車站服務范圍內某類土地使用的加權面積越大(小),其對地鐵客流的貢獻能力越大(小),例如,商業類土地使用中,博物館車站服務范圍內的商業類土地使用加權面積最大,但單位面積內其對客流的貢獻能力處于中等水平.
土地使用多樣性指數的系數在各車站的分布情況見圖5.

圖5 土地使用多樣性指數的系數在各車站分布圖
由圖5可知,土地使用多樣性指數的系數從樺樹街車站到博物館車站逐漸增大,從博物館車站到哈達車站逐漸減小,且其系數在各車站均為負值,說明一定范圍內的土地使用多樣性系數與客流產生之間為負相關,當土地使用多樣化程度越大,居民能夠在一定范圍內滿足其基本的生活需求,因此不需要地鐵這一適用于中遠距離出行的交通方式.
接駁公交車數量的系數在各車站的分布見圖6.

圖6 接駁公交車數量的系數在各車站分布圖
由圖6可知,200 m范圍內接駁公交車的系數從樺樹街車站到和興路車站逐漸增大,而在和興路車站到哈達車站逐漸減小,且系數始終為正值,說明接駁公交車線路數對地鐵車站客流產生具有促進作用.
通過對哈爾濱地鐵1號線乘客依路網距離的分布規律進行分析,確定了地鐵車站800 m路網距離為其服務范圍,該范圍小于大部分研究中所采用的800 m歐氏距離.結合乘客依路網距離的衰減規律定義了加權樓層面積,并采用Arcgis的幾何計算和路網分析功能進行計算.在GWR模型中,采用了行政管理、商業、休閑娛樂、醫療衛生、土地使用多樣性指數和200 m范圍內接駁公交線路數6個解釋變量,運行結果表明基于GWR模型的客流預測模型由于基于最小二乘法的多元回歸模型.本文研究對象為單條地鐵線路的客流預測,而地鐵線路發展成網后,其特點將不同于單條線路,需要進行后續的研究.