999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

建成環境非線性作用下汽車客運站最高聚集人數模型

2022-07-22 14:09:32唐秋生
關鍵詞:環境模型

唐秋生,許 浩

(重慶交通大學 交通運輸學院, 重慶 400074)

0 引言

伴隨著我國城鎮化進度加快和國民經濟水平提升,汽車客運站在設計初期因缺乏歷史客流數據、最高聚集人數測算方法泛化能力低等因素所導致的場站資源浪費問題日益嚴重。為此,探求汽車客運站最高聚集人數在現狀城市空間數據下的作用機理以完成人數測算尤為重要。傳統汽車客運站最高聚集人數測算主要有3種方法:① 聚集系數法:根據最大月均乘車人數統計值和聚集系數計算;② 單向列車次數法:根據單方向發車次數和不平衡系數計算;③ 概率法:根據車站行車計劃表,假設旅客服從某一分布到達場站進行人數仿真[1]。之后,眾多學者針對概率法進行改進,完成對最高聚集人數的近似估計。姚加林等[2]認為因列車的出發方向不同,在概率法基礎上計算的聚集人數存在統計學差異;狄智瑋等[3]認為旅客聚集規律受旅客出行目的、出行方式等個人因素影響較大;李兆豐等[4]建立了多特征融合的客流預測模型,其中不僅包括旅客個人特征,還包含天氣、日期等環境特征。至此,眾多學者展開了基于環境特征對場站聚集人數的研究。崔敘等[5]以站域范圍的興趣點、周邊房價、路網密度等數據構建旅客流量預測模型;姚加林等[6]引入城市交通環境可靠性相關指標,結合概率法探求其對場站最高聚集人數的影響機理。

參考國內外針對環境特征展開的研究,Chen等[7]在考慮空間異質性的基礎上提取建成環境指標,探求針對多式聯運出行方式的影響機理; Ding等[8]構建以建成環境數據為基礎的交通通勤行為預測模型,以此解釋空間異質性對交通行為的非線性作用;Ramezani等[9]從建成環境角度綜合研究了一系列交通行為,包括活動空間、小汽車保有量、出行行為等;Hasnine等[10]將建成環境指標與區域氣象指標相結合,構建網約車需求預測模型;Tu等[11]選取成都市為分析單元,探求旅客出行方式劃分與建成環境間的作用機制。

綜上,最高聚集人數測算研究從立足于場站自身數據(行車時刻表、車位配比等)分析逐漸轉向多源數據特征提取預測。利用建成環境差異性分析交通行為獲得了較好的反饋[12-13],而最高聚集人數是旅客交通行為的派生變量,故本研究從空間異質性角度考慮最高聚集人數受建成環境變化的非線性作用機理。

1 研究數據描述

1.1 研究范圍

基于重慶市現有交通運輸樞紐場站總量,結合實際運營情況,選取其中具備基本場站功能區且發班正常的汽車客運站作為研究對象。共得到143個有效樣本,包括一級汽車客運站7處、二級汽車客運站30處、三級汽車客運站12處、四五級汽車客運站94處。區位涵蓋重慶市主城都市圈、渝東南、渝東北城鎮群共29個行政區縣(圖1)。

圖1 樣本數據區位分布示意圖

建立于空間角度的建成環境數據分析應注意尺度效應與區劃效應[14]。考慮到所有樣本數據點均分布在重慶市各區縣,故以重慶市行政區劃作為基本分析單元。為保證建成環境指標對樣本關聯性,同時考慮各樣本數據附近建成環境測度的異質性,參考相關建成環境劃分研究成果,因汽車客運站多為區域性交通服務設施,最終選取場站為圓心、半徑1 000 m形成的圓形緩沖區作為基本分析尺度。

1.2 數據獲取

各樣本的最高聚集人數來自重慶市各區縣綜合交通“十四五”發展規劃中場站設施部分和地方交通局工作簡報,具體報告由重慶市國際投資咨詢集團有限公司提供。汽車客運站經緯度坐標由百度地圖開放平臺API接口爬取。建成環境數據包含至市中心距離、土地利用混合度、交叉口數量、路網密度、道路服務水平、公交站密度、地鐵站密度、鄰近CBD距離、發車位配比9類表征變量。其中,地理信息類數據均由Python程序通過百度API接口進行爬取,交通信息類數據由開源地圖網站OSM截取,重慶市域范圍路網數據通過ARCGIS軟件緩沖區分析得出。

1.3 建成環境變量描述性統計

最高聚集人數受建成環境影響主要體現在可達性、公共交通支撐、路網復雜度、環境多樣性。通過計算市中心的距離、鄰近CBD距離表征建成環境的可達性影響,由各樣本點經緯度坐標和爬取的鄰近CBD經緯度坐標以及重慶市中心(選取重慶解放碑)經緯度坐標計算歐氏距離得到。公共交通環境的數據表征使用Python程序,借助百度地圖開放平臺計量各汽車客運站緩沖區內公交站、地鐵站數量得出。路網復雜度包括交叉口數量、路網密度、道路服務水平,均由ArcGIS緩沖區工具生成數據采集范圍,再利用分析工具獲取。環境多樣性主要由緩沖區內土地利用混合程度表征,統計緩沖區范圍內工業、商業、政府、醫院、公園、學校6類POI數量,完成土地利用熵指數[15]計算,見式(1)。

(1)

式中:pij為緩沖區j內第i種設施所占的比例;Nj為緩沖區j內包含的POI種類計數。

綜合上述9個建成環境指標,構建各汽車客運站建成環境測度模型。建成環境變量描述性統計見表1。

表1 建成環境變量描述性統計

2 模型構建

最高聚集人數與建成環境之間的具體作用方式受交通出行人心理、年齡結構等因素影響,呈現非線性關系,傳統的統計學模型難以捕捉各變量對因變量的影響程度。梯度提升決策樹(GBDT)模型是一種基于集成學習的決策樹算法,通過對殘差的不斷擬合學習逐漸提高預測精度。該模型在交通行為預測領域應用較為廣泛。最高聚集人數是交通行為的派生變量,本文中嘗試構建GBDT模型研究建成環境作用于最高聚集人數的非線性關系。為保證模型有效性,需對基礎數據進行空間自相關分析和多重共線性檢測。

2.1 空間自相關分析

地理信息領域常用莫蘭指數(Moran’sI)表達變量在空間上的相關關系[16]。本文中進行假設檢驗,提出零假設:備選變量在空間上不存在顯著相關關系;備擇假設:備選變量在空間存在顯著相關關系。通過ArcGIS空間相關性工具進行計算,計算結果見表2。可以發現,最高聚集人數在空間自相關分析中的p值小于0.05,拒絕零假設,說明存在顯著關系;前8個變量通過p檢驗,說明在空間尺度下均存在統計學意義,但作為第9個變量的發車位配比p值為0.138,未通過檢驗,考慮其莫蘭指數為0.51,值較高,故暫時保留該變量,進一步分析變量間的線性相關性。

表2 莫蘭指數分析

2.2 共線性分析

構建模型的因變量為最高聚集人數,自變量為9個建成環境指標。為避免因變量間的共線關系影響模型預測精度,對變量數據集進行多重共線性檢測。通過Matlab軟件內置的Corr函數,對變量兩兩進行Pearson相關性分析,結果見表3。表3內數據結構為(R,P)。可以發現,交叉口數量與路網密度之間存在強相關關系且通過顯著水平檢驗。考慮到交叉口與路網結構的依存關系和空間自相關分析結果,選擇保留該變量;發車位配比分別與4個變量存在顯著相關關系,同時考慮空間自相關分析結果,認為發車位配比不僅在空間上不存在統計學意義,還嚴重影響其余變量的正常表征,故剔除發車位配比變量;其余變量間均通過Pearson相關性檢驗,表明無顯著相關關系,故保留變量x1~x8。

表3 變量共線性檢驗結果

2.3 梯度提升決策樹模型

GBDT模型的核心思想是回歸樹的迭代學習,不同于分類樹,其計算值以累加的形式呈現,故對損失函數L(yi,η),yi為第i個樣本最高聚集人數值與預測估計值的差,η為使得損失函數最小的參數,即有:

(2)

利用負梯度下降(梯度提升)的方式不斷擬合損失函數,直到達到預測精度或最大迭代步數完成學習,最終得到:

(3)

梯度提升決策樹模型的具體學習步驟如下:

步驟1損失函數參數估計:初始化最高聚集人數計算模型F0(x),各回歸樹參照初始常數值設置進行損失函數參數η估算,有:

(4)

步驟2梯度計算:計算損失函數L(yi,η),并求偏導計算梯度:

(5)

其中:rim為負梯度,m為迭代次數,F(xi)為估計函數。

步驟3回歸樹參數估計:利用回歸樹hm(x,βj)對殘差進行擬合求解,使得殘差最小的回歸樹參數βm有:

(6)

其中:βm為第m次迭代時回歸樹參數;hm(x,βm)為第m次迭代時回歸樹的估計結果;N為樣本數。

步驟4回歸樹權重估計:迭代到目前步驟,已完成損失函數、回歸樹參數估計,還需估計回歸樹權重系數。繼續使用損失函數對回歸樹權重進行估計,有:

(7)

步驟5更新模型:

Fm(x)=Fm-1(x)+γmhm(x,βm)

(8)

步驟6判斷精度或步數:針對當前迭代結果進行精度檢驗,若達到預設精度則輸出最終模型;或檢查迭代步數是否達到最大步數,若達到則輸出模型;否則,返回步驟2繼續迭代。

對于決策樹類模型,因其集成學習的特殊性,可由所有基學習器(即子決策樹)計算分析各個變量對因變量的影響程度:

(9)

(10)

針對上述GBDT模型,借助Python程序“sk-learn”包中“ensemble”模塊進行求解,構建綜合考慮建成環境影響的最高聚集人數計算模型。在建模學習過程中,需要對模型的超參數進行設置,模型學習率與學習步長通常情況下具有耦合關系,需協同調整。當學習率較大時,需要更長的迭代次數以防止過擬合;反之,當學習率較小時,需要較小的迭代次數增強模型的泛化能力。采用五折交叉驗證法進行模型檢驗[12]。考慮研究樣本數據量為143,屬于偏小,故學習率和迭代步長不宜過小。為防止過擬合現象,設置學習率值為0.91,迭代步長為30;為表征所有指標對因變量產生的影響程度,并體現與OLS模型的區別,將單顆回歸樹深度結構控制為5,所含特征數即指標數量為8;原始樣本中各指標數據由“爬蟲”技術爬取,存在一定誤差,故樣本噪聲處理系數值取0.7進行降噪處理。

3 模型結果分析

3.1 全局分析

通常使用檢驗集擬合優度R2來檢驗模型的預測情況。為體現GBDT模型在建成環境非線性作用影響下的預測精度,采用傳統線性回歸(OLS)和隨機森林模型(RF)進行對比論證,具體結果見表4。RF模型的訓練超參數設置與GBDT模型超參設置在最大程度上保持一致,設置迭代步長為30,單顆決策樹深度限制為5,單顆決策樹最大特征樹取值為8,其余決策樹葉子數量和初始數生成方法等參數均使用缺省值。

表4 模型預測精度分析結果

經過對比分析發現,GBDT模型在訓練集和測試集2個維度上均優于RF模型和OLS模型。在GBDT與RF模型之間,因GBDT模型的基學習器由回歸樹組成,而RF模型由分類樹和回歸樹共同組成,故對于純數值變化類型的樣本數據集,GBDT模型更能有效捕捉自變量對因變量的影響程度;在GBDT與OLS模型的擬合優度對比方面,說明最高聚集人數與建成環境指標間的作用方式傾向于非線性影響。模型適用性方面,通過GBDT模型和RF模型的訓練集表現可發現,2種模型均能較好地表征樣本數據內部作用關系。模型泛化能力方面,針對最高聚集人數方面的研究中,變量屬性多為純數值變量,故GBDT模型的基學習器回歸樹更為占優,而RF模型的基學習器為分類樹,更適合在指標為邏輯變量和數值變量混合時使用。在泛化能力方面,GBDT模型在最高聚集人數測算方面表現較好。

從模型的顯著水平來看,所有變量均與最高聚集人數存在顯著相關關系。根據變量重要程度指標分析,影響最高聚集人數的最重要指標是土地利用混合度,貢獻程度為23%;其次是公交站密度和至市中心距離,貢獻程度分別為20%、17%,除地鐵站密度(4%)之外,其余變量貢獻程度在7%~12%范圍浮動。不難看出,土地利用混合度表征建成環境的多樣性,即表明該區域的綜合發展程度,故出行人在選擇汽車客運站時,傾向于選擇周邊環境便利、發展程度高的汽車客運站。公交站密度與地鐵站密度表征該建成環境的交通設施服務水平,研究結果表明周邊交通配套設施的齊全程度對最高聚集人數有主要影響。

3.2 單變量分析

采用控制變量法,取所有變量樣本數據均值為基礎數據,以上、下限為界獨立分析各變量與最高聚集人數的作用機制。

建成環境可達性指標對最高聚集人數的影響見圖2。

圖2 建成環境可達性指標對最高聚集人數的影響

最高聚集人數隨著至市中心距離的增大而逐漸減少,可理解為至市中心遠的區域為郊縣,其出行量必然小于主城都市區。其中,距離為12 km時達到最大值1 473人,之后隨距離增加而逐漸降低;在37~183 km區間內趨勢平穩,人數穩定在900左右;在210~310 km區間,人數穩定在550左右。出現2個平臺的原因可能是城市聚集效應影響導致閾值效應明顯,城區范圍內的汽車客運站受距離影響較大,而近郊和遠郊的汽車客運站因距離過大受影響較輕。與鄰近CBD距離整體呈負相關,距離越大,最高聚集人數越低。

建成環境多樣性對最高聚集人數的影響見圖3。土地利用混合度峰值作用明顯,在混合度為0.385時取得最大值1 504,小于該值時呈上升趨勢,大于該值時呈下降趨勢,最終趨于穩定。在土地利用混合度低時,說明區域基礎設施建設不完全,無法為出行人提供便利;在混合度較高時,區域發展水平高可能導致區域結構復雜,同樣不利于出行。

圖3 建成環境多樣性對最高聚集人數的影響

建成環境路網復雜度對最高聚集人數的影響見圖4。交叉口數量在0~20區間走勢平穩;從20開始最高聚集人數陡增至1 350,此后呈下降趨勢。路網密度變化趨勢相同,在1~1.7區間最高聚集人數上升至1 200,呈現U型關系。道路服務水平閾值作用明顯,在密度值為5.04時轉折聚集人數由900下降至230并趨于穩定。交叉口數量、路網密度和道路服務水平均表征建成環境路網復雜度,其值過小說明該區域交通組織存在局限,其值過大說明該區域復雜程度高,易增加出行人的心理負擔,進而影響最高聚集人數。

圖4 建成環境路網復雜度對最高聚集人數的影響

建成環境公交支撐度對最高聚集人數的影響見圖5。公交站密度與最高聚集人數之間整體呈正相關,在0.859~15.8區間人數逐漸上升。地鐵站密度與聚集人數存在明顯閾值效應,當密度值為0.366時,最高聚集人數為948;當密度值為0.844時,最高聚集人數為1 541。公交站布設難度小,布設站點廣,能基本表明該區域的公共交通支撐度,密度值高說明該區域公交便捷,利于換乘;而地鐵站密度受軌道線路布設影響大,樣本數據周圍至多存在3座地鐵站,大部分為0座,故考慮是樣本數據結構問題導致閾值效應。

圖5 建成環境公交支撐度對最高聚集人數的影響

4 結論

1) 最高聚集人數的變化趨勢在空間信息上存在顯著相關,且與建成環境指標有密切關聯。土地利用混合度貢獻程度最高,為23%;接下來是公交站密度,貢獻20%和至市中心距離,貢獻17%。這表明在新建或改建汽車客運站時,可結合區域控制性規劃著重考慮以上3個因素進行聚集人數的合理測算。

2) 在各變量的局部分析中,變量對最高聚集人數的非線性作用明顯,并有效詮釋了不同測度下對聚集人數影響的差異。其中,表征建成環境可達性的市中心距離和鄰近CBD距離均呈現負相關趨勢;建成環境多樣性的土地利用混合度峰值效應明顯,于0.385時取得最大值;建成環境路網復雜度中的交叉口密度指標隨著數值變化逐步增大,于23.7時取得最大值,隨后逐步減少。此外,路網密度和道路服務水平均呈現U型關系,故建議規劃時將取值控制在適宜區間;建成環境公交支撐度中的公交站密度呈正相關,地鐵站密度閾值效應明顯,故建議在汽車客運站建設時控制地鐵站密度。

猜你喜歡
環境模型
一半模型
長期鍛煉創造體內抑癌環境
一種用于自主學習的虛擬仿真環境
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
孕期遠離容易致畸的環境
不能改變環境,那就改變心境
環境
孕期遠離容易致畸的環境
3D打印中的模型分割與打包
主站蜘蛛池模板: 伊人久久综在合线亚洲91| 久久精品人妻中文系列| 99r在线精品视频在线播放| 无码综合天天久久综合网| 小蝌蚪亚洲精品国产| 青青青伊人色综合久久| 久热精品免费| 中文字幕免费在线视频| 欧美乱妇高清无乱码免费| 国产一区免费在线观看| 国产精品视频999| 国产精品99久久久久久董美香| 人妻少妇乱子伦精品无码专区毛片| 精品中文字幕一区在线| 国产福利小视频在线播放观看| 免费毛片网站在线观看| 香蕉综合在线视频91| 色天天综合| 女人18一级毛片免费观看| 国产主播喷水| 伊人久久大香线蕉综合影视| 久久综合丝袜日本网| 手机精品福利在线观看| 性视频久久| 欧美日韩91| 亚洲欧美成aⅴ人在线观看| 最新亚洲人成网站在线观看| 最新国产网站| 国产高清国内精品福利| 国产九九精品视频| 国产丰满大乳无码免费播放| 欧美一区福利| 99热这里只有成人精品国产| 午夜激情婷婷| 日韩一级毛一欧美一国产| 久996视频精品免费观看| 无码一区18禁| 国产区在线观看视频| 日本三级欧美三级| 91精品人妻一区二区| 不卡无码网| 国产在线八区| 成人午夜久久| 成人国产免费| 精品無碼一區在線觀看 | 久久精品无码一区二区日韩免费| 欧美a√在线| 亚洲va在线∨a天堂va欧美va| 欧美国产菊爆免费观看 | 一本大道香蕉中文日本不卡高清二区 | 在线无码私拍| 91成人试看福利体验区| 亚洲精品国产日韩无码AV永久免费网| 2021国产v亚洲v天堂无码| 国产福利在线免费| 精品国产一区91在线| 乱人伦99久久| 久久精品中文字幕免费| 香港一级毛片免费看| 国产欧美成人不卡视频| 国产新AV天堂| 黄片一区二区三区| 亚洲第一区在线| 四虎成人在线视频| a国产精品| 亚洲精品国产综合99久久夜夜嗨| 制服丝袜 91视频| 日韩av无码精品专区| 国模私拍一区二区| 国产网友愉拍精品视频| 国产性爱网站| 亚洲人成日本在线观看| 熟女日韩精品2区| 无码精油按摩潮喷在线播放| 波多野结衣无码AV在线| 极品国产一区二区三区| 亚洲成a∧人片在线观看无码| 激情成人综合网| 亚洲人成网址| 99久久精彩视频| 女同国产精品一区二区| 国产人人射|