——以煙臺市為例"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?王 昌,姜仙童,吳艷平
(交通運輸部科學研究院,北京 100029)
2020 年以來,受新冠肺炎疫情影響,我國部分地區地方財政收入減少[1],公交補貼壓力增大。為節約公交運營成本,提升其服務質量和運營效率,有必要全面了解公交企業的運營情況,掌握公交客運量的變化特征,科學劃分公交運營時段,為公交線路發車班次的確定和運營調度提供支撐。
公交調度和排班是城市公交運營的核心工作之一。其主要任務是合理分配現有的車輛和人員,從而制定科學的公交運營計劃。目前大部分城市公交的排班都是基于已劃分好的時段進行的。管理人員主要依靠經驗,將一天劃分為多個時段,如早高峰、晚高峰、平峰等,調度人員則基于各時段進行車輛和人員配置。目前,國內外針對公交線路資源配置的研究集中于內容、方法兩方面。在公交線路資源配置內容研究方面,馮樹民等[2]和劉新民等[3]通過構建評價指標體系,對公交資源配置進行了協調度評估;周煒地等[4]以資源配置為基礎,界定了公交線路運力合理配置的含義、目標及原則;還有研究提出通過優化列車時刻表來合理分配有限的資源,有效管理車輛和人員[5-7]。在公交線路資源配置方法方面,國內外研究主要集中于公交排班調度算法與評價:劉繼國[8]、周騫等[9]、丁勇等[10]通過遺傳算法解決公交車輛排班問題;程春陽[11]利用基于模擬退火算法的混合啟發式算法進行電動公交車的排班;陳童等[12]提出不固定時刻表生成技術和基于不固定時刻表的車輛排班計劃編制技術;李陶然[13]通過蟻群粒子群混合算法來求解公交調度模型;李文鋒等[14]運用時間牌輪循法進行城市公交的智能化排班;Domínguez-Martín等[15]提出加強的混合整數規劃模型用于研究車輛路徑調度問題;Liu 等[16]利用雙目標模型制定排班計劃表,使車隊規模最小;Maro? 等[17]基于線性模型研究電動公交排班問題的解決方法;Ciancio 等[18]利用模擬退火算法研究公交排班需求。
綜上,國內外已有研究主要通過對公交運行時間的研究來優化公交線路資源配置,缺少基于公交線路客流變化特征的線路資源配置時段劃分研究。實踐中,當前的公交企業主要是按照早高峰、晚高峰、平峰3 個時段來進行公交車的調度排班,缺乏隨客流量變化的精細化動態調整。鑒于此,本文選取煙臺市公交數據,分析其客流的時段變化特征,引入有序聚類法進行公交資源配置時段劃分,解決最優時段數的確定及各時段起終點的劃分問題,并提出各時段對應的公交運營調度措施,以期為公交運營的降本增效提供支撐。
本文以從煙臺市公交集團信息系統中采集的112 條常規公交線路2019 年客流數據為基礎,進行數據處理與挖掘分析,獲取公交客流信息。
公交線路客流數據主要來源于公交卡刷卡數據、微信支付數據和支付寶支付數據三方面,主要字段包括:routid(線路編號)、traddate(交易日期)、tradtime(交易時間)等,其中,交易時間為乘客上車時的刷卡時間或通過微信、支付寶支付票款的時間。數據示例見表1、表2。

表1 刷卡數據(部分)

表2 移動支付數據(部分)
本文以上車刷卡及移動支付人數作為公交客運量的表征。根據獲取的數據信息,刷卡人數占64.4%,支付寶支付人數占33.2%,微信支付人數占2.4%。
由于客流數據有3 個來源,因此需按一定時間維度對數據進行匹配與合并,并填補缺失數據,修正錯誤值。在處理好原始數據后,結合刷卡率對客流數據進行全樣本擴樣,為客流數據分析和公交線路資源配置方法研究奠定基礎。數據處理方法與流程如圖1所示。

圖1 數據處理方法與流程
1.2.1 數據匹配與融合
由于公交客流數據由公交刷卡數據、移動支付數據(微信、支付寶)組成,因此有必要對數據進行匹配融合。在對各數據進行錯誤篩選和清洗后,為減少誤差、提高計算效率,以公交線路ID 為基礎,以半小時(0.5h)為時間維度(刷卡或移動支付時間在某0.5h 內的人數為該0.5h 的客運量),匹配同一日期和時間維度的公交客流數據,匹配規則如下。
將刷卡數據中的公交線路編號、日期和時間分別與移動支付數據的公交線路編號、日期和時間匹配,并合并統計0.5h的客流量。
(1)routid(刷卡數據公交線路編號)=routid(移動支付數據公交線路編號)
(2)traddate(刷卡數據日期)=traddate(移動支付數據日期)
(3)tradtime(上車刷卡時間)=tradtime(上車移動支付時間),表示刷卡或移動支付時刻同在某0.5h內。
0.5h公交客運量計算公式為:

式(1)中:yh為0.5h 總客運量(人次);為0.5h 刷卡客運量(人次);為0.5h 移動支付客運量(人次)。
最后匹配融合的結果如表3所示。

表3 匹配融合數據表(部分)
1.2.2 填補缺失值
公交客流數據在記錄或上傳過程中可能會丟失,在檢測到缺失客流數據時,可根據客流數據的時間連續性或歷史規律填補缺失值,具體方法如下:
(1)根據時間連續性,采用相鄰時段客流量的平均值作為缺失值的補充值,計算方法如下:

式(2)中:ys為上一時段客運量(人次);yx為下一時段客運量(人次);yq為缺失時段客運量(人次)。
(2)相鄰上、下時間段數據仍然缺失的,利用上周或下周同時間段的歷史客流量數據填補缺失數據。
本文中,缺失值以上周同一時間數據為主要補充,上周同一時間數據異常或缺失的則采用下周同一時間數據進行補充。
1.2.3 修正錯誤值
在數據匹配過程中,若出現線路編號紊亂、時間日期格式不對、客流量異常等問題,會導致數據不匹配或匹配錯誤,因此,有必要對線路編號和時間格式等進行修正。通過篩選、人工糾正后進行匹配融合,無法修正的則刪除。客流量異常問題則根據客流量數據的時間連續性或歷史規律進行修正,與缺失值填補方法類似。
1.2.4 客流數據擴樣
由于本研究只獲取到了刷卡和移動支付數據,沒有投幣數據,為實現對全樣本的分析,利用該城市的總體公交客運量與總體公交刷卡量(含移動支付)計算刷卡率,基于0.5h 總客運量yh反推出0.5h內全樣本yhk情況。

式(3)中:Ys為總體公交客運量(人次);Yz為總體公交刷卡量(含移動支付)(人次);yh為0.5h 總客運量(人次);yhk為0.5h 內全樣本客運量(人次)。
基于已處理的公交線路客流數據,分析公交線路的客流時變特征,為公交資源配置時段劃分奠定基礎。
將煙臺市常規公交各線路每天每半小時的客運量數據按日期、線路和時間進行匯總,從而獲取所有線路每天的總客運量,再將日期對應到周中的每天,并求全年的均值,獲取如圖2 所示數據(圖2中工作日為星期一~星期五;節假日為元旦、春節、國慶、五一等法定節假日,周末指星期六及星期日)。由圖2可知,煙臺常規公交線路在工作日各天的客運量變化不大,而節假日的日均客運量不足40萬人次,周末較工作日日均客運量低8%以上,尤其是周日客運量更低。因此,在進行公交線路資源配置時,需區分工作日、周末和節假日的時段劃分并采取對應的調度方法。

圖2 煙臺常規公交線路日均客運量統計
以4:30—23:30 作為公交的運營時段進行分析,煙臺常規公交線路全年日均一天內不同時段客流變化情況如圖3所示。煙臺市工作日設置的早高峰時段為7:00—8:30,晚高峰時間段為16:30—18:30,在高峰時段客運量達到峰值。早上6:30—9:00,每0.5h 客運量超過了2 萬人次,晚高峰每0.5h客運量超過了1.8萬人次。周末客流變化也呈現早晚高峰形態,節假日則不明顯。由此可知,煙臺市公交資源配置的高峰時段設置相對不合理,線路排班和人員安排等方案有待優化。另外,從分析結果可看出,工作日、周末和節假日的公交客流特征相差較大,不同時段的客運量也相差較大,因此,在進行公交資源配置時段劃分時,有必要將三類日期分開分析。

圖3 煙臺常規公交線路全年日均一天內不同時段客運量變化情況
公交發車車次體現了公交運營效率,在有限的公交乘坐需求下,為公交線路設置合理的發車車次能節約公交車輛和工作人員等資源,獲得最大的旅客運送效率。不同時段的公交客運量具有不同的特征,因此,發車車次也需在不同時段合理配置。下文將利用公交客運數據,基于聚類分析法對公交線路車輛配置時段進行劃分。
有序聚類法的特點是將按順序排列的樣本看作一類,然后依據分類的誤差函數逐漸增加分類數,但樣本的順序不變[19]。公交客流數據具有按時間順序有序、連續排列的特征,因此,適合用有序聚類法劃分公交資源配置時段:將按時間排列的公交線路客運量視為一組有序樣本,以公交資源配置時段劃分為聚類目標,找到公交線路客流時段劃分的解決方法。
記按時間順序排序的客流量有序樣本X={x(1),x(2),…,x(n)}(x(i)為m維向量,i=1,2,…,n),將其分割為k段,根據排列組合原理,有種分割方法,其中有一種或多種是最優分割。
用W(n,k)代表把n個有序樣本分成k類的某種分法,各類分割計為:

式(4)中:Gk為第k類的分割;ik為k類的分割點;1=i1 (1)計算類直徑 類直徑表示各分段內部的差異程度,各分段內部差異越小,直徑就越短。某種分類G包含的樣本為X={x(1),x(2),…,x(j)},記為分類G={i,i+1,…,j}(j為G類中的元素),該類的均值向量(X(t)為第t個樣本),用D(i,j)代表這一類的直徑,有: (2)計算損失函數 損失函數L[W(n,k)]為: 損失函數越小,代表分段內的差異越小,也代表各分段間的差異越大。當參數n,k為已知數時,L[W(n,k)]越小,代表各分類的離差平方和越小,聚類結果就越合理[20],因此,要尋找使L值最小的W(n,k),即最優分割L[P(n,k)]: (3)L[P(n,k)]的遞推公式 有序聚類最核心的部分是利用以下兩個遞推公式: 以上兩公式由定義即可證明。其中由式(8)遞推出的式(9)表明,將n個樣本分為k類的最優分割,是建立在將各樣本分為k-1 類的最優分割基礎上的(這里j=2,3,…,n)。 (4)最優分段數k的確定 有序聚類法是在給定分段數的情況下進行的,因此需提前確定好最優分段數,最優分段數確定的方法有以下幾種: ①在最小損失函數L[W(n,k)]隨分段數k變化的曲線中,發生突變處的分段數為最優分段數k。 ②β值(貝塔系數)法:β=,β值越大,說明分段越優,當β值接近1 時則為最優分段數。 ③根據判斷先提出可能的分段數進行聚類,再對分段結果進行F檢驗,接受假設檢驗且F值最大的則為最優分段數。 基于有序聚類法劃分公交資源配置時段,前提是確定最優分段數。在以上的最優分段數確定方法中,曲線法需要人為判斷,存在人工誤差,F檢驗法需經多次試錯才能找到最優分段數。因此,本文利用不需要人工干預的β值法確定公交資源配置時段最優分段數。由公交客流時變特征分析結果可知,工作日、周末和節假日的客運量變化規律相差較大,因此,在聚類時需將這3 種日期分開研究,以3 種日期各自的0.5h 客運量(見表4)為聚類基礎,3 者的最優分割段數也不一樣。 表4 各日期類型的0.5h客運量(部分) 單位:人次 采用β值法確定3 種日期類型的公交資源配置時段最優分段數,結果見表5。 表5 各日期類型有序聚類的公交資源配置時段最優分段數 在最優分段數的基礎上,基于有序聚類法,對公交資源配置時段進行劃分: (1)工作日:4:30—6:30,6:30—9:30,9:30—16:30,16:30—18:30,18:30—23:30; (2)周末:4:30—7:00,7:00—9:30,9:30—18:30,18:30—23:30; (3)節假日:4:30—7:00,7:00—19:00,19:00—23:30。 為證明有序聚類結果的有效性,對有序聚類結果進行F檢驗。以工作日為例,檢驗結果如表6 所示。由表6 可知,工作日的5 類時段劃分的樣本標準偏差大于基準值,F檢驗顯著,說明各分段結果具有顯著差異。表7 所示為工作日各時段多重比較結果,早晚高峰(第2、4 類)與平峰(第1、3、5類)差異性較明顯,但早晚高峰(第2、4類)與早高峰之前時段(第1類)和晚高峰之后時段(第5 類)無顯著性差異(顯著性水平p>0.05),這也符合一天內的公交客運量變化曲線圖(見圖3)揭示的規律。因此,有序聚類方法有效,煙臺市公交早高峰時間應該調整為6:30—9:30。 表6 工作日聚類結果F檢驗 基于煙臺市公交配置時段劃分結果,充分考慮線路的時空不均勻性,確定不同時段內的公交發車形式及每種形式的車輛數。結合具體線路和站點的情況,建議各時段公交運營調度措施如下: (1)工作日6:30—9:30 和16:30—18:30 客流量較大,可采取區間車、加密發車間隔、大站快車、直達車、日勤車(高峰時段加入線路)等調度措施; (2)周末7:00—9:30 客運量相對較大,可采取局部加密發車間隔、大站快車、直達車等調度措施; (3)工作日的4:30—6:30、18:30—23:30,周末的4:30—7:00、9:30—18:30、18:30—23:30 及節假日全部3 個時段,客運量均相對較小,以“人多車密,人少車稀”為原則,可采取局部加密發車間隔、加大行車間隔、延長單程行駛時間、局部加大間隔增發區間車等調度措施。 本文基于煙臺市常規公交線路客流數據,利用有序聚類法劃分公交資源配置時段,得出煙臺市工作日、周末和節假日的公交線路資源配置時段最優分段數為5 個、4 個和3 個,并給出了具體的時段區間,劃分結果符合顯著性檢驗要求和客流變化規律,證明了該方法有效。研究成果可為公交運營調度提供參考,對排班計劃的制定和早晚高峰時段的劃分具有現實意義,相關部門可利用劃分好的時段,結合運營實際安排線路班次。由于數據資源有限,本文只獲取了煙臺市的公交數據,對其他城市尚未展開研究。在未來的研究中,可基于本文研究成果,對不同城市的公交線路資源配置時段進行劃分,并研究公交排班方法,從而為各城市公交運營降本增效提供支撐。3.3 有序聚類法的步驟




3.4 基于有序聚類的公交資源配置時段劃分



3.5 基于時段劃分的公交運營調度方法
4 結語