許 可 胡日昊 李瑋曄 黃素珍 劉桂蘭
(鹽城工學院,江蘇鹽城 224051)
共享經濟[1]的不斷發展,改變了人們的生活方式,共享單車的出現為人們的出行提供了極大的便利。大學校園里的共享單車的特點是單車的停放和使用都只能在校園內部,不可以將其騎行出校外并停放在校外。學生可以騎著共享單車穿梭在教室、宿舍、食堂和圖書館之間。但是不同地點所停放單車的數量,有時并不能夠滿足學生的需求。解決這一問題最直接的方法就是在學生常去和常在的地方大量投放單車,但過多投放會造成有些停車點單車閑置??茖W預測每個停車點的單車投放量可以為制定合理的單車投放策略提供依據。
本文以鹽城工學院希望大道校區為例,采集了不同時刻不同停車點的單車停放數據,基于時間序列分析方法,利用ARIMA算法和AR算法,對每個停車點的投放數目進行預測。以預測數目為依據,考慮損壞率,制定未來一周校園內各個停車點的投放策略。
為了充分體現大學生日常出行的特點,本文借助手機軟件“哈啰出行”獲取鹽城工學院希望大道校區八周內幾個關鍵時刻,主要不同停車地點處的停放數目,如圖1所示。

圖1 “哈啰單車”單車停放數目界面
采集的數據包含四種屬性:停車地點、停車數目、時間段、星期數。學生常去的地方主要有教室、宿舍、食堂、圖書館、操場等。因此,選?。阂黄谒奚崛?、二期宿舍群、博學樓、一期食堂、二期食堂、圖書館、操場、東大門、北大門以及兩大二級學院樓群,共11個主要停放點。不同時間段學生使用單車量不同,一般上課前10 min和下課后10 min是單車使用的高峰期。因此選?。?:40、8:00、9:40、10:00、11:40、12:00、13:40、14:00、15:40、16:00、17:40、18:00、19:00、20:00共14個時刻。
設Xi(k)為停放數目,其中變量i表示停車地點的代號,共計11個,即i=1,2,…,11;變量k表示時刻標號,選取了共計14個典型的時刻,即k=1,2,…,14。其中地點名稱對應的ID 如表1所示。

表1 停車地點名稱及其ID
由于大學生使用共享單車的頻率既存在規律性,也存在著無規律性,所以搜集到的共享單車數據主要為白噪聲序列與非平穩序列兩種。例如周末為假期,老師和學生的活動并不確定,所以周末共享單車的使用就是一個白噪聲序列,存在隨機性,是無法使用時間序列來預測的;又如線下上課改為線上上課,也會大幅影響共享單車的使用。因此做如下假設:
(1)假設學生使用完共享單車后,都停放在常用停車點;(2)假設校園內共享單車不因損壞等因素而數目變少;(3)假設每天上課出行的學生人數不變;(4)假設周末學生不使用共享單車;(5)假設學生不將單車停放校門口外的“灰色地帶”,始終將車停放在校園內部。
剔除不符合上述假設的數據,將符合上述假設的數據稱為常規數據。在正常的情況下,共享單車的使用大部分為有規律的,與大部分學生的生活和作息相關,所以常規數據主要為非平穩序列。但由于個體的差異性,存在其他需求,所以常規數據中仍然會存在少量的白噪聲序列。
數據的穩定性是時間序列預測的關鍵,一組數據的平穩性在于它在一段時間內圍繞一個范圍上下浮動,達到平穩要具備以下三個條件:
(1)數據的均值為常數:

(2)方差為常數:

(3)任意相隔h個時刻的數據的協方差相同:

通過已知數據繪制折線圖,可以看出大部分時間段,大部分地點,單車使用數據趨于平穩。對于已知數據中的非平穩的序列,采用差分進行預處理。
記?為差分算子[2],則一階差分為:

二階差分為:

通常情況下進行一階差分,如果一階差分之后數據仍不平穩,可以再進行二階差分。大多數情況下,數據在進行二階差分下就平穩了。
時間序列預測是一種回歸預測的方法,利用歷史的數據,推測未來的數據發展趨勢。有關時間序列預測的模型常見的有以下4種[3]:
(1)自回歸(AR)模型:

(2)滑動平均(MA)模型:

(3)自回歸滑動平均(ARMA)模型:

(4)差分自回歸滑動平均(ARIMA)模型:

式中:Xt——時間序列值;εt——現在和過去的誤差或沖擊值;ai(i=1,2,…,p)——自回歸系數;bi(i=1,2,…,q)——移動平均系數。
ACF是自相關系數序列函數,在時間序列內反映了Xt與Xt-k的相關程度,PACF是偏自相關函數,反映的是滯后值的相關性。通常情況下,平穩的序列自相關圖有拖尾和截尾兩種,拖尾有一個衰減的趨勢,但不全為0,截尾指在某階后,系數都為0。當自相關是拖尾、偏相關是截尾時,使用AR算法。當自相關是截尾、偏相關是拖尾時,使用MA算法,自相關和偏相關都是拖尾,則使用ARIMA算法。利用Matlab軟件,分別畫出11個地點的自相關圖和偏自相關圖,其中停車點1的自相關圖如圖2所示,停車點1的偏自相關圖如圖3所示。

圖2 停車點1自相關圖

圖3 停車點1偏自相關圖
從各個停車點的自相關圖和偏自相關圖可見,11個停車點ACF均為拖尾,PACF為拖尾的有:1、3、4、5、6,PACF為截尾的地點有:2、7、8、9,其中10、11雖然為拖尾,但隨著系數趨于0,可以近似為截尾。共享單車使用受時間相關性影響較大的還是教學樓、食堂、宿舍,而其余地點受時間相關影響相對較小,主要是受其他因素影響,具有隨機性,也可以理解為白噪聲擾動。
根據ACF與PACF的結果,可以確定使用時間序列模型。對地點ID 為:1、3、4、5、6,使用ARIMA算法。對地點ID為:2、7、8、9、10、11,采用AR算法。各停車點各關鍵時刻的單車停放數目預測結果如圖4所示。

圖4 未來一周各停車點各關鍵時刻共享單車數目預測
從圖4可知,每個停車點不同關鍵時刻停車數目不同,在制定投放策略時,既要盡可能滿足大學生騎行需求,也要考慮單車的損壞率。

根據經驗,取s=0.20,計算得到未來一周各個停車點的單車投放數目,具體初始投放數目策略如表2所示。

表2 各停車點單車初始投放數目 單位:輛
從表2可知,博學樓投放量最大,達174輛,這是因為博學樓是全校的絕大部分課程的教學場所,其次是一期宿舍和二期宿舍,學生每天都要從宿舍出去,又要回到宿舍,投放量大是合理的。投放量最小的是兩個校門,只有不到40輛,因校內生活配套齊全,無須頻繁出校門。
本文基于時間序列預測了校園共享單車停車數目,實際的校園共享單車使用情況較為復雜,很難滿足上述全部假設,特別是停車點的不規律性以及單車損壞的隨機性。因此,本文最終所給出的投放策略刻意加大了初始投放數目,盡可能滿足學生的騎行需求。共享單車在大學校園的投放離不開學校的資金投入和相關政策的實施,共享單車的停車點選址有待進一步深入研究。