高洪波, 張登銀
(1.江蘇城市職業(yè)學院,科研處, 江蘇,南通 226006;2.南京郵電大學,物聯網學院, 江蘇,南京 210003)
近年來,隨著我國民用汽車保有量幾何級數式的增長,道路交通擁堵問題已呈現常態(tài)化,這種交通現狀制約了社會經濟的良性發(fā)展,而且還是空氣質量下降的“元兇”之一。當前我國城市空氣質量不盡人意,道路交通擁堵就是其重要緣由之一,其所造成的人力物力的浪費也是非常巨大的。
為了解決上述問題,近年來智能交通系統(ITS)成為了熱點問題,而車聯網又是其中的一個重要內容。車聯網(Vehicular of Networks,IoV)有機融合了當前的物聯網技術、大數據分析和云計算等多項技術[1]。車聯網技術的應用,能夠將汽車運營相關環(huán)境中的數據采集與處理設施加以整合,通過及時的分析處理,為改善道路交通狀況奠定基礎。車聯網的實際應用已表明它能較好的改善交通狀況,有利于營造快捷、安全、環(huán)保的道路交通環(huán)境,是實現智能交通的重要抓手與途徑,智能交通系統車聯網技術的應用,有效地降低了道路交通擁堵、交通事故率和能源消耗,可以起到激活整個交通路網運行狀態(tài)的作用[2-3]。
在智能交通系統中,道路交通狀態(tài)的動態(tài)預測是其中不可或缺的組成部分,其核心功能之一是實時、準確地進行短時交通流預測。基于車聯網智能交通系統的實現,其中一個重要的問題就是短時交通流預測,它是交通管控的重要基礎,其表現在實時性、高效性等方面的預測性能的好壞,將直接關系到交通管控的有效性。
短期、中期和長期是三種常見的交通流預測類型,道路交通的不同狀況決定了交通流預測步長的差異[4]。例如,對于城市交通路網,因為實時性要求比較高而通常需要預測未來短時交通流狀況,而短時交通流預測能夠比較好地滿足這種要求,這也是由城市交通管控的需求所決定的,因此如何提升短時交通流預測精度成為了相關研究的重點內容。文獻[5]提出了一種自適應單指數平滑法,主要采用近似動態(tài)規(guī)劃方法,依據交通流數據特征優(yōu)選平滑系數,達到隨預測過程自動更新的目的。文獻[6]提出了基于長、短期結合的組合預測建模,即采用雙指數平滑、傅里葉級數殘差修正構建短期預測模型,長期預測則借助了馬爾科夫模型。文獻[7]針對城市軌道客流,提出了以小波分析去噪,再借助時間序列方法和神經網絡法進行預測,上述方法相互結合得到最終預測值。文獻[8]主要采用了三次指數平滑尋找預測最優(yōu)平滑系數,以進一步提高預測精度。
雖然上述研究對短時交通流量預測有一定的借鑒和參考價值,但也難免存在著下述有待完善和探討的問題。其一,一些方法過于繁復,計算量龐大,如文獻[6]和文獻[7]等提出預測建模方法;其二,一些方法在參數選擇確定方面欠周全,如文獻[8]提出的利用等距法尋找最優(yōu)平滑系數,但未提及和研究指數平滑法另外一個重要參數—初值如何確定。
本文提出了一種基于雙參數尋優(yōu)的改進三次指數平滑模型,即按一定的步長逐次改變平滑系數和初值,以平均相對誤差最小時所對應的平滑系數和初值為最優(yōu)值,進而達到進一步提升預測精度的目的。
指數平滑法因其對中短期時間數據序列預測有著較好的精確性而被廣泛應用于生產實踐,該法最早由布朗提出,對于時間數據序列變化趨勢而言,他提出了因其具有一定的規(guī)律性而能夠被合理地順延預測。指數平滑法就其基本思想而言,即是利用平滑系數和一定的初值將時間數據序列的差異加以弱化,通過對統計數據進行加權修勻來近似擬合數據的隨機變動獲得預測值。短期時間序列預測采用指數平滑法,因其簡單易行、可靠性較高而在實踐中得到廣泛應用。指數平滑法又可分為一次平滑、二次平滑和三次平滑[9]。對于非線性變換的時間序列預測而言,三次指數平滑就其實質是在實施二次指數平滑的基礎上進行再一次平滑處理,該法對時間數據序列變動狀況為非線性的二次曲線趨勢的情形較為適合,三次指數平滑法較之于其他指數平滑顯現出更好的性能,但同時該法對平滑系數和初值的要求相對更高[10]。由于交通流時間數據序列動態(tài)變化趨勢為典型的非線性形態(tài),用三次指數平滑法進行預測具有相對的優(yōu)勢。三次指數平滑法的公式如下:
(1)
(2)
(3)

(4)
其中,m為步長,且:
由上面的公式可以看出,在進行三次指數平滑時,有2個關鍵的參數需要預先確定,即平滑系數α和初值,這兩個參數的選取對預測精度至關重要,選取的合理與否直接關系到最終預測值的精度。
傳統的三次指數平滑法通常是在預測之前預估平滑系數和初值,其具體方法如下。
(1)對于平滑系數的預估,如果時間數據序列變化形態(tài)比較平穩(wěn),則平滑系數應取小一點,如在0.1到0.5之間取值,其目的是使預測模型包含更多時間數據序列的信息;如果時間數據序列呈現較大的波動趨勢,則平滑系數應取大一點,如在0.6至0.8之間取值,其目的是增加預測模型靈敏度,以便與數據變化趨勢相吻合。
(2)對于初值的預估,當時間數據序列采錄的數據較多,初始值對后面預測值影響相對較小,故此時可選取第一期數據作為初始值;如果時間序列采錄的數據較少,初始值對預測值將存在很大的影響,此時一般以若干初期實際值的算術平均值作為初始值。
總之,傳統的指數平滑法不論是平滑系數的選取,還是初值的確定都是按經驗預估的,不可避免地存在著盲目性和隨意性等問題,從而導致預測結果與實際值的偏差較大。例如,不恰當平滑系數α的選擇和初值的確定,加之模型在預測的過程中不能自動適應數據的變化態(tài)勢,必將導致預測結果和實際值之間誤差越來越大。因此,有必要對傳統的三次指數平滑法進行相應的改進以達到進一步提升預測精度的目的。
本文提出了基于雙參數尋優(yōu)的改進三次指數平滑法模型,其核心思想是使預測值與實際值間平均相對誤差預測最小來確定平滑系數和初值,依據預測值和實際值的平均相對誤差大小來判定取值的優(yōu)劣,其目標是力爭取得誤差相對較小的作為理想值,以提高預測的精度。
三次指數平滑法兩個關鍵參數—平滑系數和初值雙參數尋優(yōu)改進的思路是:首先確定平滑系數值,即采用等步長尋優(yōu)法(例如步長0.01)進行搜索平滑系數α的最優(yōu)值,尋優(yōu)準則是使平均相對誤差最小;然后基于上面得到的平滑系數值,依次選取前2個、前3個至前n個實測的時間序列數據值之和的算術平均值作為指數平滑法的初值,分別計算預測結果與實測值間的平均相對誤差,取使平均相對誤差最小時的算術平均值為指數平滑法的初值。其具體算法步驟如下。
Step1:選定實測歷史時間序列數據集,設定步長 0.01,自0.1開始逐漸遞增平滑系數α的取值,分別計算預測值與實測值間的對應的平均相對誤差值。
Step2:直到當α所對應的平均相對誤差值出現最小值時終止,該值即為所求平滑系數值。
Step3:以上面得到的平滑系數值為基礎,依次選取前2個、前3個至前n個(n通常取值范圍為2到8)實測的時間序列數據值,分別求算術平均值作為指數平滑法的初值。
Step4:分別計算上述每個初值對應的預測結果與實測值間的平均相對誤差,取使平均相對誤差最小時的算術平均值作為三次指數平滑法的初值。
Step5:取上述所得到的初值和α值作為三次指數平滑預測的最優(yōu)初值和平滑系數。
以南京市某地2015年8月19日7:00至19:00的車聯網實測車流量數據作為仿真對象,該路段為城市交通區(qū)域主干路段。車流量數據采集方式為每隔半小時采集一次,共采集24次,這里用1至24序號對應每個采集時間段,具體車流量數據如圖1所示。

圖1 路段實測時間序列數據
按本文所提出的改進的三次指數平滑法,首先確定平滑系數α值,即可得到當其值為0.3時,三次指數平滑法的預測值與實測值間的平均相對誤差最小,具體可見表1。表1列舉了平滑系數自0.25按步長0.01遞增的局部數據示例,表1中α表示選取的平滑系數,T1表示對應于平滑系數的相應平均相對誤差,從表中可以看出當平滑系數取0.3時預測結果最佳。綜上所述,平滑系數的取值不同,對應的三次指數平滑預測的精度有所不同,由實際數據推算可以發(fā)現,該法預測精度并不隨平滑系數的遞增或遞減而逐漸提升或下降,本文采用選取平滑系數一定的變化區(qū)間,按一定步長遞增選取平滑系數,通過比較取平均相對誤差最小得到最優(yōu)的平滑系數的方法具有較好的有效性和可操作性。

表1 平滑系數的選取
取前3個至前8個實測值作和,并分別求其算術平均值,經計算可以發(fā)現,當初值取前6個實測數據值(n=6)的算術平均值時,指數平滑預測值與實測值間的平均相對誤差最小,見圖2。

圖2 選取前3至8個數據均值對應平均相對誤差
選取上述確定的最佳平滑系數0.3和前6個實測數據之和的算術平均值作為初值進行預測,得出的預測結果與實測數據點間擬合圖如圖3。從圖中可以看到,預測的結果是十分理想的。

圖3 預測值與原始實測值擬合對照
為了進一步驗證本文所提出的改進的三次指數平滑法的優(yōu)勢,計算它們各自預測結果的平均相對誤差,如表2。表2中,α,n分別表示平滑系數和初值選取時間數據序列前幾項的個數,T1表示對應于不同的α,n值的相應的平均相對誤差。

表2 改進模型與傳統預測模型間的比較
由表2可以看出,當平滑系數自0.1遞增至0.4時,平均相對誤差從逐漸減小到開始增大,即預測的精度從逐漸提升到后來下降,這個過程中存在著一個拐點,這個拐點即是我們最終需要的雙參數值。綜上所述,改進后的三次指數平滑預測模型(α=0.3,n=6)與通過預估平滑系數和初值的傳統指數平滑法預測相比,平均相對誤差最小,這進一步說明了本文提出的基于等步長雙參數尋優(yōu)的三次指數平滑改進算法較之于傳統的指數平滑法的精度更高,可以有效地避免傳統指數平滑法由于平滑系數和初值這兩個關鍵參數預估的不確定性而導致的預測結果出現較大誤差。
車聯網技術的興起為智能交通系統建設和解決日益嚴重的交通擁堵問題提供了良好的解決途徑[11-12]。本文針對車聯網智能交通系統其中的一個核心問題——短時交通流預測,提出了一種基于雙參數尋優(yōu)的改進三次指數平滑預測模型,最后依據實測交通流量時間數據序列,對本文構建的預測模型進行了實證分析,結果表明本文提出的模型較之于傳統三次指數平滑法模型在精度方面得到了較大的改善,有效避免了由于相關參數的預估不準而導致預測的盲目性,并且該算法便于計算機編程實現,符合建模可操行和高效性等原則。
當然,隨著車聯網技術的迅猛發(fā)展,短時交通流預測領域仍有待突破性的研究,本文研究重點在于算法的改進,雖然本文提出的預測模型對短時交通預測有一定的借鑒參考價值,但由于道路交通狀況是一個非常復雜的非線性動態(tài)過程,實際的交通流量還會受到天氣變化,交通事故等突發(fā)情況的影響,因此難免存在著一定的局限性。