李碩 張萌萌 陳勇恒



摘 要:交通數據的質量修復是使用正確的交通數據進行預測分析以及交通管控的基礎,一床數據修復方法主要包括兩部分:一是基于單一的時間維或空間維的修復方法,而另一種則是基于時間維度和空間維度相結合的異常數據修復方法。由于交通數據的復雜性,并不是所有的算法都能適應這些數據,而且隨著大數據時代的到來,對算法的復雜度等要求越來越高,因此,國內外對交通數據的評價與質量控制的研究并未止步。而本文則對此進行了研究,提出了一種基于時空特性分析的交通異常數據修復方法研究。
關鍵詞:交通數據;異常;數據修復
0 引言
交通信息采集過程中,無論是傳感器的故障還是檢測環境的影響,致使獲取的數據往往存在異常、錯誤、缺失等質量問題。因此,國內外學者針對異常數據的修復展開了研究。孫玲等[1]提出了一種基于交通數據時空分布特性的交通數據質量控制理。陸化普等建立了基于數據驅動的動態閾值模型,以實現交通故障數據的實時識別。邴其春提出了一種新的交通數據質量控制方法,此方法的核心就是Tucker張量的分解。
1 基于時空特性的交通異常數據修復方法
對于基于時間序列的交通數據質量控制方法模型有很多,本文采取的是二次指數平滑法,而基于空間維度的修復方法本文只采用了相鄰車道的修復方法。不同的故障數據情況會選用不同的數據修復方法,當個別時間段的交通數據故障時,可以考慮選用當前路段和當前時間段的歷史數據來進行修復,也可以考慮利用缺失車道的相鄰的具有相同交通功能的車道的數據進行修復;當連續長時間段的交通數據故障或缺失時,也可以考慮上述兩種修復方法。
1.1 土地利用對異常數據修復的影響分析
本文考慮到土地利用類型的變化以及大型交通活動對交通流會產生影響,在相同的地點以及相同時間段內的不同日期的車流量會有很大的不同,如圖1所示。本文針對特殊情況下的異常數據修復,通過計算大型交通活動或者時新建用地對交通流產生的吸引強度,通過交通流分配理論對誘增交通量進行分配,從而在基于時間序列的基礎上加上分配到路徑的流量。
1.2 基于時空特性分析的交通異常數據修復方法
本文既考慮到了在數據修復算法的高效性,又考慮到了突發交通活動對短時間內交通流的影響,因此,本文建立了基于時空分布特性的異常數據修復算法,較好的適用于突發活動的交通流。結合土地利用性質和動態交通流分配,本文提出了以下預測模型:
式中:
Qj表示第j條路段最終預測的交通流量;qj表示第j條路段基于時間序列模型的預測流量;表示第i交通小區誘增出行量;pij表示第i交通小區第j條路段的分配率;K1表示修正系數;n表示劃分的交通小區。
2 實驗分析
本文選取實驗數據源是濟南西客站的流量數據,主要選取了兩個路段:濰坊路、淄博路。以這兩個路上的流量數據為實驗數據源,選取了基于時間序列的常用的幾種算法進行了實驗,主要有:移動平均、加權移動平均、一次指數平滑、二次指數平滑。下面對其分別進行了均方誤差與均方百分比誤差的分析。
本文選取了濟南西客站-濰坊路為數據源,對比分析了移動平均、加權移動平均、一次指數平滑、二次指數平滑四種數據修復算法的誤差,從以上實驗可以看出,二次指數平滑的效果較好,誤差較低。指數平滑相對于移動平均而言,對時間序列進行了加權處理,具有更好的預測效果,二次指數平滑法相對一次指數平滑法而言,二次指數平滑對斜坡形趨勢的數據處理效果較好,因此本文在數據修復方法中選取了二次指數平滑。
3 總結
本文針對交通異常數據的修復方法進行了研究,結合交通流的時間特性,利用時間序列放法對異常交通流數據進行預測修復,考慮到交通流的空間特性,結合土地利用性質的變化以及交通流分配理論對異常的交通數據進行了修復。但是,涉及的交通流分配的問題并未作深入的研究,因此,在下一步,可以就交通流分配最優化問題進行研究,進一步的優化數據修復模型。
參考文獻:
[1]孫玲,劉浩,牛樹云.考慮時空相關性的固定檢測缺失數據重構方法[J].交通運輸工程學報,2010,10(05):121-126.
通訊作者:張萌萌