支持向量機在智能交通系統中的研究應用綜述*

2020-06-11 01:02:58李雷孝

計算機與生活 2020年6期

林浩，李雷孝+，王慧

1.內蒙古工業大學數據科學與應用學院，呼和浩特010080

2.內蒙古自治區基于大數據的軟件服務工程技術研究中心，呼和浩特010080

1 引言

智慧交通的前身是20 世紀60 年代后期提出的智能交通系統（intelligent transportation system，ITS），ITS 作為一個充滿學科交叉的綜合性研究領域，將信息技術、計算機技術、數據通信技術、傳感器技術、電子控制技術、自動控制技術、運籌學、人工智能等學科成果運用于交通運輸管理、服務控制、車輛制造等難點問題中[1]。ITS 涵蓋了公路、鐵路、民航、水運等交通方式，通過整合多元化信息，對數據進行挖掘后分析潛在價值數據，可為政府和道路使用者提供科學的管理依據。

支持向量機（support vector machine，SVM）是一種基于統計學習理論的機器學習算法，于1964 年誕生，又在2004 年達到鼎盛。SVM 自1995 年來得到了快速發展并衍生出一系列擴展算法[2]。由于交通數據普遍具有非線性、非平穩性、潮汐性等特點，而SVM 通過尋求結構風險最小化來最小化實際風險，具有優秀的泛化能力，能夠較好地解決非線性數據、小樣本和維數災難等問題。這使它被廣泛應用于智能交通系統領域。但SVM 也有其自身局限性，例如：傳統SVM 無法解決多分類問題；對大規模數據訓練的效果不佳；大數據背景下訓練時間過長；核函數參數的確定困難；在理論上SVM 只能提供次優解等問題[3]。針對SVM 的缺點，各個研究領域的學者提出了多種不同的優化方案。

2 支持向量機

2.1 支持向量機基礎理論

支持向量機根據用途可分為支持向量回歸機（support vector regression，SVR）和支持向量分類機（support vector classification，SVC）。

其核心思想是尋找一個滿足分類（回歸）要求的最優超平面，使得該超平面既保證精度又能使得到超平面最近樣本的距離最大（小），如圖1、圖2 所示。

Fig.1 Support vector classification圖1 支持向量分類機

Fig.2 Support vector regression圖2 支持向量回歸機

以二分類問題為例，設訓練樣本集為{(xi,yi)|i=1,2,…,n},xi∈Rn，其中xi為輸入樣本，yi為輸出樣本。則超平面可記作：

可計算出分類間隔為2/||w||，后引入Lagrange 函數解決該最優化問題，則該超平面可轉化成：

令Lagrange 函數對w、b的偏導數為0，則可將問題轉化為對偶問題，則最終最優分類函數為：

對于非線性問題，SVM 可以通過引入核技巧（kernel trick）解決。其核心思想是將輸入向量映射到一個高維的特征向量空間，并在該特征空間中構造最優分類面。非線性的SVM 超平面問題可寫成：

式（4）中引入了懲罰因子C和松弛變量ξi，C的作用是調整誤差，決定了模型因為離群點而帶來的損失，同ξi一樣都是可優化的超參數。從數學模型中可看出SVM 只涉及樣本間的內積運算，故在高維空間不需進行復雜的運算。

2.2 支持向量機開源工具

2.2.1 SVM 工具箱

Matlab 是國際上最流行的科學與工程計算軟件，承擔了大部分新算法的開發任務。Matlab 擁有自帶的SVM 工具箱，并提供了訓練模型和預測的相關函數。但Matlab 自帶的SVM 工具箱僅支持二分類問題。無法改變核函數和其參數，導致在功能性和易用性方面和其他開源工具差距較大。針對這些問題，學者們開發了LSSVM、OSU_SVM、SVM_SteveGunn等工具箱，并提供了可視化函數。但Matlab本身無法應用于大數據量情況，故研究數據量大的問題時應選用其他工具。

2.2.2 Scikit-Learn

Scikit-Learn 是一個基于Python 語言開發的機器學習算法庫，它建立在NumPy、SciPy、matplotlib 等擴展程序庫上，可簡單高效地實現數據挖掘和數據分析等功能[4]。Scikit-Learn 使用起來簡單，并更易于和其他數據處理技術結合，是研究學習以至于實際應用SVM 的重要工具。Scikit-Learn 通過高封裝實現易用性，這導致有些參數都在算法API（application programming interface）內部調用，算法整體優化難度大。

2.2.3 LIBSVM

LIBSVM 是臺灣大學林智仁教授等人開發設計的一個簡單高效的SVM 軟件包[5]。LIBSVM 中提供了很多的默認參數，并自帶了交互檢驗、數據歸一化等功能。目前，LIBSVM 擁有C、Java、Matlab、Python、R 等26 種語言版本。實際上，Scikit-Learn 中的SVM 函數底層是基于LIBSVM 和LIBLINEAR 實現的[6]。LIBSVM 對數據輸入輸出格式較為嚴格，這使它很難集成到其他應用。但其功能的專業性和完整性使它成為了學術研究的首選工具。3 種開源工具的比較如表1 所示。

3 支持向量回歸在ITS 中的研究及應用

3.1 客流量預測

近年我國交通行業發展迅速，客流量激增、飽和的情況經常發生。準確及時地預測客流量直接影響著客運計劃的制定。客流量預測領域是SVR 應用和研究最多的領域，文獻[7]基于SVR 提出了一種短時交通流量預測模型，并分析了交通信息的非線性、復雜性和不確定性，為后續研究提供了重要的指導意義。文獻[8]將SVR 引入航空客流量預測中，證明了SVR 同樣適用于民航客流量預測。

只有精確預測客流量才能保證客運計劃的合理性。為了提高SVR 模型的準確率，文獻[9]采用遺傳算法（genetic algorithm，GA）優化SVR 預測了鐵路客流量，實驗證明經遺傳算法優化參數后的SVR 比傳統SVR 準確率高。因天氣、溫度、節假日等多個因素與客流量相關，文獻[10]基于文獻[9]的方法，采用主成分分析（principal component analysis，PCA）對多個斷面的交通流數據進行降維。結果表明，該方法比未數據降維的方法效果更好。文獻[11]先使用粗集理論的強定性分析約簡輸入數據，再利用SVM 預測交通流量，有效地消除了樣本中冗余數據和噪聲數據。文獻[12]使用基于黃金分割的混沌粒子群（particle swarm optimization，PSO）算法優化SVR，并設計了基于RBF 核（radial basis function）與多項式核函數的混合核函數彌補常用核函數的局限性。文獻[13]基于深度信念網絡（deep belief nets，DBN）和SVM 提出了一種交通短時客流深層預測模型，并使用多個群智能算法優化SVM 的參數。結果表明該深層模型各方面優于GA-SVM、PSO-SVM、BPNN（back propagation neural network）、LSTM（long short-term memory）等淺層模型。

Table 1 Comparison of SVM tools表1 支持向量機開源工具比較

隨著SVM 算法研究的深入，客流量預測的準確率也越來越高，但也仍然存在許多問題。在目前的研究中，客流量數據大多以10 min、15 min 和30 min為時間間隔，時間間隔越短隨機性越強，預測的難度也就越大。客流量數據的橫向周期性已成為共識，但縱向隨機性的研究較少。假設需要預測的車流量為xij，其中i表示天數，j表示時段。(xi-n,j,xi-n-1,j,…,xi-1,j)表示第i天的前n天第j時段的車流量，體現數據受到的橫向周期性影響；(xi,j-m,xi,j-m-1,…,xi,j-1) 表示第i天內第j時段的前m個時段的車流量，體現數據受到的縱向隨機性影響。即某時段客流量應受到同一天內該時段前若干時段客流量的影響與若干天前該時段客流量的影響。如不考慮天氣、溫度等原因，模型的輸入應為：

同時，效率低下的客流量預測方法對現實恐無指導意義。要將算法應用于客流量預測這種實時性較強的領域，不僅要保證準確率，更要注意算法效率。在大數據時代，客流量預測還有很大的研究價值和空間。

3.2 交通擁堵評價參數預測

為了量化交通擁堵程度，國內外學者從道路服務水平（V/C 比）、擁堵時間比和經濟比等不同角度出發，設計了許多具有整體完備性、客觀性、可操作性、可比性的因素指標。常用的指標有交通流平均速度、交通流密度和路段飽和度等[14]。

交通流平均速度是指單位時間內該條道路中所有車輛行駛距離的平均值。交通流密度是指在單位時間內該條道路單位長度內的車輛數，計算方法如下：

其中，f為車流量；v為平均速度。

路段飽和度是指該路段實際交通流量與最大通行能力的比值，其反映的是道路的實際負荷能力。路段飽和度的計算方法如下：

其中，V為該道路當前車流量；C為道路最大通行能力。

交通擁堵評價參數預測是SVR 的另一個應用熱點。文獻[15]利用SVR 預測交通流平均速度，并結合K-均值聚類、PCA、自組織特征映射等無監督學習算法分析其時空特征。文獻[16]使用均值濾波和PSO算法優化SVR 預測車道飽和度，并使用悉尼的真實道路數據對預測模型進行了驗證。結果表明，所建立的模型能夠有效預測未來車道飽和度以及有可能發生的道路擁堵。文獻[17]在文獻[16]的基礎上增加了平均車速和交通流密度的預測，通過3 個擁堵評價參數構建了多指標的模糊綜合評價模型來描述交通擁堵情況。

通過預測多個交通擁堵評價參數綜合評價交通擁堵是預測未來時刻交通擁堵較為先進的方法。其中，參數預測的準確率決定了擁堵預測的精度和實際指導意義[18]。此外，基于V/C 比的交通擁堵評價參數因其可操作性成為了目前的主流評價參數。但這并不意味著基于擁堵時間比和經濟比的參數效果不佳。如何收集這些可操作性差的數據，并利用各類優化算法進一步提高回歸預測的準確率是該領域的下一個研究問題。

3.3 交通事故預測

交通事故預測對于研究交通事故的發生規律，分析交通事故的發展趨勢以及道路交通安全控制均具有重要意義，是政府和交通部門制定策略的重要數據支持。交通事故預測的研究對象一般為交通事故數、萬車死亡率和10 萬人口死亡率。文獻[19]證明了交通事故數據之間存在著非線性關系，事故發生受政治、經濟等若干敏感因素影響，傳統的回歸預測模型無法準確地預測交通事故。故支持非線性計算的SVR 更適用于交通事故預測。文獻[20]基于ARIMA模型（autoregressive integrated moving average model）和SVR 構建了交通事故混合預測模型。研究結果表明，該混合模型的準確性高于單個ARIMA 模型的準確性。文獻[21]采用基于相關性分析的特征選擇算法對數據進行降維，實驗證明該方法有效提高了SVR 的計算速度和精度。

除公路、鐵路事故預測以外，SVR 在預測海上交通事故[22]和飛行事故預測[23]中也有一些研究成果。相較于其他熱門研究領域，交通事故預測的研究較少。據統計，交通事故預測中涉及到特征變量已經超過35 個，綜合考慮所有因素并對多余特征值進行合理降維應是今后的主要研究方向。

3.4 交通碳排放預測

交通行業是國家經濟和社會發展的基礎產業。據統計，交通行業的能源消費占全社會能源消費總量的25%～30%。交通碳排放預測可為制定合理有效的減排政策提供科學的決策依據。碳排放強度是指單位GDP 所產生的碳排放總量，其計算方法為：

其中，Ct為歷年交通運輸行業碳排放總量，GDPt為歷年經濟生產總值。文獻[24]研究并使用完全指數分解法確定了不同交通領域和不同運輸結構中的諸多碳排放影響因素。研究結果顯示，GDP 對碳排放的影響最大，汽車技術水平的影響最小。文獻[25]選取了人口、城市化率、人均GDP、服務業增加值比重、人均GDP 能耗和煤炭消費比6 個影響因素作為特征值，建立了基于SVR 的碳排放預測模型。通過中國1980 年到2009 年的數據進行驗證后得出該模型具有良好學習和泛化能力的結論。文獻[26]采用類似方法，使用河南省1991 年到2016 年的數據進行驗證得到了近似結果。文獻[27]基于上述方法，加入了機動車保有量、旅客周轉量和貨物周轉量共7 項指標作為城市交通運輸碳排放影響因素，說明了實驗區域未來交通碳排放增長趨勢逐漸變緩，但總量將持續呈上升趨勢。文獻[28]構建了一個基于PCA 和SVR 的碳排放量組合預測模型，預測結果表明使用PCA 降維后的模型誤差顯著小于其他模型誤差。

交通碳排放預測是典型的時間序列預測問題，LSTM 和RNN（recurrent neural network）等擁有記憶能力的深度學習模型更適用于該問題[29]。未來應研究SVM 與深度學習結合的深層預測模型在交通碳排放預測中的應用。

此外，SVR 在公交到站時間預測[30]、交通牽引能耗測算[31]、交通流時間序列補齊[32]、航班延誤預測[33]等應用領域也有相應的研究成果。

4 支持向量分類在ITS 中的研究及應用

4.1 交通狀態判別

交通狀態識別是ITS 重要的組成部分，一般是通過各種分類、聚類算法實現對各類交通狀態的識別，并依據識別結果實現交通系統的智能控制和管理[34]。多數研究將交通狀態劃分為4 到6 個狀態等級，表2是根據車速將交通狀態分類的依據。

Table 2 Traffic status classification表2 交通狀態劃分等級

SVC 在這方面研究成果豐富，文獻[35]通過研究和實際仿真，構建了單車道流量、平均車速、道路占有率的三維參數體系，并使用SVC進行分類預測。文獻[36]基于SVC 實現了實時交通狀態預測模型，并且考慮到了平均車速、道路密度、道路交通量、交通事件和降雨量等多個因素，對實際工作有一定的指導意義。文獻[37]提出一種通過噪聲識別交通流狀態的新方法。將發動機噪聲、輪胎噪聲、空氣渦流噪聲、排氣噪聲等信號分量作為SVC 的輸入，將交通流狀態分為自由流、飽和流及擁堵3 種狀態。該方法對飽和流的識別準確率不理想，卻為今后的研究提供了很好的思路。

交通狀態判別需要大量的交通流數據，目前該領域的樣本量普遍不足。一方面必須提高數據量和可靠性；另一方面，像歐洲的車輛行駛工況無法完全適用于中國各地一樣，應根據各地區交通流的特性、路段狀態和交通對象統計情況設計有地區特點的交通狀態判別方法[38]。并且將分類算法與3.2 節中回歸算法結合實現對未來時刻交通狀態判別的研究不多，該領域還有很多問題尚待學者們解決。

4.2 交通標志識別

交通標志識別（traffic sign recognition，TSR）是指通過采集的道路圖像，檢測、分類識別出交通標志，可為自動駕駛提供技術保障，對提高行駛安全性和保證交通運行效率都有重要意義。自2011 年起，全球各地公開了很多數據集，例如：德國交通標志識別集（GTSRB）、克羅地亞交通標志數據集（RMASTIF）、意大利交通標志數據集（DITS）等。其中，GTSRB 包括多種光照、遮擋、低分辨率、傾斜、運動模糊情況下的交通標志圖像樣本，識別難度最大[39]。

TSR 的基本流程包括圖像分割、檢測標志輪廓和識別標志三步。文獻[40]采用SVC 作為分類器識別交通限速標志，由于實際道路圖像會因為駕駛時間、天氣、照明條件等因素而出現不同程度的變化，故引入改進的Census 變換算法（modified census transform，MCT）解決這些不利因素造成的誤差。由于這些不利因素，人工特征、顏色模型和機器學習的結合是目前的研究熱點。常用的顏色模型包括RGB 模型、HSI模型、HSV 模型及高斯顏色模型等[41]。文獻[42]提出了一種基于高斯顏色模型和SVC 的快速交通標志檢測算法，解決了采用單一顏色模型或單一分類器檢測誤差較大的問題。文獻[43]為了解決樣本類別間的不平衡導致檢測性能弱化的問題，采用顏色增強技術分割提取出自然背景中交通標志所在的感興趣區域，隨后對標識樣本提取特征，最后使用遺傳算法對SVC 進行參數尋優。文獻[44]在文獻[43]的基礎上，選取魯棒性較強的HSV模型對標識圖像進行閾值分割處理，隨后采用自適應卡爾曼濾波算法進行交通標志的跟蹤識別。實驗結果表明文獻[44]提出的方法具有97.88%的分類準確率且具有較好的實時性。

經過數十年的研究，SVC 在交通標志識別領域的研究趨近成熟。很多研究成果證明了基于SVC 的方法識別率較高，但對于TSR 這種多分類復雜問題訓練時間較長[45]，導致其無法應用于實際。其次，TSR 在理論上全局特征描述是可行的，但實際交通環境成像存在各種不利條件[46]。如何更好地融合人工特征與SVC，并結合5.3.5 小節中涉及的深層模型，使得TSR 在各種不利條件下的可擴展性和實用性得到提高，這個問題依然有待研究。

4.3 交通事件檢測

交通事件檢測是通過分析交通特征參數來預測發生交通事件的可能性或判定交通事件的嚴重程度，對減少交通延誤、保障道路安全、減少人員傷亡和財產損失均具有十分重要的意義。SVC 作為最常用的分類器，在該領域的研究成果頗多[47]。

文獻[48]提出了一種基于SVM 的交通事件自動檢測算法（SVM-AID），并采用美國加州高速公路I-880 數據庫中實際數據進行測試。結果表明SVMAID 算法的正確分類率在98%以上，且平均檢測時間不超過5 s，優于人工神經網絡等其他交通事件自動檢測算法。文獻[49]以一般事故和嚴重事故作為二分類標簽，利用SVC 識別交通事故嚴重程度，并通過GA 進行模型核參數尋優。文獻[50]建立了基于SVC的水上交通事故的嚴重程度三分類模型，實驗表明分類準確率在70%以上。文獻[51]將SVC 和協同神經模糊推理系統（collaboration adaptive neuro-fuzzy inference system，CANFIS）結合，以預測交通碰撞事故的嚴重程度。該方法將空間分析和人工智能相結合，預測效果優于傳統SVC。文獻[52]利用SVC 模型研究翻車事故中駕駛員的受傷程度，從碰撞信息、環境信息、車輛特征、駕駛員人口統計和行為特征等方面考慮特征值，并與分類回歸樹（classification and regression tree，CART）進行比較。結果表明SVC 的分類效果優于CART。文獻[53]使用基于相關性的特征選擇算法對交通碰撞事故數據進行處理。結果表明，該方法可顯著提高SVC 模型的預測性能。

如何處理高維、復雜的交通事故數據是交通事件檢測的一個難點。除去上述方法，因子分析[54]、主成分分析[55]、合成少數類過采樣技術（synthetic minority over-sampling technique，SMOTE）[56]等簡化數據集技術也被應用于交通事件檢測中。如何簡化預測模型，減少檢測時間是模型能否真正應用于交通事件檢測這類實時預測領域的關鍵。

此外，SVC 在交通視頻車輛檢測[57]、道路結冰預測[58]、障礙物識別[59]、交通事故自動判案[60-61]等應用領域也有很多研究成果。

4.4 支持向量機與其他算法的對比

本文選取了5 個在ITS 中被廣泛應用的算法與SVM 進行對比。它們各自的優缺點和研究現狀如表3 所示。

5 支持向量機的優化

5.1 基于核函數及核函數參數的優化

核函數的選擇決定了特征空間的結構，多數SVM 的研究和應用均使用如下所示的常見核函數，其中式（9）為徑向基核，式（10）為拉普拉斯核。

Table 3 Comparison between SVM and common algorithms in ITS表3 支持向量機與其他ITS 常用算法的比較

常用的幾種核函數結構簡單、普及度高。但在某些數據、問題上常用核函數性能不是很好。例如常用的徑向基核函數，在預測車流量低谷期時和預測車流量高峰期時性能相差甚遠。為了提高模型性能，學者們設計了很多新核函數。文獻[62]利用小波函數構造了一個新核函數用于SVM 的車速預測模型。文獻[63]進一步提出了多尺度小波核函數，并證明了在車流量預測領域小波內核的性能優于徑向基核函數，其核函數如式（11）所示。

文獻[64]綜合了徑向基核函數和多項式核函數各自的優勢，提出了基于組合核相關向量機的短時交通流預測模型。實驗結果表明，組合核能進一步提高預測精度，其所用的核函數如式（12）所示。

文獻[65]將高斯核和多項式核混合，作為SVM的核函數預測交通流量。結果表明，如式（13）所示的核函數性能在高峰時段優于常用核函數。

SVM 的核技巧理論完備，但在實際應用上仍然存在核函數參數難以選擇的問題，其核函數參數的優化一直是SVM 的一個研究熱點。核函數的參數決定了SVM 模型的復雜度和性能。式（4）中的C和式（14）中核函數半徑g是最重要的兩個超參數，其中g與參數σ的關系如式（14）所示。

其中，g隱含地決定了數據映射到新特征空間后的分布。g越大，支持向量越少，而支持向量的個數影響著SVM 模型的訓練與預測速度。在核函數參數尋優上，早期有實驗法、網格搜索法、梯度下降法等[66-67]。為了解決傳統方法耗時長、誤差大的問題，以智能算法為首的元啟發式算法被廣泛應用于SVM 的參數尋優中。文獻[68]基于改進后的PSO 算法優化最小二乘支持向量機（least squares support vector machine，LS-SVM）構建了短期客流量預測模型。針對客流量預測，提出了慣性權重自適應調整方法優化PSO。結果表明，該優化方式相比PSO 算法、正弦粒子群算法和高斯粒子群算法對LS-SVM 的參數尋優效果更好。文獻[69]將文獻[68]的參數尋優算法替換為果蠅優化算法，實現了更精確的車流量預測。文獻[70]提出了基于GPS 數據出行模式識別模型，并采用遺傳算法對參數進行優化。實驗表明，該模型可精確識別步行、自行車、公交、汽車等交通方式。文獻[71]采用禁忌搜索算法（tabu search，TS）對SVM 參數進行優化。實驗證明，TS 算法能有效優化SVM，并且模型在高速公路事件檢測中的性能優于人工神經網絡。

除去上面提到的幾種智能算法，一些新智能算法也被應用于SVM 參數尋優中，例如煙花算法[72]、磷蝦群算法[73]、生物地理學優化算法[74]、引力搜索算法[75]等，但這些算法在ITS 中的研究應用過少。在部分回歸預測和小數據量分類問題中，參數尋優的耗時可能會占到算法整體耗時的70%～90%。目前來看，參數尋優算法顯著提高了SVM 的精度，同時也付出了相當大的時間代價。根據不同的應用場景設計不同的核函數和參數尋優算法，并利用并行化技術縮短參數尋優的時間是一個值得研究的方向。

5.2 基于并行計算的優化

為了解決SVM 在大數據集下的效果不佳的問題，學者們提出了使用并行化技術加快SVM 訓練速度的方法。文獻[76]提出了基于二次規劃的SVM 并行訓練，采用分解思想將二次規劃問題劃分成若干個子二次規劃問題，并行處理子問題以加快迭代中的計算速度。目前流行的SVM 并行化技術是利用分布式集群將訓練樣本集分割到各計算節點并行訓練。文獻[77]提出了被后來廣泛使用的層疊向量機（Cascade SVM），Cascade SVM 分割樣本集進行并行訓練，每個計算節點訓練產生分類器，經過兩兩組合篩選，最后得到一組全局最優的支持向量，其思路如圖3 所示。

Fig.3 Cascade SVM圖3 層疊向量機

SVM 常見的并行化實現方式有以下3 種：

（1）基于GPU 的并行化。CUDA（compute unified device architecture）和OpenCL（open computing language）是兩種最為流行的GPU 編程語言。OpenCL 靈活度更高，支持各種類型的協處理器；CUDA 的API更易于調用，但只支持NVIDIA 設備。文獻[78]提出了基于CUDA 的高斯核SVM 算法并行化方案，并將其應用于行人檢測應用中，最終得出隨著數據量的增加并行效率會越來越高的結論。文獻[79]將基于CUDA 并行的SVM 算法用于車牌識別。相對于原始算法，在GPU 上運行的SVM 訓練速度能提高1～30倍，預測速度能提高50～72 倍。基于GPU 的并行計算并行度很高，計算速度很快，但有單節點受限，耦合度緊密和可擴展性低的缺點。故GPU 更適合處理單指令多數據（single instruction multiple data，SIMD）的運算。

（2）基于MapReduce 的并行化。MapReduce 是由Google 公司研究提出的一種并行計算框架[80]。文獻[81]將SVM 算法與MapReduce 相結合實現對鐵路客流量的預測，實驗證明并行版算法效率顯著優于單機版算法。文獻[82]提出了基于MapReduce 的多SVM 組合分類器并行訓練方法。對每個數據集并行訓練，最后進行分類器的組合。實驗證明，MapReduce框架有效解決了SVM 在面對大數據集時的效率問題。基于MapReduce 并行可通過增加節點數量的方式體現擴展性，并且具有良好的容錯率，但集群的任務調度和啟動開銷大，不適合迭代計算。

（3）基于Spark 的并行化。Spark 是專為大規模數據處理而設計的快速通用的計算引擎，平臺中擁有MLlib 機器學習庫，包含了分類算法、聚類算法、推薦算法等函數[83]。文獻[84]根據Cascade SVM 的思想，提出了一種基于Spark 平臺的并行化方案（SPSVM）。實驗結果表明，SP-SVM 在損失很小精度的前提下減少了訓練時間。文獻[85]利用SVM 結合Spark 平臺對Twitter 推文進行文本分類，實現了一種檢測交通實時事件的新方法。基于Spark 的并行同樣擁有較好的擴展性和容錯率，但其優勢也帶來了問題。Spark 在內存中計算遠快于硬盤中，內存消耗大導致其需要更好的硬件設備支撐。MLlib 的API豐富且調用簡單，但不支持修改內部邏輯，大部分算法都只能簡單調用而不能優化。表4 列出了3 種SVM 常見并行化方式的對比。

大數據時代已經到來，使用SVM 進行回歸和分類的數據集越來越大，但以少量準確率換取運行效率的并行化SVM 在ITS 中的研究和應用可謂寥若晨星。在很多要求實時性的交通應用領域，并行化SVM 還有很大的研究空間和應用潛力。

Table 4 Comparison about common parallel implementation of SVM表4 SVM 常見并行化實現方式的對比

5.3 支持向量機衍生算法

5.3.1 最小二乘支持向量機

LS-SVM 是1999 年提出的一種SVM 衍生算法。LS-SVM 以損失解的稀疏性為代價，把求解二次規劃問題轉化為求解線性方程組，以此提高計算速度和收斂精度。文獻[86]使用LS-SVM 預測北京市地鐵客運量，并使用RBF 神經網絡和LS-SVM 的預測結果進行加權結合，證明了LS-SVM 是鐵路客運量預測的有效工具。文獻[87]利用集成經驗模態分解（ensemble empirical mode decomposition，EEMD）原始數據的灰狼優化算法（grey wolf optimizer，GWO）優化LS-SVM，通過對西安地鐵某站點一個月進出站人數進行訓練，證明了該算法能更加精確地預測進出站人數。文獻[88]提出了一種基于模糊信息粒化和PSO 優化LS-SVM 的客流量波動范圍預測模型，通過跟蹤客流量變化趨勢，為預測短期客流量提供了一種行之有效的方法。

LS-SVM 在交通領域被廣泛用于交通流量和客流量預測中，但其他應用場景少有LS-SVM 的身影。如何將LS-SVM 學習過程簡單、訓練速度快的特點在其他應用場景中體現，并進一步提高精度依然是一個巨大的挑戰。

5.3.2 多分類支持向量機

多分類支持向量機（multi-class support vector machine，MSVM）是由傳統SVM 推廣而來的算法。由于SVM 是針對二分類問題設計的算法，故MSVM的核心思路就是將復雜的多分類問題轉化為多個簡單的二分類問題[89]。文獻[90]提出MSVM 有一對多、一對一、導向無環圖、二叉樹四種結構，并通過實驗證明，對于交通實時預測應用應優先選擇二叉樹MSVM。文獻[91]采用一對一結構的MSVM 進行交通狀態分類，其結構如圖4 所示。

理論上，針對K分類問題需要K(K-1)/2 個二分類SVM。文獻[92]提出了一種結合無向圖優化的MSVM 分類器，通過檢測行人和車輛進行驗證，該方法錯誤率低但算法效率較差。

Fig.4 Multi-class SVM with one-to-one structure圖4 一對一SVM 多分類器

現實中大多數分類問題都屬于多分類問題，因此多分類支持向量機比傳統支持向量機應用價值更大。多分類相比二分類計算量必然更大，并且要考慮測試樣本同時屬于不同的類或者不屬于任何一個類的情況。如何利用5.2 節涉及的并行化等技術解決多分類算法效率不高的問題應是今后研究的重點。

5.3.3 模糊支持向量機

模糊支持向量機（fuzzy support vector machine,FSVM）的提出主要是為了減小噪聲數據對預測模型的影響，其主要思想是將模糊數學與SVM 結合，賦予支持向量較高的隸屬度并賦予非支持向量和噪聲較小的隸屬度[93]。模糊支持向量機的最優超平面為式（15）所示的目標函數最優解。

其中，μi是隸屬度，表示不同樣本的重要性程度。對不同的樣本賦予不同的μi，可達到對不同樣本采用不同程度的懲罰作用。

文獻[94]將FSVM 應用于交通標志識別。結果表明，FSVM具有良好的分類效果，對交通標志分類準確率接近100%，對限速標志分類準確率接近99%。文獻[95-96]基于FSVM 建立了旁車并線意圖檢測模型，實時檢測旁車道車輛是否要進行并線行為。經實驗發現FSVM 可使駕駛員輔助控制更加準確合理。文獻[97]利用FSVM 實現車牌識別，并使用基于Memetic 算法優化的PSO 算法對FSVM 進行參數尋優。實驗對220 幅馬來西亞的車牌圖像進行識別，得出PSO 可提高FSVM 預測準確率的結論。因為模糊數學理論降低了SVM 對噪聲數據的敏感性，按照此思路可將模糊數學理論結合其他SVM 衍生算法，例如模糊最小二乘支持向量機[98]、模糊多分類支持向量機[99]、模糊孿生支持向量機[100]。將降低噪聲影響技術與更先進的SVM 算法結合應是未來的研究熱點。

5.3.4 相關向量機

相關向量機（relevance vector machine，RVM）是于2000 年提出的基于貝葉斯框架的稀疏概率模型。RVM 具有SVM 的一切優點，并克服了SVM 支持向量個數多，模型預測時間長，核函數必須滿足Mercer定理等缺點。文獻[101]提出了一種基于RVM 的交通流預測模型，實驗證明RVM 比LS-SVM 的精度提高了60%，并具有其他算法所不具備的預測速度。為了預防飛機碰撞事故，文獻[102]利用RVM 構建了飛行安全評價模型。文獻[103]提出了一種采用混沌模擬退火算法優化RVM 的交通流量預測方法。并對6種核函數的性能進行了實驗。預測結果表明，該預測方法具有更高的預測精度，文中使用的核函數為：

文獻[104]對影響公交車頭時距的因素進行了分析，選擇歷史車頭時距、行程時間和乘客信息作為RVM 算法的輸入預測車頭時距。結果表明，該算法優于SVM、卡爾曼濾波、KNN（K-nearest neighbor）等算法。

在故障檢測[105]、情感識別中[106]，RVM 已有很多研究成果，但在交通領域，目前只有交通流預測、客流量預測、安全檢測等少數領域存在相關研究。RVM 擁有極快的預測速度并且準確率與SVM 相近，故更適合于實時預測領域。因此RVM 在ITS 中還有很大的研究潛力和應用空間。

5.3.5 SVM 與深度學習結合的深層模型

深度學習有SVM 無法比擬的非線性函數逼近能力，能夠很好地提取交通數據的特征，其本質是一個特征表征力強但不善于獨立處理分類、回歸的特征學習器[107]。SVM 作為機器學習模型，數據表征能力并不理想。因此，融合深度學習和SVM 的深層模型成為了近年來的研究熱點，如圖5 所示。

Fig.5 Deep model combining SVM with deep learning圖5 SVM 與深度學習結合的深層模型

目前，作為深層模型的底層被引入ITS 的深度學習算法主要有深度置信網絡（DBN）和卷積神經網絡（convolutional neural networks，CNN）兩種。根據兩者數據輸入的要求以及相關文獻可以得出，DBN 適用于處理單維時間序列數據，CNN 更適合處理圖像和多維時間序列預測問題[108-109]。文獻[110]將CNN與SVM結合為深層預測模型進行車流量預測，實驗結果顯示該深層模型預測性能顯著優于淺層模型。其中CNN-SVM 深層預測模型的結構如圖6 所示。

文獻[111]采用DBN 作為深層模型的底層，建立了用于判別高速公路變道危險程度的DBN-SVM 模型。實驗結果表明，該深層模型效果顯著優于樸素貝葉斯模型和BPNN。文獻[112]將深度學習中門循環單元（gated recurrent unit，GRU）與SVR 相結合，提出基于GRU-SVR 的短時交通流量預測模型。與GRU 和SVR 等淺層模型相比，GRU-SVR 的效果優勢明顯。通常DBN 和CNN 的輸出層為SoftMax 分類器，采用SVM 取代傳統模型的SoftMax 能夠有效提高模型精度。但目前研究對深層模型中SVM 的參數尋優問題解決得不好。深度學習可謂日新月異，每年都會涌現出很多新穎算法。在未來，應針對不同的問題和數據研究不同的深度學習提取特征方法，并結合5.1 節內容解決深層模型中的SVM 參數尋優問題。

Fig.6 CNN-SVM deep prediction model圖6 CNN-SVM 深層預測模型

Table 5 Comparison about derivation algorithms of SVM表5 支持向量機衍生算法的比較

5.4 支持向量機衍生算法總結

除去以上提到的衍生算法外，還有一些在交通領域應用不多但同樣具有獨特效果的衍生算法，例如：加權支持向量機（weighted support vector machine，WSVM）[113]、孿生支持向量機（twin support vector machine，TSVM）[114]、排序支持向量機（Rank support vector machine，Rank-SVM）[115]等。表5 列出了幾種支持向量機衍生算法的對比。

6 結束語

SVM 是一個非常經典的機器學習算法，針對其應用現狀、優化方法、衍生算法本文均做了詳細闡述，發現SVM 在算法應用以及算法優化方面仍有很多研究工作可做。

算法應用：（1）要將SVM 應用于客流量預測領域，需保證準確率的同時進一步提高算法的效率，并研究短間隔的客流量預測與客流量的縱向相關性。（2）利用交通數據的高維性和各類優化算法進一步提高交通擁堵評價參數預測的準確率，并加強基于擁堵時間比和經濟比的擁堵預測研究。（3）研究更合理的交通事故發生因素選取和數據降維方法。（4）將新穎的SVM 優化算法、衍生算法和深層模型應用于城市交通碳排放預測領域。（5）研究如何提高交通數據的數量和可靠性，設計有地區特征的交通狀態判別方法，并增加分類算法與回歸算法結合的研究。（6）進一步研究如何解決SVM 在TSR 中算法效率低問題，如何利用深度學習提高算法在各種不利條件下的檢測準確率。（7）在交通事件檢測領域，需研究減少SVM 檢測時間的方法。

算法優化：（1）根據不同的應用場景設計不同的核函數和參數尋優算法，并減少參數尋優的耗時。（2）將并行化的SVM 及其衍生算法推廣至智能交通系統中實時性要求較強、算法效率要求高的應用場景。（3）研究各種優化方法和SVM 衍生算法的結合。（4）將深度學習的表征能力結合SVM 的分類與回歸能力，并研究深層模型中SVM 的參數尋優問題。