楊姣姣 李嘉輝
1.湖北文理學院 純電動汽車動力系統設計與測試湖北省重點實驗室 湖北省襄陽市 441053
2.湖北文理學院 汽車與交通工程學院 湖北省襄陽市 441053
在人-車-道路-環境系統中,駕駛人是造成交通事故的主要原因,而分心駕駛又是影響駕駛人的主要因素[1]。分心駕駛是對不同駕駛分心狀態的總稱,實際研究中又將其分為聽覺分心、視覺分心、認知分心和動作分心四種類型。因此研究駕駛分心識別對于減少分心駕駛導致的交通事故具有重要意義。
為了有效減少駕駛分心帶來的交通事故,近年來有許多學者在駕駛分心識別方面做了大量的研究。通過采用不同的指標、不同的機器學習方法和深度學習方法對分心識別展開了深入研究。目前,缺乏對駕駛分心識別方法的全面綜述。本文將主要從駕駛分心類型、影響因素、識別指標、識別方法進行詳細地闡述。著重對比分析機器學習和深度學習在駕駛分心識別方面的優劣,為開展駕駛分心識別研究提供借鑒。
根據國際標準化組織定義(ISO)分心駕駛是指:駕駛時注意力指向與正常駕駛不相關的活動,從而導致駕駛操作能力下降的一種現象[2]。駕駛分心目前基本被分為四種類型:認知分心(思緒走神)、視覺分心(駕駛員眼動視線離開原本道路)、聽覺分心(聊天、語音)以及操作分心(接打電話、手離開方向盤)[3]。張輝等[4]通過對實際駕駛人駕駛情況的觀察統計發現駕駛情況中更多的是兩種以上分心活動同時出現。例如聽覺-視覺分心(駕駛員與車內人員聊天時不自覺的視線離開當前眼動區域),認知-操作分心(駕駛疲勞導致操作方向盤失控)等,且不同分心狀態下檢驗駕駛指標也存在顯著性偏差。駕駛影響因素可分為三類:駕駛人影響因素、車輛影響因素和交通環境影響因素[5]。駕駛人影響因素是分心主要原因,對此研究比較多面化。不同年齡、性別、對駕駛操作的熟練度都可能會引起不同程度的駕駛分心[1]。車輛影響因素包括車輛的性能、類型、變速箱種類、駕駛輔助系統等。李晨[6]基于貨車駕駛人分心識別研究一文中,分析了駕駛人分心對車輛運行狀態的影響。交通環境影響因素包括道路設計、道路質量、道路綠化、道路交通量、及不同天氣狀況下對交通道路的影響。這三種影響因素中駕駛人本身的影響因素對分心駕駛作用最大。
根據對不同駕駛分心類別的模擬實驗及實車實驗,用于判斷駕駛員駕駛分心的識別指標可分為六種:駕駛績效、眼動指標、生理心理指標、面部與頭部指標、融合指標。
3.1.1 駕駛績效
駕駛員對于車輛的操作信息即駕駛績效,駕駛績效可具體表現為駕駛員對車輛的橫向控制與縱向控制[2]。橫向控制指標有:橫向加速度、方向盤轉向等,縱向控制指標有:縱向加速度、油門大小、前后跟車距離等[7]。已知駕駛分心研究大多采用單項指標對某一影響因素進行測量記錄分析,如選取車輛橫擺角速度,駕駛員在分心時車輛跟車距離等。但一般現實情況涉及到的單項指標較少,且隨機兩項以上指標比較常見。多項指標共存出現的情況較多,這就導致駕駛績效測量結果偏差較大。
3.1.2 眼動數據
眼動指標是通過攝像機捕捉到瞳孔和眼角的距離變化來判斷駕駛員是否分心,需佩戴眼動儀等設備進行收集瞳孔變化圖像。實施起來精確程度有限。目前也有基于瞳孔的駕駛分心檢測,采用Viola-jones 算法提取人臉眼睛附近區域,再通過匹配得到瞳孔和眼角位置差[8]。
3.1.3 生理數據
生理數據包括:心電信號,腦電波信號,血壓等,這些數據能顯著地反映當前駕駛員生理信息[9]。相較其他數據也能更科學地給出駕駛員生理情況變化,對這些測量指標在醫學上也能給出較為嚴謹的解釋。但不得不否認測量周期長,數據需得積累到一定數量才有可靠性。
3.1.4 駕駛人面部
通過頭部轉向及面部表情變化同樣可以有效測量駕駛分心程度,隨著機器學習的發展,不少駕駛分心研究采用圖像識別對駕駛員面部各項數據進行采集,之后進行面部圖像處理與特征提取,再與已有標準駕駛員圖像進行對比,得出差異大小[9]。在一定差距值內測定為安全,超過規定差距值則判定為分心[10]。
以上四種指標都是針對某種指標的單一指標,可靠性較低。若要體現出更高的準確率,則需融合以上指標兩種至三種[11]。例如將眼動數據與生理數據融合,通過構建相關模型對分心情況進行檢測;或者將駕駛績效與眼動數據進行融合,再或是將生理數據、眼動數據及駕駛人面部進行結合對駕駛員分心情況進行更精準的檢測。這一融合方法體現了多方位的檢測,更能說明分心駕駛時的具體情形及數據。
表1 是對部分機器學習方法的簡單總結,這些已知的機器學習方法運用到分心識別上大多是通過建立學習模型對駕駛人分心行為進行識別并判斷,在這些方法中向量機(SVM)分心識別模型在各類機器學習識別模型中占32.12%,模型通過遺傳算法優化比對后的結果能達到93%以上的準確率。但不同的數據、數據特征也會影響機器學習模型的準確率,同時向量機(SVM)對樣本數據要求較大時難以訓練,因此要根據實際數據類型及需求去選擇模型。

表1 機器學習方法分析
一些典型的深度學習方法見表2,算法上很大程度上依賴于高端機器,而傳統的機器學習算法允許在低端機器上面工作,因此深度學習對硬件配置有較高的要求。深度學習大多通過神經網絡實現分心駕駛的分類識別,同時通過不斷調整數據集,訓練大量模型,對多源駕駛信息進行融合,以此提高分心識別的準確率。已提出的CNN 模型、MH-SSD 網絡模型、YOLOv5 模型等在算法基層網絡上進行改進,引入注意力機制來加強對目標物體的檢測。Video Swin Transformer 用于實時抽煙、打電話動作識別,并將局部注意力計算的范圍從空間擴展到時空域,在FFN 之后添加一層Sparsification Module(SPM) 對整個網絡進行分層稀疏化。在公開數據集Kinetics400 和Moments in time 中進行實驗,結果與現有方法相比取得速度與精度最為平衡的結果。

表2 深度學習方法分析
深度學習源于機器學習,能通過學習、處理、分析大量數據動態檢測分心行為。目前研究深度學習的文獻占所有識別模型的25%,趨于這方面的研究逐漸偏多。
本文基于車輛駕駛指標,主要分析了駕駛人分心狀態識別方法,主要研究結論如下:
(1)對駕駛人分心識別的指標可分為兩大類:單項指標和融合指標。單項指標又包括駕駛績效、生理指標、眼動指標等,融合指標則是融合兩項及兩項以上的單項指標。就各項研究數據表示,融合指標對實際駕駛分心判別的準確率更高,根據大量學者研究表示未來基于融合指標數據的研究更有效,因此未來更傾向于參考融合指標的數據。
(2)機器學習算法有決策樹、向量機模型(svm)、貝葉斯網絡、AdaBoost 算法等,當分心特征數量較多時,向量機模型(svm)識別更有優勢一些,能較好地融合各類分心指標,保留原模型的圖像特征檢測能力,如機器學習對駕駛人行為、圖像的檢測識別,有利于實現分心駕駛行為的識別,但同時存在檢測數據量偏小,穩定性較差等問題。具體識別時要根據分心識別的數據類型和特點來選擇合適的模型。
(3)深度學習包括各種網絡模型,像BP 神經網絡、卷積神經網絡、記憶神經網絡等。深度學習的平均準確率較高,在穩定性和對數據的支撐上也高于傳統機器學習。相對機器學習來說較少,但它有著不可忽略的優勢:可處理數據量較多的模型、各模型準確率的標準差小、穩定性良好能實現端到端的解決問題。在未來駕駛分心檢測模型中需分析大量樣本數據,從數據中學習特征,在算法基層網絡上進行改進,以及引入注意力機制來加強對目標物體的檢測。