(Driver Behavior State Recognition based on Silence Removal Speech)
許多研究將駕駛員行為與事故原因聯系起來,有些研究重點分析了基于駕駛員行為狀態所造成事故的預防措施。根據大量的研究發現,語音已經被發現是識別和分析駕駛員行為狀態的合適的輸入信號,因為當駕駛員說話時系統可以測量潛在的情緒信息,同時也可以測量這種情緒上的改變所帶來的輸入信號上的改變。
在提取相關語音特征之前,本文提出了一種使用短期能量(STE)和零交叉率(ZCR)的靜音消除方法,以減少語音信號在車輛環境中的計算時間。采用梅爾頻率倒譜系數(MFCC)特征提取方法,結合多層感知器與分類器獲取駕駛員行為狀態識別性能。MFCC在人類聽覺頻率響應中應用了耳蝸機制,該機制利用一定數量的系數濾波器組和特定的形狀濾波器組。這些特征捕捉音頻信號的頻譜包含了感知最重要的部分,然后將這些信息解釋為腦解碼的神經沖動。然而,在某些駕駛行為中,數據往往是不準確的、可調整的或有明顯缺陷的,并且有可能包含許多噪聲和偽影。因此,需要對一個干凈的數據進行分析,以確保觀察結果來自正確的數據。通常,我們可以用預處理來保證噪音和偽影的最小化甚至實現去除。預處理是對原始數據執行子流程的過程,用于特征提取和分類階段的準備。
檢測靜音區域的兩種最常用的方法是采用零交叉率(ZCR)和短時能量(STE)方法。ZCR是在給定的時間間隔/幀中對語音信號的幅度通過零值次數的度量,短期能量(STE)可以定義為特定語音段內幅度的平方絕對值之和。這兩種方法均能有效的用來消除噪音從而獲得有效的聲音信號。