王 磊,張華鐘,陳安東
(江蘇省鐵路集團有限公司,江蘇 南京 210018)
傳統的鐵道松動的檢測手段主要是通過經驗豐富的鐵道工人通過敲打鐵軌,通過鐵軌回音來識別鐵軌是否發生松動[1-2]。這種方式對工人的技術要求較高,并且識別的成功率不穩定,容易出現漏判,誤判的情況。為了提高識別的準確率,降低人為因素的影響,同時針對目前鐵道安全檢測系統尚待升級,政府和百姓愈發重視交通安全性的現狀,我們提出了結合計算機人工智能算法的思路,構建全自動化的智能識別系統。
梅爾頻率倒譜系數(MFCC)在1980年由Davis和Mermelstein所提出,是一種在語音識別中廣泛使用的特征。MFCC是梅爾頻率倒譜的系數,來自于音訊片段的倒頻譜[3]。倒譜和梅爾頻率倒譜的差異主要是梅爾頻率倒譜的頻帶劃分是等距劃分的,它比用于正常的對數倒頻譜中的線性間隔的頻帶更能近似人類的聽覺系統。通過這樣的表示手段,可以在多個領域中使聲音信號有更好的表示[4]。
MFCC特征提取主要分為以下幾個步驟。
(1)將聲音信號分解為多框。(2)將聲音信號高通濾波。(3)通過FFT將信號變換至頻域。(4)將頻譜通過梅爾濾波器,得到梅爾刻度。(5)在每個梅爾刻度上提取對數值。(6)對結果進行IDFT變換,變換到倒頻譜域。(7)MFCC就是這個倒頻譜圖的幅度。
概率線性判別分析(PLDA)最早由Prince等人提出,PLDA與LDA相比,PLDA也是將數據投影到低維空間中,從而最大化類間距離。PLDA具備LDA不具備的優勢,它能同時考慮到數據和噪聲來建模,實現比LDA更佳的實驗效果[5]。
主成分分析是從原始樣本數據里的多個參量提取出幾個貢獻率較高的主成分,每個主成分都可以最大程度體現樣本數據的最主要特征,相互獨立,在保留樣本數據主要特征的同時,最大限度的減少數據量[6-7]。PCA將原始數據中大量的參量通過分析最后獲取幾個貢獻率最大的主成分,降低建模難度,同時選出更為精簡更能突出數據特征的數據。但是,在實際案例樣本的研究中,為了完成多元統計分析中的數據特征提取,需要記錄眾多影響結果的主成分。因為每個參量都從不同的角度上反映了數據的特征,如需要反映一個人的總體情況,可以從身高,外貌,品質的不同角度來體現一個人的特征;而且參量與參量之間可能存在著一定的聯系,例如學生的學習成績和家庭關系的和睦程度是有著一定的聯系的,因而原始統計數據反映的信息存在重復點。當然,目前已經有一些方法可以較好的規避重復性帶來的數據冗余以及其對提取主成分的影響。
PCA是從數個主成分來體現出樣本整體特征,將我們原始數據中許多相關性很高的參量轉化成彼此相互獨立或不相關的主成分。通常是選出少數幾個,能體現數據的主要特征的幾個主成分,用來代表原始數據的主要特征并完成數據降維[8]。
(1)數據采集
本實驗通過專業的聲波儀每隔10 m采集一次鐵棒敲擊鐵軌的聲音,并通過鐵道專業人士檢查鐵軌是否出現松動。未松動標簽設置為0,松動標簽設置為1;一共采集了200例未松動鐵軌的聲音信號,183例松動鐵軌的聲音信號。
(2)結果分析
數據處理如圖1所示,我們首先將200例未松動鐵軌的聲音信號和183例松動鐵軌的聲音信號按照7:3劃分為訓練集和測試集。訓練集:160例未松動鐵軌的聲音信號和150例松動鐵軌的聲音信號;測試集:40例未松動鐵軌的聲音信號和33例松動鐵軌的聲音信號。然后分別提取訓練集和測試集的MFCC特征,將提取出的特征作為PLDA模型的輸入構建識別模型,最終結果顯示針對測試集中未松動鐵軌識別準確率100%,松動鐵軌識別準確率為98.5%,表現出了MFCC-PLDA模型有著極好的識別效果。PCA-PLDA模型對測試集中未松動鐵軌識別準確率90%,松動鐵軌識別準確率為95%。該模型的分類效果相對比MFCC-PLDA模型效果要差,主要原因可能與MFCC更適合提取聲音相關的特征,而主成分分析法相對語音重要特征提取的能力較MFCC要弱一些[9]。此外我們還將MFCC-PLDA識別模型的結果與有經驗的鐵路工人根據經驗來判別的結果進行了對比,工人根據經驗針對測試集中未松動鐵軌識別準確率90%,松動鐵軌識別準確率為96.67%;工人識別結果明顯低于MFCC-PLDA模型結果,與PCA-PLDA模型的結果相當,再次表明了未來通過人工智能算法可以比人工更好解決該問題。

圖1 MFCC-PLDA數據分析模型
本研究基于鐵軌松動這一研究點,通過MFCC算法進行語音特征提取,然后使用PLDA分類器構建一種全新的自動化識別方法來替代傳統的人工識別手段,此外我們還與PCA-PLDA模型進行了對比,最終模型的識別結果顯示模式識別算法可以有效地提高了自動化識別的精確率和工作效率,為未來構建智能化的鐵道安全監控系統奠定了基礎。