湯立新



摘要
為保障列車運行安全,機務(wù)部門陸續(xù)投入使用了各種行車音視頻監(jiān)控設(shè)備,為確保行車安全發(fā)揮了重要作用,逐步建立了安全音視頻監(jiān)控設(shè)備記錄數(shù)據(jù)分析制度,為規(guī)范機車乘務(wù)員標準化作業(yè)取得了較好效果,但目前對于海量的機車音視頻的分析工作主要由人工完成,分析效率低等問題,展開對機車音頻文件智能化分析的研究,以自動識別機車音頻文件中的各類語音信號,一個是將分析人從繁雜而枯燥的任務(wù)解脫出來,由機器來完成這部分工作;另夕1—個是可以在海量的音頻數(shù)據(jù)中快速定位,及時發(fā)現(xiàn)問題有效處置,從而能夠高效的完成各種日常音頻文件的分析工作,全面提升分析工作效率,大幅度提高機務(wù)安全管理水平。
【關(guān)鍵詞】數(shù)據(jù)智能化 語音識別 系統(tǒng)自動校時 標準化作業(yè)管理
1引言
隨近年來,隨著鐵路交通的發(fā)展,列車的數(shù)量不斷增加,列車的速度不斷提高,對于列車運行安全提出了更高的要求。為保障列車運行安全,機務(wù)部門陸續(xù)投入使用了各種行車音視頻監(jiān)控設(shè)備,為確保行車安全發(fā)揮了重要作用,逐步建立了安全音視頻監(jiān)控設(shè)備記錄數(shù)據(jù)分析制度,為規(guī)范機車乘務(wù)員標準化作業(yè)取得了較好效果。由于錄音筆、機車視頻監(jiān)控設(shè)備和LKJ監(jiān)控記錄裝置各具時鐘系統(tǒng),時間難免產(chǎn)生誤差,分析時存在時間混亂,數(shù)據(jù)失真的情況。同時機車乘務(wù)員的值乘狀態(tài)預(yù)警分析是鐵路安全運輸?shù)闹匾h(huán)節(jié),是保障鐵路安全運輸?shù)年P(guān)鍵,目前對機車乘務(wù)員值乘狀態(tài)的預(yù)警分析主要是人工盯控,缺少智能化設(shè)備。此外,機車乘務(wù)員作業(yè)過程中的關(guān)鍵項點,如分相前,呼喚“過分相注意”,禁止雙弓標前,呼喚“單弓好了”等發(fā)生時,需要對關(guān)鍵項點進行相應(yīng)的呼喚應(yīng)答。為了檢查機車乘務(wù)員是否作業(yè)規(guī)范,需判斷機車乘務(wù)員是否在關(guān)鍵項點是否進行相應(yīng)的呼喚。然而在目前鐵路系統(tǒng)中,普遍使用人工方式完成,不僅浪費人力成本,且耗時長,易出錯,效率低下。針對以上現(xiàn)狀,有必要開展對機車音頻文件自動分析系統(tǒng)的研究。該系統(tǒng)代替?zhèn)鹘y(tǒng)人工操作,高效完成各種日常音頻文件的分析工作,實現(xiàn)對機車乘務(wù)員標準化作業(yè)過程進行有效的卡控和管理,全面提升分析工作效率,大幅度提高機務(wù)安全管理水平。
2主要系統(tǒng)構(gòu)成與研究內(nèi)容
2.1主要系統(tǒng)構(gòu)成
機車音頻文件自動分析系統(tǒng)包括錄音筆、數(shù)據(jù)服務(wù)器、機車音頻分析臺。
在機車駕駛室裝配錄音筆,采集行車期間駕駛室內(nèi)音頻信息。通過該系統(tǒng)綜合分析機車乘務(wù)員作業(yè)音頻數(shù)據(jù)、LKJ運行記錄數(shù)據(jù),準確定位關(guān)鍵時間、關(guān)鍵地段和關(guān)鍵項點,自動糾正錄音文件的時間偏差,判斷機車乘務(wù)員呼喚應(yīng)答情況,智能分析機車乘務(wù)員的作業(yè)情況。
在機務(wù)段信息中心部署數(shù)據(jù)服務(wù)器,用于音頻數(shù)據(jù)、作業(yè)數(shù)據(jù)分析結(jié)果的存儲,并向各個查詢端提供音頻數(shù)據(jù)信息的流媒體傳輸服務(wù)。
在機務(wù)段音頻分析中心和各運用車間,安裝部署機車音頻分析臺,可進行機車乘務(wù)員作業(yè)現(xiàn)場音頻信息與LKJ運行記錄文件關(guān)聯(lián)分析和智能分析。
2.2系統(tǒng)主要功能
(1)利用己配備的錄音筆對機車乘務(wù)員的呼喚應(yīng)答標準化作業(yè)狀況進行錄音。實現(xiàn)機車乘務(wù)員作業(yè)過程中關(guān)鍵事件的自動提取分析功能,能夠自動讀取機車乘務(wù)員當(dāng)次作業(yè)的LKJ運行記錄文件,根據(jù)設(shè)定邏輯規(guī)則,自動提取作業(yè)過程中關(guān)鍵事件信息,如:進入調(diào)車事件、出入庫事件、車位對中事件、降級、開車、停車、側(cè)線運行、臨時限速等事件信息,并可根據(jù)事件自動定位播放當(dāng)時的音頻信息。
(2)實現(xiàn)機車乘務(wù)員作業(yè)過程中關(guān)鍵項點呼喚應(yīng)答的自動分析,根據(jù)LKJ運行記錄文件定位關(guān)鍵項點時間,在錄音文件中,限定在關(guān)鍵項點的時間段內(nèi),用語音分析技術(shù)來判斷音頻信號流中的語音和非語音信號。根據(jù)呼喚應(yīng)答語句(根據(jù)字數(shù)、語句)的最短時間來規(guī)定各關(guān)鍵項點的呼喚應(yīng)答時間的閥值,短語閥值,說明機車乘務(wù)員沒有按要求進行呼喚應(yīng)答。
(3)實現(xiàn)作業(yè)項點分析記錄網(wǎng)絡(luò)化存儲功能,項點的分析結(jié)果和相應(yīng)的音頻信息采用網(wǎng)絡(luò)化的方式集中存儲,管理人員可以使用系統(tǒng)平臺通過網(wǎng)絡(luò)對各個分析結(jié)果、音頻文件進行集中查看、分類查詢、驗證。
(4)實現(xiàn)基于音視頻分析結(jié)果的大數(shù)據(jù)分析;系統(tǒng)自動分析數(shù)據(jù)進行整理、分析、和推斷。找出對應(yīng)的規(guī)律和趨勢,對應(yīng)一些關(guān)鍵人、關(guān)鍵車隊、關(guān)鍵地點進行預(yù)警提醒,同時為制定作業(yè)規(guī)范、提供數(shù)據(jù)支持,從而采取預(yù)防措施,避免事故重復(fù)。
2.3關(guān)鍵技術(shù)研究
2.3.1錄音文件數(shù)據(jù)與LKJ運行記錄的相互關(guān)聯(lián)
將錄音筆的數(shù)據(jù)與LKJ運行記錄文件數(shù)據(jù)的相互關(guān)聯(lián),充分考慮機務(wù)各個部門的業(yè)務(wù)需要,充分保證數(shù)據(jù)的共享和功能互操作,本系統(tǒng)采用統(tǒng)一的基礎(chǔ)平臺,包括操作系統(tǒng)平臺、數(shù)據(jù)庫平臺和應(yīng)用平臺。采用統(tǒng)一平臺,可避免不必要的系統(tǒng)間數(shù)據(jù)的轉(zhuǎn)換、功能的接口、以及系統(tǒng)升級擴展時大量的維護工作量,保證系統(tǒng)的一致性和穩(wěn)定性。
2.3.2錄音文件的降噪處理
由于機車駕駛室內(nèi)聲源環(huán)境復(fù)雜,錄音筆在采集音頻信息中往往會包含各種噪聲信息,干擾后續(xù)的系統(tǒng)分析工作,影響分析結(jié)果。本系統(tǒng)采用一種快速降噪方式,根據(jù)公式(1),采用時遇到頻域的變換方式,估算出噪聲的頻域與能量特征。然后根據(jù)公式(2)的條件,對音頻文件中的每一幀信號進行分析,去除其中的噪聲部分,保留主要信息。
上式中,N為音頻文件的總幀數(shù),Xi(k)為音頻文件中第i幀信號,D(k)為噪聲估計值,α為過減因子,β為補償因子,降噪效果如圖(1)所示。
2.3.3機車乘務(wù)員作業(yè)過程中關(guān)鍵項點呼喚應(yīng)答的自動分析
人在發(fā)音時,根據(jù)聲帶是否震動可以將語音信號分為清音跟濁音兩種。濁音又稱有聲語言,攜帶者語言中大部分的能量,濁音在時域上呈現(xiàn)出明顯的周期性;而清音類似于白噪聲,沒有明顯的周期性。發(fā)濁音時,氣流通過聲門使聲帶產(chǎn)生張弛震蕩式振動,產(chǎn)生準周期的激勵脈沖串。這種聲帶振動的頻率稱為基音頻率,相應(yīng)的周期就成為基音周期。基音周期作為語音信號處理中描述激勵源的重要參數(shù)之一,在語音合成、語音壓縮編碼,語音識別和說話人確認等領(lǐng)域都有著廣泛的應(yīng)用。endprint
首先定位LKJ運行記錄文件中的關(guān)鍵項點的時間。同時與錄音文件中該關(guān)鍵項點時間關(guān)聯(lián)。以基音周期為主要特征,結(jié)合時域特征中能量、過零率、熵、等參數(shù)和頻域特征中的頻譜能量、頻譜幅度、共振峰等參數(shù)以及它們的衍生參數(shù),來判斷音頻信號流中的語音和非語音信號。同時與關(guān)鍵項點呼喚應(yīng)答時間的相關(guān)參數(shù)進行對比,實現(xiàn)機車乘務(wù)員關(guān)鍵項點呼喚應(yīng)答的自動分析。
2.3.4機車錄音筆和LKJ監(jiān)控裝置的時間同步
如圖2所示,首先從接收機車錄音筆輸入的語音信號中采集LKJ監(jiān)控裝置發(fā)出的語音提示信號;然后對輸入的語音信號和語音提示信號進行端點檢測,其目的是要在一段輸入的音頻信號中將語音信號同其他非語音信號分類開來。語音信號在長時間內(nèi)表現(xiàn)為一個非平穩(wěn)過程,具有較強的時變性,但在短時內(nèi)具有平穩(wěn)性。采用短時自相關(guān)函數(shù),語音信號的xi(N)的短時自相關(guān)函數(shù)Rw(k)可由式(3)定義。
由圖3所示。帶噪語音的短時自相關(guān)系數(shù)具有明顯的周期性,每個峰值點較為明顯。而噪聲信號的自相關(guān)函數(shù)不具備明顯的周期性,且除了在零點處出現(xiàn)的最大值為1的峰值外,其余峰值均不明顯。利用自相關(guān)系數(shù)特征,可以較好的區(qū)別每一幀語音信號是否包含語音信息。端點檢測結(jié)果如圖4所示,語音時長4minl5s。
選取目前工業(yè)界主流應(yīng)用的梅爾系數(shù)特征(MFCC)如圖5,即計算信號的能量普并使用一組梅爾三角帶通濾波器進行帶通濾波后所得的特征參數(shù),結(jié)合其他輔助特征如基音周期,共振峰估計等提取語音提示信號的特征。然后使用機器學(xué)習(xí)算法進行訓(xùn)練,級聯(lián)多個分類器得到一組分類器模型。
利用一個滑動時間窗口(如圖6),計算窗口內(nèi)輸入語音信號的特征與訓(xùn)練模型進行匹配和識別,識別出輸入語音信號中的語音提示信號及該語音提示信號在錄音記錄中的時刻;最后將檢測到的錄音記錄中的語音提示信號所在時刻與LKJ運行記錄文件中該語音提示信號所在的時刻進行同步,從而實現(xiàn)機車錄音筆和LKJ的時間同步。
5結(jié)束語
隨著我國鐵路規(guī)模的不斷擴大,機車數(shù)量的不斷增加,各類日常機車信息管理工作的要求與難度也與日俱增。對機車音頻文件自動分析系統(tǒng)的研究,可提高日常工作效率,減少人力成本,便于管理。借助鐵路大數(shù)據(jù)平臺的不斷完善,對該系統(tǒng)的深入研究將提升機務(wù)安全管理智能化水平,在實際工作中具有重要的實用價值。
參考文獻
[1]陳澤偉,曾慶寧,謝先明,龍超.基于自相關(guān)函數(shù)的語音端點檢測方法[J/0L].計算機工程與應(yīng)用,2017(03):13.
[2]曹正鳳.隨機森林算法優(yōu)化研究[D].首都經(jīng)濟貿(mào)易大學(xué),2014.endprint