云南電網有限責任公司迪慶供電局 錢 峰
配網調度不但要求調度人員掌握扎實的專業知識,還需要對有關信息、資料等進行全面掌握,同時具備隨機應變、反應靈活等能力。這加大了調度人員素質要求和工作強度要求。本文研究將基于深度學習的語音識別技術,實現配網語音調控系統,輔助開展調度業務,極大的簡化了調度業務過程,提升調度業務中日志記錄及回填、交接班等過程的效率;同時也減輕了調度人員的工作量,使調度人員專心于的需要較高安全保障的調度業務,最大限度保證調度作業的安全性。
目前配網調度工作在日志填寫和交接班記錄方面,主要采用的方式是調度通話過程中手寫記錄關鍵信息,通話后再手動錄入系統,效率較低。同時,以人工測聽的方式進行調度通話錄音抽檢,工作量較大、且效率低覆蓋面不全,對調度規范性的提高作用較小,無法及時有效的提醒調度員注意事項。這不但要求調度人員掌握扎實的專業知識,還需要對有關信息、資料等進行全面掌握,同時具備隨機應變、反應靈活等能力。
基于深度學的語音識別技術是近年來興起的語音識別技術,能夠實現準實時語音轉寫,普通話識別率能夠達到95%以上,已經廣泛應用到各行業中。
本文研究將該技術應用到智能電網調度領域,使計算機能聽懂電網調度人員之間的溝通,并能根據溝通內容進行相關的比較和分析,也能將調度人員的聲音準確記錄并轉為文本信息,然后將這些文本信息自然地播放出來,這對于調度業務的安全性、效率化具有極高的戰略意義。
傳統語音識別是一個非常復雜的過程,始于20世紀70年代。語音識別的通常做法是先將歷史語音數據進行標注,就是先建立語音數據與詞語之間的一一對應關系,然后通過不同的模型進行訓練,最后利用訓練結果進行識別。
電力調度語言與日常用語的發音有一定的差異。首先,電力調度語言含有大量專有名詞,例如調度地點、線路名稱、調度令等。其次,電力調度語言中數字或者時間的讀音和傳統發音不同,同時一些計量單位等特殊符號也需要處理。例如,“1560”的傳統發音為“一千五百六十”,但電力調度發音則是“幺五六洞”;時間“08:30”的傳統發音為“八點三十分”,但電力調度發音則是“洞八點三洞分”。本文主要通過基于GMM-HMM組合的模型和基于深度學習神經網絡與HMM組合模型進行電力調度語音識別。
(1)基于GMM-HMM組合的電力調度語音識別
GMM-HMM模型包括高斯混合模型(GMM)和隱馬爾可夫模型(HMM),其中HMM適合對語音信號進行建模,而GMM則能夠擬合任意概率密度函數的曲線。本文研究的基于GMM-HMM組合的電力調度語音識別系統的結構圖如圖1所示。該圖分為上下兩層,上層描述的是訓練階段,下層描述的是識別階段。

圖1 語音識別系統結構圖
在訓練階段,首先從語音數據庫中獲取獲取歷史語音數據,并按一定的規則提取出語音信號的聲學特征;然后利用隱馬爾科夫模型(HMM)建立聲學模型。識別階段則是先利用高斯混合模型(GMM)生成概率密度函數,然后與HMM結合,完成識別模型建模工作。
(2)基于深度學習神經網絡與HMM組合的電力調度語音識別
基于深度學習神經網絡的語音識別與GMM-HMM相比,最大的改變就是利用深度學習神經網絡(DNN)替換GMM模型。DNN模型不需要對語音數據分布進行假設,輸入特征的形式多樣,包括離散或者連續的;同時還可以利用相鄰的語音幀所包含的信息作為特征。基于深度學習神經網絡的語音識別流程如圖2所示。

圖2 基于深度學習神經網絡的語音識別流程
調度交接班記錄的一致性,可以理解為兩個文本記錄間基于字與詞語上的匹配程度,以及語義的高度相似性。要對交接班內容進行一致性檢查,需要通過文本相似度和語義相似度作綜合處理后進行判斷。
(1)應用流程
在調度人員進行交接班時,麥克風陣列對語音進行采集,然后對所采集的語音內容進行記錄、區分、識別、轉寫和展示,在交接班完成時,將對話語音和轉化的文本與交接班基礎信息作關聯存儲,并生成交接班事項,再獲取當前系統交接班記錄后,兩者進行一致性檢查。智能交接班記錄一致性檢查流程如圖3所示。

圖3 調度交接班一致性檢查流程圖
(2)基于深度學習的交接班記錄一致性檢查的算法實現
交接班記錄一致性檢查主要工作是計算文本相似度,在針對調度領域進行文本相似度計算時,本文采用的是one-hot方法,該方法具有所需訓練數據量少,效率高的特點,但是存在因特征維度少導致語義信息丟失的問題。對此,本文在one-hot的基礎上引入文本矩陣,先將文本中的句子替換并拼接成文本矩陣,然后計算文本矩陣的余弦相似度,從而得到文本的相似度矩陣,最終得到文本相似度。
本系統在調度室安裝麥克風陣列來進行高清語音數據采集,并將語音數據實時傳送到后臺系統。后臺系統通過深度學習算法對語音進行轉寫,形成文本。然后就可以實現調度日志自動填寫、智能交接班一致性檢查、智能化語音搜索輔助而等調度業務場景,提高調度業務的開展效率,系統總體結構設計圖如圖4所示。

圖4 系統總體結構設計圖
結束語:本文通過對基于深度學的語音識別技術進行研究,實現準實時語音轉寫,交接班一致性檢查等功能。并應用到配網智能語音調度系統,為實現配網智能語音調度提供支撐。通過該系統的運行,輔助開展調度業務,極大的簡化了調度業務過程,提升調度業務中日志記錄及回填、交接班等過程的效率;同時也減輕了調度人員的工作量,使調度人員專心于的需要較高安全保障的調度業務,最大限度保證調度作業的安全性。