孟寶燦
(作者單位:國家新聞出版廣電總局五五三臺)
?
語音自動評估系統在廣播遙控監測中的應用
孟寶燦
(作者單位:國家新聞出版廣電總局五五三臺)
摘 要:隨著我國廣播電視監測事業的發展。監測手段由傳統依靠人工手動監測逐漸發展到自動化、網絡化的監測模式。監測業務向深度和廣度發展的同時,對廣播效果評估自動化的需求日益增加,本文重點探討語音自動評估技術在廣播遙控監測中的應用。
關鍵詞:遙控監測;語音比對;自動評估
隨著音頻識別、圖像處理技術的發展,很多新技術都達到了在相應條件下的應用水平,如何適應新時期遙控監測站廣播效果評估的新要求和新業務模式,充分應用計算機對于海量節目內容自動處理,將眾多語音比對先進技術與廣播效果評估監測相結合,實現遙控站廣播效果評估的自動化、智能化和標準化,是廣播監測業務向深度和廣度發展所面臨的緊迫問題。
遙控監測站廣播效果語音自動評估系統主要由以下3部分組成:數據采集單元、數據庫和數據存儲單元、引擎計算節點和客戶端顯示單元。
系統工作流程如下:根據監測運行圖及人工設置好的評分流程,按照V8接口標準遠程控制遙控站設備,獲取遙控站回傳的流媒體音頻信號。
遙控監測站廣播效果語音自動評估系統主要包括以下4個功能模塊。
2.1 自動打分引擎
自動打分引擎基本組成部分包括任務調度器、計算節點和任務監視器。其中,計算節點承擔了主要的音頻數據計算處理任務。具體的比對流程如下:1)檢查目標音頻信號是否存在,是否滿足比對引擎要求(≥3秒),若不滿足則直接上報給人工處理,滿足條件則進入下一步;2)對目標音頻信號進行分類,判斷為音樂、語音、白噪聲或靜音,若靜音則直接上報人工處理,若不是靜音則進入下一步處理;3)判斷與音量是否達到門限,并判斷是否有參考信號存在,若不存在,則計算信噪比,進行綜合質量評估,最后得出分值及置信度并輸出,若存在,則進入下一步;4)判斷參考源類型是否為目標源,然后結合目標音頻信號與參考音頻信號進行匹配沒最后綜合質量評估,得出分值及置信度。
2.2 音頻數據與音頻特征采集子系統
音頻數據與音頻特征采集子系統根據所采集的數據源類型分為2種:前端采集子系統與中心采集子系統。
2.2.1 前端采集子系統
用于遠程控制遙控站接收機執行頻點任務,并采集從遙控站接收機傳回的目標音頻數據;同時,提取目標音頻數據中有用的音頻特征數據,傳送給自動打分引擎進行計算。另外,由于系統必須提供廣播效果音頻回放功能,作為廣播效果人工校對的依據。因此,采集后廣播效果音頻以及音頻特征的歷史數據必須保存,在存儲介質中存放。
前端采集子系統的工作流程如下:啟動前端采集系統后,系統等待到達工作的時間段;獲取當前時段運行圖數據;創建臨時存儲區,將當前時段運行圖中的頻點任務以隊列的形式存儲,根據人工配置文件對當前時段運行圖中的頻點任務進行分析;將隊列中的頻點任務進行優先級排序;動態規劃當前時段頻點任務的執行流程;開始從隊列中取出頻點任務并執行;自動提取音頻中的音頻特征值數據;數據入庫,通知打分引擎任務準備完畢,等待引擎處理;判斷隊列中是否有其他任務,若有則繼續執行任務,若無則結束任務。
2.2.2 中心采集子系統
用于采集從衛星接收機上傳來的模擬音頻信號,并轉換為數字音頻信號,同時完成運行圖同步的工作。其工作流程如下:初始化系統后,啟動運行圖同步線程,判斷是否到達同步時間;初始化采集卡;多線程采集參考源信號;達到采集時間后,存儲音頻文件。
2.3 Web服務
系統的Web服務框架采用Struts框架、Free Marker模板技術以及Web Service相結合的方式。
通過Struts框架與FreeMarker模板的結合,很好地均衡了客戶端與服務器端的工作負載,在很大程度上提高了頁面的瀏覽速度以及用戶與服務器的交互性,增強了用戶的體驗;同時,采用了Web Service的相關技術,由客戶端瀏覽器發起的Web Service請求,由Web Service服務器調用相關的服務,由服務邏輯訪問數據庫,完成請求的處理,并返回處理結果。
2.4 評估結果自動上報數據中心子系統
評估結果自動上報數據中心子系統用于自動上報符合標準(置信度大于某一門限)的自動評估結果,不符合標準的自動評估結果留待人工校對后再進行上報。其工作流程如下:初始化系統后,開始更新數據中心數據庫;首先訪問本系統的數據庫,獲取最新的自動評估結果,并判斷自動評估結果是否滿足標準,若不符合標準,則過濾該自動評估結果,并留待系統人工校對后再自動上報數據中心。
通過語音自動評估系統在廣播遙控監測中的應用,極大地減輕了值班人員的工作量,提高了廣播監測智能化的水平。隨著音頻識別、圖像處理技術的繼續發展,相信在不久的將來,通過技術優化一定能夠進一步提高語音自動評估的準確率,為廣播監測智能化事業的發展添磚加瓦。