一種基于語音識別的騷擾電話撥測系統

2013-05-15 12:47:02中國移動通信集團江蘇有限公司網絡部王玉申

江蘇通信 2013年6期

中國移動通信集團江蘇有限公司網絡部王玉申

現有騷擾電話治理中，存在的主要問題是：識別的號碼數量多與客服撥測人員工作量大之間的矛盾。相比于目前通常采用的人工撥測方式，計算機自動處理有著速度快、效率高、誤差率低等特點，尤其是針對重復內容的自動撥測和處理技術更是具有不可替代的作用。近年來，語音識別技術已經得到了長足的發展，通過引入語音識別技術對錄音文件進行甄別，可以極大提高騷擾電話的撥測效率。

1 騷擾電話自動撥測系統構建

通過新增1套騷擾電話撥測識別系統，實現騷擾電話的自動撥測、識別、錄音和取證功能。該系統與現有騷擾電話治理各系統間的關系如圖1所示。

該系統通過文件接口從騷擾電話識別系統采集需要撥測的號碼清單，對號碼進行撥測、錄音、語音識別，撥測結果輸出到攔截系統和客服系統進行后續處理。通過騷擾電話自動撥測識別系統代替客服的人工撥測和審核，提升騷擾電話人工審核的效率和準確度，提高騷擾電話治理效果。

1.1 騷擾電話撥測系統處理流程

騷擾電話撥測系統的處理流程見圖2。

騷擾電話自動撥測識別系統的業務流程主要分為4步，分別是：待撥測號碼的采集分析、對號碼進行撥打呼叫、對騷擾電話的識別和判斷、結果輸出。

1.2 撥測系統構建

撥測錄音模塊設計了2個方案供選擇：測試卡方案或模擬主叫號碼方案。測試卡方案：利用自動撥測系統的撥測儀進行撥打。模擬主叫號碼方案：利用自動撥測系統，采用PBX（專用小交換機）撥測設備進行撥打。

1.2.1 方案一測試卡方案

為滿足多張本省和外省測試卡在撥測儀上進行測試，設計采用自動撥測系統上已配備的SUM（服務器集中監控管理）設備集中插放SIM（用戶識別模塊）卡，通過遠程調用的方式實現SIM卡自動切換撥測，以達到測試的目的。系統構架圖見圖3。

1.2.2 方案二模擬主叫號碼方案

在現有自動撥測系統基礎上，使用PBX中繼撥測儀實現自動撥測與錄音功能，以達到測試的目的。保持現網自動撥測系統網絡結構不變，新增的專業撥測儀采用IP方式接入，接受自動撥測系統管理。組成拓撲見圖4。

本方案中新增1臺（PBX）中繼撥測儀，通過TCP/IP（傳輸控制協議/網際協議）方式接入自動撥測系統，接受CMS（內容管理系統）的管理和維護。中繼撥測設備通過E1中繼專線方式連接匯接局或MSC（移動交換中心）、且與STP（信令轉接點）間開鏈路。使中繼撥測儀成為移動MSC下的一個專用PBX用戶端局。通過匯接局或MSC可以實現與MSC、GMSC（網關移動交換中心）以及其他運營商網絡的用戶通信。為專用的E1（2.048 Mb/s數字同步傳輸）中繼電路配置專用OPC（源信令點編碼），并設置為免費，解決計費問題。

2 自動識別算法

為了提高騷擾電話撥測系統的識別準確率，降低騷擾電話誤識別率，我們采用了多種組合算法進行騷擾電話的識別。具體的算法說明如下。

1）先進行較小文件過濾。通過對騷擾電話的錄音分析，發現騷擾電話都有較長的通話時長（約30～100 s），錄音文件也都比較大（起碼大于800KB）。因此先將一部分較小的文件過濾掉（都是關機、停機、暫時無法接通等），這些小文件的幾乎都可以確定都是非騷擾電話。獲得較小文件大小的經驗值為450KB，小于450KB的認為是非騷擾電話。

2）騷擾電話號碼識別庫過濾。騷擾電話號碼識別庫可以通過歷史的自動撥測系統平臺全國共享，避免同一個號碼重復識別，節約系統資源，提高騷擾電話的判斷效率和準確性。

3）PESQ（語音質量的感覺評定）過濾（過濾掉長時間的振鈴、無人接聽和來電提醒等）。參考文件為常見的非騷擾電話，score（ITU-TP.862）speech分數大于2，認為評估文件是非騷擾電話。

PESQ語音評估軟件其本質就是一個相似度比對系統，原理是把無法自動判斷的錄音文件，比如怪異的接聽應答音，先通過人為判定是否是騷擾電話，然后設取比對值，作為一個文件藍本庫保存。當下次撥測產生與之相似度高的錄音文件時，自動判斷成藍本庫所屬內容，確定是不是騷擾電話。因此，隨著不斷的開展撥測工作，樣本庫文件會不斷的豐富，最終的識別率也會不斷提高。

4）語音識別。使用一系列常見的騷擾電話關鍵字進行識別，同時對正常帶彩鈴的號碼進行識別。語音識別系統其本質是一套通過對錄音文件中的關鍵字匹配來確認是否是騷擾電話的系統。關鍵字如“公證處”“抽獎”“中獎”“獎金”等，其內容庫可以通過語音訓練不斷豐富，以提高最終的識別率。

語音識別軟件采用定制的InterReco語音識別系統，是一款與說話人無關的語音識別系統，能夠完成電話應用環境下的語音識別功能。定制的語音識別系統采用了ASR（自動語音識別）技術。它是一種使計算機能夠識別人通過麥克風或者電話輸入的詞語或語句的技術。簡單地說，就是能夠讓計算機聽懂人說話。它的最終目標是使得計算機在不受詞匯量限制，在各種噪聲環境、語音信道下，能夠實時、準確地識別不同方言、口音等特點的說話人的語句。包含了騷擾電話特征詞，如：中獎、公證處、賭博、六合彩等。

由語音識別模塊對經過“騷擾電話號碼庫”過濾的錄音文件進行自動識別，判斷出具有騷擾電話特征的錄音文件，并判斷為騷擾電話，隨錄音文件一起送至輸出接口模塊。語音識別中不符合騷擾電話特征的錄音文件繼續轉交下一步處理。

5）PESQ語音再評估（語音識別的識別率只有70%～80%，還有20%～30%的疑似騷擾電話沒有被識別出來）。我們對這些沒有被識別出來的20%～30%的疑似騷擾電話進行PESQ語音評估，目的是提高被降低的語音識別漏判率。

3 應用情況

3.1 試點情況

騷擾電話撥測系統于2013年3月底完成平臺的搭建，實現了對騷擾電話的撥測測試。撥測系統初期對江蘇移動提供過的三批共計2 758個騷擾電話樣本做了識別判斷，具體測試情況見表1。

采用基于語音識別的騷擾電話撥測系統對1 000個號碼進行撥測和識別，需要的時間約為20min，存儲空間約為12GB，大大提升了騷擾電話的人工審核效率。同時，對于無法確認的號碼輸出撥測錄音，供客服人員人工判斷，有效解決了部分號碼無法通過系統進行識別的問題。

我們把完成1～5項步驟的判斷機制定義為“模式一”，把僅完成1～3項步驟的判斷機制定義為“模式二”。模式一是對模式二識別出來的疑似騷擾電話號碼再進行一次語音識別和PESQ再評估，目的是降低誤判率，而語音識別和PESQ再評估沒有100%地將騷擾電話識別出來，因此，漏判率增加了。

模式二的思路是排除非騷擾電話，剩下的認為是騷擾電話；模式一的思路是排除非騷擾電話，剩下的進行語音識別和PESQ再評估，識別出來的是騷擾電話，沒有識別出來的是非騷擾電話。因此，模式一比模式二誤判率低，漏判率高。

在實際使用中，可能還會存在正常帶彩鈴的錄音文件，這個必須要借助語音識別系統來判斷，所以說必須要用模式一的判斷機制來進行撥測。當然模式二的測試結果給了我們一些參考，比如在測試當中發現和論證了這樣一個問題：模式一比模式二誤判率低，漏判率高。如果不使用語音識別軟件（即模式二），漏判率反倒有明顯的降低。結合上述三批測試，模式二測試情況見表2。

經過反復比對和論證，查明的原因是：第三方的語音識別軟件本身也存在一定的不足，語音識別率只有70%~80%，即使我們已經通過PESQ語音評估進行補漏，也不能達到100%的識別率，會漏掉很多的騷擾電話，只能不斷來優化完善它，后續需不斷進行改進。

3.2 試點結論

從理論上分析，使用語音識別后可以減少誤判的發生，隨著語音識別軟件的日益完善，這方面的效果會越來越得到體現。本著盡可能減低騷擾電話誤判率（為此可以犧牲部分的漏判）的原則，體現真實的判斷效果，且正確判斷正常帶彩鈴的號碼，建議繼續使用語音識別系統，即模式一這樣的全程判斷機制來做騷擾電話撥測。

4 其他應用領域

基于語音識別的騷擾電話撥測系統，除了能夠準確識別騷擾電話外，還可以廣泛應用于基于語音識別的語音撥測系統，如：來電提醒系統的撥測、10086客服系統的撥測等，從而極大地提升系統撥測的效率，提高系統的運行穩定性。 ◆

江蘇通信2013年6期

江蘇通信的其它文章: 行業信息; C網承載網安全隱患分析及防御策略; 江蘇聯通渠道實名制推廣階段性小結; 江蘇省人民政府毛偉明副省長調研江蘇通信業; 江蘇省人民政府毛偉明副省長到江蘇通管局視察指導工作; 招之即來來之能戰戰之能勝——淮安電信切實加強應急通信保障