電話網非法呼叫篩查模型研究及應用

2013-02-28 02:05:18宋名星

電信科學 2013年2期

何磊，宋名星

（中國電信股份有限公司深圳分公司深圳 518048）

1 背景

由于通信行業競爭加劇及各類新業務的頻繁推出，電話網絡的路由結構及業務邏輯關系日趨復雜，電話網絡的復雜性給網絡話務和路由的規范帶來一定困難。同時，技術的進步使得電話改號軟件和接入平臺普及，給犯罪分子實施電話詐騙等違法行為帶來可乘之機。

目前電信運營商雖然積累了一些非法呼叫篩查的經驗，為打擊犯罪、規范呼叫提供一些依據和幫助，但以往的篩查沒有實現自動化，工作量較大。為了實現非法呼叫篩查自動化，期望利用完善的信令監測系統，研究、建立一種非法呼叫篩查模型，對電話網上所有非法呼叫進行篩查、歸類和整治。

模型建立后，通過全網排查，能夠主動、及時發現各類非法的、不規范的方式和手段，可有力支撐打擊電話詐騙，同時為組網原則及業務實現的不斷完善和修訂提供依據。

2 現狀分析

電話網具有一套科學有效的組網原則對路由配置進行規范，但是由于電話網的路由規范及業務邏輯相對復雜，呼叫信息龐大（根據信令系統記錄深圳本地網的呼叫信息每天約1.3億條數據記錄），現網上仍然存在非規范呼叫，如非規范路由呼叫、非規范主叫呼叫，不法分子利用非規范呼叫謀取私利，比如利用網間非法主叫套取結算、利用非法主叫實施詐騙等。電信運營商只能根據用戶的投訴或者公安部門的要求事后進行人工篩查。由于篩查沒有實現自動化，投入的人工工作量較大，滯后性明顯。

目前網絡電話和用戶終端小型設備使用者越來越多，致使網內、網間傳送的呼叫中出現了一些虛假主叫，而目前的技術手段難以快速查找真正的呼叫發起者，犯罪分子就會據此進行電話詐騙的活動。當前電話詐騙已成為人們關注的一個熱點問題。

3 模型結構

通過分析現網的非法呼叫，發現非法呼叫主要表現為主叫號碼不規范和呼叫路由不規范。為了能夠在海量的呼叫記錄中篩查非法呼叫，本文在此提出非法呼叫篩查模型的總體結構。

3.1 篩查思路

信令監測系統里的呼叫記錄為海量級，而且部分呼叫信息與非法呼叫篩查無關。如果直接使用信令監測系統的呼叫記錄進行篩查，工作量巨大、繁瑣，因此這樣的做法不可取。本文采用信息提取、漏斗篩查、分層處理的方法，對呼叫記錄進行篩查。信息提取可以只關注于呼叫篩查的信息，有效屏蔽無關信息，減少篩查的數據量；漏斗篩查、分層處理能夠實現多次篩查，確保沒有遺漏，而且能夠有效降低下層篩查的工作量。篩查思路如圖1所示。

圖1 篩查思路

3.2 總體結構

根據篩查思路，提出非法呼叫篩查模型總體結構，如圖2所示。該模型總體結構處理流程如下。

（1）基于信令監測系統，在海量呼叫記錄中進行呼叫信息提取，構成現網呼叫信息庫一，該庫作為第一步篩查比對的基礎。

（2）現網呼叫信息庫一與已有異常呼叫模型庫進行第一步比對，符合異常呼叫規則的呼叫歸入異常呼叫數據庫，然后進行網絡整改；不符合異常呼叫規則的呼叫構成現網呼叫信息庫二，該庫作為第二步篩查比對的基礎。

（3）現網呼叫信息庫二與基準呼叫模型庫進行第2步比對，不符合基準呼叫規則的呼叫建立異常呼叫模型，該模型通過驗證后，進行網絡整改。

（4）網絡整改后，對基準呼叫模型和已有異常呼叫模型庫進行優化、完善。

3.3 詳細解析

3.3.1 現網呼叫信息庫一

現網中，信令監測系統存在海量的呼叫記錄，如果直接從這些呼叫記錄中進行篩查，那么過程將比較復雜、繁瑣，工作量巨大。為此，根據系統比對需要定義可擴展的信息提取原則，對海量記錄進行信息提取，主要包括主被叫信息、路由信息、業務信息、行為信息等，構成“現網呼叫信息庫一”。

3.3.2 已有異常呼叫模型庫

根據目前已知的非法呼叫類型，建立“已有異常呼叫模型庫”，該庫涵蓋主叫號碼不規范、呼叫行為不規范、話務路由不規范等異常呼叫模型，作為第一步比對的基準。該庫內模型可以人為直接定義，也可以由系統自動完善生成。

3.3.3 現網呼叫信息庫二

現網呼叫信息庫一與已有異常呼叫模型庫進行第一步比對后，不符合異常呼叫規則的呼叫將歸入現網呼叫信息庫二，作為第2步比對的基礎。該庫與現網呼叫信息庫一相比，數據量將進一步減少，有利于降低第2步比對的工作量。

3.3.4 基準呼叫模型庫

基準呼叫模型庫為非法呼叫模型研究的核心，直接定義了現網中規范話務的各種基準，包括路由規范、業務規范、行為規范等一系列基準，是篩查非法呼叫的準繩。該庫內模型可以人為直接定義，也可以系統自動優化生成。該庫的完備性直接影響非法呼叫篩查的精確度和效率。

3.3.5 異常呼叫數據庫

篩查出來的非法呼叫歸入異常呼叫數據庫，作為網絡整改、日常查詢、統計等操作的基礎。

4 模型細節

基于總體結構，為了能夠實現高效篩查比對，對篩查模型細節進行進一步研究，重點提出了呼叫信息上下文和呼叫遷移狀態圖的概念，并基于UML定義了呼叫上下文和呼叫遷移狀態圖。呼叫信息上下文和呼叫遷移狀態圖是非法呼叫篩查模型總體結構中各種模型庫內容以及篩查比對的基礎。

圖2 非法呼叫篩查模型總體結構

4.1 呼叫信息上下文

4.1.1 呼叫信息上下文的作用

呼叫信息上下文是一個或者一類完整呼叫過程中各類信息的形式化描述。呼叫信息上下文規定了非法呼叫模型研究中所需要的各種信息，描述了路由信息、業務信息、行為信息等。

呼叫信息上下文將改變傳統的基于信令消息描述呼叫的方式，提出了一種以篩查非法呼叫為目的，同時屏蔽無關信息的呼叫信息描述模型，為整個非法呼叫模型的核心部分，為高效篩查打下了良好基礎。

此外，通過定義呼叫信息上下文，抽象出與話務規范相關的特征信息，有利于進行后期的網絡整改，同時能夠滿足非法呼叫的查詢、統計等操作的個性化呈現。

4.1.2 呼叫信息上下文的定義

根據呼叫信息上下文的概念，結合現網的非法呼叫類型，分析得出呼叫信息上下文應該包括路由信息上下文、業務信息上下文、行為信息上下文，如圖3所示。

路由信息上下文是對一個完整呼叫所經過的局點路由信息的描述，主要包括主被叫信息和路徑信息。主被叫信息用戶記錄呼叫的主叫號碼、被叫號碼、原被叫號碼等信息；路徑信息記錄呼叫經過的局點，使用源信令點、目的信令點表示；輔助信息可以記錄呼叫的通話時長、釋放原因等。

業務信息上下文是對一個呼叫過程中觸發的業務信息的描述，主要包括業務名稱、業務ID、業務接入碼。

行為信息上下文是對用戶的呼叫行為進行描述。由于用戶行為具有很大的可變性和不可預見性，所以行為信息上下文信息主要從實際已經發生的用戶行為中提取。在此，行為信息上下文主要記錄轉接平臺信息和回撥平臺信息，以后可以根據實際情況對行為信息上下文進行擴展。

圖3 呼叫信息上下文

4.2 呼叫遷移

4.2.1 呼叫遷移的概念

在電話換網中，一個完整的呼叫源于發端局，會經過匯接局或長途局等中間局點，最終到達受端局。那么一個局點可以看作一個狀態，一個完整呼叫過程可以看作在不斷由一個局點狀態遷移到下一個局點狀態，直到遷移終止，這一過程定義為呼叫遷移。

4.2.2 呼叫遷移狀態圖

根據呼叫遷移的定義，把呼叫經過的每一個局點看作一個局點狀態，那么一個完整的呼叫流程所經過的局點狀態就構成了呼叫遷移狀態圖。例如一個呼叫由本地發起，呼叫異地號碼，該呼叫經過本地發端局、匯接局、長途局，最終到達異地受端局，其呼叫遷移狀態圖如圖4所示。

圖4 呼叫遷移狀態圖

4.2.3 呼叫遷移基準狀態圖

根據網絡路由規范、業務規范、行為規范等基準約束條件，可以定義出一個呼叫在滿足這些基準條件下所可能發生的所有呼叫遷移狀態圖的集合，就構成了呼叫遷移基準狀態圖。下面借鑒UML（unified modeling language，統一建模語言）的狀態圖概念，重點提出本地網呼叫遷移基準狀態圖。

當本地網局點為主叫發端局時，呼叫可能最終到達本地網局點、其他地市局點、其他運營商局點，那么呼叫遷移可能就會經過本地端局、匯接局或者長途局或者關口局等，最終到達收端局。此時的呼叫遷移基準狀態圖如圖5所示。

圖5 呼叫遷移基準狀態圖一（本地網局點為主叫發端局）

當本地網局點為被叫收端局時，呼叫可能是來自本地網局點、其他地市局點、其他運營商局點，那么呼叫遷移可能就會來自本地端局、匯接局或者長途局或者關口局等，最終到達收端局。此時的呼叫遷移基準狀態圖如圖6所示。

圖6 呼叫遷移基準狀態圖二（本地網局點為被叫收端局）

4.3 應用

根據呼叫信息上下文的定義，呼叫信息上下文內容可以從信令系統中提取，構成現網呼叫信息庫一、已有異常呼叫模型庫、現網呼叫信息庫二、異常呼叫數據庫等庫的基礎內容。

根據呼叫遷移基準狀態圖的定義，呼叫遷移狀態基準狀態圖是一個呼叫遷移規范路徑的標準，一個呼叫在滿足各種路由規范、業務規范、行為規范等約束條件下才能發生遷移。在非法呼叫篩查模型的總體結構中，重點在于第二步的篩查比對，即現網呼叫模型庫二與基準呼叫模型庫的比對。那么呼叫遷移基準狀態圖及其約束條件就可以應用于基準呼叫模型庫，構成比對的基準。

一個具體呼叫的呼叫信息上文信息包括路由信息上下文、業務信息上下文、行為信息上下文，通過這些信息，可以分析出一個具體呼叫實際發生的呼叫遷移狀態圖。如果該呼叫遷移符合呼叫遷移基準狀態圖及約束條件，那么這個呼叫就是規范的；如果該呼叫遷移并不符合呼叫遷移基準狀態圖及約束條件，但是卻實際發生了狀態遷移，那么這個呼叫是非規范的。

5 初步驗證

基于非法呼叫篩查模型總體結構，應用呼叫信息上下文和呼叫遷移狀態圖，深圳電信初步搭建了驗證平臺。針對近期出現的假冒110電話進行詐騙的情況，基于驗證平臺，對深圳電信本地網呼叫進行篩查，發現的確存在非法假冒110電話的呼叫。下面以一個呼叫進行舉例說明，從信令系統中提取出來的呼叫信息上下文如圖7所示。該呼叫主叫號碼為000755110，呼叫深圳號碼29937809，此時的主叫號碼具有很大的迷惑性和欺騙性，用戶很容易上當受騙。

圖7 呼叫上下文信息舉例

圖8 呼叫遷移狀態圖舉例

根據路徑信息可以得到該呼叫遷移狀態圖如圖8所示。

通過該呼叫遷移狀態圖與呼叫遷移基準狀態圖及約束條件進行比對，發現主叫號碼000755110為虛假主叫，從深圳通信二局送到深圳電信關口局，屬于非法呼叫。

經過篩查，發現現網存在不少類似的呼叫，并非真正110發起的呼叫，均屬于通過虛假主叫假冒110進行詐騙的非法呼叫。通過核查整改，完善呼叫路由原則，從網絡上對此類呼叫進行封堵，有力打擊了利用虛假主叫進行詐騙的行為。

通過初步驗證，本文提出的非法呼叫篩查模型是可行、有效的，呼叫信息上下文和呼叫遷移狀態圖在篩查過程中能夠得到很好的實際應用。

6 結束語

電話網非法呼叫篩查在實際應用中意義重大，本文提出的篩查模型總體結構能實現自動、靈活篩查。基于總體結構，提出了呼叫信息上下文和呼叫遷移狀態圖的概念。本文定義了呼叫信息上下文，提取了與呼叫篩查有關的特征信息，能夠靈活應用，并具有擴展性。本文根據呼叫遷移狀態圖的概念，定義了呼叫遷移基準狀態圖，能夠有效地在呼叫篩查中得到應用。在后續的研究和時間中，將不斷改進、完善非法呼叫篩查模型的總體結構，改進、豐富呼叫信息上下文和呼叫遷移基準狀態圖的語義描述。

1 芮蘭蘭，孟洛明，邱雪松.終端業務上下文的定義方法及業務模型.電子與信息學報，2010，32（3）

2 周力，何雪飛.UML建模圖解教程.北京：人民郵電出版社，2009

3 李雁，李曉峰，喬秀全.模型驅動的電信業務元模型研究.北京郵電大學學報，2006，29（2）