林睿
電信詐騙已經成為危害社會的毒瘤,運營商必須承擔起社會責任,協助公安機關對其進行打擊。如何通過海量數據分析來精準的識別涉嫌電信詐騙的號碼,成為運營商需要研究的課題之一。
近年來電信詐騙猖獗,除了給受騙群眾造成了經濟損失之外,部分案件還在社會上造成惡劣影響,已經成為危害社會的毒瘤。不少企業已經在各自的領域內采取手段扼制電信詐騙,例如信息安全公司和手機生產商通過來電標識提醒用戶,銀行也加強了對轉賬行為的限制和風險提示。
三大運營商作為基礎電信業務的提供商,在防范電信詐騙上已采取了限制購卡、垃圾短信攔截等諸多被動措施,但詐騙分子仍可通過異地購卡,變換詐騙內容等方式來規避。打擊電信詐騙還需要主動出擊,為此本文設計并實現了一種基于運營商O/B域大數據,通過號碼歸類分析、信令數據清洗、號碼識別處置三步來協助公安機關打擊電信詐騙的辦法。
目前運營商均為各省獨立組網,對于不同的用戶,本地網絡能夠獲取的數據和處置方式也不一樣。因此需要根據歸屬地和當前位置將號碼分為國際漫入、省際漫入、本省漫出和本省本地等四類,采取不同的判斷流程和處置措施,如表1所示。


進行號碼分類后,我們通過訪談已抓獲的電信詐騙犯罪分子、回溯已立案的詐騙號碼記錄和行為邏輯預測等三種方式,總結分析出了詐騙號碼的特征。四類號碼共同的特征如下:一是號碼復用率低,終端復用率高;二是作案時間較為規律,多為工作日的白天;三是作案地區相對集中;四是主叫占比高,被叫離散度高。對于國際漫入和省際漫入類號碼,其特征還有首次漫入開機地點為非省際邊界地區且非港口地區。對于本省號碼,其特征還有開戶時間小于4個月,且未辦理流量套餐、集團業務,以及信用級別不高等等。對于本省漫出號碼,其特征還有首次漫出開機地點為詐騙案件高發地區。
數據是分析的基礎,目前各運營商基本都實現了2/3/4G全接口的信令采集,可以對所有在網用戶的海量信令數據進行清洗,提取出關鍵字段進行分析。各個特征數據的來源如下:漫入位置可以通過eNodeB-MME間S1接口GTP-C信令的Cell ID字段獲取。漫出位置可以通過MME-DRA-HSS間S6a接口Diameter信令的Origin-Host字段獲取。終端信息可以通過MSC-MGW/eNB-MME間Mc/S1接口BSSAP/GTP-C信令的callingimei/IMEI字段獲取。業務使用情況可以通過XDR話單獲取,業務辦理情況可以從BOSS側的經營分析數據獲取。
另外我們還建立了詐騙終端庫和敏感地區庫。詐騙終端庫中存儲著所有已立案的和經公安機關判定的涉詐號碼所使用過的終端IMEI號,數據量還會隨著時間的推移不斷的增長。敏感地區庫分為省外和省內兩部分,省外部分存儲的是公安部掛牌的詐騙高發地的MSC ID和MME host,省內部分存儲的是涉詐號碼常駐的CI和ECI。
所有類型號碼判斷識別流程的第一步都是在其開機接入網絡時,將手機上報的IMEI與詐騙終端庫進行匹配,如匹配成功則直接判定為“高度疑似詐騙用戶”,進入處置環節。如未匹配成功則進行第二步號段過濾,進行號碼分類后送往不同的判斷流程,如圖1所示。

對于本省本地號碼,第三步以日為粒度記錄并觀察每個號碼的業務行為,如果有號碼的通話短信次數、主叫占比、被叫離散度三項均超過閥值,且所在位置不變或在敏感地區庫中,則標識為“疑似詐騙號碼”。第四步向BOSS系統申請調出該號碼的B域數據,如果滿足近期開戶、一證多號、非集團用戶、非校園用戶、非寬帶用戶、靜默期(未開機)大于閥值、月流量低于閥值、信用等級低于閥值等8項條件,則被標識為“高度疑似詐騙號碼”,送公安機關審核通過后停機。
對于本省漫出號碼,第三步是將其開機時所在位置與省外敏感地區庫進行匹配,看是否位于公安部掛牌的電信詐騙高發地。如果匹配成功則進入第四步:回溯該號碼最近一周的位置軌跡,判斷其是否有其他地區的漫游記錄。如果該用戶僅出現在敏感地區,則標識為“疑似詐騙號碼”。第五步向BOSS系統申請調出該號碼的B域數據,判斷標準和處置方式同“本省本地號碼”的第四步。
國際漫入和省際漫入的判斷方法一致,第三步是將其開機時所在位置與省內敏感地區庫進行匹配,看是否為非港口(空港、碼頭、火車站、長途客運站)和邊界地區,如果匹配成功則標識為“疑似詐騙號碼”。第四步以日為粒度記錄并觀察每個號碼的業務行為,如果有號碼的通話短信次數、主叫占比、被叫離散度三項超過閥值,且所在位置不變或在敏感地區庫中,則標識為“高度疑似詐騙號碼”。高度疑似詐騙的國際漫入號碼送公安審核通過后拒絕其接入網絡,高度疑似詐騙的省際漫入號碼報送歸屬省進一步判斷和處置。
通過上述的特征維度和判斷流程,能夠有效的識別出涉嫌電信詐騙的號碼。然而不同地區的詐騙分子行為特征有所不同,同一地區的詐騙分子為了規避打擊也會不斷的變換行為模式。因此為了提高識別的準確率,運營商還需根據實際情況不斷調整和優化各個判斷方式和閥值。
機器學習是一項非常適合用于識別電信詐騙號碼的新技術,面對海量的數據分析和不斷變化的特征有著天然的優勢,部分運營商已經投入研究。但目前的問題是分散到各地的電信詐騙號碼樣本量偏少,識別的精準度不足,還需要經過長時間的訓練才能夠正式投產。
三大運營商作為國有企業肩負著社會責任,應當繼續投入人力物力進行,研究新的技術手段,協助公安機關打擊電信詐騙,還人民群眾一個健康安全的通信環境。
作者單位:中國移動通信集團海南有限公司