垃圾短信治理方案及技術實現

2015-07-02 17:03:13王研

科技資訊 2015年4期

王研

摘要：近年來，垃圾短信愈發泛濫，這種行為不但極大危害了用戶的切身利益，而且對于聯通的品牌打造也制造了很大的障礙。因此，對運營商的監管提出了更高的要求。該文綜合比對了主流的垃圾短信攔截方案，最后明確了所采用的基于發端短信中心實時控制的垃圾短信攔截方案。通過采用系統自動處理和人工審核相結合的方式，垃圾短信治理工作取得了顯著的成果。最后，該文結合目前垃圾短信治理的形勢，對最新的基于可疑度的垃圾短信攔截機制進行了介紹，對后期的治理工作提出了展望。

關鍵詞：發端短信中心實時控制垃圾短信被舉報率關鍵字攔截機制

中圖分類號：TN929 文獻標識碼：A 文章編號：1672-3791（2015）02（a）-0024-02

2012年以來，垃圾短信又有重新抬頭之勢，并有了新的變種，主要包括偽基站垃圾短信、iMessage垃圾信息及智能手機中毒后成為“肉機”發送的垃圾短信，其內容大多涉及反動、詐騙、買賣非法物品等違法信息。這種行為不但極大危害了用戶的切身利益，而且對于聯通的品牌打造也制造了很大的障礙，因此對垃圾短信進行治理刻不容緩。

針對此種情況，集團公司于2012年起將垃圾短信的治理納入KPI考核，按月對未達到考核指標的省份進行通報及收入扣減；于2013年優化考核標準，開展“凈網”活動，對全網和地方端口短信進行清理，對不符合條件的端口進行關停處理；于2014年執行行業端口省間結算，完成國際垃圾短信攔截系統擴容，組織開展打擊偽基站專項行動，啟動建設集中攔截系統。

1 垃圾短信治理方案分析

垃圾短信監控，按照攔截位置的不同可以分為發端控制、收端控制和其他控制三種模式。其中又根據短信數據處理網元的不同分為短信中心控制模式和信令控制模式，下面分別加以介紹。

1.1 發端短信中心實時控制模式

垃圾短信信息安全監管系統與短信中心（SMSC）連接，SMSC將MO/AO短信暫存并實時傳遞副本給垃圾短信信息安全監管系統，由垃圾短信管理系統根據設定的判別規則對MO/AO短信實時進行垃圾短信甄別，并將判別結果通知SMSC進行攔截或下發處理。

垃圾短信管理系統對SMSC上報的短信數據進行甄別分析，對符合垃圾短信判別規則的短信通知SMSC進行攔截處理；對不符合垃圾短信判別規則的短信通知SMSC進行下發處理。

發端實時短信中心控制模式網絡結構與準實時短信中心控制模式網絡結構類似，其中接口機可以采用與現有信息安全匯聚網關復用。

1.2 發端信令實時控制模式

垃圾短信管理系統與信令處理機連接，信令處理機串接在LSTP與SMSC之間的信令鏈路中；如果建設的是HSTP，信令處理機串接在HSTP與SMSC之間的信令鏈路中，由信令處理機根據設定的判別規則，對提交給SMSC的MO短信和SMSC發出的MT短信數據進行比對，對符合判別條件的MO/MT短信進行實時攔截，同時將MO/MT短信記錄副本上報至垃圾短信管理系統做進一步分析處理以及數據存儲。

垃圾短信管理系統對各個信令處理機上報的短信數據進行匯總分析，根據分析結果更新垃圾短信判別規則并同步至各信令處理機執行。

1.3 收端信令實時控制模式

垃圾短信管理系統與信令處理機連接，信令處理機串接在LSTP與MSC之間的信令鏈路中；如果建設的是HSTP，信令處理機串接在HSTP與MSC之間的信令鏈路中，由信令處理機根據設定的判別規則，對下發至MSC的MT短信數據進行比對，對符合判別條件的MT短信進行實時攔截，同時將MT短信記錄副本上報至垃圾短信管理系統做進一步分析處理以及數據存儲。注：MT短信記錄應包括發送方號碼、接收方號碼、消息內容、發送時間等信息。

垃圾短信管理系統對各個信令處理機上報的短信數據進行匯總分析，根據分析結果更新垃圾短信判別規則并同步至各信令處理機執行。

1.4 治理方案比較

對于垃圾短信治理的發端方案和收端方案，從監控范圍，攔截策略，維護要求進行比對可以發現：全網發端方案和收端方案的監控范圍和攔截策略基本相同，但發端方案可以采用短信中心方案和信令方案，監控的設備投入較小，相比收端，發端的性價比更高，因此天津聯通垃圾短信平臺采用的是發端短信中心實時方式的方案。

2 天津聯通垃圾短信治理成果

通過新建垃圾短信信息安全監管系統，采用發端短信中心實時控制方式，實現天津本地發端垃圾短信治理功能，較之之前通過短信中心自帶模塊離線分析短信中心話單后生成黑名單的攔截方式，攔截短信數量和范圍有了很大幅度的提高。

另一方面，針對通過大量號碼池低頻發送垃圾短信的行為，如果單純依靠垃圾短信監控系統的話，采用嚴格單一的攔截策略，容易造成正常短信的誤攔，遺漏垃圾短信。因此，采用關鍵字+流量控制、系統自動處理+人工審核相結合的方式，重點啟用組合關鍵字和連續低頻次規則精確攔截。具體包括以下幾方面。

（1）降低可疑短信的門限值，盡可能多的收集可疑短信，對內容雷同的可疑短信進行內容分析提純，通過“與或”邏輯組合及時添加攔截策略，對垃圾短信進行精準攔截。

（2）增加了臨時關鍵字、關鍵句功能，通過人工審核將確認為垃圾短信的聯系電話、網址、QQ號、銀行賬號等加入臨時關鍵字，發送3條即加入黑名單，有效提高攔截率。

（3）人工審核團隊堅持對可疑信息進行100%人工審核，發現一例封堵一例，進行100%封堵；及時制作、更新監控攔截關鍵字，堅持人工和智能化系統相結合，確保不良信息7×24h審核處理的及時有效。

在多種治理舉措的共同實施下，天津地區的垃圾短信發送量大幅度降低，垃圾短信被舉報量也明顯減少。通過12321和10010垃圾短信舉報處理平臺數據顯示，2012年天津地區點對點垃圾短信被投訴量顯著下降（其中垃圾短信被舉報率=來自于10010和12321平臺的垃圾短信舉報數/本地短信用戶數（千萬數量級）該文中本地短信用戶數以2012年在網用戶數均值430萬來進行計算），如圖1所示。

3 技術發展與展望

雖然天津聯通已經建設了基于短信中心發端控制的垃圾短信監控系統，并通過系統自動處理與人工審核相結合的方式取得了較好的成果，但是單純依靠“關鍵字+頻次”實現垃圾短信一次過濾的方式仍有不足，并且人工審核工作無法做到垃圾短信的事前處理。隨著垃圾短信治理工作的深入，垃圾短信也呈現出新的發送特征。

（1）發送者采用同音、形近、近義等方式，規避關鍵字方式的攔截，同時在其中混淆一些無意義的字符，用來欺騙攔截算法。例如：“fa-瞟”、“貨（貸）款”等拼音詞匯變形，嵌入特殊字符等使得目前的關鍵字和關鍵字組合失效。需要針對此類進行語義特征提取，自動過濾關鍵字。

（2）發送者采用頻繁換號的方式，每個號碼都是低頻發送，模擬正常用戶的發送行為進行發送，以躲開針對發送者的異常行為進行流量探測的方法。

針對此類問題，集團公司總部在部分省市進行試點，開展基于可疑度計算的垃圾短信過濾方案的運行測試工作，在垃圾短信的過濾過程中首次引入了可疑度的概念，使用多種特征過濾及內容過濾算法對一條短信的可疑度進行估算，命中一個算法，給當前短信累加一個分值，并且賦予每種算法不同的權值，當短信的可疑度累積增加到一定閥值時，可疑短信被視為垃圾短信。

下一步，集團公司計劃于2014年內啟動的基于收端控制的垃圾短信集中攔截系統的建設，該平臺實現關鍵字和攔截策略的統一部署，從而能大幅度減少垃圾短信在省際間的流動泛濫問題，同時結合天津本地現有垃圾短信平臺的優化擴容，為用戶打造了綠色誠信的網絡文化環境，實現了經濟效益和社會效益的雙豐收。

參考文獻

[1] 張永忠，王江.垃圾短信監管系統方案分析與實現[J].硅谷，2012（7）：128-129.

[2] 張燕，傅建明.垃圾短信的識別與追蹤研究[J].計算機應用研究，2006，23（3）：245-247.

[3] 李愷明.廣東移動通信垃圾信息分析與治理方案設計[D].北京：北京郵電大學，2011.

科技資訊2015年4期

科技資訊的其它文章: 企業參與的高職鐵道工程技術專業課程開發與設計; 基于Proteous的交通燈理實一體化教學項目的研究; 工程訓練教學示范中心建設研究; 大學英語口語教學引入“語言游戲”理論的策略; 大學體驗英語綜合教程中英語詞匯隱喻的運用; 打造小學數學高效課堂實踐探討