何曉明 ,賈 曼 ,劉志華
(1.中國電信股份有限公司廣東研究院 廣州 510630;2.中國電信集團公司 北京 100032)
隨著3G網絡的日益完善及廣泛覆蓋,移動互聯網業務進入發展的快車道,智能手機已成為人們生活的基本配置。預計到2012年底,中國電信的3G手機用戶數將達到7 000萬左右,3G智能手機用戶數將占新增手機用戶數的80%以上。移動互聯網在滿足人們隨時隨地接入互聯網的便捷性要求的同時,更為重要的功能是為人們提供廣泛多樣的社交溝通方式,如手機QQ、手機微博等即時通信(IM)類應用。
智能手機“永遠在線(always-on)”的這種業務體驗需求對3G網絡帶來了巨大的沖擊。最典型的例子是2012年1月25日發生的日本最大的移動運營商NTTDoCoMo大面積網絡癱瘓事故,故障持續近5 h,而這已經是DoCoMo在過去6個月中出現的第5次網絡問題。美國AT&T、歐洲Orange等知名電信運營商近年來也都曾遭遇類似的網絡癱瘓。
本文主要分析人們廣泛使用的IM應用這類小流量長在線業務,對Ev-Do網絡的影響。在對小流量長在線業務特征進行分析和現場試驗的基礎上,進一步梳理Ev-Do網絡承載小流量長在線業務的實現機制,從終端、網絡、業務平臺各個環節提出專為小流量長在線業務而優化的解決方案。
小流量長在線業務大體分為兩類:人與人通信及機器與機器通信(M2M)。目前,國內人與人通信的小流量長在線應用軟件主要以QQ、微信、微博為代表。根據統計,校園學生中手機QQ和微信的滲透率達到70%以上,而普通用戶中參與QQ應用的用戶占比也達到30%左右;校園學生同時也是手機微博的主要使用群體,滲透率達到35%以上。M2M應用是一種典型的小流量長在線業務,發展勢頭良好,是未來小流量長在線業務的潛在增長點。這兩類小流量長在線業務的共同特征是數據傳輸的流量較低,但占用過多的無線資源,導致無線資源的使用效率低;同時頻繁的連接激活與釋放產生大量的信令開銷,使無線網絡的信令負荷過重。小流量長在線業務特征可概括為以下幾個方面。
(1)在線時間長
對于M2M應用,因不同業務的應用場景不同,業務在線時間也不盡相同,但總體在線時間較長。如在電力抄表應用中,電力公司為了實時了解電力抄表系統的工作狀態,要求抄表終端24 h在線;環境監測系統也要求全天候上報監測點的溫度和濕度情況;公交或出租車的車載終端GPS定位業務每天在線時長至少為10 h。在手機IM應用中,雖然不同個體間存在使用習慣的差異性,但運營商普遍采用的按流量計費方式使得大多數用戶的平均在線時間超過8 h。
(2)流量小
不同于上網下載這類大流量突發業務,大多數小流量長在線業務具有小流量突發特點,即每次連接傳輸的數據量都很小。根據現場測試數據,車載終端GPS定位業務每次連接的前、反向數據量為800~860 byte,前、反向速率均小于4.8 kbit/s;手機QQ每次連接的前、反向數據量為500~600 byte,前、反向速率大部分接近 3 kbit/s。
(3)連接次數高
對于車載終端GPS定位業務,需要實時了解車輛的軌跡和行蹤,可根據車速情況調整GPS數據發送頻度,若按平均每分鐘上報一次數據計算,每小時建立的空口連接數約為60次;對于手機QQ業務,消息的發送頻次取決于應用場景,根據華為公司智能終端實驗室得到的長期測試數據可以得出,QQ用戶每小時建立的空口連接數平均約為80次。在主流的IM軟件中,由于國內使用QQ應用的用戶滲透率最高,如此頻繁的空口連接和釋放對無線網絡是一個挑戰。
(4)心跳周期短
為保持業務長時在線,大多數客戶端軟件都具有心跳機制,如較早版本的QQ客戶端心跳周期為30 s。
(5)前、反向鏈路的占空比低
由于小流量長在線業務具有較強的間隙性傳輸數據的特點,一個小的突發數據過后,要經過一個較長的時間間隔才傳送下一個突發數據。因此,根據現場測試數據可以得出,車載終端及手機IM應用大部分連接的占空比都低于20%。也就是說,終端在提供小流量長在線業務的時候,大部分時間處在休眠狀態,只有小部分時間在發送或接收數據。
下面以QQ業務流程為例,說明消息在QQ客戶端和QQ應用服務器之間的交互過程。QQ業務流程包括:客戶端登錄/退出、心跳消息的周期性發送、聊天消息和系統消息傳遞,如圖1所示。QQ業務客戶端在QQ服務器成功登錄后,才能進行聊天消息和系統消息的傳遞。聊天消息由客戶端發送到服務器,再由QQ服務器下發到目標客戶端;系統消息包括好友的上/下線通知和系統推送通知如廣告等,由QQ服務器端發起,發送到QQ客戶端。

為了了解小流量長在線業務對Ev-Do網絡的影響程度,筆者收集了大量已有的現網測試數據,并在江蘇、四川等省份進行了現場試驗,測試拓撲如圖2所示。現場試驗中,連接分光器的外置DPI設備及后臺分析系統主要用于采集分析移動互聯網業務的流量組成、小流量長在線業務在整個移動互聯網流量占比以及參與小流量長在線業務的用戶占比情況。核心網分組域中PDSN通過內置DPI模塊對下行的IP報文進行識別和標識,在A10連接中通過GRE頭部擴展屬性攜帶業務標識APP ID及業務QoS等級profile ID,并傳遞到無線側的BSC/PCF(base station controller/packet control function,基站控制器/分組控制功能)。無線網管內置呼叫話單統計(CDT)模塊實現基于業務的無線資源占用統計和分析,CDT能夠統計到每個連接的時長、前/反向流量以及業務屬性。根據CDT統計數據,能夠得到各種業務所產生的連接數、連接時長、流量情況。現場試驗結果發現,由IM應用產生的無線連接數占所有移動互聯網業務連接數的30%左右,由IM應用產生的話務量占到所有移動互聯網業務話務量的20%,但IM應用所產生的前、反向流量卻不到全網整個流量的1%。換言之,IM這種小流量長在線應用占用了Ev-Do網絡30%的信令負荷及20%的無線資源,但是由于按流量計費這種商業模式,使得IM應用只為電信運營商貢獻了1%的業務收入。

圖2 現場試驗測試拓撲
到目前為止,中國電信還未發生因小流量長在線業務引起的大面積網絡癱瘓現象,但是在部分高校、高密度寫字樓等人群聚集的熱點區域,收到大量的用戶投訴,主要表現為接入網絡困難、頻繁掉線、上網速率慢,甚至打不開網頁等。通過無線網管數據分析得到,這些熱點基站的忙時連接成功率、無線掉線率、連接數、話務量、反向鏈路RoT(rise over thermal,扇區總功率與基底噪聲功率的比值)等指標偏離正常水平,但是忙時前/反向吞吐量、前向時隙占用率等指標并未表現異常,這表明這些問題基站并不是由于業務量過載引起的。筆者對高校學生進行調研后發現,學生普遍喜歡使用QQ、微信、微博這類IM業務,尤其在一天中的22:00-24:00時段使用最為集中。
在Ev-Do網絡中,每載扇激活的用戶數主要受前向MACIndex數量、反向CE數量以及反向RoT等參數的限制。前向MACIndex資源中,每載扇能用于業務信道的最大數是114個,考慮到軟切換的需要,假設軟切換因子為30%~40%,則前向業務信道MACIndex資源最大可用數為70~80個,再考慮30%的冗余 (一部分用于控制信道分組),實際可用于用戶終端的數量為50~60個。反向CE數目受信道板硬件資源(如芯片)的限制,一般可通過硬件升級等方式提供更多的CE資源。
另一個限制每載扇激活用戶數的重要因素是反向RoT指標。基站根據RpT來評估基站的干擾和負載情況。由于Ev-Do系統反向采用碼分多址接入方式,所以反向干擾受限;反向RpT抬升,將造成基站反向覆蓋的收窄,遠點用戶由于功率不足造成接入失敗和掉話,從而影響用戶感知。反向RpT值越高,意味著反向負荷越重。一個載扇下激活的用戶數越多,反向干擾就越嚴重。現場測試數據發現,50部手機QQ主動通信時(每分鐘發送一條消息),可將反向鏈路的底噪抬升3~5 dB,相當于消耗30%~70%的反向容量。這會嚴重影響其他用戶的業務體驗。
在校園區域,由于大量學生在同一時間段頻繁使用QQ這類IM應用,容易形成聚集效應,過度占用無線資源,導致上述無線資源枯竭,網絡性能急劇惡化,用戶體驗變差。另一方面,IM消息的頻繁發送引起空口連接的頻繁激活與釋放,產生大量的信令開銷,加重了控制信道的信令負荷。當控制信道發生信令擁塞時,信令開始丟棄,更有甚者,當信令風暴引起大量突發的尋呼消息時,將使得BSC的信令處理能力嚴重過載,最終引起大面積網絡癱瘓。表1概括了小流量長在線業務對Ev-Do網絡資源的影響。
根據上述分析,小流量長在線業務對Ev-Do網絡的影響主要表現為兩個方面:
· 空口連接時間長,造成對無線資源的過度占用,而每連接內傳輸的數據量小,無線資源使用效率低;

表1 小流量長在線業務對Ev-Do網絡資源的影響
· 空口連接次數高,增加無線網絡的信令負荷,容易引起信令風暴。
針對這些問題,本文從終端、網絡及應用平臺3個方面提出較為完整的端到端優化手段。
對于IM這類小流量長在線業務,由于消息的傳輸具有較強的間隙性,一個小的突發數據過后,要經過一個較長的時間間隔才傳送下一個突發數據,表現為傳輸鏈路的占空比很低。若能在傳送一個突發數據后立即釋放空口連接,可大大減少這種小流量長在線業務對空口資源的占用時間。休眠定時器就是指終端和網絡側檢測到空口連接空閑時 (沒有數據傳輸),釋放該連接所需等待的時間。通過減少小流量長在線業務的休眠定時器可降低使用這類業務的話務量水平。休眠定時器設置得過長,會增加每次連接的空閑等待時間,反映在用戶平均話務量的升高;休眠定時器設置得過短,雖然會降低話務量,但可能會引起連接次數的增加,產生更多的信令開銷。因此,調整休眠定時器需要權衡話務量與信令負荷兩者的關系,不適合在信令負荷較高的網絡中實施。
本文中以休眠定時器的最短極限3 s為例,定義小流量長在線業務的一個消息突發為一串間隔小于3 s的連續收發數據分組,每個消息突發之間的間隔稱為消息突發間隔。假定小流量長在線業務的所有消息突發間隔以90%以上的概率落在10 s之外,那么,休眠定時器調整為3 s比調整為10 s時充其量會多產生10%的連接數,但用戶平均話務量卻降為原來的一半以上,相應地,無線網絡的傳輸效率將得到成倍的提升,這對于校園這種QQ應用密集的區域是相當有吸引力的。通過在分組域部署的內置或外置DPI對小流量長在線消息報文的時間間隔分布情況進行統計分析,可以為優化調整休眠定時器提供參考依據。
因此,調整終端和網絡的休眠定時器作為小流量長在線應用優化的重要手段,可有效減少用戶對空口資源的占用,降低每用戶話務量,減少反向干擾,提升網絡性能,接入更多用戶。調整休眠定時器可普遍適用于高校區域這種大量用戶使用小流量長在線業務的場景等。
大多數手機IM客戶端為了保持業務的長時間在線,都會周期性向應用服務器發送心跳消息,以維持PPP連接永不中斷。每次心跳消息的發送都可能引起空口連接的激活與釋放,心跳消息的發送周期越短,增加的連接次數越多,用戶的平均話務量水平和信令開銷也會相應增加。因此,在不中斷PPP連接的條件下,最大限度地降低終端發送心跳消息的頻度,可以有效減少空口連接的次數,提高無線資源利用率。如早期版本的QQ客戶端心跳周期為30 s,1 h會產生120次的心跳消息,最壞情況下因心跳消息可能會多產生120次的空口連接。由于現網中分組域PDSN與終端的PPP連接的空閑超時定時器通常配置為10~15 min,而實際上,IM客戶端的心跳周期只要小于PPP連接的空閑超時定時器時間就可以維持PPP連接不會中斷。
IM應用服務器也會主動向IM客戶端頻繁推送大量消息,如在QQ或MSN應用中,服務器會實時更新好友的上/下線通知及各種廣告信息等內容,特別是“群”服務中一個用戶發送的消息將會廣播給 “群”中的所有用戶,IM客戶端建立的“群”越多,接收到的廣播消息量就越大。大量來自服務器的消息一方面加重了Ev-Do網絡尋呼終端的尋呼量,另一方面也會因大幅增加的空口連接次數造成對無線資源的過度占用。現場測試中發現一個列有100個好友的QQ客戶端差不多每隔30 s發生一次尋呼及空口連接的激活/釋放過程。如果SP能調整IM應用服務器的消息推送方式,把除了聊天這類實時性要求較高消息外的其他消息先緩存起來,再以較長的時間周期批量推送給IM客戶端,可以大大減少服務器推送消息的頻次,相應減少信令量及對空口資源的占用。
針對小流量長在線業務所產生的大量信令負荷,可通過改進Ev-Do網絡的尋呼方式來加以緩解。
基于業務的尋呼抑制技術就是網絡側根據發起尋呼的數據分組的業務類型,設置不同的尋呼丟棄門限,當同步消息達到緩存隊列相應門限閾值時,開始丟棄對應業務類型的尋呼消息,以緩解控制信道的擁塞。如為Qchat業務的尋呼消息設置最高優先級,對應的尋呼丟棄負載門限為90%;為上網瀏覽、視頻播放類較高價值業務的尋呼消息設置次高優先級,對應的尋呼丟棄負載門限為80%;為IM類低價值業務的尋呼消息設置對應的尋呼丟棄負載門限為60%;為攻擊流量的尋呼消息設置為“總是丟棄”。
基于業務的尋呼優先級技術類似于上述尋呼抑制技術,不同優先級尋呼消息進入不同優先級尋呼隊列,當控制信道發生擁塞時,較高優先級隊列中的消息優先得到尋呼。
上述尋呼技術在信令過載時會丟棄大量的低優先級的尋呼消息,是以降低低優先級業務體驗為代價來換取高優先級業務的體驗保障。分層尋呼技術則是通過改變尋呼范圍來降低基站控制信道的擁塞程度,有3種不同層次的尋呼方式。
·第1層尋呼是指最近上報的有效激活集扇區尋呼,該級尋呼是對上次終端與基站發生消息交互時AT上報的RU(route update,路徑更新消息)里包含的有效PN所在的BTS發送尋呼,也稱為RU尋呼。當距上次終端與基站側的聯系間隔t滿足:t · 第2層尋呼也稱為鄰區尋呼,該級尋呼是對上次終端與基站交互的接入小區的所有鄰區所屬的BTS尋呼。當距上次終端與基站側聯系間隔t滿足:RU有效時間 · 第3層尋呼是子網+鄰區尋呼方式,該級尋呼是對上次終端與基站發生消息交互時在接入小區所在的子網和接入小區鄰區從屬的BTS中發送尋呼。當距上次終端與基站側聯系間隔t滿足:t>子網方式RU有效時間,使用第3層尋呼。 目前已有廠商的無線設備支持這種分層尋呼技術。 針對校園這種使用小流量長在線業務聚集的區域,載扇同時激活的并發連接數很高,通常會接近每載扇設定的接入用戶數極限,加重了反向干擾,導致反向容量嚴重受限,影響上網瀏覽、視頻等其他業務的體驗。干擾消除技術可以消除用戶間的干擾,提高信道的信噪比,降低終端的發送功率,接入更多的用戶。干擾消除技術包括TIC(traffic interference cancellation,業務信道干擾消除)和PIC(pilot interference cancellation,導頻干擾消除)功能,它是基于高通公司的信號調制解調芯片來實現的。實驗室測試數據表明,干擾消除技術可以把Ev-Do反向容量提升60%以上,非常適合于小流量長在線業務使用密集的校園區域。 移動互聯網的迅猛發展以及物聯網的興起,催生出越來越多的小流量長在線業務,對Ev-Do網絡的影響日益顯現。電信運營商首先應加強無線指標的實時監控安全預警系統,一旦發現有相關無線運行指標偏離正常范圍,到達設定的安全邊界,就應立即啟動無線網絡保護措施,避免網絡大面積癱瘓事件的發生。同時,需從終端、網絡及業務平臺3方面研究和試驗可操作的端到端的優化方法,維持現有網絡的可持續運營,保護Ev-Do網絡大規模建設投資。 小流量長在線業務顛覆了傳統業務的話務模型,基于CDMA的3G移動網絡技術在標準定制中沒有考慮到今天如此廣泛使用的小流量長在線業務對無線業務信道資源和信令資源的過度占用問題。因此,除了做好終端、網絡及業務平臺各個環節的優化工作外,還需對數據流量進行合理疏導,進一步加大Wi-Fi網絡的覆蓋力度,提升Wi-Fi網絡服務質量水平,加強CDMA網與WLAN的協同,把更多的小流量長在線業務分離到WLAN,有效緩解Ev-Do網絡的壓力。 1 3GPP2 C.S0024-A (Version 3.0).cdma2000 High Rate Packet Data Air Interface Specification,2006 2 羅興國,唐曉梅,郭淑明等.cdma2000高速分組數據傳輸技術.北京:國防工業出版社,20075 結束語