何 陽,黃 樂,孫 潔
(中國移動通信集團設計院有限公司陜西分公司 西安 710077)
在無線寬帶化、業務融合化以及降低運營成本的驅動下,移動通信網絡向All IP演進已經成為必然的發展趨勢,目前中國移動已經完成了承載網、核心網的IP化建設,無線接入網的IP化建設也在有計劃地部署之中。隨著中國移動通信網絡IP化程度的不斷提高以及分組域業務地位的迅速提升,SGSN Pool技術作為一種能夠充分利用核心網分組域網絡資源、提升核心網絡安全性、有效降低運營成本的重要技術,受到各移動運營商以及設備廠商的高度關注。
3GPP TS23.236技術規范中明確提出了池組的概念,即多個核心網絡節點組成一個池區,針對核心網分組域網絡而言就是SGSN Pool。在SGSN Pool內每個BSC/RNC與池組內所有的SGSN節點均存在連接關系(物理連接或是邏輯連接),每個SGSN設備都可以為池組內所有的BSC/RNC提供服務[1]。SGSN Pool技術的實現涉及一個重要參數和一個關鍵功能,重要參數指的是NRI(network resource identifier,網絡資源標識),關鍵功能指 NNSF(NAS node selection function,非接入層網絡節點選擇功能)。
在SGSN Pool中,NRI是P-TMSI的一部分,其長度可以在0~10 bit靈活選擇,若為0 bit,則表示不啟用SGSN Pool功能。在實際組網中,各廠商對P-TMSI結構中的比特位會有不同的分配方式,一般是按照當前SGSN Pool的規模以及核心網絡發展趨勢分配NRI的長度,即 SGSN Pool的容量與NRI的長度選擇是互相制約的關系[2]。P-TMSI的具體結構以及NRI的具體位置如圖1所示。
從圖1可以看出,P-TMSI由32 bit構成,具體分析如下。
·30~31 bit:PS/CS標識位,用于表明 TMSI是在電路域還是在分組域中使用,即用來表示是TMSI還是P-TMSI。
·24~29 bit、0~13 bit:P-TMSI預留位 (包含 SGSN 重啟標識位),用來標識分組域用戶。
·14~n(n≤23)bit:NRI標識位,NRI的長度可以靈活調整(0~10 bit),NRI從第23個比特位開始由高到低依次使用。
從上面的分析可以看出,NRI和P-TMSI中用于分組域用戶標識的比特位長度是一種互為制約的關系。為了保證每套核心網SGSN設備有足夠的P-TMSI資源可分配給用戶,且有足夠的NRI碼號資源分配給SGSN Pool內的核心網元設備,同時考慮后續SGSN設備用戶容量的擴容需求,NRI的長度規劃十分重要。

圖1 P-TMSI結構示意
在SGSN Pool組網時,NNSF功能在BSC/RNC節點實現,但是3GPP TS23.236中并沒有規定NNSF功能實現的具體算法,完全由設備廠商自行定義。在現階段,經與相關廠商溝通,NNSF算法在實現時一般是參照SGSN Pool內的各套SGSN設備附著用戶容量比例,在BSC/RNC節點對Pool內各套SGSN預先設置相應的負載均衡因子(根據網絡發展需求,后續也可以有針對性地開發不同的算法滿足特定的需求),這種靜態配置的方式,只是將SGSN設備的附著用戶容量作為計算容量因子的基礎,沒有考慮核心網分組域不同類型業務之間業務量的差異,可能會造成SGSN Pool內各套SGSN設備業務量的不均衡。
如果要實現SGSN Pool內相對精確的負載均衡效果,則需要采用動態的負載均衡算法。動態負載均衡算法能夠根據SGSN Pool內各套SGSN設備的實時負荷參數(附著用戶數、業務量、處理能力等)為分組域用戶選擇Pool內的SGSN設備,最大限度地保證SGSN Pool區域內各套SGSN設備的負載均衡。但是由于需要BSC/RNC節點不斷獲取SGSN設備的實時負荷信息,帶來額外的信令開銷,對BSC/RNC和SGSN的設備性能提出了比較高的要求,隨著后續設備性能的提升和技術的發展,在SGSN Pool內引入動態負載均衡算法將會極大地提升池組內SGSN設備的利用率。
在SGSN Pool技術實現時,MS首次進入池組區域、在池組區域內移動、從池組區域中移動到非池組區域、完成用戶遷移操作或是池組內SGSN設備出現故障,都會涉及不同的業務流程。
MS首次附著及池組內路由更新流程如圖2所示,具體介紹如下。
·MS從BSC1/RNC1的路由區域中首次進入SGSN Pool時,BSC1/RNC1執行NNSF選擇功能為MS選擇SGSN,這里設定為SGSN2。
·MS接入SGSN2之后,由SGSN2為MS分配P-TMSI(包含 NRI值,SGSN2 對應的 NRI值為 2),SGSN2中保存MS的相關信息。
·當MS移動到BSC2/RNC2的路由區域中時,BSC2/RNC2根據相關信令消息 (對于RNC來說為IDNNS信令消息,對于BSC來說為TLLI信令消息)中攜帶的NRI信息,仍然為MS選擇NRI=2對應的SGSN2為其提供相應服務。
從上述流程中可以看出,MS在SGSN Pool范圍內移動時,始終由一個特定的SGSN設備為其提供服務,減少了由MS位置變化帶來的SGSN之間的信令交互,降低了SGSN設備的信令負荷。
跨池組路由更新流程如圖3所示,具體介紹如下。
·當MS移動到SGSN Pool外的區域時,需要重新附著到非Pool區域中的SGSN4,SGSN4中并沒有MS的相關信息(MS的相關消息仍保存在SGSN2中)。
·SGSN4向DNS發送NRI請求消息,該消息中包含MS的原始RAI,DNS通過原始RAI值,找出對應的SGSN Pool區域內已經設置的Default SGSN,這里假設為SGSN3。

圖2 MS首次附著及池組內路由更新流程

圖3 跨池組路由更新流程
·SGSN4將從MS獲取的原始NRI信息發送給Default SGSN,Default SGSN通過 NRI找出此 NRI對應的原始SGSN,這里為SGSN2。
·SGSN4通過與SGSN2發起通信獲取MS的相關信息。
在SGSN Pool中設置Default SGSN的目的是為了在MS從SGSN Pool區域切換到區域外時,提前設置池組內的SGSN作為中轉,實現SGSN Pool內外SGSN的通信。Default SGSN可以設置一個,也可以設置多個,設置多個Default SGSN的目的在于Default SGSN出現單點故障時SGSN Pool內外SGSN的正常通信仍不會受到影響。
SGSN Pool的負載重分配是指將某個SGSN上的用戶遷移到SGSN Pool內其他SGSN上,也稱為用戶遷移,可以實現SGSN Pool內SGSN的負載重新分配或對Pool內SGSN設備進行相應的維護操作,最大程度地減少對用戶業務的影響,其具體的業務流程如圖4所示。
·在SGSN Pool的網絡管理平臺中將需要負載重分配的SGSN設置為卸載狀態(重分配狀態),并通知RNC/BSC設備SGSN的相應狀態,這里負載重分配的SGSN選擇為SGSN2。
·通過SGSN Pool的網絡管理平臺,在SGSN2上啟動相應的用戶卸載流程,SGSN2通知BSC/RNC設備自己處于卸載狀態。
·BSC/RNC下發相應信令消息指示MS進行相應的路由更新,MS發送相應的路由更新消息給SGSN Pool內的 SGSN2。
·SGSN2已經設置為卸載狀態,故SGSN2分配Null-NRI和 Non-broadcast RAI給 MS。Null-NRI是一個不屬于任何SGSN的特殊NRI,僅在SGSN Pool內的SGSN設備之間進行負荷遷移時使用。

圖4 負載重分配流程
·當MS重新進行業務請求時,BSC/RNC從MS獲得NRI信息,即 Null-NRI。根據 SGSN Pool內剩余SGSN的容量比例,RNC/BSC為MS重新選擇一個SGSN為MS提供相應的服務,這里假設為SGSN3。
·SGSN3根據Non-broadcast RAI定位原先為MS提供服務的 SGSN,即 SGSN2,并通過與 SGSN2進行通信獲得MS的相關信息。
經與相關廠商溝通,目前各個廠商均無法實現負載重分配時完全無損的用戶遷移,正處于PDP激活狀態并進行數據交互的用戶,其相關的業務會發生中斷。
當SGSNPool內單套SGSN宕機時,對于BSC/RNC設備來說,宕機的SGSN已經處于不可用狀態,會出現以下兩種情況。
·對于在Pool內單套SGSN宕機期間內,新發起附著流程的MS來說,BSC/RNC根據NNSF功能算法,為其選擇SGSN Pool內正常的SGSN為其服務,但是不包括宕機的SGSN,且在BSC/RNC側負載均衡因子的配置不包括宕機SGSN的容量。
·對于原先由宕機的SGSN服務的MS來說,由于Pool內其他的SGSN并沒有這部分MS的相應信息,需要MS在進行周期性路由更新、路由區切換或是發起新的業務請求時,由BSC/RNC重新按照NNSF算法為其選擇Pool內正常的SGSN為其提供服務。
在3GPP TS23.236技術規范中規定,SGSN Pool內每個BSC/RNC與池組內所有的核心網SGSN設備均存在連接關系 (邏輯連接或是物理連接),即BSC/RNC設備與SGSN設備是一種全連接的組網方式。因為3GPP中并沒有規定SGSN Pool內設備互聯鏈路的實際承載方式,在現階段實現SGSN Pool時,會存在以下3種組網方式。
在Gb/Iu-PS接口未實現IP化承載之前,如果要實現SGSN Pool組網,BSC/RNC設備(需支持Flex功能)需要通過直連鏈路與核心網SGSN設備實現全互聯。若M個BSC/RNC設備與N個SGSN設備實現全連接,則需要配置M×N條互聯鏈路。這種組網方式會占用較多的2 Mbit/s傳輸資源和BSC/SGSN設備端口,而占用的傳輸資源和設備端口的實際利用率卻相對較低,對投資、網絡資源均是一種浪費,且一旦有新網元加入池組,網絡的調整相當復雜,不易于維護,增加了運維成本。Gb/Iu-PS接口未IP化時組網示意如圖5所示。
在Gb/Iu-PS接口實現IP化承載后,池組中的SGSN設備與BSC/RNC設備的全連接可以通過路由方式實現(通過IP承載網絡互通),物理上并不需要有直接相連的鏈路,SGSN Pool技術的引入變得容易,且一旦有新網元加入池組,網絡調整比較簡單,只需要制作相應數據即可。Gb/Iu-PS接口IP化后組網示意如圖6所示。
SGSN Pool組網時,需要BSC設備支持Gb-Flex功能。若BSC不支持Flex功能,可以通過引入SPP(SGSN Pool proxy,池組功能代理設備)完成組網部署。SPP能夠提供以下兩大類功能。
·協議轉換功能,實現FR和IP協議之間的轉換,使BSC設備的Gb接口從原來的幀中繼承載方式轉變為IP承載方式。
·Flex代理功能,使原來不具備Gb-Flex功能的BSC設備具備Flex功能。
在實際應用中,對于SPP在網絡中的設置,可以采用集中設置方式和分散設置方式兩種,其組網方式分別如圖 7、圖8所示。

圖5 Gb/Iu-PS接口未IP化時組網示意

圖6 Gb/Iu-PS接口IP化后組網示意
若SPP設置在核心網SGSN設備側,BSC設備側不需要作任何的改動,但是SGSN側的Gb電路需要進行重新割接,因為集中設置的SPP數量少,一旦SPP出現故障,則會對核心網分組域網絡產生較大的影響;若SPP設置在無線接入網BSC設備側,BSC設備則需要進行電路割接,通過SPP接入IP承載網絡,需要增加大量的SPP設備,且割接工作量較大,對網絡的影響較大。
Gb/Iu-PS接口在沒有全部實現IP化承載之前,現網引入SGSN Pool技術的難度非常大,BSC/RNC設備需要通過實際的物理連接與SGSN進行全連接,組網十分復雜,不建議采用這種方式進行SGSN Pool組網;SPP代理設備應作為SGSN Pool技術引入的一種彌補策略,在少數BSC設備無法滿足條件時使用,不建議大規模使用(引入SPP后網絡結構復雜,故障點增多,且產品成熟度不高);建議在現網BSC/RNC設備完成Gb/Iu-PS接口IP化承載并支持Flex功能后,再引入SGSN Pool技術,這樣可以避免割接調整和網絡結構變化對現網造成的影響,實現簡單,符合網絡IP化演進的趨勢。

圖7 SPP集中設置組網示意

圖8 SPP分散設置組網示意
·在引入SGSN Pool技術后,無線接入網BSC/RNC設備可以共享核心網SGSN設備資源,池組內SGSN容量配置不需要按照單套SGSN附著用戶容量的峰值進行考慮,只需要按照平均的附著用戶容量進行核算即可,節省了投資,提高了SGSN設備整體利用率。
·SGSN Pool的服務區域變得更大,MS在池組的服務區域中移動時一直由固定的SGSN為其提供服務,減少了SGSN之間的切換流程,間接提升了核心網分組域網絡的處理性能。
·SGSN Pool技術能夠很好地平衡“潮汐效應”,在減輕業務高負荷區域SGSN設備負荷的同時,利用業務低負荷區域SGSN設備的處理能力,解決現網不同區域或不同時段業務量不均衡的現狀,特別是對突發的業務量(節假日、大型活動等)有良好的應對能力,提升了池組中SGSN設備的利用率。
·在現網中,核心網分組域缺少容災機制,一旦出現SGSN單點故障,其服務區域下的所有用戶將無法使用分組域相關業務,業務恢復時需要將掛接在這套SGSN上的無線接入網BSC/MFS設備的Gb鏈路割接調整到正常工作的SGSN設備上,過程復雜,業務恢復時間長。在SGSN Pool技術引入后,當池組中的SGSN出現故障時,BSC/RNC設備會通過NNSF節點選擇功能將用戶重新分配到正常工作的SGSN上,實現了SGSN設備的容災備份。
·SGSN Pool內每套SGSN均具有相同地位,維護人員在進行數據配置時需要對全池組進行考慮,統一規劃相應參數,如NRI、Null-NRI、Non-Broadcast RAI、Default SGSN等,且單套SGSN設備需要配置的局數據量大幅度增加,如單套SGSN需要配置整個池組區域的所有RAI。與傳統組網方式相比,SGSN Pool的維護難度雖有所下降 (避免了頻繁的電路割接調整),但網絡數據配置相對復雜,對維護人員的技術要求更高。
現網引入SGSN Pool技術時,在綜合考慮設備支持程度、網絡投資、不同區域的業務需求等因素的基礎上,建議采用兩步走的策略[3],第一步先在局部范圍內進行試點引入(降低新技術引入風險,保護現網投資),總結部署、建設和維護經驗;第二步在試點引入取得良好效果后,再有計劃、有步驟地向全網推廣,應遵循的原則如下。
(1)NRI全網統一規劃
NRI在網絡中使用后再進行調整會相當復雜,在引入SGSN Pool技術之前,應立足于整個網絡的角度,考慮后續網絡發展,對NRI進行細致的規劃(包括Null NRI)。NRI的規劃不統一會對后續SGSN Pool的維護管理帶來很大的困難,可能會導致池組區域內的負荷不均衡。
(2)SGSN Pool組網地域規劃
在引入SGSN Pool組網時,無線接入網BSC/RNC管轄區域應盡量連續覆蓋,且在選擇SGSN Pool區域邊界時,盡量避免切換頻繁的區域,以減少MS在SGSN Pool區域和非池組區域之間的切換,提升用戶使用感受和分組域網絡質量;池組區域在規劃時應盡量在本省范圍內部署,不要進行跨省設置,以降低運維成本,減少對已有網絡管理模式的影響;SGSN Pool覆蓋區域的選擇應考慮區域性的業務互補,這樣能夠降低“潮汐效應”的影響,發揮其“消峰抑谷”的特性,提高核心網設備利用率。在實際組網時,建議SGSN Pool內所有SGSN設備的配置容量均相同,并采用相同的計費策略;盡量不要進行重疊SGSN Pool區域的規劃,降低數據配置復雜性和維護復雜度。
(3)Default SGSN 的規劃
Default SGSN用于SGSN Pool內的用戶漫游出池組區域,或者注冊到池組外的SGSN時的移動性管理問題,或者用于用戶切換到池組外SGSN時的切換請求。Default SGSN需要配置池組內所有的SGSN信息和NRI,用于向池組內目標SGSN轉發池組外SGSN的切換請求,可以認為Default SGSN是池組內核心網SGSN與外界SGSN之間的消息轉接點。在SGSN Pool技術中,池組中的的每套SGSN都可以配置成Default SGSN,可以同時在池組中設置多套SGSN作為Default SGSN,也可以將池組中所有的SGSN均設置為Default SGSN。
(4)池組內SGSN數量與容量配置規劃
出于對SGSN Pool容災備份的考慮,池組內的SGSN設備數量不宜太少,建議大于等于3套,一般選取4~5套SGSN設備進行組網較為合適;池組內SGSN設備容量建議采用等容量配置方式,單套SGSN設備的設備利用率建議選取為60%~70%,以保證池組內單套設備出現故障時,其余的SGSN設備能夠接管業務。
(5)無線接入網設備改造
對于需要引入SGSN Pool技術的地市來說,首先需要完成其無線接入網BSC/MFS設備的Gb接口IP化工作并使其支持Gb-Flex功能,同時使相應RNC設備支持Iu-Flex功能,對于各地市設備型號較老的BSC/MFS設備,建議在合適的時間將其用能夠支持Gb over IP和Gb-Flex功能的BSC/MFS設備進行替換。
雖然SGSN Pool技術具備很多優勢,能夠提升核心網分組域設備利用率,并引入了容災機制,但是目前所有廠商均只支持同廠商SGSN設備組成池組,如何實現多廠商SGSN設備組Pool成為后續技術發展的主要方向;同時目前BSC/RNC設備所使用的NNSF靜態算法仍然不能實現最優的負載均衡,可能會造成SGSN的實際業務量出現較大的差異,如何讓SGSN設備的負載更加均衡也是后續需要重點關注的問題。
1 3GPP TS 23.236.Intra-domain connection of radio access network(RAN)nodes to multiple core network(CN)nodes,2008
2 藍瀾.MSC池技術及組網應用.電信交換,2010(3):56~60
3 中國移動通信集團公司.中國移動SGSN Pool網絡試點測試方案V1.0.1,2010