楊曉敏,靳清澤
(1.運城學院,山西 運城 044000;2.山西移動運城分公司,山西 運城 044000)
隨著NR SA 網絡的建設,城區主要區域已經完成SA 連續覆蓋。SA 站點涉及LNR 互操作,包括空閑態重選、PS 連接態互操作、EPS FB 以及快速返回功能。由于當前語音主要基于EPS FB,在4G 通話結束后如何快速返回5G,保障用戶數據和語音體驗,是當前需要重點解決的問題[1-3]。現場測試發現,5G 用戶在SA 網絡發起語音呼叫時,由于當前SA 網絡不支持VoNR 功能,因此語音呼叫需要通過EPS FB 回落到LTE 側做VoLTE 呼叫,但VoLTE 呼叫結束后終端無法快速返回5G 網絡,導致用戶感知差[4-6]。
定位此類問題要熟悉相應的信令流程,看異常流程出現在哪里,從而進行問題的隔離定界。通過對快速返回信令觸發流程,針對可能出現問題的B1 測量控制下發、終端上報B1 測量報告、切換準備和切換執行4 個階段可能出現的問題進行分析定位,指導現場優化人員快速定位解決問題[7-9]。
快速返回的觸發源是終端結束VoLTE 呼叫,網絡側觸發下發B1 測量控制。當終端3 s 內上報B1 測量報告時,將終端通過重定向/切換的方式轉移到NR 繼續享受大帶寬[10-14]。基于切換的快速返回信令流程圖如圖1 所示,基于重定向和快速返回信令流程圖如圖2 所示。
步驟1:當用戶完成VoLTE 語音業務并刪除語音業務承載后,判斷UE 是否支持NR 和NGC。
(1)判斷終端能力是否支持NR。

圖1 基于切換的快速返回信令流程
(2)判斷UE 的初始上下文/上下文修改信息中的切換限制列表,只要核心網沒有將NR 列為禁止名單,則認為在5G 已開戶。如果支持NR 和NGC,當前版本還會判斷UE 攜帶的業務QCI 的切換屬性。當存在MUST HO 且不存在NO HO 的QCI時,轉下一步。
步驟2:eNodeB 下發異系統B1 事件測量。
步驟3:UE 收到eNodeB 的測量配置,進行異系統NR 測量。
(1)如果測量NR 信號在Inter Rat Ho Nr Param Grp.NrB1B2TimeToTrigger 內持續大于Inter Rat Ho NrParamGrp.ServBasedNrB1RsrpThld,則UE 上報事件測量報告,選擇過濾后信號質量最好的NR 小區作為目標小區/頻點。
(2)如果eNodeB 在InterRatHoNrParamGrp.NrB1B2TimeToTrigger 超時后還未收到異系統B1 事件上報,則終止異系統B1 事件,不再繼續后續操作。
步驟4:UE 收到NR 目標小區或目標頻點信息后,完成到NR 小區的切換或重定向。

圖2 基于重定向和快速返回信令流程
L2NR 切換所涉及的特性為快速返回、基于業務的L2NR 移動性和基于覆蓋的L2NR 移動性。網絡側不下發B1測量控制的問題可以分為以下幾類。
(1)針對基于覆蓋的L2NR 切換,如果終端沒有上報基于測量的A2 測量報告,網絡側不會下發B1 測量控制。此類問題多為LTE 本身的信號質量太好或者A2 門限配置過低,導致無法上報測量報告。
(2)針對基于覆蓋的L2NR 切換,如果已經上報A2 測量報告,可以優先在基站側查看LTE 側是否已經配置了正確的NR 鄰區鄰頻點。
(3)當前版本快速返回和基于業務的L2NR切換采用同一套QCI 切換判斷機制,即如果需要觸發快速返回,則當QCI1 釋放后,終端還攜帶的QCI 中必須要有MUST HO 的QCI,且不能有NO HO 的QCI。例如,當QCI1 釋放后,終端還有QCI5/8(可以從NR2L 的切換請求和后續的ERAB建立請求中找到),QCI8 對應的切換策略為NO HO,因此無法觸發fast return。
(4)觀察終端的初始上下文建立/上下文修改/切換入請求,如果核心網攜帶HRL 將5G 列為禁止接入系統,網絡側將不下發B1 測量控制。
(5)終端不支持對應的5G 頻段,網絡側也無法下發B1 測量控制,終端的支持頻段能力信息可以從UE 上報的能力信息中的V1540 結構體中查到。需要注意,終端接入時,網絡側會先查詢終端的2/3/4G 能力信息。在終端報上來的能力信息中如果攜帶了支持NR 的字段,才會繼續查詢終端的NR 能力信息。如果終端沒有攜帶支持NR 的字段,則不會繼續查詢NR 的能力信息。
(6)針對多頻帶頻點未配置頻帶指示,也會導致網絡側無法下發B1 測量控制。
(7)核查基站FR license 是否配置。
此類問題主要從以下方面進行排查。
(1)是否NR 信號不好或者不穩定。排查該場景可以將終端鎖頻鎖制式駐留在5G,觀察終端顯示的NR 信號情況是否過低或者浮動過大。此類問題優先優化NR 的RF 情況或者變更測試點位。
(2)是否門限配置異常高導致NR 信號無法滿足。此類場景可以查看網絡側下發的B1 測量控制中攜帶的門限,觀察是否符合LNR 互操作的策略設計。B1 測量控制中攜帶的RSRP 門限=顯示值-156 dBm。
(3)LTE 配置NR 鄰頻點是否正確。排查此類問題要對比LTE 的NR 鄰頻點設置和NR 側NRDUCELL 中的頻點設置。需要注意,LTE 側配置NR 的頻點為NR 的下行SSB 頻點,需要根據5G FMA 中的頻率計算工具進行計算,而非NRDUCELL.DlNarfcn。
(4)NR/LTE 沒有時間同步導致終端概率性測量不到NR。LTE 和NR 網絡系統不同步場景下,如LTE FDD+NR TDD(或者LTE TDD 和NR TDD時間不對齊),UE 做NR B1 異系統測量,由于協議規定LTE GAP 必須包含NR SSB,否則可能導致測量不到NR 小區,從而無法發起L2NR 切換流程。此時,需要修改NR 和LTE 均為時間同步,或者修改NR SSB 周期為5 ms,但是會影響NR 的峰值速率。
(5)沒有打開測量搶占功能,導致SA 的測量優先級低。該功能由參數CellUeMeasControlCfg.MeasOptAlgoSwitch 的子開關“NSA_SA_MEAS_OBJ_PREEMPTION_SW”控制。開關打開時,在頻點能力受限時,判斷當前觸發的算法和UE 正在測量的最高優先級算法中哪個優先級高。若當前觸發的算法優先級高,則進行測量搶占,即測量當前觸發的算法的頻點。測量順序為CSFB >必要類切換>SA B1 >NSA B1 >NSA PCC >LTE(非必要類)>U(非必要類)>G(非必要類)
(6)鄰區是否沒有配置為支持SA 模式。需要核查NREXTERNALCELL.NrNetworkingOption 是否支持SA。
此類問題為終端已經上報了NR B1 測量報告,但是eNodeB 并沒有發起handover required 消息。此時網絡側已經下發了B1 測量控制,因此基礎的開關和license 應該沒有問題,可以從以下幾方面進行排查。
(1)測量上報的NR 小區是否已經配置為鄰區。LTE 側下發NR B1 測量控制的時候僅會下發頻點,所以當終端上報的NR 小區如果沒有配置為鄰區,那么網絡側必然無法發起handover required消息。檢查鄰區的方法:①通過B1 測量報告的measId 找到B1 測量控制中的measObjectId;②通過measObjectId 找到B1 測量控制中對應的NR 頻點;③通過NR 頻點和B1 測量報告的PCI,在LTE配置文件中查找是否已經配置NRexternalcell 和NrNRelationship。
(2)測量上報的NR 小區是否存在PCI 沖突。通過(1)可以獲得小區的信息,此步驟需要查明該LTE小區是否配置兩個同頻同PCI的小區為鄰區,此時會產生PCI 沖突,需要刪除冗余的鄰區。
(3)測量上報的NR 小區PLMN 配置是否正確。通過(1)可以獲得小區的信息,此步驟需要查看NRexternalcell 中PLMN 和NrNRelationship 中的PLMN是否配置一致。如果不一致,繼續核查NrNRelationship中的PLMN 是否和NREXTERNALCELLPLMN 中的sharedPLMN 配置一致。檢查NCELLPLMNLIST 中的PLMN 配置是否正確,如果不正確,會導致無法獲取到正確的gnodeblength 進行切換。
(4)終端攜帶的QCI 是否已經開啟了移動性策略組開關。在16.0 版本,LTE 側增加了L2NR 移動性的QCI 切換策略組INTERRATPOLIC YCFGGROUP.NRHOCFG,需要在該策略組中打開對應QCI 的移動性策略才能發起切換。
(5)終端攜帶的QCI 是否終端能力支持切換到NR。對于一些終端攜帶QCI1 的場景,僅僅網絡側打開開關且終端支持NR 能力并不夠。根據TS 36.331,網絡側還需核查終端能力信息中的v1540結構體,僅當終端支持VoNR 時才允許終端切換到NR,也可以核查終端是否支持切換到NR。
(6)切換準備失敗在終端側較難感知,需要在4G 標口跟蹤中進行篩選,典型信令流程如圖3所示。eNodeB 發送給MME 切換請求消息后,MME回復切換準備失敗消息。
此類問題定位建議抓取NR 標口跟蹤、LTE 標口跟蹤以及核心網側跟蹤進行聯合定位隔離。隔離的思路方法比較明晰,即找到回復錯誤原因值的網元并分析原因。

圖3 典型信令流程
對于正常的切換執行流程,信令流程如圖4所示。
可以看到,對于切換成功場景,eNodeB 在切換命令后收到的第一條消息應該是MME 下發的UE Context Rel CMD 消息。對于失敗場景,一般為在MME 發送切換命令后eNodeB 的第一條消息為切換取消或者是eNodeB 在S1 口等待超時后主動上發UE 上下文釋放消息。

圖4 L2NR 切換執行成功流程
針對切換失敗類問題分析,同樣應該在信令流程上判斷流程中止在哪一步,通過對比分析隔離定界出問題的網元。
一般可以分為以下3 類:
(1)eNodeB 主動發起切換取消消息(非終端重建引起);
(2)終端切換接入失敗重建;
(3)終端已經發送RRC 重配置完成消息,但是eNodeB 沒有收到。
從切換的4 個流程,即網絡B1 測控下發、終端B1 測量報告上報、切換準備和NR 側接入4 個階段來進行問題現象歸類,并提出相關優化指導建議,系統且全面地分析FR 失敗問題。各階段排查策略如表1 所示。

表1 各階段排查策略

續表1
由于一線優化人員處理SA 問題經驗及能力有限,初期定位一個FR 失敗問題消耗時間往往超過3天。按照上述優化流程及思路,可大幅減少問題定位時間,由3 天減少到1 天,問題解決效率提升2 倍,運城市FR 快速返回成功率從94%提升到99%。
經過省內經驗推廣,全省FR 快速返回成功率基本在99%以上,平均返回時延從2.4 s 降低到1.7 s左右。四階定位法解決EPS FB 完成后無法快速返回5G 問題的推廣,全面推進山西省SA 商用進程,同時有效改善SA 建網初期網絡優化人員技能水平不足情況,指導一線優化人員分析、優化、解決實際測試中遇見的問題,提高省內優化人員技能水平。
通過對EPS FB 完成后無法快速返回5G 的問題進行研究與分析,從切換的網絡B1 測控下發、終端B1 測量報告上報、切換準備和NR 側接入等4個階段進行問題現象歸類,并提出相關優化指導建議,系統且全面地分析FR 失敗問題,最后通過在運城市內進行相關的實驗測試,發現四階定位法可以有效提高問題的解決效率,并且進行了相應的推廣,整體提高了優化人員的技能水平。