劉學武 王凱



摘要:為提升微信支付失敗率這一用戶感知指標,從LTE網絡側對微信支付的影響因素,包括故障、覆蓋、負荷、干擾、參數設置等進行分析,提出對應提升措施并實施優化。對微信支付指標與網絡KPI指標、用戶感知指標、覆蓋、負荷指標進行關聯對比,對微信支付失敗進行了實際的模擬測試,分析與失敗率關聯特征。同時對涉及的端到端流程以及定義算法進行簡要解析,找出可能影響指標的問題。
關鍵詞:微信支付;失敗率;LTE;用戶感知;網絡優化
一、引言
為提升移動網絡用戶滿意度,通信運營商需要對各類移動互聯網業務的質量進行監控和優化提升,如流媒體業務、手機游戲、支付類業務等。4G LTE網絡仍是當前移動通信數據業務主力網絡,微信支付作為移動互聯網的一種典型業務應用,對微信支付業務失敗進行LTE網絡專項優化提升可有效提升用戶使用感知。
描述支付失敗的指標有時也表述為“支付卡頓率”,這里統一以“支付失敗率”表示,計算公式為:支付失敗率=小區支付失敗率加權總和/小區個數加權總和。
二、基礎無線網優化分析及措施
從微信支付失敗率的定義看,該指標是針對出現微信支付失敗的小區進行加權統計計算出的,因此最直接的提升措施就是降低支付失敗的小區數量,重點針對支付失敗重復出現的TOP小區進行分析處理。取某月支付失敗數據提取TOP小區進行原因歸類,按照覆蓋RSRP、上行干擾、擁塞高負荷等顯性分類原因占比如圖1所示。其中也有近50%難以確定網絡側原因,首先對較明確的基礎無線網絡問題進行分析優化。
(一)覆蓋優化
通過上下行路損、鏈路平衡及終端測量報告(MR)數據分析相關支付差小區的覆蓋狀況。以248283-11小區為例,基礎指標沒有明顯異常,平均RSRP也正常,但是上行SINR偏差,上行SINR小于10dB的占比50%左右;查看時間提前量(TA)值,1km到1.5km的樣本點偏多。調查該小區現場情況,發現其位于山溝里面,周圍站點稀疏,近點覆蓋山下居民,遠點覆蓋到了山上景區,導致該小區整體RSRP正常,但是遠點用戶多,有些被山勢遮擋,終端上行信號衰減大。由于泰安有較多山地,尤其是泰山景區周邊,此類情況較多,對此主要通過天線RF優化進行改善。
(二)干擾問題優化
主要針對上行高干擾問題處理。上行干擾易引起上行解錯或導致下行丟包概率增加。經集中排查處理多處外部干擾源,包括私裝信號放大器,ATM機,電力抄表設備,森林防火設備,行車記錄儀,電廠設備等各種類型。
(三)參數類優化
從無線網配置的參數看,主要存在幾個風險點對支付指標有負面影響:1.對支付類小包業務沒有針對性優化;2.互操作參數不合理可能帶來重選延遲容易導致干擾以及負荷不均;3.部分小區的隨機接入信道(PRACH)參數配置錯誤;4.功率參數有優化余地。對這些問題分別進行優化。
1. 支付類小包業務參數優化
支付類屬于小數據包業務,頻繁的信令連接、釋放會降低網絡效率[1],而TCP代理及預調度功能通過快速服務器下發的數據進行快速應答,縮短了服務器發送下一輪數據的RTT時延,而且基站對服務器的數據包也是逐包應答,所以從兩個方面實現了(時延、ACK應答數量)加速。微信支付使用的協議一般都是HTTP協議,所以可以開啟預調度功能,主要實現的功能就是GET預調度和HTTP下行包應答預調度,降低相應流程時延,提升網絡效率。通過相關參數核查,并將異常參數拉齊優化。
2.互操作參數優化
針對4G回落3G的高倒流情況,加強覆蓋的同時修改調整3\4G互操作參數,主要避免用戶占用4G網絡差;對異頻切換A1/A2門限優化調整,尤其針對L1800與L2100插花站點,并加強RF優化,提升SINR及覆蓋,從而降低支付失敗率。
3. PRACH信道配置問題
支付業務的發起成功率與LTE無線網隨機接入信道(PRACH)性能有關聯,從KPI指標分析,發現存在一些小區的PRACH專用preamble檢測失敗次數高,msg3的檢測成功率低。選擇典型小區229119-31小區(異常)和229119-11小區(正常)的小區對比,發現31小區的前導碼與周圍的碼沖突。進一步篩選網絡中存在類似問題的小區共1600余個,經過參數優化,msg3檢測成功率從65%提升到69%,相關參數優化情況如圖2所示。
4. Pa功率參數
在下行功率計算中,有Pa、Pb參數,其用來定義了A類、B類符號的功率增益,當業務信道的功率增益增加,CQI將跟隨改善。針對有功率余量且CQI差、弱覆蓋等問題小區,調整修改功率參數PA從-3修改為0,提升支付成功率。
(四)隱性故障處理
針對傳輸質量可能存在的隱性故障進行排查處理,通過對傳輸路徑的指定節點之間的傳輸質量,比如時延、抖動和丟包進行測量,并獲取性能統計數據來分析基站的傳輸質量,統計基站到核心網傳輸時延高于15ms站點進行排查,避免由于傳輸問題而導致的支付失敗。另外,部分室內分布站點存在RRU通過光纖分布系統連接多個遠端機導致時延大、RRU端口配置與實際不符問題;部分宏站的天線端口不平衡問題等,對此根據實際分別處理。
(五) 基礎優化效果
經過以上從覆蓋、干擾、參數、隱性故障處理等多方面集中采取了大量優化措施,取得了一定成效,從指標看網絡接通、切換、用戶速率、上下行質差均有不同程度的改善,微信支付失敗率指標也有逐步改善趨勢。
三、支付失敗指標的關聯性分析和模擬測試
考慮從全省各地市的支付失敗指標和其他基礎質量指標的縱、橫向對比來進行支付指標的關聯性分析,并設法進行一定量的模擬支付失敗測試,以進一步深入優化。
(一)網絡質量指標地市間對比
從山東各地市4G無線網絡質量主要KPI性能指標(主要包括E-RAB掉話率、E-RAB建立成功率、RRC建立成功率、CQI優良比等)、用戶感知類指標(主要包括TCP傳輸時延、下行TCP平均丟包率等)、下行覆蓋指標(主要包括RSRP高于-110dBm的覆蓋率等)、上行覆蓋指標(上行SINR優良占比等)、無線負荷指標(PRB高負荷占比等)進行對比分析,可以得到以下幾點結論:
1.KPI指標以及用戶感知類的某個單項指標與微信支付失敗率沒有明確對應關系;
2.上行覆蓋與支付失敗率有正相關性,但也不是支付失敗的決定性因素;
3.在未引起擁塞的情況下無線負荷與支付指標相關性較弱。
(二)微信支付失敗的模擬測試
微信支付失敗指標從公式看統計的是微信支付失敗的小區,但具體失敗行為是從業務應用側的統計,從前述關聯分析看具體與LTE網絡的某個指標或計數器沒有明確對應。為進一步研究問題,通過大量實際測試模擬了在LTE網絡下幾種支付場景。測試過程如下:
1.正常支付做了600次,全部成功。
2.在LTE網絡下進行支付過程中將數據連接斷掉。這種是模擬支付過程脫網,付方在LTE網絡下發起支付,輸密碼前斷開數據連接,多數會提示“交易請求已提交...”有時會提示“網絡通信出現問題...”。收方手機終端有支付失敗的提示,如圖3所示。
3.模擬支付過程中4G切換3G。4G發起支付,輸密碼前手工切換到3G,付方變為3G時,有短暫“網絡連接不可用...”立即輸入密碼,實際交易失敗,收方提示支付失敗。
4.網絡正常情況下,付方取消支付時,收方提示支付失敗。
5.通過進出電梯模擬信號變弱場景。找一個電梯弱覆蓋環境,手機不做設置的情況下,在4G發生支付,進入電梯(電梯無信號覆蓋),支付失敗情況和斷掉網絡連接效果一樣,付方多了一個微信支付等待的過程。
模擬測試小結:1.在不進行人工干預的情況下,很難直接測試到支付失敗;2.第一種模擬場景,實際大部分用戶應該是在有4G網絡下發起支付才會統計為4G支付小區的,因此直接脫網可能性比較小,極弱覆蓋場景可能會遇到;3.第二種,在4G網絡下支付過程中突然切換到3G,這種應該有實際場景。支付過程中4G向3G切換時,因為網絡原因消息沒有送達導致失敗;4.第三種,用戶撤單導致支付失敗,應該不屬網絡原因;5.電梯弱覆蓋應該是實際存在的場景。
通過微信支付失敗場景的大量模擬測試,可以驗證在弱覆蓋場景下的支付失敗問題。
四、微信支付指標的其他影響因素分析
前面進行支付失敗原因分類時有近50%小區難以確定明顯LTE網絡原因,在優化過程中也出現過支付指標突變情況,且省內各地市同步變化,顯然這與網絡質量并不直接相關,還存在其他影響因素。
(一)微信相關應用服務涉及軟硬件影響
從微信支付的原理和流程來看,支付行為涉及付款方、收款方、微信方以及相關業務方,微信用戶通過微信應用頁面、APP以及二維碼使用登錄的微信號完成支付,支付請求通過微信官方服務器再接入相關商家處理完業務后,再由微信服務器發給發起請求的用戶,完成一次基于微信的交互[2]。由于支付業務對安全性等要求的特殊性,服務器和終端之間還有身份認證、數字簽名等多種交互流程。因此支付失敗除移動網絡本身因素外,還涉及微信支付應用的相關服務器和軟件等,需要從業務層、網絡層、控制層端到端的全流程分析[3]。
(二)微信支付指標的定義算法影響
從各地市橫向和縱向對比分析看,微信支付失敗率與平臺統計規則和算法也有較強相關性。騰訊公司定義的指標的計算方式如下:
先根據支付業務量確定基站小區的支付業務量級(WEIGHT_PAY)L1~L10,即量級為從0到總量級均勻劃分的等長區間,確定L1~L10權重為1至19,以2為步長遞增;其次確定小區的支付失敗率:支付失敗率=小區失敗率加權總和/小區個數加權總和。
例:假設A、B兩個支付失敗小區,一周內每日失敗率分別為A1、A2…A7,B1、B2…B7,量級權重分別為x1、x2…x7和y1、y2…y7,則支付失敗指標為:A1x1+A2x2+…A7x7+B1y1+B2y2…B7y7除以x1+x2+…x7+y1+y2…y7,其中x、y為1、3、5、7、9……19。
以上定義中由于支付權重的有限級數量化特征會帶來一個問題:相同支付失敗次數發生在高權重小區比發生在低權重小區失敗率更低。簡單說就是兩個“算數支付失敗率(支付失敗次數/支付總次數)”相同的小區因支付次數和權重不同會定義為不同的失敗率,這與通常對網絡質量指標的理解是不一致的。因為考慮了業務量因素,使該定義與用戶分布和用戶行為有了較大關聯,并不是單純網絡質量的反映。
五、結束語
微信支付作為移動互聯網的一種典型業務應用,反映了用戶對數據業務的感知。經過對支付失敗指標專項優化分析,總結如下:
(一)通過對重復出現的支付失敗小區分析優化,支付失敗與網絡覆蓋、上行干擾、參數優化、隱性故障等有直接關系,這些也不同程度反映在其他一些KPI/KQI指標中,對這些質差TOP小區的處理作為一項日常工作需要長期堅持,久久為功,進而提升用戶感知。
(二)弱覆蓋場景下可以模擬測試到支付失敗情況。
(三)支付業務失敗涉及端到端的全流程。
(四)按微信支付失敗率的定義,支付權重對指標計算結果影響較大,即支付權重越高,支付失敗率越低。這種計算方式的受人為因素影響。
作者單位:劉學武? ? 王凱? ? 中國聯通泰安市分公司
劉學武(1973.09-),男,漢族,山東泰安,學士,高級工程師,研究方向:移動通信無線網絡優化;
王凱(1984.04-),男,漢族,山東泰安,碩士,高級工程師,研究方向:移動通信無線網絡優化。
參? 考? 文? 獻
[1]宋蒙,范斌,孫雷.LTE系統小數據包業務無線資源優化研究[J].移動通信,2014(15):85-88.
[2]顧永好.基于微信客戶端的微信支付研究與實現[J].通訊世界,2016(04):26-27.
[3]黃美璇.基于掃碼的微信支付系統的設計與實現[J].淮海工學院學報(自然科學版),2018(03):34-37.