王一鳴



摘? ?要:如今,很多上班族和學生將共享單車作為出行的首選工具。每一輛單車都配有一個智能鎖,通過運營商的無線網絡,連接到單車企業的系統平臺。數以千萬計的共享單車為市民出行帶來了便利,也給通信網絡的性能監控和運營帶來了新的挑戰。文章旨在通過對共享單車應用的系統架構、業務機制進行研究,對行業終端(智能鎖)的通信行為進行分析,掌握共享單車的解鎖、閉鎖流程,提煉出業務流程中的網絡行為模型,并建立針對應用的網絡性能指標體系,最終利用自動化的大數據分析平臺,開發出一套行之有效的業務監測系統。
關鍵詞:共享單車;物聯網;智能鎖
1? ? 共享單車概念
1.1? 共享單車發展簡史
20世紀60年代,共享單車的概念就已經產生。
21世紀初,企業使用電子設備和計算機系統對單車進行管理和調度,借用單車的人可通過專用的電子卡,在存放站中解鎖固定的樁鎖,取走單車。
2015年,一種新興的共享單車模式(文章研究的重點)出現:每輛單車配有一個可聯網的智能鎖,車子的存放不再需要專用的存放點和固定樁。
1.2? 共享單車的應用特性概述
從產品的技術角度來看,2015年出現的共享單車,其核心部件—智能鎖具有網絡信息化的特征,是一種“智能互聯產品”[1](也稱為智能終端或物聯網終端)。通過遠程通信,應用系統可以控制、管理智能終端,也可以接受手機請求,向其用戶提供相應服務。
從通信的技術角度來看,各類“共享”產品,是“M2M”應用的突破性延伸。“M2M”原指“機器和機器之間建立連接”[2],將兩端(云端和終端)進行連接,而共享應用涉及三端(智能終端、云端、用戶端)的信息協同,其業務流程復雜程度更高,對通信質量要求也隨之提高。
1.3? 運營商面臨的挑戰
自2017年開始,在全國范圍內,千萬級別數量的共享單車連接到運營商網絡,并向全國用戶提供共享服務。和普通個人用戶及手機終端不同,共享單車在網絡中需要時刻保持數據業務的連接(有心跳報文機制)、對特定通信業務有著非常高的質量要求(下發解鎖指令的短信);同時,它們在某些城市熱點地區中集中度高,(租車)業務并發的情況也較多,從早到晚的業務/通信活躍度一直較高。它的業務特性,向運營商的網絡質量保障提出了挑戰,運營商需要特別針對這個千萬級別的應用,重新分配或擴展網絡資源,并針對某些關鍵業務的信息交互,調整通信質量指標,進行網絡預警監控。
1.4? 研究目標
文章旨在通過對具有代表性的物聯網應用(共享單車)進行研究,分析這一行業應用的技術特性,構造“業務-網絡”的質量模型,并整理出專屬的網絡質量指標集。同時,面對海量的物聯網終端數據,開發高性能的大數據分析工具,監控業務并探索面向行業用戶的網絡運營新模式。
2? ? 共享單車發展的時代背景
2.1? 信息產業背景:物聯網進入蓬勃發展的階段
20世紀90年代,“物聯網”的概念由美國麻省理工(Massachusetts Institute of Technology,MIT)的Kevin Ashton教授首次提出。此后,各種傳感、通信、控制及計算等信息技術,被運用到各行各業的生產和商業活動中,也漸漸滲透進人們的生活,各類智能家電(掃地機器人、智能音箱等)逐漸成為家中一員。在物聯網技術的幫襯下,新興商業模式的生命力開始展現。
通過物聯網技術,企業能夠更低成本、更高效率地進行資產管理、遠程控制、數據采集和分析;能夠分享產品價值,讓消費者從中獲利;還能夠從產品的生命周期中獲取使用數據,用以優化應用系統,實現產品迭代。
2.2? 通信行業背景:運營商的“大連接戰略”
在2019年,“中央經濟工作會議”提出了一項重點工作:加強人工智能、工業互聯網、物聯網等新型基礎設施建設。中國希望通過信息化基礎設施的鋪墊,加快各類信息應用的落地,在傳統行業領域中構建新業態、探索新模式、融創新技術,推動傳統企業生產、管理和營銷模式變革。
在此背景下,中國移動(中國三大電信運營商之一)提出了“大連接戰略”“進軍”物聯網領域。2019年年底,中國移動的物聯網連接數超過6億。面對日益龐大的物聯網聯接規模,移動網絡部門開始探索建立針對物聯網的新支撐體系。
2.3? 網絡運營背景:傳統維護模式的特性
運營商圍繞網絡質量開展網絡維護工作:網絡建設階段,通過嚴格遵循國際網絡技術標準(例如3GPP規范)來保證網絡服務的整體質量;網絡運營階段,維護工作主要是監控并處理網絡故障、分析網絡性能并進行網絡優化。
傳統網絡維護工作采用標準化、專業化的精細分工方式。在通信行業的各個細分專業領域(計費、網管、無線、核心網、傳輸網、數據網等)之間,形成了相對獨立的生產分工和環節。
網絡部門在投訴和故障處理方面,采取反應式、人工化的問題解決機制:一方面無法實時地發現用戶使用中存在的問題;另一方面,技術排障采取耗時耗力的人工查證方式。
2.4? 物聯網大發展背景下的網絡運維挑戰
如今,面對千姿百態的智能終端及行業應用,電信運營商傳統的通信技術規范和質量標準,已經難以衡量現今及未來的網絡服務質量;專注于網絡、各自為政的維護模式,也不再適用于日新月異的網絡應用。
首先,為滿足信息化應用創新的各類需求,網絡運營者首先需要深刻理解垂直領域的場景化、個性化需求,掌握客戶行為,明晰業務流程。其次,探索新穎的網絡管理模式和手段,建立“從應用到網絡”的系統化質量保障體系。最后,將業務/網絡信息糅合成一個整體,向個人和企業用戶提供更為完善的網絡信息服務,成為在國家戰略框架下互聯網/物聯網技術創新的基石。
3? ? 共享單車的技術架構
共享單車是一個典型的“物聯網+互聯網”應用。應用的一邊是車(物)、另一邊是用戶(人),通過云端的應用系統控制終端(單車)來向用戶提供租賃服務。
本文將簡單地解構共享單車的技術架構,并梳理其主要業務環節的信息交互流程。共享單車應用的網絡架構如圖1所示。
3.1? 共享單車的“云端應用”
3.1.1? 云計算和平臺服務
共享單車的云端應用建立在云計算之上,一方面能夠保證應用的快速部署和高擴展性,另一方面能夠應付大規模高并發場景,滿足百萬級數量的連接需要,可實現大規模的、實時的雙向信息交互,并有利于對單車的集中管理。
在云計算之上,共享單車的應用系統還會還會使用平臺服務(Platform as a Service,PaaS),使得應用能夠動態調配資源和能力,并實現功能的靈活開發。
3.1.2? 集成化的應用
在共享單車應用的全部功能中,還包括了許多外部的互聯網功能(例如支付、二維碼應用、電子地圖等)。應用系統整合了大量內外部的信息化能力,將單車和用戶連接起來,完成一套完整的租賃服務流程。
共享單車應用需要存儲并管理兩類關鍵數據:單車數據和用戶數據。其中,單車數據由智能鎖通過電信運營商網絡送達到云端系統,包括單車的通信連接狀態、地理位置、車鎖狀態等。
3.2? “智能鎖”的通信模塊和單車數據
共享單車內的通信模塊包括:移動通信芯片(Modem),內置電信運營商的SIM卡,負責與云端的應用平臺進行通信;藍牙通信模塊,主要用于直連用戶手機并實現解鎖;全球定位系統(Global Positioning System,GPS)通信模塊,用于地理定位。
單車數據由智能鎖通過電信運營商網絡送達云端系統,包括單車的通信連接狀態、地理位置、車鎖狀態等。
3.3? 共享單車的主要業務(信息交互)流程
共享單車依靠在“單車-云端-手機”之間的信息傳遞,來完成租賃服務,主要包括3個租用環節和一個管理環節(解鎖、騎行、閉鎖、閑置)。其中,最關鍵的是解/閉智能鎖的兩個環節。不同共享單車企業的解/閉鎖流程具有一定的差異性。
主流的解/閉鎖方式有兩種:“短信&流量”和“藍牙”。其中,短信方式的解鎖是需要通過運營商網絡下發全球移動通信系統(Global System for Mobile Communication,GSM)短信來實現的。藍牙的解鎖/閉鎖則由手機和智能鎖直接通過藍牙連接和交互,不經過運營商網絡。
本研究的解/閉鎖流程主要為短信解鎖和短信/流量閉鎖。短信方式的解鎖流程:
(1)手機掃描并解析智能鎖上的二維碼,向應用發起解鎖請求。
(2)應用核查用戶和單車的信息,再通過短信方式將解鎖指令發送給單車,智能鎖開鎖后向云端回復“解鎖成功”。
(3)應用開始計費,并通知用戶手機。
3.4? 騎行環節的數據上報
在用戶騎行過程中,單車和手機會將各自的GPS定位信息上報。短信或流量方式的鎖車、還車流程:
(1)用戶鎖車后,由智能鎖(通過短信或數據流量)通知應用:“還車成功”。
(2)應用通知用戶手機,并結算費用。
(3)智能鎖在還車后將位置信息上報。
3.5? 閑置狀態下的“心跳”業務
共享單車通過通用分組無線服務技術(General Packet Radio Service,GPRS)網絡,周期性地將狀態數據和位置信息向應用系統上報,周期間隔為1~4 h。
4? ? 面向行業應用的網絡運維體系
本文通過深入研究(共享單車)關鍵的環節及步驟,從關鍵步驟中尋找到關鍵的網絡行為;基于網絡行為的數據統計,制定出網絡質量指標集;開發相應的信息處理系統,對網絡行為的數據予以采集和分析,并反饋到相應的監測預警系統。通過探索面向行業的網絡支撐模式,為以后針對其他行業領域的業務監測和網絡運維積累經驗。
4.1? 整理業務環節中的關鍵步驟和網絡行為
網絡連接是共享業務的基礎。在共享單車應用中,智能鎖和用戶手機都需要和單車應用服務器建立通信連接并交互信息。
根據上文分析,共享單車各類業務環節包含著一系列的信息傳遞和處理過程。在運營商網絡中,每個業務的信息交互步驟,可以對應到不同的網絡行為。如表1所示。
4.2? 各網絡行為的重要性分析
基于業務環節和網絡行為矩陣表,對各環節各步驟終端的網絡行為進行重要性(關鍵性)分析。
4.2.1? 網絡附著行為
“網絡附著”是運營商網絡對智能鎖中的客戶識別模塊(Subscriber Identity Module,SIM)進行鑒權和功能配置,是所有通信行為的前提。
當SIM欠費停機、功能失配,或共享單車位于信號弱覆蓋、無覆蓋地區時,會造成附著失敗。
4.2.2? 解鎖環節中的網絡行為
從《業務環節和網絡行為矩陣表》中可以看出,解鎖環節是企業和個人用戶(單車租戶)最關注的環節。在解鎖環節中,終端側的“短信接收”“行為特質動態衡量系統(Professional Dyna-Metric Programs,PDP)激活”和“傳輸控制協議(Transmission Control Protocol ,TCP)連接”建立,用戶側的“域名系統(Domain Name System,DNS)查詢”“TCP/超文本傳輸協議(Hypertext Transfer Protocol,HTTP)連接”建立,是5個關鍵步驟。任何一個步驟出現問題,都有可能造成解鎖失敗。
(1)“解鎖(短信)指令下發”的網絡行為:由運營商物聯網專用的短信中心向單車智能鎖發送解鎖短信。
(2)智能鎖的“應答解鎖指令”:先由智能鎖建立PDP連接(建立數據面承載)和TCP連接(連接到應用服務器),再向應用平臺推送“解鎖完成”消息。
(3)在讀取過單車二維碼后,用戶手機會先發起DNS查詢共享單車的應用服務器地址,然后向服務器發起TCP/HTTP連接,最后發起業務請求(租用申請)。
一般情況下,用戶手機通過4G無線信號(LTE-EPC網絡)連接網絡,并一直處于PDP激活狀態;智能鎖通過2G無線信號連接網絡,空閑環節的大部分時間內不激活PDP連接,在收到解鎖信息(短信/藍牙)后再激活PDP連接。由于網絡和業務特性的差異,用戶側網絡行為的可靠性、穩定性,比終端側要高。在5個關鍵步驟中,“終端側”的網絡行為(步驟)相比“用戶側(手機)”更為重要,更值得關注。
4.2.3? 其他環節中的網絡行為
在其他環節中,終端和用戶手機的網絡行為以“保持聯接”為主,如在這些環節遇到使用問題,則對用戶體驗影響較小。
4.2.4? 識別關鍵網絡行為
基于以上分析,可整理出共享單車關鍵的網絡行為:
(1)向智能鎖發送解鎖短信。
(2)在運營商核心網中,智能鎖激活數據鏈路(PDP激活)。
(3)智能鎖和應用平臺服務器建立TCP連接。
(4)單車租戶的手機查詢應用服務器地址(DNS查詢)。
(5)手機和應用服務器建立TCP/HTTP聯接。
(6)共享單車在所有環節中的“網絡附著”。
其中,(1)和(2)最重要。
4.3? 網絡行為的數據采集與處理
4.3.1? 網絡行為的數據采集
經過調研,5種行為數據可以從相關的(網管)采集系統中獲取。對于“TCP連接”,由于智能鎖使用GPRS網絡進行聯網,其配套的網管系統未建設,所以不具備信令及數據報文的采集能力。
在采集系統的數據庫中,通過對關鍵標志信息的數據篩選(例如號碼APN信息、TCP連接的服務器地址等),可以提取出共享單車應用的全量網絡使用記錄和統計數據,如表2所示。
4.3.2? 共享單車的網絡質量指標集
在獲取共享單車網絡行為的全量數據后,結合地域信息、時間維度,可以對共享單車業務質量的整體和細節進行統計和分析。
運營人員選擇并制定與(共享單車)業務現實場景密切相關的網絡指標,包括:車輛活躍數、附著成功率、短信解鎖成功率、PDP激活成功率、數據流量統計、用戶APP連接成功率、用戶APP DNS成功率等。其中一部分有正常參考值如表3所示。
4.3.3? 智能鎖業務質量問題定位
當共享單車出現業務故障時,對智能鎖(單車)的問題界定相對較難,原因如下:
(1)終端不會主動上報應用錯誤。
(2)終端數量巨大,故障初期難以發現問題。
(3)業務測試困難,故障定位困難。
因此,需要進一步開發自動化工具,對智能鎖出現的網絡錯誤進行采集、統計和分析,以此來快速、準確地定位業務或網絡故障。
在網絡交互過程中出現差錯時,應用的各端(終端、應用端、客戶端)會產生相應的錯誤碼,對錯誤碼的采集和統計,可以幫助運營人員及時發現業務異常,并進行初步的排障,大幅提升故障定位的速度和準確度。
網絡故障的錯誤碼,可以在信令采集數據(網絡原始數據)中提取和分析。“短信”和“PDP激活”的錯誤碼為重點分析對象。
短信錯誤碼統計分析:短信下發失敗主要由用戶與無線原因引起(占比:90%),包括“用戶不在服務區(包括終端尋呼無響應,75%)”和“用戶存儲溢出(15%)”。在日常情況下,短信的成功率在98%左右,當短信成功率、短信數量出現波動時,可以通過對短信錯誤碼的統計,結合短信中心自有的日志記錄,來初步判斷短信故障的原因。
PDP激活錯誤碼統計分析,PDP激活失敗的原因可分為3大類9個小項目。
(1)終端系統類:用戶掉電、終端無配置信息、流程超時。
(2)業務數據類:無效消息類型,位置APN,請求服務選項未簽約,用戶鑒權失敗。
(3)網絡及其他類:激活拒絕、其他。
在日常情況下,PDP激活的整體成功率在99%左右,且失敗原因主要集中在終端系統類(50%左右)和業務配置數據類(40%左右)。當PDP激活成功率出現波動時,失敗原因可用于初步定位故障。
4.3.4? 可視化呈現
對于成功率類、總數類的網絡質量指標,可以將做成趨勢圖的呈現形式,以便于通過縱向比較,發現異常情況。
在一個區域內租賃業務的活躍程度,可以通過業務行為(解鎖)熱力圖的方式呈現。熱力圖能夠直觀地展現區域的業務量,在出現故障時也方便判斷是否存在區域網絡問題。
5? ? 結語
首先,文章深入研究共享單車應用的網絡架構和業務流程,分析業務質量與網絡行為之間的關聯,篩選出關鍵的網絡質量指標,并形成指標集;其次,針對終端側故障對錯誤碼進行分類統計,納入排障的分析模型中;再次,通過對網管系統的擴容和二次開發,可以做到自動化、準實時地采集業務數據、提取網絡行為信息、計算關鍵網絡指標、可視化呈現業務狀態及提供故障分析服務;最終,形成針對行業應用(共享單車)的網絡質量監測體系。
經過多次的迭代,質量監測系統逐漸趨于完善,并且可以向其他系統推送分析數據(例如集團的“一戶一案”業務平臺),形成跨省跨部門的信息分享和聯動機制,為保障物聯網業務提供了有效支持。
在物聯網應用中,終端的標準不統一,信息交互的模式千差萬別,業務涉及的系統和環節諸多,且多數的系統和終端自身(故障)感知能力較弱,又很難進行網絡測試。通過對共享單車網絡架構和質量監測體系的研究和開發,可以為保障其他物聯網應用提供借鑒,探索并創造面向行業應用的網絡運營模式,為萬物互聯時代的到來做好準備。
[參考文獻]
[1]邁克爾·波特.迎接第三次IT浪潮[J].哈佛商業評論,2015(2):24-25.
[2]JAN H,VLASION T,CATHERINE M,et al.從M2M到物聯網(架構、技術及應用)[M].李長樂,譯.北京:機械工業出版社,2016.