張 奎,付 韜
(中國電子科技集團公司第四十一研究所,山東 青島 266555)
隨著5G基站的加速建設,多接入邊緣計算與5G相結合可以服務于延時敏感的應用場景。多接入邊緣計算旨在解決海量接入、動態熱點、可靠高帶寬等問題,實現快速卸載任務處理是其核心問題,需要處理大量通過式計算請求。與批量計算受限于數據庫訪問速度不同,流計算對在時間分布和數量上無限的一系列動態數據進行實時計算和處理,在數據的有效時間內獲取預期價值。流式計算架構可以與多接入邊緣計算服務的實時特征進行融合,具體可以包括以下幾個方面:
A.針對吞吐量大、實時性強、無需長久存儲的數據流預處理。主要包括一些傳感器數據,在與應用相關時需要分析出特定事件,并基于事件和上下文形成具體的服務,屬于處理但不存儲的模式。B.優化計算拓撲的部署結構。現有流式計算框架一般是針對服務器節點和任務之間的數據流向進行計算拓撲優化,但是近幾年如車聯網、移動智能終端等應用場景需要在邊緣實現低延遲的計算服務,大量感知器和手機等實時信息會擁塞邊緣基站,因此需要針對移動邊緣計算中各類智能終端應用流式計算處理拓撲。智能終端可以在任務中作為流式計算節點與多個基站組成任務組,進而針對分布式物理節點調控任務均衡,MEC服務器則負責計算任務的并行化、分配和分組等問題。C.流式計算采用計算節點和存儲解耦的模型。在“終端-邊緣-云”上采用更加靈活的存儲緩存策略,而緩存的數據內容和位置也會影響流式計算的效率。需要針對移動邊緣計算的應用類型和節點移動性設計專用的緩存策略。
本研究將介紹流式計算應用于移動邊緣計算場景,針對移動智能終端、典型應用、快速移動條件下的計算任務提出流式計算模型和其中的關鍵評估指標,提出一種適用于移動邊緣計算的計算任務部署評估模型,有力支撐移動邊緣服務建設。
移動終端早期主要是利用基站實現通信接入、用戶鑒權、定位等任務的計算,計算數據量較小。隨著近些年移動端應用種類越來越多,用到的傳感器不斷增加,需要處理大量一次性流數據。多接入邊緣計算處理的數據類型主要包括傳感數據流處理、視頻數據流處理、服務數據流處理。傳感數據流計算場景體現處理實時數據的迫切需求,視頻數據流計算場景體現算法復雜度對計算架構的迫切需求,服務數據流計算場景凸顯對復雜交互的迫切需求。在終端移動性較強的情況下,需要設計專用的MEC流式計算系統。
De Assuncao等[1]設計物聯網中流式計算的應用,值得注意的是在該架構中雖然實現計算拓撲和數據存儲之間的弱耦合,但僅在邊緣節點重點處理實時上傳的數據流,實現無丟失、去重復、檢錯的數據預處理。計算復雜度較高的流式計算功能依然在云或機群實現,沒有充分挖掘出邊緣的計算存儲能力。
Dautov等[2]設計一種工作負載均衡的邊緣流計算方法,通過Zookeeper將計算任務群發到多個流式計算邊緣設備,在處理時間敏感數據時提高吞吐量。該方案在邊緣樹莓派上部署大規模流式計算節點,設計專用的消息中間件,實現集中任務分割、任務分發、節點發現、節點選擇、計算編排的優化。
Papageorgiou[3]等針對多個計算拓撲之間可能存在關聯,研究存在于多個物理節點的相互獨立的計算拓撲的協同,針對智能終端在本地計算和遠程計算的切換控制設計計算架構,在任務拓撲執行過程中,會根據終端狀態和數據分布動態調整流式計算拓撲。
在MEC中,部署流式計算框架如圖1所示。從設備視圖來看,移動設備可以通過安裝的客戶端或應用內含的模塊將計算任務上傳至基站處理。

圖1 MEC流式計算Fig.1 MEC streaming calculation
從計算任務視圖來看,移動終端首先進行任務調度,針對符合計算卸載需求的任務請求遠端MEC基站處理。本研究的模型中,終端也需要開啟流式計算的兩個組件,其中數據源獲取傳感器數據并傳給本地處理單元,處理單元實現數據脫敏和服務定級等操作,隨后通過無線通信發送給MEC服務器,MEC服務器運行流式計算框架。
多個計算節點將不停處理移動端上傳的數據,由于數據的讀寫都在內存中完成,主要延遲取決于拓撲復雜度。在MEC中,主要涉及到是否存在多個基站的協同處理,處理延遲是整個拓撲中最長的處理鏈時間,在獲得結果后,將不含敏感信息的數據反饋給移動端,移動端將進行最后的處理,這里一般需要考慮移動性管理。
本研究在進行MEC下的流式計算測試評估時采用黑盒測試方法,仿真時需要設計多種流類別,各種仿真測試流的區別在于突出被測關鍵指標。結合國內外相關研究,目前MEC場景下流式計算平臺的關鍵評估指標如下:
A.系統延遲。該延遲代表處理計算遷移任務的時間,數據流處理時間由事件、消息隊列、注入時間、處理時間構成[4]。B.通信開銷。指完成計算任務過程中所有處理單元向下一級處理單元發送數據量的總和。通信開銷占用邊緣云的通信帶寬,減少通信開銷有利于提高MEC效率。C.資源利用率。運行計算任務時CPU利用率、內存利用率、網絡帶寬利用率。D.能耗開銷。邊緣云可以開啟或關閉部分硬件資源,所以能耗是可以調節的開銷。E.流式計算拓撲。該指標是數據處理單元之間的連接關系,復雜程度和合理性會影響處理速度。可通過通信負載優化、實例重分配、線程部署優化、任務負載均衡等手段調整計算拓撲。
在多接入邊緣計算領域中,系統延遲和流式計算拓撲依然是最關鍵的評價指標。基于MEC基站的服務特征,采用流式計算更符合移動用戶的服務需求。