面向5G邊緣計算的短視頻緩存策略研究*

2021-05-08 06:10:22秦瑾，焦勇

通信技術 2021年4期

秦瑾，焦勇

（中電萬維信息技術有限責任公司中電萬維研究院，甘肅蘭州 730030）

0 引言

隨著5G技術的商用和各類短視頻應用的崛起，短視頻業務數據呈現指數增長[1]。如果按照傳統云計算集中存儲、計算模型來響應用戶終端大量的點播短視頻請求，將會大幅增加系統響應時延，導致網絡擁塞等。為解決上述弊端，移動邊緣計算（Mobile Edge Computing，MEC）[2-3]模式應運而生。MEC模式可以將云計算中心實時性要求高的業務和數據遷移到邊緣，在靠近用戶終端的邊緣側進行分析處理，有效降低云中心的負載壓力，降低傳輸時延，提升用戶體驗質量。

隨著微信、抖音等短視頻應用的興起，短視頻成為一種新的媒體方式。為了滿足人們對短視頻即點即播的需求，在MEC網絡架構中采用有效的視頻緩存技術將內容放置到合適的MEC服務器成為一項研究熱點。國內外研究者根據不同應用場景提出了差異化的緩存策略。在2014年，Ahlehagh等人[4]基于用戶偏好（User Preference Profile，UPP）實現的緩存策略，建立用戶偏好的分析模型，對目標區域內的用戶偏好進行分析并調整緩存內容。該策略對運動狀態穩定的用戶有較好的效果，當用戶狀態變化時，策略性能下降明顯。Sengupta等人[5]將機器學習技術和緩存技術相融合實現了一種分布式架構下的緩存策略。面對小區異構網絡模型，Gu等人[6]提出Q-learing技術的內容緩存策略（Q-Learing Content Caching Strategy，QLC）。當用戶偏好處于穩定狀態時，QLC能夠預測和調整緩存策略，但對突發改變的用戶請求事件無效。文獻[7]基于相互協作的思想實現協作緩存策略（Cache Strategy Based on Cooperation，CSC）。該策略將基站之間的相互通信作為研究基礎，在緩存容量和用戶體驗質量方面性能優越，但沒有篩選緩存內容，導致大量重復內容緩存在不同基站中造成空間損失。Traverso等人[8]提出了一種通過噪聲模型來動態獲取內容流行度的緩存策略（A Caching Strategy for Noise Model to Dynamically Obtain Content Popularity，NMDOCP），在抑制內容流行度的時間局部性方面是有效的，但所采用的噪聲模型在系統傳輸時延方面表現不佳。Poularakis等人[9]提出一種用戶感知的數據資源緩存策略（User-Aware Data Resource Caching Strategy，UADR），為用戶移動時邊緣緩存策略提供了有效解決方案。同時，基站作為封閉個體存在，當用戶在基站間切換時，會出現延遲抖動現象。Li等人[10]提出了一種低成本的任務調度緩存策略，旨在降低傳輸成本。

在邊緣緩存策略的研究中，盡管已有比較成熟的緩存方案，但大多數都是針對特定的應用場景而產生，且具有相對獨立性，對用戶終端的短視頻場景刷新快的特點未作全面的分析和考慮。本文基于用戶終端短視頻請求刷新快的特點，以短視頻緩存策略為核心，在“端-邊-云”系統協同架構下，建立基于最小傳輸時延和用戶體驗質量為目標的緩存策略，并提出面向5G邊緣計算的長短時記憶網絡模擬退火算法緩存策略（Cache Strategy of Simulated Annealing Algorithm for Long and Short-term Memory Network，LSTM-SA）。仿真結果表明，本文所提緩存策略能夠有效降低傳輸時延，提升用戶體驗質量。

1 系統架構及網絡模型

1.1 系統架構

邊緣緩存策略在短視頻場景的應用研究是大勢所趨[11]。在面向5G邊緣計算的短視頻緩存策略中，針對用戶對短視頻即點即播的需求，結合短視頻刷新快的特點和用戶終端在不同MEC服務器之間切換的場景，提出一種基于“端-邊-云”系統協同架構，如圖1所示。

圖1 “端-邊-云”系統架構

在上述系統協同架構中，用戶終端根據需要請求短視頻資源。如果在靠近用戶的MEC服務端有緩存所請求的資源，則直接響應請求結果；若在本MEC服務區域內沒有請求的資源，則會在臨近的MEC服務器查找請求資源，若有請求資源，則通過MEC服務器之間的協同機制響應請求結果；如在臨近的MEC服務器中沒有查找到請求的資源，則會通過本地MEC服務器向云中心查找請求資源，并通過云中心響應查找結果。在該系統協同架構中，不同的MEC服務器之間通過軟件定義網絡（Software Defined Network，SDN）[12]進行控制并統一配置資源。在“端-邊-云”系統協同架構中，采用合理的緩存策略將部分短視頻資源部署在MEC服務器中，實現了MEC服務器與請求資源的深度融合，能夠有效減少數據傳輸冗余和傳輸時延，提升用戶體驗質量。

1.2 網絡模型

本文主要考慮在用戶終端移動場景中，面對短視頻刷新快的特點，以減少傳輸時延提升用戶體驗質量為目標建立網絡模型。假設在邊緣端有MBS個MEC緩存服務器，用集合表示為M={1,2,3,…,MBS}；有N個用戶，用集合可表示為U={U1,U2,U3,…,UN}。定義MEC服務器緩存文件矩陣為X，若在MEC服務i中緩存了文件f，則Xif=1，若未緩存則Xif=0。每個MEC服務器服務的區域可看作半徑為ri的圓，Puf表示用戶u請求文件f的概率，Ni表示MEC服務器鄰居數。規定用戶在服務區域內的運動速度為v，假設MEC服務器響應請求內容的時間間隔為τ，定義變量為：

當Q=0時，表示用戶終端在時間τ內沒有移出當前服務區；

當Q=1時，表示在時間τ內移出當前服務區。

假設下一時間段移入的MEC服務器為j，則系統命中率可定義為：

在空間維度可將用戶終端的移動軌跡看作是若干個狀態的馬爾科夫鏈模型。用戶終端移動的方向和距離可通過用戶終端移動的歷史參數通過LSTM模型來預測當前的位置信息。假設MEC端緩存短視頻數量為m，表示為F={f1,f2,f3,…,fm}，且fi的內容流行度大于fj（i>j），短視頻i的大小為|fi|。用戶對短視頻的請求相互獨立且互不干擾，根據請求概率Puf，假設請求概率服從參數為σ的Zipf分布[13]：

式中，σ和m分別為Zipf分布的參數。根據短視頻刷新快的特點，假設用戶在一段時間內可能請求多個視頻內容，且每個視頻內容的大小呈隨機分布。每個視頻內容都有延時要求dt，即MEC服務器在這個時間段內必須完成請求內容的響應，否則視為請求無效。

緩存策略的核心思想是根據短視頻集合的屬性和用戶請求將短視頻集合中的某些短視頻緩存到MEC緩存服務器，形成緩存矩陣X。在這個過程中，緩存系統總時延為用戶終端從MEC緩存服務器請求短視頻內容至收到響應的時延和用戶終端從云中心請求短視頻內容至收到響應的時延代數和。要使總時延最小，使上述請求盡可能在MEC緩存服務器中得到響應。假設dM表示用戶終端從MEC服務器請求的時延，dY表示從云中心請求的時延，則總時延為：

式中，θ為命中率。約束條件為：（1）每個MEC緩存服務器緩存文件的總大小不能大于該MEC緩存服務器緩存容量的大小；（2）每個視頻內容文件傳輸時延要小于它要求的時延dt，且請求時延服從參數為(σ,N)的Zipf分布。

于是，優化策略問題可以定義為：

求解上述最優解，就是在約束條件下求解系統的最小時延DT。

2 LSTM-SA緩存策略

長短時記憶網絡（Long Short-Term Memory，LSTM）[14]是一種時間循環網絡，是為有效解決長時依賴問題而提出的。因為本文用戶終端的移動性問題可抽象為馬爾可夫模型，所以LSTM對于時間序列預測問題更加有效。LSTM網絡模型具有輸入門、輸出門和遺忘門的獨特結構，因此能夠根據用戶終端歷史軌跡信息預測當前目標MEC服務器。所以，在該策略模型中選擇LSTM網絡模型能夠對目標MEC服務器做出準確預測。

模擬退火算法（Simulated Annealing Algorithm，SA）[15]是一種基于概率的算法，將物體的退火過程應用到約束條件下的組合優化問題是其核心思想。該算法假設物體從某一高溫開始退火，且溫度參數逐漸下降，在迭代過程中逐步尋求全局最優解。該算法在并行執行的同時具有收斂速度快的優點，對NP-hard問題是一種有效的解決方法。

求解上述約束條件下系統最小時延問題是NPhard問題，因此可結合長短時記憶網絡和模擬退火算法本身的優越性，既可以準確快速預測用戶終端移動的特征并獲得局部最優解，又可以通過模擬退火算法求解全局最優解并實時更新緩存矩陣。鑒于此，本文提出了長短時記憶網絡模擬退火算法的緩存策略（Cache Strategy of Simulated Annealing Algorithm for Long and Short-term Memory Network，LSTM-SA），在用戶終端移動的時候能夠最大限度在MEC緩存服務器終端請求到內容，并以最小化傳輸時延為優化目標。

2.1 目標MEC服務器預測

在實際應用場景中[16]，當用戶終端在MEC服務器之間移動時，MEC緩存服務器里存儲的內容會隨之失去價值。如果用戶正在請求短視頻文件時發生用戶終端切換MEC服務器的情況，則請求將被中斷。本文采用LSTM網絡模型預測用戶終端下一時間段有可能會切換的目標MEC服務器，在該MEC服務器中提前緩存用戶終端所請求的文件或正在觀看的短視頻文件，在用戶終端移動的同時實現MEC服務器緩存資源的無縫切換和視頻的流暢播放。

LSTM網絡模型主要包括輸入門、輸出門、遺忘門和一個記憶單元。遺忘門用來選擇性忘記之前一些次要狀態信息。在忘記部分次要狀態信息后，需要從當前的狀態增加新的記憶，這由輸入門實現。LSTM模型在計算得到新的狀態后需要輸出當前時刻的狀態，此時由輸出門來實現。具體網絡模型結構如圖2所示。

在如圖2所示的LSTM網絡模型中，用來控制信息傳遞的細胞狀態為Ct；上一序列狀態為ht-1和當前序列輸入數據為Xt；通過激活函數得到遺忘門的輸出ft，且ft∈[0,1]，ft表示遺忘上一層隱藏細胞狀態的概率。它的表達式為：

式中，Wf和bf分別表示線性關系的系數和偏置，σ為激活函數。

輸入門負責實現當前序列的輸入。輸出由兩部分組成：第一部分輸出it，使用σ激活函數實現；第二部分輸出at，使用tanh激活函數實現。

輸入輸出的表達式分別為：

圖2 LSTM網絡模型

細胞狀態的更新由輸入門和遺忘門共同的結果確定。更新規則表示為：

細胞狀態Ct更新后，輸出狀態ht的更新由ot、Ct以及tanh激活函數決定，表達式分別如下：

預測下一時間段目標MEC服務器基本流程如下：

（1）輸入用戶終端歷史移動軌跡所經歷的MEC服務器集合H和時間片τ；

（2）根據歷史移動軌跡，采用LSTM網絡模型，預測用戶終端下一時間段將要切換到的MEC服務器，同時通過ft遺忘門忘記一些無關信息；

（3）通過輸入門生成it和at狀態信息，同時以一定概率更新細胞狀態Ct；

（4）以ft概率更新Ct-1的狀態為Ct狀態；

（5）生成ot，并由ot和Ct決定下一時間段將要移動到的MEC服務器ht；

（6）在MEC服務器ht中計算所請求的短視頻傳輸總時延Dt得到局部最優解，并更新局部緩存矩陣X。

2.2 短視頻緩存策略流程

通過LSTM網絡模型預測目標MEC服務器，并得到傳輸時延局部最優解，再通過SA算法在局部最優解中尋求全局最優解，更新全局緩存矩陣。當用戶終端在不同MEC服務器之間切換時，能夠將SA更新后的緩存矩陣實時更新到下一目標MEC緩存服務器，實現用戶終端在無感知狀態下完成MEC緩存服務器切換和短視頻連續播放。

根據Metropolis準則，結合SA算法，比較此時溫度與上一時刻溫度下的解（用戶終端未切換到新的MEC服務器）。在緩存矩陣中任意選取兩個短視頻文件，若兩者在切換到下一MEC服務器的傳輸時延縮短，則接受新解；若在新的MEC服務器中傳輸時延增加，則拒絕接受新解。

定義下列概率用來接受新解：

式中，DT表示在當前溫度T下的傳輸時延，表示用戶終端未切換MEC服務器時的傳輸時延。

短視頻緩存策略的基本流程如下所示：

（1）參數初始化，主要包括迭代次數、目標MEC服務器位置信息、初始溫度和終止溫度；

（2）采用LSTM網絡模型預測目標MEC服務器，根據式（4）構造解空間；

（3）按照傳輸時延計算局部最優解，并根據DT更新局部緩存矩陣X；

（4）采用SA，目標MEC服務器局部緩存矩陣X的傳輸時延，并根據Metropolis準則決定是否要接受新解；

（5）判斷當前溫度下得到的局部最優解是否收斂于某一穩定值，若滿足則繼續下一步，若不滿足則返回步驟（4）；

（6）根據式（6）、式（7）和式（8）約束規則，計算全局傳輸時延DT，同時更新全局緩存矩陣X；

（7）若當前溫度下降至最小回火溫度，則輸出最優解，否則返回步驟（2）。

3 仿真實驗

為了驗證“端－邊－云”系統協同架構下LSTM-SA緩存策略的有效性，將其與UPP、QLC、CSC等緩存策略在命中率、傳輸時延、吞吐量、丟包率等性能指標進行對比分析。

3.1 仿真環境

在仿真實驗中，輸入的視頻數據主要包括視頻ID、視頻名稱、視頻大小以及流行度。用戶數據主要包括用戶ID、位置信息、所連MEC服務器數、時間片內移動的距離、用戶偏好集、總流行度、流行度波動參數以及目標MEC服務器位置。MEC服務器數據主要包括基站數量、基站半徑、基站內的用戶數以及緩存隊列等。具體仿真參數如表1所示。

表1 實驗仿真參數

3.2 結果分析

3.2.1 命中率

命中率主要是指短視頻資源成功在MEC邊緣緩存服務器（或鄰居MEC緩存服務器）內找到并響應的次數和總請求次數的比值。仿真參數按照表1進行設定。在不同迭代次數下，本文所提緩存策略和上述3種策略的命中結果如圖3所示。

圖3 命中率隨迭代次數性能分析結果

從圖3仿真結果看，在開始迭代時，本文所提LSTM-SA策略命中率性能相比于其他策略性能稍差，主要是因為在開始迭代時終端用戶的歷史軌跡信息較少，導致對用戶移動的目標MEC服務器出現偏差。隨著迭代次數的增加，系統收集到的用戶終端軌跡數據逐漸增多，預測結果愈發準確，命中率也隨之上升。可見，本文所提策略在隨著迭代次數的增加，命中率整體優于其他3種策略。

3.2.2 傳輸時延

這里傳輸時延主要是指用戶終端發送請求到接收響應的總時延。傳輸時延越小，系統緩存策略性能越好，用戶體驗質量越高。圖4為本文所提策略和上述3種策略在不同迭代次數下傳輸時延性能比較的結果。

圖4 總傳輸時延隨迭代次數性能分析結果

從仿真結果可知，本文所提LSTM-SA策略隨著迭代次數的增加，在總的傳輸時延方面有更好的性能。因為該算法針對用戶終端的移動場景采取了預測路徑和實時更新緩存矩陣，同時在傳輸時延方面較其他算法具有顯著的有效性。此外，CSC算法考慮了基站之間的協同響應機制，因此在傳輸時延方面也具有較好的性能。

3.2.3 吞吐量

當用戶終端大量請求短視頻資源時，較高的吞吐量能夠保證請求資源得到及時快速的響應和傳輸，同時能夠保證用戶端更流暢地播放。系統吞吐量性能指標在不同迭代次數下的性能指標，如圖5所示。

圖5 吞吐量隨迭代次數性能分析結果

從仿真結果可知，隨著迭代次數的增加，上述所有策略吞吐量性能指標均增加并最終趨于穩定，但CSC算法是基于基站之間相互協作的通信方式，且未充分考慮用戶終端的移動性，因此相比于其他的算法在吞吐量方面稍欠佳。本文所提策略在充分考慮用戶終端移動性的基礎上，考慮MEC服務器之間的相互協作關系，當用戶端有大量視頻請求時能夠有效快速響應，因此其吞吐量性能指標方面較其他幾種算法具有優勢。

3.2.4 丟包率

在短視頻傳輸過程中，如果丟包率過高，會導致中斷播放和停頓現象。因此，丟包率也是衡量系統性能的指標之一。系統的丟包率性能指標在不同迭代次數下的仿真結果，如圖6所示。

圖6 丟包率隨迭代次數性能分析結果

從仿真結果可知，隨著迭代次數的增加，丟包率逐步降低。本文所提策略隨著迭代次數的增加，丟包率低于UPP、OLC、CSC策略。因為當用戶終端移動時，通過LSTM模型預測目標MEC服務器并更新緩存矩陣，提前將要請求的短視頻內容緩存到目標MEC服務器，使內容請求和傳輸更加連續和流暢，減少了丟包現象的發生。

4 結語

隨著5G技術的商用，用戶終端短視頻業務數據呈現出指數級增長。當用戶終端在不同MEC服務器區域內切換時，用戶終端能夠實現業務的連續性和短視頻資源的及時響應。本文基于“端-邊-云”協同架構建立以最小化時延為目標、提升用戶體驗質量的網絡模型，實現了短視頻資源的合理調度及響應。針對用戶終端的移動性和短視頻刷新快的特點，提出了LSTM-SA視頻緩存策略，可通過LSTM網絡模型預測目標MEC服務器并給出局部最優解。同時，SA算法在前述預測最佳路徑的基礎上，可通過時延信息搜尋全局最優解并實時更新緩存矩陣，將其緩存到最佳目標MEC服務器。仿真實驗表明，本文所提LSTM-SA緩存策略相比其他緩存策略具有較高的命中率、較低的傳輸時延、較高的吞吐量和較低的丟包率，有效提升了用戶體驗質量。