吳修權 鐘其柱



【摘? 要】通過Python Scrapy的方法獲取終端數據,結合PCA降維和監督學習的方式研究了多個終端指標對用戶感知的影響,挖掘不同終端以及指標對VoLTE視頻通話感知的影響。結合移動終端領域、計算機軟件領域和機器學習中的神經網絡優化模型,建立了一個手機設備端硬件指標對VoLTE視頻通話重要參數的影響指標體系模型。通過AUC等模型檢驗指標體系模型,評估模型AUC值達到0.7,驗證了該方法的有效性。
【關鍵詞】VoLTE視頻通話;機器學習;終端設備;AUC
doi:10.3969/j.issn.1006-1010.2019.08.008? ? ? 中圖分類號:TN929.5
文獻標志碼:A? ? ? 文章編號:1006-1010(2019)08-0045-06
引用格式:吳修權,鐘其柱. 基于監督學習的VoLTE視頻通話感知評估方法[J]. 移動通信, 2019,43(8): 45-50.
[Abstract]?Through obtaining terminal data with Python's Scrapy method, the combination of PCA dimension reduction and supervised learning is then adopted to study the impact of multiple terminal indicators on user perception and explore the impact of different terminals and terminal indicators on VoLTE video call perception. Combining the neural network optimization models in the fields of mobile terminal, computer software and machine learning, an indicator system model is established to investigate the impact of mobile device hardware indicators on the important parameters of VoLTE video call. Finally, using AUC models to test the indicator system, the AUC value of the evaluation model reaches 0.7, which verifies its effectiveness.
[Key words]?VoLTE video call; machine learning; terminal equipment; AUC
1? ?引言
隨著通信網絡的發展,最初的語音方案逐步顯露出問題。為了提高用戶通話質量,運營商加快了VoLTE視頻語音方案的部署。但VoLTE視頻通話也出現花屏、卡頓、色彩等方面不同程度的問題,用戶體驗較差。因此,提升VoLTE視頻通話用戶體驗成為運營商面臨的新挑戰[1]。
目前業界對視頻用戶體驗的研究大部分都只是停留在用戶體驗、視頻質量評估方面的理論研究。對于終端硬件的分析還沒有可實際應用的產品和模型。文獻[2]和文獻[3]基于線性回歸的方法研究了視頻序列質量評估算法,但是其算法主要針對視頻的質量差異進行評估,未真實反映用戶的體驗質量。文獻[4]以視頻流媒體為背景,建立了隨機模型評價指標,根據QoE(Quality of Experience,體驗質量)值對評價體系進行評分,得到視頻業務的QoE評價模型。但該模型局限于QoE對指標權重的主觀判斷,并未考慮不同終端指標的區別,不具備普遍性。文獻[5]通過對比各類視頻的評估方法,利用PEVQ(Perceptual Evaluation of Video Quality,視頻質量感知評估)算法,研究TD(Time Division,時分)視頻通話質量評估系統。該方案主要對TD網絡進行優化并開展視頻通話質量評估系統的設計,沒有考慮終端硬件指標的綜合影響,忽略了多因素疊加對效果的影響。
針對上述研究中存在的問題,本文提出了一種基于監督學習的VoLTE視頻終端硬件指標的感知方法,該方法研究終端因素對VoLTE視頻通話質量的影響。利用其處理器、屏幕、攝像頭、音頻輸出、視頻輸出等關鍵參數,得出用戶實際使用評分,結合機器學習的神經網絡監督機制方法,建立VoLTE視頻通話質量評估模型,分析出用戶最真實的感知。
2? ?因素分類
對于VoLTE視頻通話的影響因素,除了網絡原因造成的質量問題外,其終端因素也會產生影響。終端硬件的優劣是直接影響用戶VoLTE視頻感知的重要因素,其因素主要包括處理器、圖形處理器、主頻、屏幕像素、攝像頭像素等[6],其像素因素與視頻質量的關系如表1所示。
由表1可以看出,終端的像素及分辨率越高,視頻的感知效果越好。本文根據終端的各個參數的特征,總結歸納三個特征參數來評估終端對VoLTE視頻通話的影響,完成參數與視頻通話質量的映射。
(1)終端處理能力
要使視頻的感知效果越好,對終端處理芯片的計算能力要求也就越高。因此終端視頻處理能力的提升,是實現高效壓縮算法的硬件保障[5]。
(2)攝像頭能力
該功能決定了視頻像素的能力,同時也能夠反映出視頻通話的質量,是用戶通話質量的直接影響因素。
(3)視頻編解碼器性能
該功能能夠對數字視頻進行壓縮或者解壓縮,是影響視頻質量的關鍵因素。
本方案按照監督學習的方法分析終端用戶的感知影響,結合爬蟲技術(一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本)和PCA(Principal Components Analysis,主成分分析)對終端參數進行特征分析,運用降維和特征歸納的方法,精確得出評估結果。利用機器學習在實際使用中的延展性,為VoLTE視頻通話感知評估提供了有效和智能的解決方法。
3? ?原理和方法
為構建終端參數的數據集,本方案通過終端瀏覽的相關網站,采用Python Scrapy框架對瀏覽的手機網站進行爬蟲,獲取手機設備(均為測試機)的硬件信息。再結合監督機制的機器學習對數據集自主特征進行選擇學習,利用神經網絡模型對終端參數進行特征提取及訓練,最后通過AUC(Area Under Curve)、ROC(Price Rate of Change,變動率指標)模型對本方案建立的模型進行驗證,從而完成終端對VoLTE視頻通話質量的評估及優化,其整體架構如圖1所示。
3.1? 數據集的構建
終端參數的數據集的構建是保證數據真實性的基礎,保證機器學習和神經網絡模型性能的一個關鍵因素。為此本節基于網絡爬蟲,通過Python的Scrapy框架對各大手機設備網站進行爬蟲,提取終端結構化數據,其流程如圖2所示:
通過終端瀏覽網頁發送的HTTP(Hyper Text Transfer Protocol,超文本傳輸協議)網站信息,Scrapy是通過定義Scrapy Items實現終端信息的抓取,得到網頁中的實體。通過網站爬蟲解析后,將爬蟲的數據發送到機器進行處理并利用特定的次序處理數據。然后交給實體管道進一步處理并入庫。
為了增加機器學習的神經網絡模型的可靠性,將爬蟲得到的終端原始數據進行整合、降維、轉換并進行特征選擇,獲取終端特征參數,建立可靠的終端數據集,以提高模型的準確性。
(1)數據整合
爬蟲數據和測試數據的清洗工作主要內容其實是如何將多用戶的評分結果進行整合,對于同一次VoLTE視頻通話的結果進行平均,平均后的數據作為最后的評分。
(2)數據降維與轉換
針對上述數據用PCA算法進行降維處理。算法如下:
3.2? 機器學習模型構建
數據特征標準化后,需要根據數據的特點選擇不同的數學模型。針對用戶進行VoLTE視頻通話遇到的質量問題,需要建立一個有監督的機器學習模型。而神經網絡模型是通過選擇適當的隱含單元和網絡層次對于一組輸入和輸出數據之間的關系進行建模,具有監督機制的機器學習,符合本方案的要求。并且其擁有強大的擬合能力,能夠描述任何規模數據集之間的關系。其算法如下:
(1)根據得到的數據集確定此模型輸入層的神經元個數。根據終端參數特征,全連接神經網絡包含1個輸入層、1個輸出層和2個隱含層。
(2)初始化神經網絡權重并設置學習率。運用服從標準正太分布的隨機數來設置初始權重,選擇一個作為基準,確定一個最好的算法方案。
(3)使用Sigmoid函數作為激活函數,該函數能夠對數據進行非線性變化,將輸入值壓縮到0~1,使之有強大的解析數據的能力。
Sigmoid函數公式為:
Sigmoid(x)=1/(1+ex)? ? ? ? ? ? ? (3)
(4)反向傳播。本步驟需要定義損失函數,計算損失函數關于神經網絡中各層的權重的偏導數(梯度),使用梯度下降的方式優化神經網絡參數。
(5)重復以上過程,直到模型收斂為止。
隨著訓練次數的增加,模型的損失值震蕩減少。當模型損失值不再變化時,表示訓練結束,說明模型已經收斂。
3.3? 模型驗證
為了驗證本方案機器學習的神經網絡模型的算法可行性,本文采用準確率、ROC曲線和AUC面積模型相結合的方法來衡量模型優劣的指標。與準確率和ROC曲線相比較,AUC面積更能保證模型的準確度,如圖3所示。
4? ?效果分析
本方案采用神經網絡的機器學習模型對采集的終端信息數據進行清洗、預處理等操作,然后對模型數據進行訓練,得出評估結果,具體算法如圖4所示。
為了驗證本方案的機器學習的神經網絡模型的算法可行性,采用AUC模型對本方案進行準確度驗證,如圖5所示。
可以看出:ROC越往上,分類器效果越好。本方案模型出來的AUC值是0.7,效果比較好。從上述實驗結果可以看出:基于監督學習建模的算法和現有的評估模型算法相比[7],其能降低終端特征值的維度并提高標準化的準確率。
為了進一步驗證本方案模型的優越性,本文選取市面常見的11款終端,根據Python的Scrapy架構及功能對終端發送的HTTP信息進行爬蟲,建立數據集,然后通過Scrapy中Item Loaders數據處理功能,對入庫終端信息進行增加解釋或者清洗,從而獲取手機設備的硬件信息的原始數據,包括數據類型及參數,如表3所示。
數據輸入模型對采集的數據進行整合、降維、轉換和特征選擇,得到終端的參數及MOS值,測試評估結果如表4所示。
將數據集輸入機器學習的神經網絡模型,模擬不同終端對VoLTE視頻指標的影響,具體實驗結果如表5所示。
對比VoLTE指標排名情況與算法評分結果,終端的實際指標情況與終端評分結果吻合,本算法在多終端多維度評估VoLTE視頻通話感知的結果較準確。