,, ,
(常州大學 信息科學與工程學院,江蘇 常州 213164 )
手機用戶網絡行為預測方法研究
朱正偉,黃曉竹,劉晨,陳陽
(常州大學信息科學與工程學院,江蘇常州213164 )
傳統離線方法對手機網絡耗電量進行的優化不能準確判斷用戶網絡消耗狀態,對用戶正常使用手機帶來很大影響,針對這個問題,提出基于用戶習慣的網絡行為在線預測方法;該方法分析用戶使用網絡的歷史數據,建立對用戶使用網絡行為進行在線預測的數學模型,使用0-1背包算法求該模型的最優解,預測用戶使用網絡情況;并在此基礎上對最優解進行模糊處理,以增強預測方案的適應能力;實驗結果表明,所設計的方法能夠有效預測手機用戶網絡的使用狀態,為基于用戶習慣的手機網絡節電研究奠定了堅實的理論基礎。
手機網絡;節電;背包算法;預測
隨著WIFI覆蓋面的增加和手機網絡的發展(如4G網絡的發展),智能手機網絡耗電問題變得越來越嚴峻,續航能力短成為智能手機的通病,然而目前電池的密度在未來幾十年內卻不會有突破性的發展[1]。很多學者對手機耗電問題進行了研究,發現手機各個部件中網絡耗電量占總耗電量的很大一部分[2]。在網絡方面采取節電措施,將會對手機節電有重要意義。
文獻[3-5]對近萬名用戶手機網絡使用情況進行了調查,調查結果顯示,用戶使用網絡的行為是多樣的,并且具有一定的規律。Qian等人[6]對手機網絡進行了深入研究,發現手機在屏幕關閉活動下無線網絡能耗占總網絡能耗的30%,而進行的網絡傳輸量只占總傳輸的1.7%,這部分網絡活動存在很大的優化空間。同時在屏幕開啟的狀態下,用戶使用網絡的總時間占屏幕開啟的總時間百分比也很低,如果對其進行優化,將會有很好的節電效果。
文獻[7]采用通過軟件監測屏幕關閉時關閉手機網絡的方式來達到節電目的,但這樣嚴重影響了屏幕關閉下某些通信軟件信息的接收。文獻[8-9]分別采用延遲100秒和延遲180秒,對網絡數據進行批處理的方法達到網絡節電的目的。雖然文獻[8-9]中的方法對手機續航有一定的效果,但是他們均采用離線方式對網絡進行處理,忽略了用戶的習慣,嚴重影響了用戶對手機的正常使用。
針對上述問題,本文提出了一種在線預測手機用戶網絡行為的方法。
用皮爾森參數[10]判斷用戶行為習慣的相關性。ρx,y表示總體的相關系數,rx,y表示樣本的相關系數,總體相關系數的定義式是:
(1)
其中:Cov(X,Y)是隨機變量X和Y的協方差;Var(X)和Var(Y)分別為變量X和Y的方差。總體相關系數是反映兩變量之間線性相關度的一種特征值,表現為一個常數。-1 ≤rx,y≤ 1。rx,y大于0時正相關,rx,y小于0時負相關,rx,y的絕對值越接近于1,兩要素的關系越密切;越接近于0,兩要素的關系越不密切。
通過自主開發的Android手機APP“Collect”,對10位不同年齡段和職業的用戶使用網絡的情況進行為期一個月的采集。其中Collect采集的數據有:1)手機自出廠時到采集時刻接收的總流量;2)手機自出廠時到采集時刻發送的總流量;3)采集數據的時刻。Collect將采集的數據最終存儲到SQLite數據庫中[11],且默認采集數據的最小時間間隔為1 s。
圖1為10個用戶為期一周的皮爾森參數分析圖,從圖中可以看出,用戶之間的皮爾森參數基本在0.4以下,即不同用戶使用手機網絡行為相關性很低。因此,同一種離線算法可能于用戶1來講有很好的用戶體驗,但對用戶2來講就會影響手機的正常使用。
圖1 10位用戶之間的皮爾森參數圖
圖2為一個用戶在為期10天里使用手機流量數據中每兩天之間的皮爾森參數值;從圖1可以看出,同一個用戶在不同天里使用手機數據的皮爾森參數基本在0.65以上,即單個用戶使用手機網絡行為相關度很高并具有很高的可預測性。因此,根據用戶手機網絡習慣設計在線算法,預測用戶手機網絡行為是可行的。
圖2 一位用戶10天的皮爾森參數圖
進一步分析圖2,可以發現天數越接近,皮爾森參數的值越高,即用戶手機網絡的相關度越高。從而采用天數越接近的網絡歷史數據進行預測,準確度相對越高。
將一天的時間分成N個相等的時間段,每個時間段用Ti表示,其中i∈{1,2,…,N}。將每個Ti中有網絡傳輸的總時間記為TOi。假設每個Ti中,有n個最小采集時間tj,j∈{1,2,…,n},這里的tj不一定相等。每個tj中網絡產生的數據流量用lj表示,其中lj是網絡發送和接收流量之和。本文取一個時間段Ti的網絡使用情況作為樣本,對其數據進行分析。
針對手機網絡節電問題,對網絡進行的操作一般只有開啟網絡和關閉網絡兩種狀態,因此把時間段tj的網絡狀態用xj表示,且xj∈{0,1}。其中xj= 0表示tj時間段關閉網絡,xj= 1表示tj時間段開啟網絡。
設(x1,x2,…,xn)是上述背包問題的最優解,如果這個最優解包含了物品n,即xn= 1,那么(x1,x2,…,xn-1)一定構成子問題物品(1,2,…,xn-1)在容量(C-wn)時的最優解。如果這個最優解不包含物品n,即xn= 0,那么(x1,x2,…,xn-1)一定構成子問題(1,2,…,xn-1)在容量C時的最優解。設m(j,w)表示背包容量為w時,j個物品導致的最優解的總價值,如公式(2)和(3)所示,需要求出m[n,w]。
(2)
當j> 0且wi≤w時,
m[j,w]=max{m[j-1,w-wj]+vj,m[j-1,w]}
(3)
判斷m[j,w]與m[j- 1,w]是否相等,若相等則設置xj= 0,否則設置xj= 1。于是便求出了最優解向量(x1,x2,…,xn),xj∈{0,1}。
對0-1背包求出的最優解向量進行在線模糊處理[14],以增強預測方案的適應能力。當手機網絡開啟時,應用會自動檢測網絡關閉期間的網絡請求,如QQ、微信等,并將滯后的信息重新處理。因此將最優解向量中大片為零的區域參照實際流量使用情況,按一定的方法把0變為1,則在“0”向量時間段的流量會自動加載到其后最近的“1”向量中。
假設最優解向量中有m個連續為零的區域,用UCk表示每一個連續為零的向量集合,用TCk表示每一個集合UCk所對應的所有tj之和,其中k∈{0,1,…,m}。定義TS為給定的時間參數,TM為監測間隔,且TM初始值為TS。在TM (4) 如果TM內L= 0,則將監測間隔TM變為2TS;如果繼續判斷時L仍然為0,則將監測間隔變為4TS,以此類推以2n增加監測間隔TM的值。如果TM內,L> 0,則將監測間隔TM復位為原始的TS。求出預測向量(y1,y2,…,yn),yj∈{0,1}。圖3(a)為向量xj的分布情況,其中黑色表示“1”,白色表示“0”;圖3(b)為當前流量的使用情況,其中實際有流量傳播的時間用黑色填充,沒有流量傳播的時間用白色填充;圖3(c)為求解出的向量yj分布情況,其中黑色表示“1”,白色表示“0”。 圖3 向量對比圖 取連續兩天相同時間段用戶使用手機網絡的數據作為樣本進行分析。如圖4中(a)和(b)分別為同一個用戶前一天在10:00-11:00之間和后一天相同時間段實際使用網絡情況圖,從兩圖中可以看出,數據呈離散狀態,且分布很不規則。 圖4 用戶前后兩天10:00-11:00網絡使用情況圖 本設計通過Matlab設計相關程序,求出最優解向量xj和預測向量yj以及其對應的時間段tj內預測產生的流量lj的值。圖5中(a)(b)(c)分別為TS的值取30 s,15 s和1 s的預測效果圖。將這三幅圖中的預測效果與圖4(b)用戶實際使用網絡圖對比,可以看出,TS的值越小,預測網絡效果與實際網絡使用情況約接近,即預測效果越好。 圖5 TS取不同值時網絡預測情況圖 為了對預測效果進行量化分析,令Фi為Ti段時間內網絡預測延遲參數。將預測向量yj= 0的時間段tj內實際產生的網絡流量記為lj。將時間段tj距離其后最近的yj= 1的時間記為ttj,則:在時間段Ti內網絡延遲參數Фi的計算方法如公式 (5)所示。 (5) 其中:Фi越小表示對用戶網絡行為預測效果越好。如圖6所示為TS取不同值時對應網絡延遲參數Фi的不同結果。 圖6 TS取不同值時網絡延遲參數圖 由于本設計的實用價值是為節約手機網絡耗電量做貢獻,所以在選擇TS參數時還需要考慮節電的效果,不能單一的追求卓越的預測效果。根據初步測量可知,4 G模塊空載功率大概為Pe= 500 mW;4 G模塊網絡傳輸功率大概為Pb= 3 500 mW。在Ti時間段內,將預測的結果中,yj= 1且沒有流量傳輸的tj集合記為TTi,用公式(6)求出Ti時間段內手機網絡節電百分比的理論值。 (6) 圖7 預測結果理論節約手機網絡耗電量圖 圖7為TS取不同值時預測結果理論手機網絡節約的耗電量百分比圖,從圖中可以看出,TS的值越大,節電效果越好。結合圖6中TS取不同值時對應Фi的不同結果,選擇TS= 20作為初始監測間隔時間且當TS= 20時,Фi= 337 Byte,ξi= 83.6%。 分別利用本文方法和文獻[8-9]方法,對10個用戶同一時間段Ti內網絡使用情況進行對比實驗,比較預測結果延遲網絡參數Фi和理論節約手機耗電量百分比ξi。 圖8 不同方法網絡延遲參數圖 圖8為10個用戶預測結果網絡延遲情況圖,從圖中可以看出,本文方法中平均網絡延遲參數 Фi= 383 Byte,文獻[8]方法中平均網絡延遲參數Фi= 1 921 Byte,文獻[9]方法中平均網絡延遲參數Фi= 2 925 Byte。本文方法的平均網絡延遲參數比文獻[8]方法的平均網絡延遲參數減少了80.1%;比文獻[9]方法的平均網絡延遲參數減少了86.9%。也就是說,本文方法對用戶網絡行為預測效果比文獻[8-9]有很大的提高。 圖9 預測結果理論節約手機網絡耗電量圖 如圖9所示為預測結果理論節約手機網絡耗電量百分比圖,其中本文方法平均節約網絡耗電量百分比ξi= 84.3%,文獻[8]方法平均節約網絡耗電量百分比ξi= 84.7%,文獻[9]方法平均節約網絡耗電量百分比ξi= 85.6%。本文方法平均節約網絡耗電量與文獻[8-9]相差不大,有一定的實用效果。 實驗結果表明:本文方法對用戶使用手機網絡有著很好的預測效果,并且理論節電效果與現有方法節電效果相差不大。在手機節約網絡耗電量的同時,最小化對用戶正常使用手機產生的影響。 對用戶使用手機網絡的行為進行分析,發現不同用戶使用手機網絡的行為相關性很低,同一用戶不同天數使用手機網絡的行為相關性很高,因此對用戶使用手機網絡的行為進行在線預測是可行的。提出了一種基于0-1背包算法與模糊處理相結合的方法,對用戶使用手機網絡的行為進行預測。實驗結果表明,所設計的方法能夠在不影響用戶正常使用手機的前提下,達到對手機節電的目的。為節約手機網絡耗電量、提高手機續航能力奠定了堅實的理論基礎。 [1] 李 泓,鄭杰允.發展下一代高能量密度動力鋰電池——變革性納米產業制造技術聚焦長續航動力鋰電池項目研究進展[J]. 中國科學院院刊, 2016, 31(9):1120-1127. [2]錢紅艷,王 玲,劉琳,等.4G手機待機耗電機理與預測模型分析[J].內江科技,2017,(2):54-55. [3]Trestian I, Ranjan S, Kuzmanovic A, et al. Measuring serendipity: connecting people, locations and interests in a mobile 3G network[J]. Acm Sigcomm, 2009:267-279. [4]Maier G, Schneider F, Feldmann A. A First Look at Mobile Hand-Held Device Traffic[A]. Passive and Active Measurement, International Conference, PAM 2010, Zurich, Switzerland, April 7-9, 2010. Proceedings. DBLP[C]. 2010:161-170. [5]Fukuda K, Asai H, Nagami K. Tracking the Evolution and Diversity in Network Usage of Smartphones[A]. Internet Measurement Conference[C]. ACM, 2015:253-266. [6]Qian F, Wang Z, Gao Y, et al. Periodic transfers in mobile applications:network-wide origin, impact, and optimization[A]. Proceedings of the 21st international conference on World Wide Web[C]. ACM, 2012:51-60. [7]方 葵. 基于Android系統網絡耗電量優化方法的研究[J]. 通信技術, 2012(10):33-35. [8]Pathak A, Hu Y C, Zhang M. Where is the energy spent inside my app?:fine grained energy accounting on smartphones with Eprof[A]. Proceedings of the 7th ACM european conference on Computer Systems[C]. ACM, 2012:29-42. [9] Huang J, Qian F, Mao Z M, et al. Screen-off traffic characterization and optimization in 3G/4Gnetworks[C]. Proceedings of ACM IMC, 2012:357-364. [10] 賈俊平,何曉群,金勇進,統計學(第6版)[M]. 北京:中華人民大學出版社,2015. [11]郭 霖,第一行代碼——Android[M].北京:人民郵電出版社,2014. [12]Zhang Y, He Y, Wu X,et al. NetMaster:Timing Energy Devourers on Smartphones[J].IEEE computer society, 2014:301-310. [13]王曉東, 算法設計與分析(第2版)[M]. 北京: 清華大學出版社, 2008. [14]唐駿宇,馮長江. 基于模糊辨識算法的蓄電池荷電狀態測量方法與模塊設計[J]. 計算機測量與控制,2017(2):39-42. ResearchonPredictionofUsers’BehaviorswhenUsingNetworkonMobilePhones Zhu Zhengwei,Huang Xiaozhu,Liu Chen,Chen Yang (College of Information Science and Engineering, Changzhou University, Changzhou 213164, China) An online prediction method was put forward which based on users’ network habits when using network since traditional offline method to optimize mobile phone network energy consumption cannot indicate users’ network consumption, which leads to a compromised users’ experience. This method analyzes the history data of users’ usage of network, established mathematical model to predict users’ behaviors when using network online and then get the optimized solution of prediction of the status of users’ network by leveraging the 0-1 knapsack algorithm, fuzzily processes the optimized solution. Simulation has shown that our method can predict the users’usage status when using network efficiently without compromised users’ experience, which set a solid theoretic foundation for saving phones’ network power consumption and improve the span time of navigation on mobile phones. mobile phone network; energy saving; knapsack arithmetic; predict 2017-05-06; 2017-05-23。 國家自然科學基金青年科學基金資助項目(61501061)。 朱正偉(1963-),男,江蘇常州人,教授,博士,研究生導師,主要從事計算機網絡技術、嵌入式系統及應用方向的研究。 1671-4598(2017)11-0212-04 10.16526/j.cnki.11-4762/tp.2017.11.054 TP301 A2.3 最優TS參數的選擇
3 對比實驗分析
4 結論