呂培卓 戴洪濤(河北冀州中學,河北 衡水 053000)
?
智能家居用戶行為預測的方法研究
呂培卓 戴洪濤
(河北冀州中學,河北 衡水 053000)
摘 要:隨著物聯網技術、大數據計算、傳感器技術等新興技術的發展,智能家居更加貼近人類生活。對用戶未來活動的預知,將使家居生活更加靈活和智能。本文基于隱馬爾科夫模型(hidden Markov model, HMM),提出了對用戶家居生活行為預測的方法。首先本文闡述了用戶行為預測的方法架構,隨后從相似數據篩選、基于HMM的行為模式發現和預測等多個方面詳述了用戶行為預測的方法。此預測方法能夠為用戶日常家居生活提供便捷、高效的生活服務。
關鍵詞:智能家居;用戶行為預測;隱馬爾科夫模型;數據挖掘
近年來,隨著物聯網技術的快速發展,社會上以物聯網為中心衍生出來許多相關技術。利用無線傳感技術和計算機網絡技術,將小區內的普通底層硬件設備(冰箱、臺燈、熱水器等)聚合在一起,形成一整套智能家居體系;結合大數據技術,將與用戶日常行為相關的海量數據存儲在云平臺,保證數據穩定且高效的存儲。通過對用戶日常生活行為的挖掘,可以讓家居系統更好地了解用戶生活習慣,并根據用戶習慣設計電器開關時間、電器啟動用量,以達到簡化用戶生活、環保、低功耗的目的。在智能家居領域,用于用戶行為預測的常見方法有人工神經網絡、支持向量機、決策樹分類方法等。本文采用了隱馬爾可夫模型的算法,利用隱馬爾科夫模型,對每個用戶的歷史行為數據建模,實現用戶的行為挖掘和預測的功能,為智能家居中家電設備的控制提供依據。本文首先介紹了用戶行為預測方法的架構,隨后詳細介紹了方法的具體實現,包括利用余弦相似性篩選與當前行為習慣相似的數據集和基于HMM的用戶行為預測的方法等;最后通過實例,展示了在智能家居系統中其應用的方法,為用戶日常家居生活提供便捷的生活服務。
研究表明用戶的日常行為中包含明顯的行為模式。假設一家中3個用戶(爸爸、媽媽和小明),工作日媽媽每天6點鐘起床為全家做早餐;爸爸6點鐘起床打開熱水器,待30分鐘后洗漱;小明7點鐘起床吃早餐;早晨8點鐘大家都已經離開了家上班或者上學。本文的工作重點是對用戶的歷史行為數據建模,挖掘用戶的行為特征,并預測在時間t用戶將會有什么行為,從而為智能家居中家電設備的控制找到依據。圖1顯示了單用戶行為預測的模型框架,主要包括以下3個部分:(1)相似數據篩選:用戶的行為隨著時間可能發生變化,本模塊將從歷史行為數據中,挑選和當前用戶行為習慣相關的數據;(2)當前的行為模式發現:通過篩選的數據集,挖掘用戶的行為模式,發現時間和用戶行為的關系,獲得用戶日常行為習慣的時域特征;(3)行為預測:基于用戶行為的時域特征,預測用戶未來的一個時間點的行為。后文將具體介紹在智能家居下,用戶行為預測實現的方法。

圖1 用戶行為預測的模型架構Figure 1. Structure of our model for user behavior prediction
自20世紀80年代以來,隱馬爾可夫模型被應用于語音識別,取得重大成功。到了90年代,HMM還被引入計算機文字識別和移動通信核心技術“多用戶的檢測”。近年來,HMM在生物信息科學、故障診斷等領域也開始得到應用。該模型具有研究透徹、算法成熟、效率高、效果好、易于訓練的優點。隱馬爾可夫模型作為一種統計分析模型,用于分析由馬爾科夫過程產生的序列,并且序列中又引入了一個隱含狀態,是一個雙重隨機過程。一般的講,隱馬爾可夫模型可以用五個元素來描述,包括2種狀態變量(隱狀態和可觀察狀態)和3個概率矩陣。圖2為一個HMM模型的實例。圖中的每個節點代表一個隨機變量,隨機變量s(t)是在時間t的隱狀態,在圖2的模型中s(t)∈{s1,s2,s3}隨機變量o(t)是在時間t的可觀察狀態,在圖2的模型中o(t)∈{o1,o2,o3,o4}。此外,正如圖2的箭頭所示,隱馬爾可夫模型仍然包含2類條件概率:

圖2 隱馬爾科夫模型實例Figure 2. Example of hidden Markov model

表1 用戶行為與數值的映射關系Table 1. Map between user behavior and value

所有變量的聯合概率分布,可以簡化為:

引入符號λ={A,B,π}來描述隱馬爾可夫模型,其中:隱狀態轉移概率矩陣A是一個N×N矩陣,且Aij=p(Sj∶t+1|Si∶t),1≤i,j,≤N;混雜矩陣B是一個N×M矩陣,且Bij=p(Oi∶t|Sj∶t),1≤i≤M,1≤j≤N;初始狀態概率矩陣π是一個1×N向量,且π=[p(s1),p (s2),…p(sN)](N是隱狀態數,M是觀察狀態數)。
隱馬爾可夫模型主要關注以下3個問題,這些問題同樣關乎到下文用戶行為習慣預測的實現。
(1)評估問題(evaluation):給定觀測序列(O1O2…Ot)和模型參數λ={A,B,π},怎樣有效計算這組觀測序列的概率p(O1O2…Ot|λ)。此問題通常通過利用前向算法(forward algorithm)實現,算法中引入迭代計算,降低了算法的復雜度。
(2)解碼問題(decode):給定觀測序列O1O2…Ot和模型參數λ={A,B,π},怎樣尋找最優的隱狀態序列:

此問題需要從所有可能的隱狀態s1∶t序列中,找到一個序列使得概率p(s1∶t|λ,o1∶t)取最大值。在這類問題通常利用維特比(Viterbi)算法來實現。
(3)學習問題(learning):充分利用所有已知的觀察序列O1O2…Ot,通過多次訓練,使得λ={A,B,π}能夠更好的數據集的特征:

解決此問題通常使用Baum-Welch算法。
4.1相似數據篩選
為了挖掘時間和用戶行為的關系,將單用戶每天的行為數據,轉化為一個向量Day。將用戶常見的行為映射為數值1至N(N≥1),比如1表示打開熱水器、2表示關閉煤氣灶等,見表1。以15min為粒度,將全天劃分為96個時隙。默認每個時隙k,單用戶只會發生一種行為,每個時隙k將對應一個數值x,組成一個96維的向量Day[k]=x。若15min內連續有2或以上的行為發生,則選擇出現頻次最高的動作x,作為時隙k的取值Day[k]=x。(此外,引入的數值0表示此15分鐘內用戶沒有任何行為)。96維的向量Day的格式如下:Day=(1,2,3,5,4,…,x,y…0,10,12),1≤x,y≤N。用戶行為可能隨著時間的變化而發生改變。比如暑假期間,小明行為習慣要明顯區別與上學期間。準確識別出用戶當前的行為模式,明確這種行為模式持續了多久,即包含用戶當前行為模式的數據集的時間窗的長度,是非常重要的。鑒于以上原因以及防止模型的過度擬合,在數據篩選時:(a)考慮到一周內不同天,用戶行為可能存在的差異,則區分用戶一周內每一天的數據;(b)識別包含當前行為模式的時間窗的長度,比如,今天是第i個周一Dayi,找到之前有幾個周一的用戶行為和今天相似。方法如下:通過余弦相似性計算Dayi和Dayi-1相似度σij。如果σij大于一個閾值Θ,窗的長度繼續加一;否則,將跳過Dayi-1,比較Dayi與Dayi-2的相似性σij。如果連續m天,σij均低于Θ,時間窗的長度將不再增加。篩選的數據集中僅包含σij高于閾值Θ的數據。

圖4 表征時間和用戶行為關系的HMM實例Figure 4. An HMM representing user behavior and their relationships with time slots of a day
4.2基于HMM的行為預測模型定義
借助HMM對單用戶的行為建模,發現用戶當前的行為模式,HMM模型λ={A,B,π}定義如下:(1)隱狀態:用戶的N種行為,以及表示用戶沒有任何行為的狀態“0”;(2)可觀測狀態:用戶每天的96個時隙;(3)初始狀態概率矩陣π:每種用戶行為發生的概率。借助篩選的數據集,計算每種動作x發生的概率p(x),x∈[1,N];(4)轉移矩陣A:不同用戶行為間轉移的概率,即已知狀態i(打開洗衣機),狀態j(打開掃地機器人)發生的概率aij=p(Sj∶t+1|Si∶t),1≤i,j,≤N;(5)混雜矩陣B:已知用戶行為j已經發生,用戶處于特定時隙i的概率bij=p(Oi∶t|Sj∶t),1≤i≤96,1≤j≤N。圖4為用于行為預測的HMM實例。模型中包含包含5個時隙,并且隱狀態有4種用戶行為為例。
4.3用戶行為預測
預測d天用戶在每個時隙可能的行為時,首先要利用用戶的d-1天的歷史數據,篩選出相似數據,利用它們更新模型λ={A,B,π}。通過模型λ={A,B,π}表征當前用戶的行為模式。基于此模型,可以展開未來一天的各個時隙的用戶行為預測。結合HMM模型的原理,預測的本質是:已知一個HMM模型λ={A,B,π},找到特定時隙k(觀察狀態)最有可能的用戶行為i(隱狀態)。這是一個HMM的解碼問題(decode)。比如,今天是2015年11月15日星期日,想預知用戶明天的6∶00-7∶00的日常行為。利用維特比算法,結合反映用戶當前行為特征的周一的馬爾科夫模型λ={A,B,π},識別滿足6∶00-7∶00這個時間段,概率最高的一組隱狀態序列(用戶行為序列)。這組用戶行為序列,將是用戶行為預測的結果,此結果將為智能家居中家電設備的控制找到依據。實際應用中,可以為家庭中的多用戶分別建模,為多用戶的日常生活預測提供了可能性,解決了多人的室內環境中建模和預測的局限性。
在現有的智能家居體系下,本文提出了隱馬爾可夫模型為基礎的用戶行為預測的方法。為了保證模型的準確性和魯棒性,本文利用余弦相似性對歷史數據進行數據預處理;隨后利用隱馬爾可夫模型挖掘用戶行為的時域關系,基于此,提供了用戶行為預測的方法。此方法可以對家庭中的多用戶分別建模和預測,解決了多人在室內環境中建模和預測的局限性;本方法無需復雜的模型訓練,算法復雜度低。為推進家居生活的智能化具有一定的理論價值和現實意義。將模型應用到實際的智能家居中,對其穩定性和可行性進行評估是我們后續的研究工作。
參考文獻
[1]鐘依平.智能家居借勢提速發展[N].中國建設報,2013.
[2]孔英會.智能家居中用戶行為模式挖掘及控制策略研究[J].電視技術,2013,37(24).
[3]牛邵峰.一種基于云端數據倉庫的智能家居用戶行為模式研究[D].北京郵電大學,2013.
[4] Fatima I. A unified framework for activity recognition-based behavior analysis and action prediction in smart homes[J].Sensors, 2013, 13(02): 2682-2699.
[5]李勇,桑艷艷.網絡文本數據分類技術與實現算法[J].情報學報, 2002 (01):21-23.
[6] Chiang Y T, Hsu J Y, Lu C H, et al. Interaction models for multiple-resident activity recognition in a smart. home[C]// Intelligent Robots and Systems (IROS), 2010 IEEE/RSJ International Conference on. IEEE, 2010: 3753-3758.
中圖分類號:TP39
文獻標識碼:A