摘要:隨著WWW的迅速擴張和網絡用戶的急劇增加,準確預測Web用戶的訪問行為對減少用戶的感知延時、提高網絡服務質量具有重要作用。文章分析了傳統Markov模型的優缺點,針對低階Markov模型準確率不高,而高階Markov模型狀態空間復雜度較高的缺點,提出了一種新的K步Markov模型(K-Step Markov Model,K-SMM),并引入了偏愛度的概念,建立了基于偏愛度的多步Markov網頁預測模型(Preferred K-Step Markov Model,PKSMM)。實驗結果表明,該模型可以獲得更高的預測準確率與覆蓋率,并能有效地降低存儲復雜度。
關鍵詞:數據挖掘;Markov模型;偏愛度;瀏覽路徑預測;空間復雜度