王瑞晗,高建瓴,陳 語
(1.貴州大學(xué) 大數(shù)據(jù)與信息工程學(xué)院,貴州 貴陽 550025;2.貴州大學(xué) 檔案館,貴州 貴陽 550025)
由于云計算模式能夠?qū)Ψ稚⒌摹悩?gòu)系統(tǒng)中的檔案數(shù)字資源、計算資源進行有效集成和共享,開發(fā)新型的存儲與計算共享架構(gòu),能夠建立起區(qū)域內(nèi)聯(lián)動的運行機制[1]。所以目前已經(jīng)有越來越多的檔案館將其業(yè)務(wù)運行在云平臺上,不僅可以節(jié)省資金,減少工作量,并且能夠更好地共享資源。作為負(fù)責(zé)為業(yè)務(wù)系統(tǒng)提供計算和存儲資源且保證業(yè)務(wù)系統(tǒng)能夠正常運行的虛擬機是云平臺的基礎(chǔ)是其核心部件[2],所以為了預(yù)警保障云平臺的穩(wěn)定運行,對虛擬機異常進行檢測是其中重要的措施。由于傳統(tǒng)SVM不能處理海量數(shù)據(jù),且不具備在線學(xué)習(xí)能力,不能進行實時分類,所以不能滿足云環(huán)境下的異常檢測要求,所以文章使用具備在線學(xué)習(xí)能力且需求更少內(nèi)存能夠處理海量數(shù)據(jù)的LASVM算法來進行異常檢測。
作為一種流行的機器學(xué)習(xí)算法,支持向量機[3](Support Vector Machines,SVM)在模式識別、回歸分析、函數(shù)估計、時間序列預(yù)測等領(lǐng)域都得到了長足的發(fā)展[4],它是以統(tǒng)計學(xué)習(xí)理論[5-6]VC維理論和結(jié)構(gòu)風(fēng)險最小化原理為基礎(chǔ)的。
支持向量機是一種二類分類模型,它是在感知器(Perceptron)基礎(chǔ)上發(fā)展而來,可以表述為以特征空間上的間隔最大的線性分類器為其基本模型,以最大化間隔為其目的,最終轉(zhuǎn)化為一個凸二次規(guī)劃問題的求解[3]的機器學(xué)習(xí)方法。

圖1 超平面間隔示意……p>