劉春陽(yáng),申 瑩,趙永翼
(沈陽(yáng)師范大學(xué),沈陽(yáng) 110034)
在最近幾年,隨著互聯(lián)網(wǎng)在各個(gè)領(lǐng)域的發(fā)展,將人類帶入了快速網(wǎng)絡(luò)經(jīng)濟(jì)時(shí)代,互聯(lián)網(wǎng)+在各個(gè)領(lǐng)域的應(yīng)用表現(xiàn)出很大優(yōu)勢(shì),大數(shù)據(jù)在應(yīng)用中有著很大的優(yōu)勢(shì),會(huì)帶給人類在網(wǎng)絡(luò)社會(huì)飛速的發(fā)展,但也帶來(lái)了很多問(wèn)題,比如“信息過(guò)載”的問(wèn)題,所以用戶不得不從浩如煙海的信息海洋獲取真正需求的信息。推薦系統(tǒng)能夠成為緩解“信息過(guò)載”最有效的方法之一,已經(jīng)應(yīng)用到電子商務(wù),電影,視頻等很多領(lǐng)域。并取得了很大的進(jìn)步。在個(gè)領(lǐng)域也有了一定的成果。我們利用協(xié)同過(guò)濾的方式的矩陣分解對(duì)用戶構(gòu)建喜好矩陣。得到隱性向量,組成推薦模型,其研究具有很大的學(xué)術(shù)價(jià)值以及商業(yè)應(yīng)用價(jià)值,目前最經(jīng)典的是協(xié)同過(guò)濾算法,同時(shí)也是應(yīng)用最廣泛的算法。
玻爾茲曼機(jī)是一種神經(jīng)網(wǎng)絡(luò),由Hinton和Ackley兩位學(xué)者作為研究學(xué)者在不同的領(lǐng)域不同的目的同時(shí)提出的BM學(xué)習(xí)機(jī),通過(guò)從訓(xùn)練樣本得到的隱層神經(jīng)元狀態(tài)上執(zhí)行馬爾可夫鏈抽樣過(guò)程,隱藏的神經(jīng)元和可見(jiàn)的神經(jīng)元是組成BM的主要神經(jīng)元。BM有很強(qiáng)的學(xué)習(xí)能力主要是能夠?qū)W習(xí)數(shù)據(jù)規(guī)則,且較為復(fù)雜的。但是,受限玻爾茲曼機(jī)的訓(xùn)練時(shí)間很長(zhǎng)。因?yàn)殡[藏層神經(jīng)元獨(dú)立于給定的訓(xùn)練樣本并且神經(jīng)元之間不連接。這也讓從屬數(shù)據(jù)的期望值變得容易。其狀態(tài)為1-2,狀態(tài)1表示抑制下的神經(jīng)元,狀態(tài)2表示激活下的神經(jīng)元。因此提出了一種受限玻爾茲曼機(jī)的結(jié)構(gòu)。如圖1所示,包括可見(jiàn)層v和隱藏層h,兩層節(jié)點(diǎn)上下都是連接的,而左右相互之間沒(méi)有連接。

圖1 受限玻爾茲曼機(jī)示意圖
我們通過(guò)學(xué)習(xí)深度學(xué)習(xí)學(xué)習(xí)到使用者表示的隱性和向量的低維矢量來(lái)實(shí)現(xiàn)建議的協(xié)同過(guò)濾算法經(jīng)常面臨可伸縮性不足的問(wèn)題。但他們中的大多數(shù)現(xiàn)在推薦協(xié)同過(guò)濾應(yīng)用程序。
我們利用使用者反饋給我們的隱式數(shù)據(jù)經(jīng)過(guò)深度學(xué)習(xí)讓模型輸出等于輸入。但要保證得到的隱式數(shù)據(jù)維度要一致,提取數(shù)據(jù)進(jìn)行神經(jīng)協(xié)同過(guò)濾,將隱性數(shù)據(jù)串聯(lián)到一起組成使用者與項(xiàng)目關(guān)系。提高準(zhǔn)確性,利用輔助信息,可以將推薦信息推薦給使用者,使用戶能夠在海量的數(shù)據(jù)中找到準(zhǔn)確的信息。
基于受限玻爾茲曼機(jī)的協(xié)同過(guò)濾方法
受限玻爾茲曼機(jī)是玻爾茲曼機(jī)的一種特殊拓?fù)浣Y(jié)構(gòu),基于RBM的協(xié)同過(guò)濾。推薦系統(tǒng)傳統(tǒng)的定義可以理解為采集用戶信息,結(jié)合推薦模型幫助用戶選擇商品或者提供建議的過(guò)程。這就需要數(shù)據(jù)得收集,預(yù)處理,推薦算法和產(chǎn)生推薦3部分組成。例如一個(gè)典型的電影推薦系統(tǒng)一般包括含有N個(gè)用戶的用戶集合U={u1,u2,u3,…,uN}和含有M個(gè)項(xiàng)目的項(xiàng)目集合I={i1,i2,i3,…,iM},使用者在對(duì)I評(píng)價(jià)時(shí)只有一小部分,這一小部分的會(huì)表示成RNM,得到的數(shù)據(jù)稀疏,所以推薦的信息不夠準(zhǔn)確,因此,我們采用一個(gè)0-1向量r表示電影是否被評(píng)過(guò)分,通過(guò)加入這種輔助數(shù)據(jù)得到了一種條件RBM。模型的結(jié)構(gòu)如圖2所示。

圖2 基于RBM的協(xié)同過(guò)濾方法的模型結(jié)構(gòu)
依據(jù)RBM模型可見(jiàn)單元和隱層單元之間的獨(dú)立性質(zhì),當(dāng)給定可見(jiàn)狀態(tài)時(shí),可見(jiàn)層單元A和隱層單元C的條件概率可以表示為:

式中,K和F表示用戶和隱變量的數(shù)量。
本文對(duì)深度學(xué)習(xí)應(yīng)用于推薦系統(tǒng)分析與研究,可以知道深度學(xué)習(xí)不僅可以應(yīng)用到推薦系統(tǒng)中,還可以運(yùn)用到各個(gè)領(lǐng)域,本文將深度學(xué)習(xí)技術(shù)融入推薦系統(tǒng)中,討論了推薦算法的分類及算法的思想,并著重分析了協(xié)同過(guò)濾算法,闡釋推薦算法所存在的問(wèn)題,試驗(yàn)方法,和評(píng)測(cè)指標(biāo),通過(guò)對(duì)協(xié)同過(guò)濾算法的研究,可以反映出不同的用戶不同的偏好度,同時(shí)也可以提高推薦的精確度。現(xiàn)在,在很多研究中使用深度學(xué)習(xí)來(lái)解決問(wèn)題,盡管目前信任是個(gè)問(wèn)題,但它終將被解決。我相信在未來(lái)深度學(xué)習(xí)會(huì)成為一項(xiàng)很重要的技術(shù)手段。