999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于卷積神經(jīng)網(wǎng)絡(luò)的協(xié)同過(guò)濾算法在影片推薦中的應(yīng)用研究

2022-08-31 22:53:51張海飛崔軍納葛金鼎
電腦知識(shí)與技術(shù) 2022年17期

張海飛 崔軍納 葛金鼎

摘要:文章運(yùn)用深度學(xué)習(xí)算法中的卷積神經(jīng)網(wǎng)絡(luò),利用MovieLens數(shù)據(jù)集,實(shí)現(xiàn)了基于協(xié)同過(guò)濾的影片推薦系統(tǒng)。系統(tǒng)運(yùn)行表明,該方法實(shí)現(xiàn)的推薦系統(tǒng)可以有效緩解“冷啟動(dòng)”問(wèn)題。

關(guān)鍵詞:影片推薦;協(xié)同過(guò)濾;卷積神經(jīng)網(wǎng)絡(luò)

中圖分類(lèi)號(hào):TP18? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2022)17-0073-05

1簡(jiǎn)介

推薦系統(tǒng)[1]已經(jīng)成功應(yīng)用到商品推薦中,并逐步滲透到了文化領(lǐng)域,豐富了人們的文化生活。在推薦系統(tǒng)還未萌發(fā)的時(shí)候,用戶使用傳統(tǒng)的搜索引擎,在獲取數(shù)據(jù)時(shí),如果需求很明確,比如需要找一個(gè)電影,但是用戶只知道這個(gè)電影的名稱或?qū)а莸刃畔ⅲ阉鞒龅男畔⒑芷妗鹘y(tǒng)的搜索引擎的弊端暴露了:當(dāng)用戶自己也不清楚自己需要尋找的信息的具體內(nèi)容,搜索得到的結(jié)果可能和用戶想要的結(jié)果相差很大,用戶獲得的體驗(yàn)較差[2]。在推薦系統(tǒng)誕生之后,系統(tǒng)開(kāi)發(fā)人員對(duì)獲取的數(shù)據(jù)進(jìn)行研究,這些數(shù)據(jù)的共同點(diǎn)指向特定的一類(lèi)群體,數(shù)據(jù)的不同點(diǎn)指向每一個(gè)用戶,通過(guò)合適的推薦算法,生成相應(yīng)的推薦列表,會(huì)更加契合用戶的需求。本文運(yùn)用卷積神經(jīng)網(wǎng)絡(luò),基于MovieLens數(shù)據(jù)集,設(shè)計(jì)并實(shí)現(xiàn)了基于協(xié)同過(guò)濾的影片推薦系統(tǒng),以滿足人民日益增長(zhǎng)的文化娛樂(lè)需求。

2相關(guān)工作

協(xié)同過(guò)濾(Collaborative Filtering,CF)[3]和推薦系統(tǒng)的概念最早在20世紀(jì)90年代被提出,國(guó)內(nèi)外的推薦系統(tǒng)迅速發(fā)張,但是這時(shí)候的系統(tǒng)并不具備為用戶生成推薦列表的能力,必須通過(guò)復(fù)雜的數(shù)據(jù)庫(kù)查詢語(yǔ)句構(gòu)造推薦列表推送給用戶。不久,第一個(gè)能夠完成自主推薦的新聞系統(tǒng)GroupLens[4]誕生了。1997年,推薦系統(tǒng)(Recommender System,RS)一詞被Resnick等人提及。自此,推薦系統(tǒng)逐漸走入正軌,被世人廣泛應(yīng)用,也逐步成為較為熱門(mén)的研究領(lǐng)域,各式各樣的推薦算法,不同分類(lèi)的模型,陸續(xù)來(lái)到了人們的視野中。經(jīng)常沉淀,目前主流的算法涉及以下各個(gè)方面:

基于內(nèi)容的推薦算法[5]的本質(zhì)是提取用戶的歷史記錄,依據(jù)用戶頻繁瀏覽過(guò)并且喜歡的內(nèi)容,生成推薦列表,向用戶推薦與商品信息較為相似的內(nèi)容[6]。

協(xié)同過(guò)濾算法的基本方式就是對(duì)于數(shù)據(jù)的挖掘、對(duì)歷史數(shù)據(jù)的分析和用戶的偏好的分析得出的結(jié)論,找尋到用戶的存在和相同興趣的用戶群,然后根據(jù)預(yù)測(cè)用戶可能存在的喜歡的電影序列進(jìn)行推送,以和用戶同類(lèi)型的受眾群里喜歡的電影推薦列表為基礎(chǔ)進(jìn)行的推薦模式,因而這個(gè)算法存在的冷啟動(dòng)[7-8]問(wèn)題,不能夠?yàn)樾碌挠脩籼峁┯行У耐扑]信息。而基于項(xiàng)目的協(xié)同過(guò)濾算法是在設(shè)計(jì)和用戶的喜好推薦上進(jìn)行類(lèi)似商品的推薦模式,根據(jù)其計(jì)算的本質(zhì)進(jìn)行相關(guān)相似度的推薦方法,生成相似度較高的矩陣方式,來(lái)為廣大的用戶群體推薦電影。鄧明通等[9]通過(guò)對(duì)用戶偏好多樣性的計(jì)算來(lái)實(shí)現(xiàn)推薦,有效地緩解了冷啟動(dòng)問(wèn)題,提高了推薦信息的多樣性。

3相關(guān)算法和模型

3.1協(xié)同過(guò)濾算法

協(xié)同過(guò)濾算法是推薦系統(tǒng)常用的算法。自提出以來(lái)引起了各大學(xué)術(shù)領(lǐng)域包括行為科學(xué)、管理科學(xué)和計(jì)算數(shù)學(xué)等領(lǐng)域的廣泛關(guān)注,越來(lái)越多的專(zhuān)家學(xué)者參與到算法的研究[10]中,同時(shí)大型的互聯(lián)網(wǎng)網(wǎng)站如:YouTube、Facebook 等公司都使用深度學(xué)習(xí)[11]對(duì)協(xié)同過(guò)濾算法進(jìn)行相關(guān)的設(shè)計(jì)研究,進(jìn)行成功的引用,豐富自己的信息網(wǎng)站。傳統(tǒng)的協(xié)同過(guò)濾算法可以細(xì)分為以下兩個(gè)方面:

1)基于用戶的協(xié)同過(guò)濾算法

這個(gè)算法的原理是先確定所有的用戶群體,再根據(jù)目標(biāo)群體,從所有的用戶群體中尋找與之相似的用戶群體,根據(jù)用戶群體里的喜好項(xiàng)目逐一遍歷展示給目標(biāo)用戶。要實(shí)現(xiàn)推薦主要通過(guò)這個(gè)算法的以下三個(gè)步驟:

①通過(guò)收集的用戶信息的分析,生成一個(gè)評(píng)分矩陣,其中包括用戶ID、項(xiàng)目ID、評(píng)分這三個(gè)部門(mén)。

②利用評(píng)分矩陣,計(jì)算用戶的相似性矩陣。

③為目標(biāo)用戶推薦項(xiàng)目,主要是依據(jù)與目標(biāo)用戶最相近的用戶群所喜歡的項(xiàng)目。

比如在一個(gè)電影推薦系統(tǒng)當(dāng)中,通過(guò)對(duì)用戶的歷史記錄來(lái)分析數(shù)據(jù)樣本進(jìn)行推薦,用戶a對(duì)ABC電影給予了高分平均,用戶b對(duì)CDE給予了高分評(píng)價(jià),用戶c對(duì)ACF給予了高分評(píng)價(jià),電影推薦系統(tǒng)能根據(jù)用戶對(duì)于數(shù)據(jù)的相似性來(lái)判斷分析,得出了用戶a與用戶c的性格喜愛(ài)方式類(lèi)型,最終給用戶a推薦電影F。

2)基于項(xiàng)目的協(xié)同過(guò)濾算法

這個(gè)算法的原理在用戶群體中尋找目標(biāo)用戶消費(fèi)過(guò)的產(chǎn)品,將這些產(chǎn)品遍歷給用戶群體。基于項(xiàng)目的協(xié)同過(guò)濾算法分以下三步進(jìn)行推薦:

①根據(jù)整理的信息,生成包含用戶ID、項(xiàng)目ID和評(píng)分三部分的特征矩陣。

②根據(jù)包含這三部分信息的特征矩陣,結(jié)合算法生成相似性矩陣。

③逐一遍歷相似性矩陣,根據(jù)需求,適當(dāng)?shù)倪x擇推薦給用戶的內(nèi)容數(shù)量。

再比如,在電影推薦系統(tǒng)當(dāng)中,通過(guò)對(duì)數(shù)據(jù)樣本的歷史記錄的分析得知a、b、c三個(gè)用戶都對(duì)A電影打出來(lái)高評(píng)價(jià),用戶a、b同時(shí)對(duì)B電影打出來(lái)高評(píng)價(jià),用戶a對(duì)C電影打出了高評(píng)價(jià),用戶b對(duì)D電影有高評(píng)價(jià),因此電影AB的相似度就很高,用戶c喜歡A電影,因此根據(jù)系統(tǒng)的判斷把B電影推薦給用戶c。

上述的假設(shè)過(guò)程就是常見(jiàn)的協(xié)同過(guò)濾算法的級(jí)別推薦方式,通過(guò)這一方式能夠較快地向用戶推薦相關(guān)電影信息,但是協(xié)同過(guò)濾算法存在兩個(gè)缺點(diǎn),對(duì)這個(gè)算法的改進(jìn)目前仍然處于探索階段。

1)存在擴(kuò)展性問(wèn)題,隨著電影數(shù)量和用戶數(shù)量的增加,一定會(huì)影響推薦算法的效率,對(duì)于實(shí)時(shí)性效率比較高的商務(wù)網(wǎng)站,基于協(xié)同過(guò)濾的推薦系統(tǒng)存在嚴(yán)重的擴(kuò)展性問(wèn)題。

2)存在冷啟動(dòng)問(wèn)題,如果有新用戶注冊(cè),沒(méi)有相應(yīng)的歷史數(shù)據(jù)對(duì)其進(jìn)行分析,導(dǎo)致模型無(wú)法找到相似的用戶或商品,也就不能推薦適合的內(nèi)容,其中冷啟動(dòng)問(wèn)題表示的是在沒(méi)有大量數(shù)據(jù)的情況下,如何進(jìn)行有效的推薦。

3.2卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(CNN)[12]是一種包含了卷積計(jì)算的方法,是深度學(xué)習(xí)算法技術(shù)的代表之一,卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)用方式,可以進(jìn)行監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)進(jìn)行構(gòu)建結(jié)構(gòu),其核心的五層結(jié)構(gòu)為數(shù)據(jù)輸入層、卷積計(jì)算層、激勵(lì)層、池化層和全連接層。

數(shù)據(jù)輸入層主要是對(duì)原始數(shù)據(jù)進(jìn)行處理操作,對(duì)無(wú)用的信息進(jìn)行過(guò)濾,有效的信息進(jìn)行有序的排布,對(duì)數(shù)據(jù)進(jìn)行去均值、歸一化和PAC降維等處理,通過(guò)對(duì)數(shù)據(jù)的處理,可以更好地劃分層次結(jié)構(gòu)。

卷積計(jì)算層是卷積神經(jīng)網(wǎng)絡(luò)最為重要的部分,是對(duì)前面獲取到的數(shù)據(jù)進(jìn)行計(jì)算處理,拆解的過(guò)程,其中較為關(guān)鍵的操作,是對(duì)局部關(guān)聯(lián)和窗口滑動(dòng),對(duì)其中的深度、步長(zhǎng)和填充值進(jìn)行相應(yīng)的獲取,通過(guò)對(duì)矩陣的映射計(jì)算,得出相應(yīng)的數(shù)值,同時(shí)卷積計(jì)算層還有很高的共享性,能夠把計(jì)算出的相關(guān)數(shù)值,同傳分析,分享到各層當(dāng)中,同時(shí)計(jì)算用戶和電影的信息數(shù)據(jù),計(jì)算矩陣向量可以用來(lái)之后的推薦。

激勵(lì)層主要的功能是把卷積計(jì)算層計(jì)算出的相關(guān)數(shù)據(jù),進(jìn)行結(jié)構(gòu)的非線性映射,其主要的特點(diǎn)是能快速地對(duì)相關(guān)數(shù)據(jù)進(jìn)行展現(xiàn),梯度求值較為簡(jiǎn)單,但其本身數(shù)據(jù)較為脆弱易被更改,不利于長(zhǎng)期保存。

池化層就是相對(duì)于輸入層存在的層次關(guān)系,因?yàn)檩斎雽虞斎氲臄?shù)據(jù)較為龐大,存儲(chǔ)較為復(fù)雜且占用大量的空間,因此設(shè)計(jì)的池化層就是用來(lái)解決這一問(wèn)題,池化層主要的功能就是進(jìn)行數(shù)據(jù)圖片的壓縮,壓縮相關(guān)數(shù)據(jù)便于存儲(chǔ)。

全連接層其主要功能是在層次間的連接當(dāng)中,通過(guò)全連接層進(jìn)行數(shù)據(jù)的快速傳輸,方便進(jìn)行數(shù)據(jù)的傳遞,位于卷積神經(jīng)網(wǎng)絡(luò)隱含層的最后部分,并只向其他全連接層傳遞信號(hào)。

通過(guò)輸入層進(jìn)行數(shù)據(jù)的讀取,把獲取的數(shù)據(jù)通過(guò)輸入層錄入,再通過(guò)卷積計(jì)算層進(jìn)行數(shù)據(jù)的計(jì)算,計(jì)算出相應(yīng)的矩陣值,通過(guò)激勵(lì)層實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)的非線性映射實(shí)現(xiàn)圖層,再通過(guò)池化層把龐大的數(shù)據(jù)進(jìn)行壓縮,實(shí)現(xiàn)數(shù)據(jù)的推薦,上述的層次結(jié)構(gòu)都是通過(guò)全連接層實(shí)現(xiàn)的,這便是完整的卷積神經(jīng)網(wǎng)絡(luò)的基本實(shí)現(xiàn)方式。

4 基于卷積神經(jīng)網(wǎng)絡(luò)協(xié)同過(guò)濾的影片推薦

4.1數(shù)據(jù)處理

本項(xiàng)目使用MoviesLens數(shù)據(jù)集[13],該數(shù)據(jù)集存儲(chǔ)了電影評(píng)分,包含了來(lái)自6000名用戶對(duì)4000部電影的100萬(wàn)條評(píng)分?jǐn)?shù)據(jù)。

用戶數(shù)據(jù)由五部分組成,主要是用戶ID、性別、年齡、職業(yè)ID和郵編。從圖1可以看出,郵編是地區(qū)的郵政編碼,不是用戶特征字段,不需要使用。用戶數(shù)據(jù)user.dat文件中以“::”連接每個(gè)數(shù)據(jù)。收集的數(shù)據(jù)包含各個(gè)年齡段中各行各業(yè)的人們,年齡段主要分為年齡在18歲以下、年齡在18~24歲之間、年齡在25~34歲之間、年齡在35~44歲之間、年齡在45~49歲之間、年齡在50~55歲之間、年齡在56歲以上,涉及的行業(yè)包含學(xué)術(shù)/教育工作者、藝術(shù)家、文員/行政等二十個(gè)方面的。用戶數(shù)據(jù)預(yù)處理前的數(shù)據(jù)格式如圖1所示。

影片數(shù)據(jù)集中收集到的電影可以分為十六個(gè)類(lèi)別,由動(dòng)作片、冒險(xiǎn)片、動(dòng)畫(huà)片、兒童片等組成,由電影ID、電影名稱和電影風(fēng)格三個(gè)字段組成,數(shù)據(jù)之間的連接方式依然通過(guò)“::”連接,影片數(shù)據(jù)預(yù)處理前數(shù)據(jù)如圖2所示。

評(píng)分?jǐn)?shù)據(jù)由用戶ID、電影ID、評(píng)分、時(shí)間戳四部分組成,評(píng)分?jǐn)?shù)據(jù)中數(shù)據(jù)的排序以用戶ID為主,電影ID為輔進(jìn)行排序。評(píng)分?jǐn)?shù)據(jù)預(yù)處理后的數(shù)據(jù)如圖3所示。

因?yàn)閿?shù)據(jù)存在差異性,要根據(jù)數(shù)據(jù)的特點(diǎn)進(jìn)行不同的處理:用戶ID、職業(yè)ID和電影ID是不用改變的;性別字段:需要數(shù)據(jù)庫(kù)中的F和M字符轉(zhuǎn)換成數(shù)值0和1;年齡字段可以將年齡分為七大類(lèi),將七大類(lèi)分別轉(zhuǎn)成7個(gè)連續(xù)0—6的數(shù)值;電影分類(lèi)字段,需要轉(zhuǎn)換成數(shù)字,首先組成一個(gè)由電影分類(lèi)和唯一標(biāo)識(shí)這個(gè)電影分類(lèi)的數(shù)字的字典,將每部電影的分類(lèi)字段轉(zhuǎn)換成相應(yīng)的列表,因?yàn)槊坎侩娪翱赡懿恢挂粋€(gè)類(lèi)別。電影的名稱字段與電影類(lèi)別做相似處理。電影名稱和電影類(lèi)別的長(zhǎng)度需要統(tǒng)一,為了方便處理,長(zhǎng)度不足的部分用‘對(duì)應(yīng)的數(shù)字進(jìn)行填充。預(yù)處理完成之后的用戶數(shù)據(jù)、電影數(shù)據(jù)、評(píng)分?jǐn)?shù)據(jù)如圖4所示。

3.2 實(shí)驗(yàn)準(zhǔn)備

實(shí)驗(yàn)的目的是通過(guò)計(jì)算訓(xùn)練出用戶特征值和電影特征值,進(jìn)行推薦處理分析使用,分析數(shù)據(jù)集中的相關(guān)字典,發(fā)現(xiàn)其中一些字段信息較為特殊,對(duì)這些不同于其他字段,且不方便存儲(chǔ)的信息通過(guò)one hot編碼方式進(jìn)行轉(zhuǎn)化存儲(chǔ),如用戶ID、電影ID等字段,這種編碼表示的是由0和1組成的數(shù)據(jù)集合。在存儲(chǔ)數(shù)據(jù)時(shí),時(shí)常遇到稀疏性問(wèn)題,輸入的時(shí)間較長(zhǎng),維度也急劇膨脹,這是急需解決的問(wèn)題,因此通過(guò)相關(guān)數(shù)據(jù)的預(yù)處理方式,將這些字段轉(zhuǎn)化成數(shù)字,用這些數(shù)字當(dāng)作嵌入矩陣的索引,網(wǎng)絡(luò)的第一層使用了嵌入層,維度是(N,32)和(N,16)。

電影類(lèi)型的處理要多一步,有時(shí)一部電影有多部電影類(lèi)型,這樣從嵌入矩陣索引出來(lái)是一個(gè)(n,32)的矩陣,將這個(gè)矩陣求和,變成(1,32)的向量。從嵌入層索引特征以后,將每個(gè)特征值通過(guò)全連接層傳入,再將輸出傳入到全連接層,最終得到(1,200)的用戶特征和電影特征兩個(gè)特征向量。對(duì)于電影名稱的處理比較特殊,從嵌入矩陣中得到電影名對(duì)應(yīng)的各個(gè)單詞的嵌入向量,名稱長(zhǎng)度有一定限制,這里過(guò)濾器大小使用時(shí),就選擇2、3、4、5長(zhǎng)度。然后對(duì)文本嵌入層使用滑動(dòng)2、3、4、5個(gè)單詞尺寸的卷積核做卷積和最大池化。最后進(jìn)行Dropout 操作,全連接層輸出。

3.3 實(shí)驗(yàn)環(huán)境

1)硬件設(shè)備

處理器:Intel(R) Core(TM)i7 -8750H CPU @ 2.20GHz 2.21 GHz。

內(nèi)存:8GB。

2)軟件環(huán)境

操作系統(tǒng):Microsoft Windows10 操作系統(tǒng)(64位)。

開(kāi)發(fā)語(yǔ)言:Python 3.7。

編碼工具:JetBrainsPyCharm 2018.1.3。

軟件工具:Pandas、Numpy、Tensorflow、Collections、Os、Pickle、Re、Zipfile、Hashlib、Matplotlib、Time、Datetime,其中安裝Numpy版本過(guò)高的話會(huì)報(bào)錯(cuò),所以需要安裝1.16.0版本的numpy。

實(shí)驗(yàn)采用了協(xié)同過(guò)濾算法進(jìn)行的相關(guān)設(shè)計(jì),從不同方面進(jìn)行相關(guān)數(shù)據(jù)的讀取、呈現(xiàn)和分析,能夠做到的就是一個(gè)根據(jù)不同設(shè)計(jì)模式進(jìn)行的算法驗(yàn)證操作。

3.4訓(xùn)練參數(shù)設(shè)置

為了保證算法的精確性,采用了大量的訓(xùn)練數(shù)據(jù)進(jìn)行長(zhǎng)時(shí)間的計(jì)算,以折現(xiàn)圖的方式進(jìn)行展現(xiàn)。在每個(gè)圖中,Train_loss表示訓(xùn)練誤差,即訓(xùn)練集在模型中預(yù)測(cè)結(jié)果與真實(shí)結(jié)果的差值,Test_loss 表示驗(yàn)證集上的損失。從折線圖變化的趨勢(shì)可以看出,Train_loss折線圖和Test_loss折線圖都呈下降趨勢(shì),表明設(shè)計(jì)的網(wǎng)絡(luò)信息還在不斷學(xué)習(xí),即網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)得當(dāng),訓(xùn)練超參數(shù)設(shè)置得當(dāng)。

對(duì)于卷積神經(jīng)網(wǎng)絡(luò)的推薦結(jié)果影響最大的三個(gè)參數(shù)為Batch_size、學(xué)習(xí)率和迭代次數(shù)。Batch_size就是每批處理的樣本的個(gè)數(shù),即一次訓(xùn)練所選取的樣本數(shù)。學(xué)習(xí)率就是機(jī)器學(xué)習(xí)的速率,開(kāi)始時(shí)需要較高的學(xué)習(xí)率進(jìn)行快速學(xué)習(xí),運(yùn)行一段數(shù)據(jù)學(xué)習(xí)率不斷衰減,達(dá)到穩(wěn)定。 迭代次數(shù),每一次迭代都會(huì)更新一次網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)。Dropout是為了應(yīng)對(duì)神經(jīng)網(wǎng)絡(luò)很容易過(guò)擬合的問(wèn)題。本次設(shè)置了三種不同的參數(shù),學(xué)習(xí)率和Dropout的值始終為0.0001和0.5,而B(niǎo)atch_size和迭代次數(shù)設(shè)置為三組不同的數(shù)值,根據(jù)“一個(gè)參數(shù)不變,改變另一個(gè)參數(shù)”的原則,選擇了256和5、64和5、64和20三組,并且對(duì)于Test_loss和Train_loss的值進(jìn)行統(tǒng)計(jì),結(jié)果如圖5、圖6、圖7所示。

圖5是在迭代次數(shù)為5的情況下,將Batch_size設(shè)置為256時(shí),從訓(xùn)練缺損和測(cè)試缺損的統(tǒng)計(jì)分布來(lái)看,訓(xùn)練缺損的值在0.966和12.162之間,測(cè)試缺損的值在 0.722和1.418之間,可以看出來(lái)波動(dòng)比較大,不是很穩(wěn)定。

圖6與圖5相比,樣本數(shù)量不變,但是樣本的迭代次數(shù)增加到20次,此時(shí)訓(xùn)練缺損值的范圍在0.899~7.984之間,測(cè)試缺損值在0.546~1.589之間,相比圖5,相對(duì)而言波動(dòng)收斂些,這就說(shuō)明,在batch_size的數(shù)值相同時(shí),增加迭代次數(shù),可以使訓(xùn)練和測(cè)試結(jié)果更加穩(wěn)定。

圖7與圖5的迭代次數(shù)一致,都為5,將Batch_size設(shè)置為64時(shí),對(duì)比圖5,訓(xùn)練缺損值范圍在0.823至13.101之間,測(cè)試缺損值范圍在0.232至1.712之間,忽略網(wǎng)絡(luò)開(kāi)始學(xué)習(xí)不穩(wěn)定的情況,說(shuō)明在一定范圍內(nèi),適當(dāng)降低Batch_size值,可以降低訓(xùn)練缺損。

圖8結(jié)合圖6和圖7的規(guī)律,將batch_size的值設(shè)置為64,迭代次數(shù)設(shè)置為20,訓(xùn)練缺損值范圍在0.506至14.021之間,測(cè)試缺損值范圍在0.192至1.708之間,可以看出訓(xùn)練缺損和測(cè)試缺損的趨勢(shì)更為穩(wěn)定,因此本文認(rèn)為,當(dāng)batch_size 為確定值時(shí),增加迭代次數(shù)可以使訓(xùn)練和測(cè)試結(jié)果更加穩(wěn)定。

4 實(shí)驗(yàn)結(jié)果分析

推薦同類(lèi)型的電影根據(jù)在數(shù)據(jù)集中隨機(jī)選區(qū)的電影,計(jì)算電影特征向量與電影特征矩陣的余弦值進(jìn)行相似度的比較,計(jì)算較大的五個(gè)值,如圖9所示。

根據(jù)喜歡的電影推薦,隨機(jī)生成用戶特征,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)結(jié)合電影特征矩陣計(jì)算電影評(píng)分,進(jìn)行推薦評(píng)分最高的部分,這個(gè)數(shù)量是可以進(jìn)行修改的,在本項(xiàng)目中推薦的數(shù)量設(shè)置為5,如圖10所示。

根據(jù)看過(guò)此電影的人還喜歡哪些電影,在數(shù)據(jù)集中選取出的一個(gè)電影,然后根據(jù)排名選出有同樣喜好的用戶,提取這些用戶的特征向量,進(jìn)行算法的設(shè)計(jì)得出相應(yīng)的推薦,將每個(gè)人評(píng)分最高的電影選出,并分別進(jìn)行推薦,如圖11所示。

通過(guò)對(duì)IMDB數(shù)據(jù)集的獲取,對(duì)存在的相關(guān)用戶個(gè)性特征值和電影特征值進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)CNN的計(jì)算,通過(guò)上述的設(shè)計(jì)方法,進(jìn)行數(shù)據(jù)值的處理比對(duì),根據(jù)生產(chǎn)用戶的特征值矩陣和電影特征值矩陣進(jìn)行處理分析得出loss的數(shù)值,計(jì)算當(dāng)前看的電影特征向量與整個(gè)電影特征矩陣的余弦相似度,添加其中隨機(jī)生成的字段不同,使用用戶特征向量與電影特征矩陣計(jì)算所有電影的評(píng)分,獲取得出數(shù)較高的電影信息,進(jìn)行推薦,充分地結(jié)合CNN的設(shè)計(jì)思路,并通過(guò)協(xié)同過(guò)濾算法來(lái)解決用戶的冷啟動(dòng)問(wèn)題,計(jì)算新用戶的矩陣特征值,對(duì)數(shù)據(jù)集中的用戶數(shù)據(jù)進(jìn)行比對(duì),有相似用戶特征值信息的用戶,喜歡的電影類(lèi)型,進(jìn)行相同類(lèi)型的推薦,這樣可以稍微緩解用戶的冷啟動(dòng)問(wèn)題。

5結(jié)束語(yǔ)

本文利用卷積神經(jīng)網(wǎng)絡(luò)和協(xié)同過(guò)濾算法對(duì)電影數(shù)據(jù)分析,經(jīng)過(guò)大量的訓(xùn)練實(shí)驗(yàn)得出較優(yōu)的卷積參數(shù),通過(guò)協(xié)同過(guò)濾算法計(jì)算與其他用戶的相似度,實(shí)現(xiàn)了電影推薦系統(tǒng),設(shè)計(jì)的電影推薦系統(tǒng)結(jié)合算法維度進(jìn)行推薦,并實(shí)現(xiàn)較高的準(zhǔn)確度,緩解了推薦系統(tǒng)的“冷啟動(dòng)”問(wèn)題。

參考文獻(xiàn):

[1] Chen Y L,Cheng L C,Chuang C N.A group recommendation system with consideration of interactions among group members[J].Expert Systems With Applications,2008,34(3):2082-2090.

[2] 許海玲,吳瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009,20(2):350-362.

[3] 馬宏偉,張光衛(wèi),李鵬.協(xié)同過(guò)濾推薦算法綜述[J].小型微型計(jì)算機(jī)系統(tǒng),2009,30(7):1282-1288.

[4] Resnick P,Iacovou N,Suchak M,et al.GroupLens:an open architecture for collaborative filtering of netnews[C]//ACM Conference on Computer Supported Cooperative Work.ACM,1994:175-186.

[5] Tuzhilin A.Towards the next generation of recommendersystems[C]//Proceedings of the 2010 International Conference on E-Business Intelligence.Paris,F(xiàn)rance:Atlantis Press,2010.

[6] 陳思亦,何利力,鄭軍紅.結(jié)合商圈位置區(qū)域模型的商品推薦算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(8):136-141.

[7] 孫冬婷,何濤,張福海.推薦系統(tǒng)中的冷啟動(dòng)問(wèn)題研究綜述[J].計(jì)算機(jī)與現(xiàn)代化,2012(5):59-63.

[8] Schein A I,Popescul A,Ungar L H,et al.Methods and metrics for cold-start recommendations[C]//SIGIR'02:Proceedings of the 25th annual international ACM SIGIR conference on Research and development in information retrieval,2002:253-260.

[9] 鄧明通,劉學(xué)軍,李斌.基于用戶偏好和動(dòng)態(tài)興趣的多樣性推薦方法[J].小型微型計(jì)算機(jī)系統(tǒng),2018,39(9):2029-2034.

[10] 劉建國(guó),周濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009,19(1):1-15.

[11] 孫志軍,薛磊,許陽(yáng)明,等.深度學(xué)習(xí)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012,29(8):2806-2810.

[12] Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.

[13]Harper F M,KonstanJ A.The MovieLens Datasets:Historyand Context[J].ACM Transactions on Interactive Intelligent Systems (TiiS) 5,4,Article 19 (December 2015),19 pages.DOI=http://dx .doi.org/10.1145/2827872.

收稿日期:2022-03-16

作者簡(jiǎn)介:張海飛(1980—),男,江蘇如東人,副教授,博士,研究方向?yàn)闄C(jī)器學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)、地理信息系統(tǒng);崔軍納(1979—),男,河南許昌人,工程師,碩士,研究方向?yàn)楣I(yè)互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)、自動(dòng)控制技術(shù);葛金鼎(1984—),男,江蘇通州人,碩士,研究方向?yàn)榇肮こ獭C(jī)械工程、自動(dòng)控制技術(shù)。

主站蜘蛛池模板: 播五月综合| 婷婷丁香在线观看| 国产在线欧美| 538国产视频| 欧美色图第一页| 日本高清免费不卡视频| 波多野结衣久久精品| av在线手机播放| 亚洲人成网站日本片| 国产欧美中文字幕| 国产新AV天堂| 国产精品人成在线播放| 亚洲国产精品日韩欧美一区| 欧美一级高清片欧美国产欧美| 国产极品美女在线| 亚洲日本中文综合在线| 国产H片无码不卡在线视频| 国产成人凹凸视频在线| 一级毛片高清| 国产第一页第二页| 国产精品丝袜在线| 日韩激情成人| 91极品美女高潮叫床在线观看| 欧美区一区二区三| 色香蕉网站| 54pao国产成人免费视频| 久久综合五月婷婷| 美女被操91视频| 欧美日韩精品综合在线一区| 丁香婷婷综合激情| 狠狠操夜夜爽| 久久久久人妻一区精品色奶水| 一级毛片在线免费看| 中国国产A一级毛片| 亚洲精品人成网线在线| 中文字幕日韩久久综合影院| 久久精品嫩草研究院| 亚洲国内精品自在自线官| 福利视频久久| 精品人妻无码区在线视频| 色天堂无毒不卡| 成人在线综合| 国产高清精品在线91| 国产婬乱a一级毛片多女| 三区在线视频| 在线精品视频成人网| 国产精品微拍| 中文字幕在线观| 一级香蕉人体视频| 国产精品对白刺激| 一级毛片在线免费视频| 华人在线亚洲欧美精品| 69视频国产| 国产日本一区二区三区| 精品一区二区三区无码视频无码| 五月天久久综合| 国产午夜一级毛片| 日本91在线| 亚洲一区国色天香| 亚洲一区二区约美女探花| 欧美日韩国产成人高清视频 | 久久综合九色综合97网| 国产精品伦视频观看免费| 狠狠干综合| 国产成人精品男人的天堂下载| 亚洲IV视频免费在线光看| 日韩在线影院| 第九色区aⅴ天堂久久香| 天天色综网| 久久semm亚洲国产| 免费看久久精品99| 国产亚洲精品无码专| 男女性色大片免费网站| 国产成人一级| 国产成人a毛片在线| 亚洲性一区| 国产91视频观看| 无码AV高清毛片中国一级毛片| 婷五月综合| 久久精品这里只有国产中文精品| 久久精品人人做人人爽97| 亚洲AⅤ无码国产精品|