999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多子域隨機森林在情境感知推薦中的應用研究

2020-11-18 09:14:50顧曉梅劉子豪
計算機工程與應用 2020年22期
關鍵詞:特征情境用戶

李 凌,顧曉梅,劉子豪

1.河海大學 計算機與信息學院,南京211100

2.南京師范大學 外國語學院,南京210097

3.江蘇科技大學 計算機學院,江蘇 鎮江212003

1 引言

移動互聯網(Mobile Internet)、物聯網(Internet of Things,IoT)和全球定位系統(Global Positioning System,GPS)等技術的普及,極大地促進了基于位置服務(Location Based Service,LBS)的發展,并產生了海量的情境大數據[1]。用戶所處的時空信息(Spatio-Temporal Information)中包含了大量的用戶行為習慣和生活情境信息[2]。因此,人們可以使用數據挖掘、機器學習等技術從情境信息數據中提取出潛在的、有效的、新穎的知識和價值。

冷啟動和數據稀疏是影響推薦系統預測精度的兩個主要問題,其中冷啟動問題又包括用戶冷啟動、項目冷啟動和系統冷啟動[3]。一方面,情境感知技術可以改進用戶冷啟動問題。用戶冷啟動問題是指新用戶剛進入系統的時候,系統內沒有該用戶的歷史行為數據,很難向此用戶推薦偏好的項目[4]。解決用戶冷啟動問題的有效方案之一是將用戶情境信息加入推薦模型中。以物流車輛和貨物之間信息推薦為例,當新的司機完成注冊并進入系統時,系統沒有該司機的歷史行為數據,不能根據歷史數據向該司機進行貨物推薦。此時,可以根據物流司機當前所處的情境信息進行推薦,比如以該司機所在位置為圓點,向他推薦半徑40 km圓內的有運輸需求的貨物。另一方面,情境感知也可以改進數據類別稀疏問題。通過引入情境感知技術主動獲取用戶與系統交互行為的情境信息,不僅能夠使獲取的用戶信息數大幅增加,而且使獲取的用戶信息時間分布更合理[5]。用戶信息的獲取和用戶與系統的交互行為直接相關,系統可以實時獲取用戶的當前情況,使推薦服務能夠動態反映用戶需求的變化情況,改善數據稀疏問題。因此,在推薦系統中應用情境感知技術非常必要。

本文提出一種基于多子域隨機森林算法的情境感知推薦方法。該方法首先對特征重要性按權值大小進行排序,將權值的取值區域分為多個大小相等的子區域,在這些子區域中隨機選擇特征,構造特征子空間來改進隨機森林算法;然后通過改進的隨機森林算法來分解并降低用戶、項目和情境的特征維度;最后使用協同過濾推薦算法來進行冷鏈物流配載個性化推薦。對LDOS-CoMoDa 和Cycle Share 兩個數據集進行仿真實驗,結果表明該方法相比傳統方法平均絕對誤差減少近10%,有效地提高了推薦系統的預測精度,為情境感知推薦的應用提供借鑒。

2 相關工作

目前情境感知推薦方法主要有三類:基于內容的情境感知推薦,基于協同過濾的情境感知推薦,混合式情境感知推薦[6-7]。基于協同過濾的情境感知推薦將情境信息融入到用戶相似性、項目相似性和模型計算上,以提高推薦精度[8-9]。基于內容的情境感知推薦重點考慮用戶偏好、情境信息與項目屬性的匹配度,挖掘用戶在不同情境下對不同項目屬性的偏好,并結合每個具體項目的屬性描述,發現用戶、項目、情境之間的匹配程度,從而預測潛在的情境用戶偏好,最后結合用戶當前情境生成推薦[9]。混合式情境感知推薦將上述多種單一推薦方法混合進行推薦,混合的策略主要有加權、串聯、混合呈現、特征組合等[10]。上述三類情境感知推薦方法有效地將情境信息應用到推薦系統,取得了廣泛應用,但也存在一些不足,主要體現在:

(1)目前的研究主要是基于用戶位置的信息推薦,較少有將地理位置與用戶所從事的活動類型這兩方面綜合起來描述情境的特征。

(2)目前的研究主要將情境感知與個性化推薦結合時都賦予了情境因素相同的權重,忽略了用戶在不同的情境下所偏好項目的不同,以及情境因素在推薦過程中所起的影響作用不同。

近年來,多種包含情境信息的推薦方法被提出,有效地提高了推薦結果。Wang等人考慮了利用層次結構提高推薦質量的問題,提出了一種新的兩階段推薦模型,稱為層次分解機(Hierarchical Factorization Machines,HFM)[11]。Zheng等人[12]提出了屬性和全局增強(Attribute and Global Boosting,AGB)模型來完成情境感知推薦中的評分預測任務。該研究的主要結論是,屬性可以通過局部優化和全局優化來充分利用。Ren等人[13]提出了一種稱為TGSC-PMF的情境感知概率矩陣分解方法,用于POI(Point-of-Interest)推薦。TGSC-PMF模型利用了文本信息、地理信息、社會信息、分類信息和流行信息,并有效地結合了這些因素。Hidasi等人[14]提出了一個通用分解框架(General Factorization Framework,GFF),GFF是一種單一的靈活算法,將偏好模型作為輸入維度的輸入和計算的潛在特征矩陣。GFF 無論是對顯式反饋還是隱式反饋,均允許在情境感知的推薦任務中使用多種線性模型。Alhamid等人[15]提出一種新模型來幫助推薦系統通過整合情境參數來選擇最適合、最喜歡的或相關的內容。該模型利用社交標簽,計算用戶對來自其他相似情境的潛在偏好,以及計算項目來自其他相似情境的潛在偏好。Unger等人[16]提出了一種以環境特征表示低維無監督潛在情境為中心的新方法。他們從移動傳感器中提取大量數據,以無監督的方式推斷用戶的情境。潛在情境被建模為從原始傳感器數據有效提取的數字向量的隱藏情境模式。使用無監督深度學習和主成分分析(Principal Component Analysis,PCA)技術從用戶手機收集的數據中,為每個用戶自動學習潛在情境。候營輝等人[17]將情境感知思想加入到流式應用分發系統中,實現為用戶在不同的情境下提供個性化應用推薦。該方法通過采集流式應用場景下用戶的情境信息數據,利用機器學習Xgboost算法識別用戶情境活動,并根據識別的用戶情境來為用戶推薦應用。

3 關鍵實現

3.1 基于多子域隨機森林算法

隨機森林是一種基于隨機決策樹的集成學習方式,已被用于處理多種學習任務,并取得了很好的效果[18]。隨機森林的總體思想是以隨機的方式建立一個森林,森林里面包含多個決策樹,每一棵決策樹之間沒有關聯性。在隨機森林生成后,當新的樣本輸入進來時,隨機森林讓每一棵決策樹分別對樣本進行預測,然后選擇所有決策樹預測最多的類別作為新樣本的類別。

隨機森林的分類準確率受到決策樹數目的影響較大,而實際應用中考慮到計算代價,樣本集數目又不宜設置過大[16]。如果要改善隨機森林在高維數據中的問題,需要在樣本集數目一定的情況下,盡量減少冗余特征帶來的干擾,降低特征子空間的不確定性,讓隨機選取的特征具有更高的代表性。

標準隨機森林算法通過隨機方法選取特征屬性,在這種情況下,每一個特征被選中的概率是一樣的。而在現實情況中,每一個特征的重要程度并不一樣,對節點分裂影響也不一樣。如果所有樹均以特征相關性大小作為參考進行特征子空間選取,會出現權值大的特征總被選中的情況,降低了特征子空間的多樣性,使得被選中的樹具有較高的相關性,反而降低了模型的泛化能力。為了既能體現被選中樹的特征重要程度,又能保持被選中樹的多樣性,本文提出了一種基于多子域隨機森林算法,總體思路如下:首先選定特征子空間個數g,不同的數據集可以通過實驗確定最優的g 值,g 值建議取值范圍是2 ≤g ≤10,較大的g 值表示劃分的特征子空間個數較多,反而會降低模型精度;然后對特征的重要性進行評估,根據計算的權值大小重新排序;接著將重新排序后的權值區間分為g 個子區域;最后根據劃分的子區域,分別從每個區域隨機選取特征,構造g 個特征子空間。標準隨機森林算法的每棵決策樹的每個節點分裂依據是從f 個輸入特征中,隨機挑選fsub個特征(fsub<<f),按照節點不純度(如Gini不純度)最小原則,從這fsub個特征中選出一個特征作為該節點的分裂屬性。本文提出的改進隨機森林算法中節點分裂方法與標準隨機森林算法的分裂方法基本原理相同,只是特征選取范圍原來是“從所有輸入特征中隨機選取fsub個特征”改變為“從各個子區域內的多次循環隨機選取個特征”。

詳細的改進隨機森林算法步驟如下:

輸入:包含k 個樣本的原始訓練集H ,訓練集特征為f 。

輸出:包含z 棵決策樹的隨機森林。

步驟1 選取特征子空間個數g。

步驟2 對包含k 個樣本的原始訓練集H 中的數據,采取隨機有放回抽樣(Bootstrap 抽樣)抽取樣本,重復抽樣k 次后形成一個大小相同的新的訓練數據集(有可能出現重復的樣本)。

步驟3 重復步驟2共z 次,最終形成z 個訓練數據集。

步驟4 從z 個訓練數據集中選取一個數據集,以此生成一棵決策樹,該數據集將是這棵決策樹的全部訓練數據。

步驟5 使用PCA計算各個特征的權值Fl。

步驟6 將Fl降序排列,以為邊界,劃分出g 個子區域分別如式(1)、式(2)和式(3)所示。

步驟7 按照步驟6 的節點分裂方法生成整個決策樹。如果某一節點選出的分裂屬性是剛剛其父節點分裂時用過的屬性,則該節點已經達到葉子節點,無須繼續分裂了。整個決策樹的形成過程中不進行剪枝。

步驟8 重復步驟4~步驟7,直到完成對全部z 個訓練數據集的訓練后停止。

步驟9 輸出包含z 棵決策樹的隨機森林,使用隨機森林對新的數據進行預測,預測結果按照z 棵決策樹的投票結果決定。

在標準隨機森林中每一棵決策樹模型的訓練均是采用隨機有放回抽樣方法(Bootstrap抽樣)抽取樣本,這樣使得每一棵決策樹模型的訓練樣本不完全相同,每一棵決策樹模型都存在一些樣本不在該模型的訓練集中的情況,這些沒有被抽中的樣本可以作為該決策樹模型的測試集樣本。在構造每一棵決策樹模型的過程中并沒有使用全部的特征變量,而是隨機地從全部特征中抽取一個子集來訓練模型,從而使得每一棵決策樹的訓練選取的樣本不完全一樣,選取的特征變量也不完全一樣,保證了隨機森林中多棵決策樹模型的多樣性。本文提出的多子域隨機森林算法中每一棵決策樹的訓練樣本選取與標準隨機森林中決策樹一致,也是采用Bootstrap 抽樣方法抽取樣本,使得每一棵決策樹模型的訓練樣本不完全相同,每一棵決策樹模型都存在一些樣本不在該模型的訓練集中的情況,那些沒有被抽中的樣本作為該決策樹模型的測試集樣本。另外,本文提出的多子域隨機森林算法中特征變量的選取方法是先計算各個特征的權值并按照權值大小排序,然后以為邊界,劃分出g 個子區域,特征選取時分別從g 個子區域內多次循環隨機選取特征,每個特征被選中的概率也是一樣的,保證了特征的多樣性。圖1為標準隨機森林子樹選取分裂特征過程示意圖,圖2為本文提出的多子域隨機森林子樹選取分裂特征過程示意圖。

圖1 標準隨機森林子樹選取分裂特征過程示意圖

圖2 多子域隨機森林子樹選取分裂特征過程示意圖

3.2 基于多子域隨機森林的情境感知推薦方法

本文提出的基于多子域隨機森林的情境感知推薦方法模型包括三個主要過程:初始化用戶偏好,計算用戶偏好權重,預測用戶偏好。推薦過程如圖3所示。

圖3 基于多子域隨機森林算法的情境感知推薦過程

3.2.1 初始化用戶偏好

流程開始時,首先輸入包含用戶、項目、情境和評分信息的歷史數據集H=(U,I,C,R) 。初始化用戶偏好時的情境可以看作是靜態變量,此時可以只考慮用戶和項目兩個維度。

用戶可以對項目信息進行查看、發布、轉發和點贊四種瀏覽行為。如果用戶對某一頁面查看次數較多,表示用戶對該頁面的信息內容比較關注,即對該項目偏好度較高。用戶對某一項目的“查看”“評論”“轉發”“點贊”的單次行為可以設置為1 分;“發布”“查看+評論”“查看+轉發”“查看+點贊”可以設置為2 分;“查看+評論+轉發”“查看+評論+點贊”“查看+轉發+點贊”可以設置為3 分;“查看+評論+轉發+點贊”可以設置為4 分。使用節點中心度來衡量節點在預測模型中的重要程度,可以通過計算某節點入度數與其他節點總數的比值來進行定義:D( u,i,c )=InD( u,i,c )/( M-1) 。綜合用戶興趣評分和節點中心度兩方面,用戶偏好初始值如式(6)所示。

其中,P( u,i,c )為用戶對偏好項目的初始評分,L( u,i,c)為用戶在Web 頁面或者移動APP 中對項目的瀏覽行為評分,D( u,i,c )為項目在模型中的重要程度,α 為調節參數。

3.2.2 計算用戶偏好權重

用戶偏好權重的計算是系統個性化推薦過程中的重要步驟,不僅需要對傳統推薦系統中的用戶和項目進行考慮,還需要對實時動態變化的情境信息進行考慮。由于用戶、項目、情境這三個維度的特征較多,本文提出的方法采用改進隨機森林算法進行特征選擇,經過特征選擇后的模型具有較少的計算量,可以用G′=(U′,I′,E′)表示。該方法借鑒了混合推薦的思想,使用協同過濾方法處理用戶-用戶的相似度,使用內容過濾方法處理項目-項目的相似度。使用協同過濾方法處理用戶-用戶之間相似度的原因是根據用戶對項目的偏好,發現與當前用戶偏好相似的“鄰居”用戶群,再基于這些鄰居用戶群的歷史偏好信息,為當前用戶進行推薦。使用內容過濾方法處理項目-項目之間相似度的原因是根據推薦項目的元數據,發現項目之間的相關性,然后基于用戶以往的喜好記錄,推薦給用戶相似的項目。最后得到與目標用戶相似的其他用戶偏好項的權重Wu′,i′,c′=Sim(( u′x,i′x,c′x),( u′y,i′y,c′y))。該權重可看成是空間中任意兩個小立方體之間的距離,即點A( u′x,i′x,c′x)和點B( u′y,i′y,c′y)之間的距離。權重的大小與兩個小立方體之間的距離成反比,同時該權重在推薦系統也表示用戶之間、項目之間、情境之間的相似度,因此相似度也與兩個小立方體之間的距離成反比,相似度公式如式(7)所示。

常用的用戶偏好的權重度量方法有歐幾里德距離(Euclidean Distance)、閔科夫斯基距離(Minkowski Distance)、馬氏距離(Mahalanobis Distance)等,其中歐幾里德距離是最簡單、最易理解的度量方法[19]。本文選取歐幾里德距離測度用戶偏好的權重,歐幾里德距離如式(8)所示。

由于向量之間距離越大表示用戶之間、項目之間或者情境之間的相似度越低,可以用余弦相似度的倒數來表達用戶之間、項目之間或者情境之間的距離:

本章提出方法中的用戶相似度Sim(u′x,u′y)基于不同用戶對相同項目具有交叉的瀏覽行為(查看、發布、轉發和點贊),即,用戶可以用向量u′=( r′1,r′2,…,r′n)表示,其中r′n表示用戶瀏覽過的項目的得分。項目相似度Sim( i′x,i′y)是基于兩個項目存在被同一用戶瀏覽的情況,即,項目可以用向量i′=(1 ,0,1,…,q )表示,q 表示該項目是否被用戶點擊過,1表示被點擊過,0表示未被點擊過。情境相似度Sim(c′x,c′y)采用基于內容過濾的方法,使用向量來表示情境信息的內容,如使用c=( time,position,emotion )來表示時間、位置和情感。如果用戶情境信息相同,則直接采用傳統的二維推薦模型進行推薦。最終的權重如式(10)所示。

3.2.3 預測用戶偏好

對于由用戶、項目、情境組成的記錄,偏好信息的預測如式(11)所示。

給定目標用戶u′ ,向u′ 推薦的項目評分如式(12)所示。

采用協同過濾推薦的思想,向目標用戶推薦與其情境相似的其他用戶偏好的項目,可以將式(12)轉換為式(13)。

式(13)中的ru′x,i′x,c′x為在c′x情境下,用戶u′x對項目i′x的評分。如式(10)所示。k 為調節因子,一般k 的取值為:

由上文可知

與相似度成正比例。最后,將預測評分較高的Top- N個項目Irec={i ′r1,i′r2,…,i′rn} 推薦給目標用戶,其中r1>r2>…>rn。

3.2.4 算法詳細步驟

輸入:原始訓練集H(包含用戶、項目、情境、評分)。

輸出:推薦的項目Irec。

步驟1 初始化用戶偏好模型G=(U,I,E )。

步驟2 用戶偏好初始值:

步驟3 使用多子域隨機森林算法對用戶特征進行選擇,得到U′。

步驟4 使用多子域隨機森林算法對項目特征進行選擇,得到I′。

步驟5 使用多子域隨機森林算法對情境特征進行選擇,得到C′。

步驟6 經過特征選擇后的模型G′=(U′,I′,E′)。

步驟7 計算兩兩用戶之間的相似度:

步驟8 計算兩兩情境之間的相似度:

步驟9 如果sim(u′x,u′y)>m 或者sim(c′x,c′y)>m,則G′=G′?{( u′y,c′y,i′y,ry)},否則G′=G′?φ。

步驟10 重復步驟7~步驟10共N 次。

步驟11 對( u′y,c′y,i′y,ry)∈G′ 中的每一個(u′y,c′y,i′y,ry),計算預測評分:

步驟12 將預測評分較高的Top- N 個項目Irec={i ′r1,i′r2,…,i′rn} 推薦給目標用戶,其中r1>r2>…>rn。

4 實驗與結果分析

4.1 實驗數據集

本文選取LDOS-CoMoDa 數據集[20]和Cycle Share數據集[21]參與實驗。LDOS-CoMoDa數據集包含了121個用戶對1 232部電影的2 296條評分數據,評分的取值區間為1~5,5表示最喜歡,1表示最不喜歡,用戶通過評分的數值表達了自己的興趣愛好。該數據集除了用戶和項目之外,還包含30 個變量,其中有12 個是情境變量,分別為time、daytype、season、location、weather、social、end Emo、dominant Emo、mood、physical、decision、interaction。Cycle Share數據集包括了美國西雅圖市500輛共享單車在54 個站點之間的140 000 條數據,每一行數據表示了某一用戶某次騎行記錄。該數據集包含了41 個變量,其中有27 個是情境變量,主要包括start time、stop time、from station name、to station name、date、min/mean/max temperature、min/mean/max dew point、min/mean/max humidity、min/mean/max sea level press、min/mean/max visibility miles、min/mean/max wind speed等。

4.2 評價指標

實驗選取推薦系統中兩種常用的預測指標來評估推薦模型的預測準確性:平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Square Error,RMSE)。MAE通過計算推薦項目的預測評分與實際評分之間的平均絕對誤差來衡量推薦模型的預測準確度,MAE 的定義如式(14)所示。MAE 值越小表示推薦系統的推薦精度越高,相反,MAE值越大表示推薦系統的推薦精度越低。RMSE 通過計算推薦項目的預測評分與實際評分之間的偏差平方和與項目數N 比值的平方根來評估推薦模型的性能,RMSE 的定義如式(15)所示。RMSE 值越小表示推薦系統的推薦精度越高,相反,RMSE值越大表示推薦系統的推薦精度越低。

其中,r′i′表示預測評分,r′i′表示真實評分,N 表示項目數。

4.3 實驗數據集

實驗中選擇不同的參數會產生不同的實驗結果。為了取得較好的實驗結果,需要確定子區域大小g 、樣本集采樣率、特征向量維數Dim 。為了方便對比和討論,將本文所提方法簡稱為CRMMRF(Context-aware Recommendation Method based on Multi-subdomain Random Forest)。實驗中,選擇MF[22]和CRMMRF作為確定參數設置的方法。

(1)確定特征子空間個數g。在確定LDOS-CoMoDa數據集和Cycle Share 數據集合適的特征子空間個數g前,先設定樣本集采樣率取值0.6,特征向量維度Dim取值10 和20。特征子空間個數g 分別取2,3,4,5,6。LDOS-CoMoDa 數據集和Cycle Share 數據集的子區域大小的選取如圖4和圖5所示。從圖4可以看出,LDOSCoMoDa 數據集最好的特征子空間個數g 為3,然后依次為4、2、5、6和7。從圖5可以看出,Cycle Share數據集最好的特征子空間個數g 為4,然后依次為3、5、2、6和7。

(2)選擇樣本集采樣率。在確定LDOS-CoMoDa數據集和Cycle Share 數據集合適的樣本采樣率前,設定特征向量維度Dim 取值10 和20。樣本集采樣率分別取0.3,0.4,0.5,0.6,0.7,0.8。LDOS-CoMoDa 數據集和Cycle Share 數據集的樣本采樣率的選取如圖6 和圖7所示。從圖6 可以看出,LDOS-CoMoDa 數據集最好的樣本集采樣率為0.6,然后依次為0.7、0.5、0.8、0.4 和0.3。從圖7 可以看出,Cycle Share 數據集最好的樣本集采樣率為0.6,然后依次為0.7、0.8、0.5、0.4 和0.3。在兩個數據集中,在采樣率低于0.6 時,MAE 值和RMSE值隨采樣率增長而降低,但當采樣率高于0.6 時,MAE值和RMSE 值隨采樣率增加而增加。這個現象表明了當采樣率高于0.6時,產生了過擬合現象。

圖4 選取LDOS-CoMoDa特征子空間個數g

圖5 選取Cycle Share特征子空間個數g

圖6 選取LDOS-CoMoDa樣本集采樣率

圖7 選取Cycle Share樣本集采樣率

(3)選擇特征向量維數Dim。LDOS-CoMoDa數據集包含30 個特征向量的維度,Cycle Share 數據集包含41個特征向量的維度。本文通過PCA來計算每個特征的貢獻實現特征向量維數的降低。選擇總貢獻率的80%特征向量參與實驗。圖8為LDOS-CoMoDa數據集每個特征的貢獻率以及總貢獻率為80%的特征向量,圖9 顯示了Cycle Share 數據集每個特征的貢獻率以及總貢獻率為80%的特征向量。從圖8 可以看出,LDOSCoMoDa數據集前80%貢獻率的12個屬性分別為country、city、budget、age、genre1、movieCountry、actor3、dominantEmo、interaction、location、social 和endEmo。從圖9可以看出,Cycle Share 數據集前80%貢獻率的22 個屬性分別為Max_Temperature_F、Mean_Temperature_F、Min_Temperature_F、Max_Dew_Point_F、MeanDew_Point_F、Min_Dewpoint_F、Max_Sea_Level_Pressure_In、Mean_Sea_Level_Pressure_In、Min_Sea_Level_Pressure_In、Max_Humidity、Mean_Humidity、Min_Humidity、trip_id、Precipitation_In、Mean_Wind_Speed_MPH、Max_Wind_Speed_MPH、to_latitude、to_longitude、from_latitude、Mean_Visibility_Miles、Min_Visibility_Miles 和sto_current_dockcount。

4.4 對比實驗及結果分析

實驗選用基于用戶最近鄰推薦(User-based Nearest Neighbor Recommendation,UserNNR)[23]、基于項目最近鄰推薦(Item-based Nearest Neighbor Recommendation,ItemNNR)[24]、HF[11]、GFF[14]和矩陣分解推薦(Matrix Factorization,MF)[22]作為參比方法。上述所有方法的默認參數均設置為文獻中提到的最優值。

圖8 LDOS-CoMoDa數據集特征維度影響

圖9 Cycle Share數據集特征維度影響

為了使實驗具有更好的代表性,對比實驗中訓練數據集選取0.4、0.5、0.6 和0.7 四種樣本采樣率,特征維度Dim 分別取12和22兩種維度。

由不同參數組合構成的實驗重復進行5次,實驗結果取這5 次的平均值。實驗中LDOS-CoMoDa 數據集的比較實驗如圖10 所示,具體數值如表1 所示。Cycle Share 數據集的比較實驗如圖11 所示,具體數值如表2所示。表3 為CRMMRF 方法與其他5 種方法的MAE和RMSE值的平均降低百分比。

從圖10、圖11和表1、表2中可以看出,CRMMRF在忽略條件偏好的情況下,在兩個實驗數據集中,預測結果均優于UserNNR、ItemNNR、MF、HFM 和GFF,表現出較好的預測準確度和泛化能力。從表3 中還可以看出,CRMMRF 與其他參比方法的MAE 和RMSE 值,在LDOS-CoMoDa數據集上平均減少了11.17%~14.29%和10.87%~18.28%,在Cycle Share 數據集上平均減少了2.48%~16.83%和1.96%~9.42%。

圖10 LDOS-CoMoDa數據集比較實驗(Dim=12)

表1 LDOS-CoMoDa數據集比較實驗中的MAE值和RMSE值

圖11 Cycle Share數據集比較實驗(Dim=22)

表2 Cycle Share數據集比較實驗中的MAE值和RMSE值

表3 MAE和RMSE平均降低百分比 %

5 結束語

本文提出了一種基于多子域隨機森林算法的情境感知推薦方法。該方法首先對特征重要性按權值大小進行排序,將權值的取值區域分為多個大小相等的子區域,在這些子區域中隨機選擇特征,構造特征子空間來改進隨機森林算法。然后,通過改進隨機森林算法來分解并降低用戶、項目和情境的特征維度。最后,使用基于內容的情境表示和協同過濾推薦的思想來預測用戶偏好,將預測評分較高的Top- N 項目推薦給用戶。實驗結果表明,該方法有效提高了推薦準確度,為情境感知推薦系統的應用提供借鑒。

猜你喜歡
特征情境用戶
情境引領追問促深
不同情境中的水
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
護患情境會話
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
特定情境,感人至深
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 在线无码私拍| 欧美五月婷婷| 国产凹凸一区在线观看视频| 自拍偷拍欧美| 欧美怡红院视频一区二区三区| 亚洲AV无码久久精品色欲 | 日本91在线| 中文字幕调教一区二区视频| 玩两个丰满老熟女久久网| 亚洲国产理论片在线播放| av无码一区二区三区在线| 国产在线观看成人91| 国产簧片免费在线播放| 亚洲狼网站狼狼鲁亚洲下载| 亚洲区视频在线观看| 亚洲无码精彩视频在线观看| 国产精品播放| 在线观看国产精美视频| 国产无码网站在线观看| 九九香蕉视频| 亚洲日产2021三区在线| 91色爱欧美精品www| 亚洲精品国产综合99久久夜夜嗨| 91精品国产91欠久久久久| 久久semm亚洲国产| 色婷婷电影网| 日本在线视频免费| 中文字幕久久亚洲一区| 激情网址在线观看| 日韩av电影一区二区三区四区| 日韩精品无码一级毛片免费| 亚洲国产系列| 午夜综合网| 播五月综合| 国产精品3p视频| 激情综合网激情综合| 69视频国产| 亚洲精品午夜无码电影网| 丰满人妻久久中文字幕| 九九久久精品免费观看| 久久久久免费精品国产| 四虎亚洲精品| 亚洲第一成人在线| 国产成人永久免费视频| 免费国产黄线在线观看| av午夜福利一片免费看| 国产综合色在线视频播放线视| 久久精品丝袜| 香蕉精品在线| 国产精品专区第1页| 亚洲美女一区二区三区| 黄色网站在线观看无码| 欧美精品v欧洲精品| 亚洲国产黄色| 高清无码手机在线观看| 免费毛片全部不收费的| 国产精品流白浆在线观看| 中文字幕中文字字幕码一二区| 久久青青草原亚洲av无码| 国产精品视频a| 国产美女自慰在线观看| 国产一区二区三区精品久久呦| 日韩在线2020专区| 欧美一级黄色影院| 久操线在视频在线观看| 亚洲成人动漫在线| 亚洲男人的天堂在线观看| 国产成人乱码一区二区三区在线| 国产女人综合久久精品视| 免费99精品国产自在现线| 欧美啪啪网| 免费A级毛片无码无遮挡| 好吊色妇女免费视频免费| 久久无码免费束人妻| 色综合久久久久8天国| 91视频99| 在线播放精品一区二区啪视频| 午夜激情婷婷| 久久99国产乱子伦精品免| 欧美色图第一页| 老司机午夜精品视频你懂的| 97免费在线观看视频|