





摘要:針對現(xiàn)有車輛推薦算法在數(shù)據(jù)稀疏情況下推薦效果不佳,以及難以處理用戶購買意圖受多種因素影響的非線性關(guān)系問題,文章提出了一種基于生成對抗網(wǎng)絡(luò)(GAN)的推薦列表二次排序模型(RGANV)。該模型首先利用門控循環(huán)單元(GRU)網(wǎng)絡(luò)分析車輛用戶的會話信息,生成初步推薦列表。隨后,利用該列表訓(xùn)練GAN 模型中的判別器,并根據(jù)訓(xùn)練好的生成器對推薦列表進行二次排序,使商品相關(guān)性評分更加準確,進而生成高質(zhì)量推薦列表。仿真結(jié)果表明,RGANV 有效解決了GRU 模型在車輛用戶長期信息獲取上的不足,并改善了多因素干擾問題,提升了推薦效果。
關(guān)鍵詞:車載電商推薦; 門控循環(huán)單元; 生成對抗網(wǎng)絡(luò); 二次排序; 策略梯度
中圖分類號:TP3 文獻標(biāo)識碼:A
文章編號:1009-3044(2025)06-0088-03開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
1 相關(guān)工作
隨著車聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,如何為車輛用戶提供高效的推薦服務(wù)已成為學(xué)術(shù)界和工業(yè)界的熱門研究方向。然而,推薦系統(tǒng)普遍面臨著冷啟動和數(shù)據(jù)稀疏等挑戰(zhàn)。冷啟動是指系統(tǒng)運行初期,可利用的車輛用戶歷史信息極其有限,難以進行精準推薦。為解決該問題,Gao等人[1]提出了一種基于多目標(biāo)特征交叉的服務(wù)質(zhì)量預(yù)測推薦算法。該算法通過詞嵌入方法引入多目標(biāo)特征,并利用神經(jīng)網(wǎng)絡(luò)實現(xiàn)特征的自動交叉,從而提升了算法在冷啟動和數(shù)據(jù)稀疏場景下的推薦效果。
相比傳統(tǒng)的個性化推薦算法,基于神經(jīng)網(wǎng)絡(luò)的方法能夠挖掘更加復(fù)雜的非線性關(guān)系,因此備受關(guān)注。Liao等人[2]提出了一種基于圖神經(jīng)網(wǎng)絡(luò)(GNN)的社交推薦方法。該方法考慮了用戶感興趣的不同物品之間的潛在相關(guān)性,并融合用戶行為和輔助信息來建模用戶偏好,以提高推薦的準確性。Jiang等人[3]針對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)協(xié)同過濾算法存在的建模復(fù)雜、訓(xùn)練效率低和數(shù)據(jù)稀疏等問題,提出了一種融合信任度與注意力機制的神經(jīng)網(wǎng)絡(luò)推薦算法。該算法將用戶間的信任度值加入特征向量,并在神經(jīng)網(wǎng)絡(luò)模型中引入注意力機制,以增強關(guān)鍵隱式反饋信息的權(quán)重,從而緩解社交網(wǎng)絡(luò)中數(shù)據(jù)缺失帶來的影響。
本文提出的RGANV模型在GRU[4]模型的基礎(chǔ)上進行強化訓(xùn)練,通過構(gòu)建生成器和判別器,并利用兩者之間的博弈訓(xùn)練來優(yōu)化推薦效果。具體而言,RGANV使用策略梯度訓(xùn)練方法來提高正樣本出現(xiàn)的概率,使商品相關(guān)性評分更加接近真實情況,從而生成更準確、高質(zhì)量的推薦列表。RGANV模型本質(zhì)上是對GRU模型推薦結(jié)果進行的二次排序。
2 推薦列表二次排序模型RGANV
本文通過使用一種提出的生成對抗網(wǎng)絡(luò)模型RGANV對推薦列表進行重排序以提高推薦效果。下面本文將詳細介紹該生成對抗網(wǎng)絡(luò)模型的基本結(jié)構(gòu)、構(gòu)建方法以及訓(xùn)練流程。
2.1 RGANV 的模型結(jié)構(gòu)
該生成對抗網(wǎng)絡(luò)的具體結(jié)構(gòu)如圖1所示。對于生成對抗網(wǎng)絡(luò)的構(gòu)建,本文將混合推薦算法模型作為生成器。RGANV模型通過輸入用戶和商品的長期歷史信息及短期會話信息,得到了一個初步的推薦列表。由于對稱性有助于增強網(wǎng)絡(luò)的魯棒性,本文將判別器設(shè)置為一個共享參數(shù)的對稱網(wǎng)絡(luò)模型。判別器的輸入數(shù)據(jù)和訓(xùn)練方式與生成器有所不同。
判別器的輸入數(shù)據(jù)除了有生成器生成的數(shù)據(jù),還有用戶真實點擊的數(shù)據(jù)和從低評分商品中隨機抽取的低評分商品數(shù)據(jù)。判別器的能力提高了自然也就能更加成功地將生成器生成的數(shù)據(jù)與真實數(shù)據(jù)進行區(qū)分。訓(xùn)練完判別器后然后將其固定住,然后通過最小化生成器中生成數(shù)據(jù)與真實數(shù)據(jù)的差距對生成器進行優(yōu)化。
RGANV模型中,生成器部分設(shè)置為第三章提出的RGANV網(wǎng)絡(luò)。生成器的輸入數(shù)據(jù)同第三章一樣,包括用戶對商品的點擊流序列(商品id、time stamp)、點擊某件商品的用戶序列(userid、time stamp)和用戶對商品的評分數(shù)據(jù)(用戶全局隱因子和商品全局隱因子),輸出模型為商品推薦列表。圖1中的真實數(shù)據(jù)包括高評分商品和隨機采樣的低評分商品信息。
2.2 使用對稱網(wǎng)絡(luò)構(gòu)建判別器
本文設(shè)計了一種共享參數(shù)的對稱網(wǎng)絡(luò)作為判別器,判別器的結(jié)構(gòu)如圖2所示。
圖2中,h表示用戶評分較高的商品信息,l表示用戶評分較低的商品信息,判別器中的對稱網(wǎng)絡(luò)共享同樣的參數(shù),通過最小化損失函數(shù)進行更新。判別器的計算式化描述如式1所示,各個變量的含義如表1 所示。
2.4 RGANV 的訓(xùn)練過程
本文構(gòu)建的生成對抗網(wǎng)絡(luò)的具體訓(xùn)練訓(xùn)練過程如圖4所示:
1)生成推薦列表。將用戶和商品的長期歷史數(shù)據(jù)和短期會話數(shù)據(jù)輸入到RGANV推薦模型中,通過計算用戶與商品間的相關(guān)性評分得出一個推薦列表。
2)判別器訓(xùn)練
步驟一:從之前計算的低評分商品中隨機抽樣輸入到判別器,訓(xùn)練判別器區(qū)分低評分和真實高分數(shù)據(jù)的能力。
步驟二:將生成器生成的推薦數(shù)據(jù)輸入到判別器,讓判別器區(qū)分生成數(shù)據(jù)與真實數(shù)據(jù)之間的差別。
3)優(yōu)化生成器。采用基于強化學(xué)習(xí)的策略梯度優(yōu)化算法對生成器進行優(yōu)化,如果一個動作的獎勵值高則增加該動作的出現(xiàn)概率,反之則減小該動作的出現(xiàn)概率。
4)迭代計算。采用交替訓(xùn)練的方式對生成器和判別器進行迭代訓(xùn)練。固定住一方訓(xùn)練另一方,直到判別器的輸出值接近0.5。這時,鑒別器無法區(qū)分真實數(shù)據(jù)與生成器生成的數(shù)據(jù)。
5)更新推薦列表。根據(jù)訓(xùn)練好的生成器,將之前生成的推薦列表中的數(shù)據(jù)通過訓(xùn)練之后的生成器重新排名。
3 實驗結(jié)果與分析
3.1 實驗環(huán)境配置及參數(shù)設(shè)置
將DIGINETICA數(shù)據(jù)集中不滿足條件的數(shù)據(jù)采用和YOOCHOOSE數(shù)據(jù)集同樣的標(biāo)準過濾掉,最終保留了188300 條會話和38500 件商品。由于YOOCH?OOSE數(shù)據(jù)集的數(shù)據(jù)量表較大,訓(xùn)練起來比較困難,因此本文截取了其中的部分數(shù)據(jù)形成了1/3數(shù)據(jù)集和1/32數(shù)據(jù)集。數(shù)據(jù)集的總體情況如表2所示。
本文的實驗是在Windows 11系統(tǒng)下基于Python3.6.2實現(xiàn)的,具體的實驗環(huán)境配置如表3所示。
3.2 實驗結(jié)果分析
本文使用實驗數(shù)據(jù)集為RecSys 2015 YOOCH?OOSE數(shù)據(jù)集和CIKM Cup 2016的DIGINETICA 數(shù)據(jù)集。將使用生成對抗網(wǎng)絡(luò)技術(shù)重新排序的推薦模型(記為RGANV) 與未使用該技術(shù)的GRU 模型進行對比實驗。實驗結(jié)果如表4所示。因為本文使用生成對抗網(wǎng)絡(luò)技術(shù)旨在對GRU模型生成的推薦列表進行重排序,所以這里本文在平均倒數(shù)排名(MRR)上進行對比,默認推薦列表長度為20。
因為使用了生成對抗網(wǎng)絡(luò),對于商品相關(guān)性評分的學(xué)習(xí),使得推薦列表中召回的商品位置更加靠前,所以,通過表3中的實驗對比結(jié)果可以看出,通過生成對抗網(wǎng)絡(luò)對RGANV模型進行強化訓(xùn)練后的推薦列表在平均倒數(shù)排名指標(biāo)上有明顯的提升,分別在YOOCHOOSE1/32 數(shù)據(jù)集上提升了4.3%、YOOCH?OOSE1/3數(shù)據(jù)集上提升了4.8%、DIGINETICA數(shù)據(jù)集上提升了5.2%。
圖5和圖6為在不同推薦列表長度情況下,RGANV 和GRU 在YOOCHOOSE1/32數(shù)據(jù)集和DIGI?NETICA數(shù)據(jù)集上的實驗結(jié)果對比。圖中,無橫坐標(biāo)為推薦列表的長度,縱坐標(biāo)為MRR數(shù)值。無花紋的柱狀圖為GRU方法的推薦結(jié)果,帶有花紋的柱狀圖為RGANV方法的推薦結(jié)果。
通過RGANV和GRU的對比實驗結(jié)果圖本文可以發(fā)現(xiàn),在不同的推薦列表長度情況下,RGANV模型在兩個數(shù)據(jù)集上均表現(xiàn)出了更加優(yōu)異的成績。在不同的推薦列表長度下,RGANV 對于平均倒數(shù)排名(Mean Reciprocal Rank,MRR)指標(biāo)提升的程度不盡相同,在推薦列表長度為15到20區(qū)間提升最為明顯。實驗結(jié)果很好地驗證了生成對抗網(wǎng)絡(luò)在推薦列表排名優(yōu)化問題上做出的貢獻。
4 結(jié)束語
本文使用生成對抗網(wǎng)絡(luò)技術(shù)對推薦列表進行二次排序的RGANV模型,使用了生成對抗網(wǎng)絡(luò),對于商品相關(guān)性評分的學(xué)習(xí),使得推薦列表中召回的商品位置更加靠前。首先,介紹了生成對抗網(wǎng)絡(luò)技術(shù)的基本原理及組成結(jié)構(gòu)。然后,介紹了RGANV模型的基本框架結(jié)構(gòu),分別介紹了如何構(gòu)建生成器與判別器。對生成器的更新方法-策略梯度進行闡述,給出了RGANV的訓(xùn)練過程。最后,通過對比實驗驗證該模型的優(yōu)越性。實驗結(jié)果表明,MRR指標(biāo)得到了明顯提升。在以后工作中,本文將嘗試引入更多的因素,例如商品種類與價格之間的關(guān)聯(lián)性,提高推薦的準確性。