999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向偏差問題的推薦方法研究綜述

2022-12-31 00:00:00郭楠黃慧慧
計算機應用研究 2022年10期

摘要:推薦系統偏差的研究眾多但零散,相關研究綜述較少。因此,根據偏差產生的主體將偏差分為用戶行為導致的偏差、物品展示導致的偏差和推薦算法導致的偏差,進而又細分為選擇偏差、一致性偏差等九種具體的類別,并給出各個偏差的定義和造成原因;著重對解決偏差問題的相關性推薦方法和因果性推薦方法的研究進行整理,并根據所采用技術手段或者所處訓練模型的前、中、后三個階段進一步分類,分析不同類別研究之間的區別和優勢;總結了在常用數據集上的偏差研究概況和新提出的偏差衡量指標;從不同的類別角度對面向偏差問題的推薦方法發展趨勢進行分析和展望,希望為推薦系統中的后續的偏差研究提供一定的幫助。

關鍵詞:推薦系統;偏差;去偏;因果性;相關性

中圖分類號:TP391文獻標志碼:A

文章編號:1001-3695(2022)10-001-2881-10

doi:10.19734/j.issn.1001-3695.2022.02.0092

Review of recommendation methods for problem of bias

Guo Nan,Huang Huihui

(School of Computer Science amp; Engineering,Northeastern University,Shenyang 110169,China)

Abstract:Due to the numerous but scattered studies on the bias of recommendation systems and few relevant research reviews,according to the subject that causes the bias,this paper divided bias into the bias in user behavior,the bias in item display,and the bias in recommendation algorithm,and then subdivided it into nine specific categories,such as selection bias and conformity bias,and gave the definition and causes of each bias.This paper focused on sorting out the research on correlation recommendation methods and causal recommendation methods to solve the bias problem,and further classified them according to the technical means or the first,middle and last three stages of the training model,and analyzed the differences and strengths between different types of research.This paper summarized the bias studies on common datasets and new bias measures,forecasted the development trend of bias-oriented recommendation methods from different categories,hoping to provide some help for the follow-up bias research in recommender system.

Key words:recommendation system;bias;debias;causality;correlation

0引言

近年來,隨著云計算、大數據等技術的迅猛發展,互聯網中產生的信息量呈爆炸式增長。這些大規模的數據帶來了嚴重的信息過載問題。推薦系統作為一種個性化信息篩選工具應運而生,它在用戶沒有明確需求的情況下能夠提供個性、精準、快速的篩選和推送,被認為是緩解信息過載的有效方法。如今,推薦技術已經被廣泛成功應用于眾多領域中,如電子商務平臺、社交網絡、視頻分享平臺、生活應用等。

雖然推薦系統在眾多領域中被廣泛應用,但是其面臨著眾多偏差問題,偏差問題的存在可能會使得無法精準捕捉用戶偏好,從而降低推薦的有效性。例如,用戶行為數據作為推薦模型訓練的基礎,是觀察性的而不是實驗性的。推薦系統最終觀察到的用戶行為歷史數據是各種復雜因素結合碰撞之后產生的結果,而不單純代表用戶對物品的喜愛程度。如果推薦算法不考慮如何準確地“蒸餾”出用戶對物品的偏好,可能會導致算法無法準確捕捉用戶的偏好,進而影響推薦效果。除了用戶行為的復雜性可能導致的偏差,推薦系統在把推薦物品展示給用戶時的展示方式,包括但不限于物品是否被曝光給用戶、物品曝光給用戶的部分特征、物品在展示頁面的位置、以及與周圍其他物品形成的對比情況等,這些都會影響用戶與物品交互的概率,混淆反饋數據,使得用戶的偏好更難以捕捉。最后就是推薦算法可能有自己本身的一些傾向性。例如,基于流行度的算法傾向于推薦較為流行的物品和內容。再者,推薦模型是一個從反饋數據到訓練模型,再到利用模型給用戶產生推薦列表,用戶交互后產生反饋數據往復循環的過程,這個不斷循環的過程也會進一步加大各種偏差。

推薦偏差的合理解決有利于更為準確地捕捉用戶偏好,但當前大多數推薦方法研究旨在發明一些機器學習模型來擬合用戶行為歷史數據,而忽略由于用戶行為習慣、物品展示方式以及推薦算法本身的設置導致觀察到的用戶行為數據存在眾多偏差的問題,例如選擇偏差[1,2]、曝光偏差[3]、位置偏差[4]等。這些偏差的普遍存在使得直接從數據中學習到的模型無法完全準確地表達出用戶的偏好,降低了推薦效果。因此,如何去除這些偏差對模型學習的影響,從而提升推薦系統的性能,逐漸引起了廣大學者和業界的關注。

現有的推薦系統偏差研究主要可以分為相關性偏差研究和因果性偏差研究。有些研究致力于發明一些模型來擬合用戶歷史數據,單純地通過匹配數據來學習或挖掘相關模式;也有研究在推薦過程中考慮因果關系,能在觀測數據之外思考用戶建模和個性化推薦[5]。關于解決推薦系統中偏差問題的研究眾多但零散,相關的研究綜述也很少[1]。因此,本文著重對近幾年解決偏差的相關研究進行整理和綜述,各個參考文獻來源情況匯總如圖1所示。不同于推薦系統綜述[6,7],本文著重分析面向偏差問題的推薦方法研究,從相關性角度和因果性角度對研究進行了分類闡述,分析不同研究之間的區別和優勢,并對面向偏差問題的推薦方法的發展趨勢進行分析和展望。

1推薦系統中的偏差問題

文獻[1]對推薦系統中的偏差問題進行了細致的總結與分析。不同于文獻[1],本文根據產生偏差的主體來劃分偏差的類別,并豐富和完善了偏差的種類。根據偏差產生主體的不同劃分偏差,從主體角度劃分偏差的類別,有利于統一去除同一個主體產生的各種偏差,為一次去除多種偏差提供思路。

1.1用戶行為導致的偏差

在推薦過程中,由于自身的行為、心理以及當時的狀態,用戶可以自由選擇對哪些物品進行瀏覽檢查、點擊和評分,也可能受到從眾心理、社交圈朋友或偶像的影響,從而作出一些不符合自己偏好的反饋行為,所以這些反饋數據并不能真實地表達出用戶真實的偏好。如果單純地使用這些反饋數據進行模型訓練和下一次推薦結果的生成,會一定程度上降低推薦效果。用戶行為導致的偏差主要有選擇偏差和一致性偏差。

a)選擇偏差。選擇偏差發生在用戶評分階段,因此常存在于顯式反饋數據中。由于用戶可以自由地選擇對哪些物品進行評分,所以最終觀察到的評分并不是所有評分的代表性樣本。文獻[2]通過讓用戶根據自己對歌曲的喜愛程度來估計自身對歌曲的評價頻率,證明了選擇偏差的存在。文獻[1]也表明,用戶更傾向于選擇和評價自己喜歡的物品,更有可能對特別差或特別好的物品評分。文獻[8~11]均提出無偏估計量來緩解選擇偏差問題。

b)一致性偏差。披露先前的集體評分會扭曲個人的決策以及個人對質量和價值的看法,評級系統不是簡單地匯總個人意見,而是創造一個以系統方式影響后續評級的環境[12]。一致性偏差就是指是用戶受到大眾或者朋友的影響,會傾向于給出與他人類似的反饋行為,即使并不符合自己的本意。這些反饋行為產生的數據并不總是可以精準地表達出用戶的真實偏好。文獻[13]通過對豆瓣數據集中的電影評分進行分析,證明了一致性偏差的存在。文獻[14~17]考慮通過建模社會因素對用戶行為產生的影響,進而引入特定參數來調節一致性偏差。

1.2物品展示導致的偏差

在推薦過程中,由于物品的展示方式,包括但不限于物品是否被曝光給用戶、物品曝光給用戶的部分特征、物品在頁面中的位置、以及與周圍其他物品形成的對比情況等,這些都會影響用戶與物品的交互,混淆反饋數據,使得不容易捕捉用戶真實的興趣偏好。物品展示導致的偏差主要有曝光偏差、點擊誘餌、位置偏差和上下文偏差。

a)曝光偏差。曝光偏差是由于物品不能全部被暴露給用戶,那些沒有曝光的物品沒有交互信息,但沒有交互信息不代表是負面偏好,所以存在正樣本未標記問題,這種問題常存在于隱式反饋數據中。某個用戶—物品對沒有交互信息可能是因為用戶不喜歡該物品或者并未檢查該物品,這些數據無法明確地表達用戶偏好,會產生歧義。影響物品曝光的因素有很多,例如先前推薦系統的偏差、用戶的地理位置以及物品熱度的影響等。文獻[3,18]分別利用均勻數據和負樣本采樣來解決曝光偏差問題。

b)點擊誘餌。點擊誘餌問題常存在于隱式反饋數據,指的是用戶作出點擊行為之前看到的物品曝光特征與點擊行為之后的物品內容特征不相符。例如,有些物品的點擊率雖高,但用戶滿意度卻很低,這些物品有可能標題和內容不相符或者物品內容質量太差,從而損害了用戶滿意度,對這些物品,推薦系統應該致力于提升用戶滿意度而不是用戶點擊率。為了緩解點擊誘餌問題,很多研究試圖在推薦算法中加入更多的信息,如停留時間、物品特征和各種用戶反饋,來縮小點擊和喜歡之間的差距[19]。文獻[20~22]首先根據這些信息識別出虛假點擊互動,然后僅使用正面互動去訓練模型,文獻[23~27]合并額外的點擊后反饋數據(如收藏)來優化推薦模型。

c)位置偏差和上下文偏差。位置偏差主要存在于搜索引擎或者廣告系統中,當用戶傾向于與列表中較高位置的物品進行交互而不考慮實際相關性時,物品展示的位置影響用戶與物品交互的概率,會干擾算法對用戶偏好的捕捉。文獻[4]進行了一項眼球跟蹤的綜合研究,印證了搜索引擎中位置偏差的存在。上下文偏差則是指用戶和物品交互的時候會被其周圍物品所影響,隨著用戶瀏覽深度的加大,上下文偏差的影響逐漸超過位置偏差,兩者均常存在于隱式反饋數據中。文獻[28,29]均采用IPS技術緩解上下文偏差。對各種偏差的總結如表1所示。文獻[3]同時解決了選擇偏差和曝光偏差;文獻[77]同時解決了選擇偏差、一致性偏差、曝光偏差、位置偏差;文獻[47]同時解決了位置偏差和上下文偏差;文獻[35]同時解決了選擇偏差和位置偏差;另外文獻[78~81]并未劃分偏差類別,以實現無偏推薦為目的,不具體針對某種具體類型偏差。

1.3推薦算法導致的偏差

不同的推薦算法本身也帶有一定的傾向,比如基于流行度的算法傾向于推薦較為流行的物品或內容,而基于協同過濾的算法則一般對交互比較多的用戶或物品的推薦更友好些。推薦算法導致的偏差主要有人氣偏差、不公平問題和循環偏差。

a)不公平。推薦中的不公平指的是系統不公平地歧視某些個人和群體,偏袒他人。例如,與男性相比,女性看到高薪工作的廣告較少。文獻[65]等就將此問題映射為一個有限的問題:公平地分配不可分割的物品,提出的FairRec算法不僅保證了大多數商品提供商的利益,也為每位用戶提供了較高的滿意度,相似的還有文獻[66],使用貪心算法來尋找公平的top-n列表解決組推薦中的公平性問題。

b)循環偏差。循環偏差的存在是由于推薦系統是一個從反饋數據訓練模型,再到利用模型給用戶產生推薦列表,用戶交互后產生反饋數據往復循環的過程,在這個不斷循環的過程中上述的各種偏差會進一步被加深。

2基于相關性去偏

相關性研究致力于發明一些模型來擬合用戶歷史數據,單純地通過匹配數據來學習或挖掘相關模式。但隨著推薦算法研究的不斷豐富,推薦結果的精確性和準確性不再是算法單純追求的目標,有研究人員注意到,僅僅基于相關性或關聯性無法很好地評估和解決公平性問題[82]。任何相關性的背后都隱藏著因果關系,相關性分析得到的結論有時是不可靠的甚至是錯誤的,且基于相關性的方法不能用于管理、控制和干預變量或事件[83]。因此基于因果性來緩解偏差的研究被提出。因果性研究在推薦過程中考慮因果關系,能在觀測數據之外思考用戶建模和個性化推薦[5]。本文將偏差相關文獻分為相關性去偏研究和因果性去偏研究。

在相關性去偏的研究中,根據文獻采用的技術以及作用的階段不同進行了分類和匯總,如圖2所示。其中,均勻數據和采樣屬于前處理操作,在訓練模型前就通過小部分無偏的數據或采樣手段來解決偏差問題,而樣本加權、正則化和訓練模型則是作用于訓練階段,目的是訓練出無偏的模型來產生無偏的推薦結果。訓練模型根據采用的技術不同又細分為生成性建模、強化學習、元學習、自動編碼器和對抗學習,評估器和重排序則是屬于后處理,旨在通過無偏的推薦指標和推薦列表的重新排序來緩解偏差問題。

2.1均勻數據和采樣

均勻數據可以緩解模型的偏差問題。對于用戶的請求,系統不再使用推薦模型生成推薦列表,而是從所有候選物品中隨機選擇某些物品進行推薦。均勻數據可以無偏差地反映用戶的偏好,也不受先前模型的影響,但是由于均勻數據的收集會損害用戶的體驗,所以如何有效地利用均勻數據就顯得十分重要。文獻[51]通過均勻數據的反事實建模來緩解循環偏差問題,為了更有效地使用少數有價值的均勻數據,提出了一個用于反事實推薦的通用知識蒸餾框架來實現均勻數據的建模,從而解決了循環偏差問題,不同的是,文獻[30]則利用均勻數據解決了選擇偏差。也有其他研究將均勻數據當做一種輔助手段來解決偏差問題。文獻[77]通過均勻數據來監督框架參數的學習,最大化均勻數據的損失來優化框架的去偏參數,而文獻[3]則是組合了均勻數據(uniform data)、逆傾向分數和數據填充(data imputation)來同時解決曝光偏差和位置偏差。

采樣策略可以控制哪些數據用來更新模型,從而糾正數據的分布。文獻[18]利用用戶瀏覽但是未點擊的數據通過負樣本采樣技術來解決曝光偏差問題,通過對抗訓練來生成高質量的負樣本。與之類似,文獻[40]則是在構建的基于物品的知識圖譜上進行采樣來緩解曝光偏差。

2.2樣本加權和正則化

樣本加權是指在模型訓練時修正每組樣本的損失貢獻值,傾向分數就可以用做樣本加權。逆傾向分數是一種反事實技術,可以利用這種思想重新加權收集的數據進行無偏的學習。但是這種方法依賴于傾向分數的準確性,通常會有方差較高的缺點,所以也衍生出了很多改進方法。文獻[52]提出用影響函數重新加權培訓樣本,更好地解決了循環偏差問題。

正則化也可以用來減少推薦模型的偏差[1]。為了解決人氣偏差問題,文獻[58]提出基于正則化的處理方法,通過降低物品流行度和模型預測分數之間的關聯程度來最小化偏差,預測分數和物品流行度之間的皮爾森相關系數作為正則化項。文獻[59]也將正則化作為一種輔助手段,根據人氣值懲罰物品的預測得分來緩解人氣偏差問題。也有學者將正則化用做解決不公平性問題。文獻[67]利用一個基于KL散度的正則化項,旨在對每個用戶的分數進行歸一化;文獻[68]則利用正交正則化使得無偏差的用戶嵌入正交于偏差感知的用戶嵌入,以便更好地區分兩者。

2.3訓練模型

偏差問題也可以通過訓練無偏的推薦模型來解決,直接使用無偏的推薦模型產生的推薦結果就是無偏的。無偏模型的訓練可以選用很多技術,根據各個研究采用技術的不同,本文將這些研究細分為生成性建模、強化學習、元學習、自動編碼器和對抗學習等不同的類別。

2.3.1生成性建模

生成性建模來解決偏差問題的主要思想是假設反饋數據的生成過程并相應減少偏差[77]。該類研究假設數據的生成過程,有利于定位各個偏差,被廣泛應用于解決各種偏差。圖3概括了點擊數據和評分數據的生成過程。文獻[31,32]通過建模評分的生成過程來解決選擇偏差問題。前者通過探索物品的可觀察性以及用戶選擇和評分之間的復雜依賴性來解決MNAR(missing not at random)問題,評分生成過程為觀察—選擇—評分。后者考慮了社交網絡,通過對觀察過程和評分過程的建模,解決了選擇偏差問題和受朋友推薦的物品會給出低分的問題,評分生成過程為觀察—評分。

也有其他學者將生產性建模的思想用于解決其他偏差問題。文獻[50]就提出了一個完全數據驅動的神經模型來解決上下文偏差問題,考慮點擊特定物品和同一會話中其他物品之間的關聯,包括相關性和位置,著重對檢查過程建模。文獻[60]則把人氣偏差問題歸因于整個推薦循環的各個階段,而不單單是一個原因造成的,提出了一種動態的緩解偏差策略,對整個推薦過程進行建模。文獻[44]則提出了一個增強的位置偏差模型,明確模擬了依賴于位置的點擊噪聲,解決了因用戶信任排名質量而導致的位置偏差,著重對檢查—點擊過程建模,并提出了補充模型來建模用戶感知相關性和實際相關性之間的關系。文獻[69]致力于解決新物品推薦公平性,在證明了數據偏差可以通過物品內容特征從熱啟動物品轉移到新物品之后,提出聯合學習生成模型來解決冷啟動階段的不公平問題,模型不斷調整物品匹配用戶分數分布狀況,彌補分數分布較低的物品,從而緩解不公平問題。不同的是,文獻[70]為了解決在推薦職業相關敏感物品時的性別偏差,提出使用神經協同過濾的預訓練和微調方法,加以偏差糾正技術開發了一種框架,更細致化地解決了推薦系統中的不公平問題。

2.3.2強化學習和元學習

眾多學者利用強化學習來解決各種偏差問題。文獻[71]認為應該考慮長期的公平性,隨著時間的發展,受公平性保護的物品組不應該是固定的。該研究關注不同物品組的曝光公平性,提出一種公平性約束的強化學習推薦算法,將推薦問題建模為一個約束馬爾可夫決策過程,能夠動態調整推薦策略,確保環境發生改變時,也能滿足公平性的要求。文獻[78]利用強化學習在模擬用戶行為之前糾正記錄數據中的偏差,實現了無偏的推薦。文獻[53,61]通過強化學習分別來解決循環偏差和人氣偏差,前者利用了反事實的技術,后者利用多臂老虎機來多樣化用戶偏好。

元學習的思想是如果模型能先在數據較多的數據集上學習,學習到一些先驗知識后再在數據較少的數據集上學習就變得容易。文獻[33]為了解決逆傾向分數會遭受較大方差的問題,利用元學習緩解選擇偏差。首先使用觀察到的評分數據預訓練三個推薦算法,然后使用其中兩個算法對隨機抽取的一系列用戶—物品對進行預測評分,如果兩個模型結果足夠相似,便使用兩個結果之一作為這一數據對的偽評分,這樣可以得到一個可以信賴的偽標簽數據集,最后在偽標簽數據集上去訓練第三個模型,由這個模型給出最終的推薦結果。文獻[77]也提出了基于元學習的參數學習方法,通過最小化風險化差異來統一處理各種偏差,實現了自適應的偏差解決方案。

2.3.3自動編碼器

也有研究利用自動編碼器來處理推薦系統中的各種偏差,自動編碼器框架如圖4所示。

文獻[72]關注主流偏差,是指推薦系統傾向于向具有主流品味的用戶提供更好的推薦結果,而忽略非主流用戶。在學習用戶和物品基于文本的卷積神經網絡時添加自動編碼器層,強制要求所有用戶和物品的獨特特征充分整合并保存在學習到的表示中,使得學習的表示更少地偏向于主流用戶,緩解了主流偏差的同時又保持了主流用戶的推薦質量,最終給所有用戶提供更加平衡的推薦結果。自動編碼器的原始輸入是用戶評論或物品屬性的特征表示,用來重構用戶和物品的原始特征向量。文獻[79]為了更好地利用大量未觀測數據,實現自適應的權重分配和有效的模型學習,提出了一種基于變分自動編碼器的快速自適應加權矩陣分解方案對數據可信度權重進行建模,減少推斷參數數量的同時還能夠捕獲用戶之間的潛在相互作用,其中編碼器是用來編碼用戶影響力,即消費量,解碼器用來預測用戶的消費,共同組成自動編碼器來學習矩陣分解的數據置信度權重和潛在因素。

2.3.4對抗學習

現有研究常使用對抗學習來解決推薦系統中的不公平問題,對抗式學習框架如圖5所示。文獻[73]提出一種基于圖的解決方案,給定任何模型的原始嵌入,學習一組過濾器,將用戶和物品的原始嵌入轉換到基于敏感特征集的過濾嵌入空間中。對于每個用戶,這種轉換是在以用戶為中心的圖的對抗學習下實現的,以便混淆過濾后的用戶嵌入和該用戶子圖結構之間的敏感特征。過濾后的嵌入不僅能表示用戶偏好的同時還必須是公平的,不會泄露用戶的敏感信息。采用對抗學習技術訓練模型,過濾網絡扮演生成器的角色試圖掩蓋用戶的敏感信息,而鑒別器網絡將過濾后的嵌入作為輸入,試圖預測敏感屬性的值,兩個網絡進行極小極大博弈。

文獻[67]通過一個去偏化的個性化排名模型展示了如何基于統計均等和機會均等來克服不公平問題,其中采用對抗學習來增強物品組之間分數分布的相似性,在BPR(Bayesian personalized ranking)模型和鑒別器之間進行極大極小博弈,BPR模型扮演生成器需要防止鑒別器對物品組進行正確分類,鑒別器則是根據BPR預測的用戶物品得分對物品組進行分類。文獻[68]則是將用戶興趣分解為兩個部分,一個組件用于學習一種感知偏差的用戶嵌入來捕獲敏感用戶屬性上的偏差信息,另一個組件用于學習無偏差的用戶嵌入僅捕獲用戶興趣信息,無偏差的用戶嵌入則采用了對抗學習來訓練,學習無偏差用戶嵌入的模型扮演生成器角色,屬性鑒別器則用來從無偏差用戶嵌入中推斷用戶屬性,兩者形成對抗。最后,為了實現公平的新聞排名系統,只使用無偏差用戶嵌入來產生推薦結果。

2.4評估器和重排序

利用評估器去除偏差的主要思想是通過修正評估度量來實現無偏的推薦,修正評估度量的研究主要利用逆傾向分數技術來實現。也有相關學者提出新的指標來衡量人氣偏差。文獻[55]提出了校準的概念來衡量用戶歷史物品的人氣分布和推薦物品之間的匹配度,從不同利益相關者角度衡量時,該度量能更好地反映算法的性能。之后的研究[56]又從用戶角度出發,提出了一個可以衡量人氣偏差的新指標UPD(user popularity deviation)。

重排序是一種可以應用于任何推薦算法輸出的后處理步驟,是以先前推薦模型輸出的top-n列表為基礎進行的,重排序的任務就是生成一個新的重新排序的top-k列表,其中(k≤n),該列表在保證一定準確性的同時也考慮了偏差問題。文獻[57]為了緩解人氣偏差,引入了個性化的重新排名方法來增加推薦列表中不太受歡迎的物品數量,同時保持可接受的推薦準確性。文獻[74]則是根據用戶的活動水平對不同用戶群體進行分析,提出了一種基于啟發式重新排序的公平性約束方法來緩解知識圖上的不公平問題,除了群體不公平度量,還提出了個體不公平度量,只需替換約束條件即可。文獻[75]也是從用戶角度出發解決弱勢群體的問題,提出了一種重新排序的方法,在評估指標上添加約束,生成公平感知的推薦列表,從而緩解了不公平問題,具體來說,將原始推薦算法輸出的top-N列表作為重新排序算法的輸入,重新排序算法的目標函數是最大化公平約束下的預測評分總和,最后輸出top-k列表,對top-k列表中的物品進行排序,作為最終的推薦列表。

2.5基于相關性去偏總結

均勻數據是通過隨機推薦策略實施推薦來收集的無偏數據,數據本身就是不存在偏差的,但缺點在于這種數據的收集和處理有可能會損害用戶體驗,成本較高。采樣方式是通過合理的采樣策略來控制哪些數據用來訓練模型,采樣策略的選定較為關鍵。樣本加權則是在訓練過程中給不同的樣本賦于不同的權重來緩解偏差,正則化也屬于訓練模型的一種,在訓練模型中通過正則化項來影響偏差和推薦結果之間的關聯程度,從而緩解偏差問題。訓練模型則是利用各種技術在訓練模型的過程中將偏差解決。評估器是通過修正評估度量來實現無偏的推薦,依賴于新提出的衡量偏差指標。重排序是一種可以應用于任何推薦算法的后處理步驟,對有偏差存在的推薦列表通過一定的重排序規則,減少偏差對推薦結果的影響程度。

均勻數據和采樣屬于前處理方式,致力于在將數據輸入訓練模型前就解決偏差問題,而樣本加權、正則化、訓練模型等中處理手段致力于在訓練模型過程中解決偏差,評估器和重排序等后處理操作致力于在訓練出模型之后再對推薦結果進行微調來調控偏差問題。

3基于因果性去偏

相關性推薦對觀測數據的依賴較大,優勢在于思想簡單,只需不斷地擬合數據,最終使得模型能較好地匹配數據。但是僅僅基于相關性無法很好地評估和解決偏差問題,這是因為相關性無法推理出輸入和輸出之間的因果關系,而偏差存在的原因可能存在于用戶和系統交互某一個階段中的因果關系中。因此,因果性推薦比較適合解決偏差問題,更有利于偏差的定位和解決,更有利于準確地消除偏差所帶來不良影響,也有利于提升推薦算法的可解釋性。

因果推斷是基于效果發生的條件來得出關于因果關系結論的過程[84]。基于因果推斷的相關研究大多是在干預和反事實的基礎上定義的,干預可通過隨機實驗來實現,而反事實則考慮現實世界之外的假設世界。當前主流研究主要是利用因果推斷中的逆傾向分數和因果圖來緩解推薦系統中的偏差。

3.1基于IPS技術的因果性去偏

IPS屬于因果推斷中的一種技術,可以調節原始數據的分布。該方法通過重新加權樣本將觀察到的記錄數據轉換為偽隨機實驗。一般來說,首先估計傾向分數,然后用傾向分數的倒數重新加權樣本,傾向分數可以看做是某種事件發生的概率,IPS已被廣泛用于無偏評估和學習[45]。利用IPS消除偏差的研究可以分為評估器和模型訓練兩類。評估器主要是利用傾向分數的思想來糾正評價指標,而利用IPS的模型訓練主要是利用傾向分數的思想融合到訓練過程,進而實現無偏推薦。

IPS思想也可以融合到模型訓練中實現無偏推薦。文獻[80]為推薦的因果效應提出了一個無偏的學習框架,首先構建用于排名度量的無偏估計,然后對估計器進行經驗風險最小化,其中的傾向分數是通過數據集的統計指標來計算的。也有文獻通過模型來計算傾向分數。例如,文獻[42]提出一個組合聯合學習,同時學習無偏的用戶—物品相關性和無偏的傾向性,用數據集的不同部分去學習這兩個子模型,以防數據重復使用帶來的偏差問題,其中傾向分數的計算就是通過模型從數據中學習出來的;文獻[81]為了提高傾向得分估計的準確性,使用了小型的注釋數據集來推斷可重復使用的傾向模型的參數;文獻[43]則提出了一種配對傾向得分估計方法,通過計算用戶流行度和無偏流行度的配對程度更精確地緩解了曝光偏差。相關學者通過傾向估計來緩解位置偏差[45,48,49]和上下文偏差[29]。為了降低對用戶搜索體驗的侵入性干擾,文獻[45]提出了一種從反饋日志中獲取干預數據的方法,在無干預的情況下進行位置偏差的估計。也有相關學者致力于改進IPS方差較大的缺點來緩解選擇偏差。文獻[8]結合了data imputation模型和IPS模型,構建了無偏估計器,只要兩種模型中有一種模型正確,便可保證算法的無偏性,最終實現了雙重魯棒性。文獻[9,10]也提出了優于IPS的雙重魯棒性評估器,最新的研究中文獻[11]為了進一步減少方差,提出了MRDR(more robust doubly robust)估計量。

上述利用IPS思想的相關研究很好地解決了積極反饋的偏差,但卻未考慮缺失反饋數據的偏差,忽略了未點擊物品也不一定不相關的問題,所以有相關學者就此不足展開研究和改進。文獻[35]提出了一種雙重的推薦學習框架,所提出的損失函數采用兩種傾向加權,以更有效地估計點擊和未點擊數據的真實偏好,同時消除了點擊和未點擊數據的偏差。文獻[36,37]則是對IPS進行改進,提出了一種新的加權方案(propensity ratio scoring)來考慮缺失反饋偏差問題的解決。

本文對基于IPS的相關文獻整理匯總如表2所示。其中使用數據范圍是指文獻中推薦算法輸入數據的范圍,反饋數據是指用戶和物品有交互記錄的數據,沒有反饋數據并不代表用戶對物品不感興趣。填充數據是指用戶和物品沒有交互記錄的數據,但論文做了數據填充。

3.2基于因果圖的因果性去偏

因果圖是反事實推理的有力工具。從觀察到的數據中解決因果推斷問題有潛在結果框架(potential outcome framework)和結構因果模型(structural causal model)兩種框架。結構因果模型包括因果圖和結構方程式,可以將系統中的因果描述為一組變量和變量之間的因果關系,其中變量之間的因果關系由一組同時成立的結構不等式來建模[84]。

因果圖能夠描述推薦系統中的因果關系,模擬出用戶和物品交互的可能因素,剖析具體某個偏差存在的位置,進而利用各種手段去除偏差的影響。文獻[39]就利用因果推理來解決一致性偏差。首先假設用戶對物品的點擊行為取決于興趣和一致性偏差;然后基于構建的因果圖使用兩種不同原因的數據分開訓練兩種嵌入,一種是興趣嵌入來捕捉用戶對物品的真實興趣,另一種是符合性嵌入來捕捉從眾心理引起的一致性偏差;再利用多課程任務學習來平衡兩種原因;最后消除了一致性偏差。每個用戶的一致性偏差是基于因果圖通過數據學習到的一種嵌入,保證了算法的可解釋性和健壯性。該研究基于的因果圖較為簡單,故而對一致性偏差的捕捉和定位也比較籠統。

文獻[63]利用較為精細的因果圖來描述整個推薦過程中重要的因果關系,將用戶與物品的交互歸因于用戶和物品的匹配度、物品流行度和用戶活躍度,在訓練期間利用多任務學習模擬每種原因的貢獻值,在測試期間執行反事實推理來消除人氣的影響,最終緩解了人氣偏差。但文獻[64]則認為并不是所有的偏差都是有害的,不能盲目地消除所有偏差,提出有效地利用人氣偏差來提高推薦效果,文獻認為人氣偏差的存在是因為熱門的物品過度曝光,并通過更加精細化的因果圖假定了反饋數據的生成過程,在訓練階段消除了人氣偏差帶來的消極影響的同時也利用了人氣偏差的積極影響,達到了利用偏差提高推薦效果的目的。也有學者利用因果圖解決點擊誘餌問題。

從圖6可以看出,推薦系統中最簡化的因果圖由兩條因果關系構成,分別是物品特征(I)→ 交互概率(Y)和用戶特征(U)→ 交互概率(Y),代表用戶和物品的交互概率由物品特征和用戶特征決定。文獻[63]則從物品特征(I)→ 交互概率(Y)因果關系中細化出了用戶特征和和物品特征的匹配度(K)。文獻[64]也更加細化了物品特征(I)→ 交互概率(Y)的因果關系,認為物品的人氣(Z)是其中的一個混淆因子,并有效利用人氣偏差提升了推薦效果。文獻[19]在物品特征(I)→ 交互概率(Y)的因果效應中加入物品暴露特征(E)和內容特征(T),分別代表物品在用戶點擊之前物品暴露給用戶的特征和用戶點擊之后看到的物品內部特征,定位到了點擊誘餌產生的具體原因,文獻[54]則實現了對用戶特征(U)→ 交互概率(Y)因果效應的精細化,加入了訓練數據在物品不同類別中的分布(D)和組級別的用戶特征(M),定位了循環偏差。

基于因果圖的研究提供了一種關于一次性解決同一主體各種偏差的思路,將各種用戶產生偏差均定位到用戶特征(U)→交互概率(Y)因果關系中,不斷細化梳理各種偏差產生的因果過程,最后統一訓練用戶無偏的特征表示,一次性去除由用戶產生的各種偏差。

3.3其他因果性去偏方法

除了IPS和因果圖這兩種因果技術,也有其他研究學者將因果性方法融合一些深度學習技術來實現因果性去偏。文獻[76]指出用戶對公平的需求是個性化的,提出從用戶特征中剔除敏感特征來實現個性化的反事實公平,通過對抗學習生成特征獨立的用戶嵌入進行推薦,同時算法也覆蓋非個性化的情況。該研究同時訓練預測器和對抗分類器,前者學習推薦任務的信息表示,后者從學到的信息表示中預測受保護特征,將敏感特征從學習到的表示中移除,確保了算法的公平性。另外,文獻[38]為了解決選擇偏差和位置偏差提出了一種新的反事實方法,采用了Heckman兩階段法,并考慮了系統中的選擇和位置偏差,在偏差不大的情況下,對噪聲具有更強的魯棒性和更高的精度。

3.4基于因果性去偏總結

基于IPS的偏差解決方案主要通過估計傾向分數和用傾向分數的倒數重新加權樣本融合到推薦模型中來緩解偏差。而基于因果圖的偏差解決方案則是通過因果圖來描述推薦系統中的因果關系,模擬出用戶和物品交互的可能因素,剖析具體某個偏差存在與某條因果關系中,進而利用各種手段去除偏差的影響。基于IPS的偏差解決方案依賴于傾向分數的計算,傾向分數的不準確可能導致該方法的方差較大。傾向分數的計算可以通過簡單的自定義函數或預先的實驗來確定,也可以在訓練數據的過程中來學習。基于因果圖的難點在于如何正確地擬定推薦系統中的因果關系,只有擬定的因果關系符合整個推薦過程的因果關系才會緩解偏差,進而提升推薦效果。

3.5基于相關性去偏和基于因果性去偏的對比分析

相關性去偏致力于通過不斷地擬合數據來挖掘相關模式去實現無偏的推薦。思路較為簡單,無須推薦所屬領域的因果先驗知識,只需擬合數據,進而糾正偏差提升推薦效果即可。但是由于虛假相關性的存在,模型在訓練數據中挖掘到的相關關系不一定總是成立,所以會導致訓練好的模型在與訓練數據分布狀況不同的數據中進行推薦時效果較差。虛假相關性也會導致不正確的推薦結果,所以就算是在訓練數據和測試數據分布狀況相同的情況下,相關性去偏也不一定總是可靠,而且推薦規則是不可解釋和不可干預的。對相關性去偏方法與因果性去偏方法整理對比如表4所示。

因果性去偏能夠去掉相關性去偏方法中的強虛假相關性,因此推薦規則更加可靠。因果性去偏中提前擬定的因果關系也導致推薦規則具有一定的可解釋性,而且可以利用因果干預技術獲得更優質的推薦結果。因果性去偏利用推薦系統中的因果關系實施推薦,不過分依賴于訓練數據中的相關性,模型的推薦效果泛化能力較好。提前擬定的因果關系雖然能夠帶來一定的解釋性,但如果提前擬定的因果關系不符合現實世界中實際的因果關系或者不全面不準確,推薦效果則會較差。

4數據集和評價指標

推薦模型的推薦效果要想獲得公認、客觀的評價,統一的數據集和評價標準是必不可少的。偏差問題客觀存在于各種推薦場景中,偏差研究目的是修正偏差,進一步提升推薦效果,因此偏差相關的研究所選用的數據集和推薦系統常用數據集無異。

本章主要總結前述偏差研究中所使用的公開數據集和評價指標,對當前學者所選用的數據集以及所研究的偏差種類進行匯總,如表5所示。

4.1常用數據集

MovieLens包含多個用戶對多部電影的評級數據和電影元數據信息。眾多研究在MovieLens數據集上進行去偏實驗,緩解了其中的人氣偏差 [55~61,63]、不公平[38,67,69,71,73]、選擇偏差[10,33~35]、曝光偏差[41]、一致性偏差[39]和循環偏差[54]。相關的電影數據集還有Netflix,文獻[39]使用該數據集進行實驗緩解了一致性偏差。Last.fm是一個在線音樂數據集,包含用戶的收聽記錄以及匿名用戶的社交網絡情況。有研究緩解了其中的人氣偏差[55,56]、曝光偏差[40]和不公平問題[73]。Epinions數據集被廣泛應用在商品推薦領域,有相關研究緩解了該數據集中的人氣偏差[57,65]和選擇偏差[32]。

Adressa數據集包含了用戶對文章的評分記錄。有相關研究緩解了該數據集中的人氣偏差[63]、點擊誘餌[19]和不公平問題[67]。Yelp數據集是美國最大的點評網站內部整理得到的數據集。文獻[40,63]分別緩解了該數據集中的曝光偏差和人氣偏差。

Yahoo!R3是音樂服務推薦中的一個數據集,其中測試集通過要求用戶對隨機選擇的歌曲進行評分來收集。當前眾多研究緩解了該數據集中的選擇偏差[8,10,11,30,31,33,37]、循環偏差[51,52]、位置偏差[48]、曝光偏差[41,42]和上下文偏差[50]。coat數據集包含機械工人對外套的評分。其中測試集是通過要求工人對隨機選擇的外套進行評分而收集。眾多研究緩解了該數據集中的選擇偏差、循環偏差和曝光偏差。

4.2性能評價指標

推薦算法的評估指標根據推薦任務的不同可分為評分預測指標、集合推薦指標、排名推薦指標以及偏差衡量指標,其中前三類評價指標都屬于傳統性能評價指標。在不考慮偏差的推薦算法中,評分預測指標降低,或者集合推薦指標和排名推薦指標升高,能直接代表推薦效果的提升。在考慮偏差的研究中,除了評分預測指標降低、集合推薦指標和排名推薦指標升高,還有偏差衡量效果指標的變化,可以代表去偏效果的提升,進而提升推薦效果。

4.2.1傳統性能評價指標

a)評分預測指標。評分預測的準確度一般根據均方根誤差(RMSE)、平均絕對誤差(MAE)和均方誤差(MSE)計算。去除偏差的效果越好,評分預測指標就會越小,推薦效果越好。

b)集合推薦指標。由于數據稀疏性和冷啟動問題的存在,有時直接預測用戶對物品的評分是困難的,top-n推薦方法被廣泛使用,不再預測用戶對物品的評分,而是生成一組用戶最有可能喜歡的物品集合推薦給用戶。去除偏差的效果越好,集合推薦指標就會越大。top-n推薦中廣泛使用的推薦效果指標包括準確率、召回率、F1指標等。

c)排名推薦指標。當推薦物品的數量很大時,用戶會更重視推薦列表中排在前面的物品,去除偏差的效果越好,排名推薦指標就會越大。常用的排名度量指標包括歸一化折扣累計收益和平均準確率。

推薦領域數據集眾多,且評價指標多樣,本文對所涉及參考文獻的實驗效果進行了匯總對比。由于包含來自隨機實驗的無偏數據,coat和Yahoo!R3數據集在推薦系統中的偏差領域被廣泛使用,所以本文整理出coat和Yahoo!R3上的部分實驗數據,如表6、7所示,希望為后續研究提供一定的指導性。從表中可以看出,因果性去偏方法在評分預測指標上較有優勢,但優勢不明顯,而在集合推薦指標上的效果對比顯示,相關性的解決方案指標效果較好,也間接證明了基于相關性的偏差解決方案擬合數據效果更好,而基于因果性的偏差解決方案只能擬合一部分數據。

4.2.2偏差衡量指標

目前推薦系統中的偏差研究還不夠完善和全面,暫時還沒有較為統一和權威的偏差衡量指標。因此本文對前述相關文獻中所提出的偏差衡量指標進行匯總,希望為后續的推薦系統偏差研究提供參考。

ARP(average recommendation popularity)指標用來計算每個列表中推薦物品的平均受歡迎程度,對于推薦列表中的任何給定建議物品,它測量這些物品的平均評分數,如式(1)所示,其中(i)表示培訓集中物品i的評級次數。但是ARP會因為算法向每個人推薦一些非常不受歡迎的物品而取值較低。為了彌補這一缺點,出現了另一個指標來表示所有用戶中獨特推薦物品的比率,用來度量一個算法在多大程度上增加了唯一推薦物品的數量,如式(2)所示。此指標的值越高,說明推薦列表涵蓋的物品類別越多,但是此指標不區分物品推薦的次數,所以經常考慮基尼指數來以確保建議在所有物品中公平分布。

ARP=1|U|∑u∈U∑i∈Lu(i)|Lu|(1)

Agg-Div=|Uu∈vLu||I|(2)

基尼指數用來測量推薦物品頻率分布的不均勻性。如果經常推薦某些物品而忽略其他物品,基尼指數將很高,如下:

Gini(L)=1-1|I|-1∑|I|k=1(2k-|I|-1)p(ik|L)(3)

其中:p(i|L)是物品i在L中出現的比率。

文獻[60]為了量化人氣偏差,選擇使用基尼系數來衡量與物品受歡迎程度相對應的真陽性率的平等性,假設物品i的點擊量為Ci,如式(4)(5)所示。

TPRi=CiAi(4)

Gini=∑i∈I(2i-M-1)TPRiM∑i∈ITPRi(5)

其中:Ai表示喜歡物品i的匹配用戶總數;物品索引從1到M,Gini的取值為[-1,1],取值越小代表人氣偏差越小。

文獻[71]使用了人氣率(popularity rate)作為一種公平性度量方式。它是指推薦列表中受歡迎的物品相對于列表中的物品總數的比值,也可以看做受歡迎程度的公平性度量。度量值越小,系統越公平。文獻[71]也使用基尼指數來量化個體推薦質量的不公平程度,給出所有物品的印象列表M=[g1,g2,…,g|I|],基尼指數公式如式(6)所示。

Gini Index(G)=12|I|2∑|I|i=1∑|I|j=1|gi-gj|(6)

其中:表示印象列表的均值。

文獻[69]提出了一個指標平均貼現收益(mean discounted gain,MDG)來衡量公平性,公式如式(7)所示。

MDGi=1U+i∑u∈U+iδ(u,i≤k)log(1+u,i)(7)

其中:U+i是新物品i在測試集中的匹配用戶集;u,i是物品i在用戶u推薦列表中的排序位置。MDGi=0意味著物品i在測試期間并沒有推薦給喜歡它的用戶,MDGi=1意味著在測試過程中,物品i對所有匹配用戶都排名第一。

文獻[61]使用驚喜度指標,該指標反映了在推薦列表中為用戶找到物品的意外程度,它是通過計算在為用戶u準備的推薦列表Lu的p位置上找到物品i的可能性相對于隨機用戶找到該物品的可能性,公式如式(8)~(10)所示。例如,僅基于人氣的非個性化推薦策略的得分為0,如果只推薦不同的和用戶不相關的物品,包括長尾物品,得分也是0。

serendipityu@k=1k[∑kp=1max(PrLku[p] (u)-PrLku[p] (U),0)·r(u,i)](8)

Pri(u)=k-rankik-1,

Pri(U)=∑u∈UPri(u)|U|(9)

5研究趨勢分析和展望

本文將推薦系統中的偏差研究分為相關性緩解偏差和因果性緩解偏差,按不同的類別分別對相關研究進行分析和展望。

a)前處理的技術手段主要有均勻數據和采樣,數據的收集和處理有可能會損害用戶體驗,成本較高,所以很多研究致力于更好地利用均勻數據或者結合其他技術手段來達到緩解偏差的目的,如何更好地利用均勻數據以及更優質的采樣策略是后續研究可以關注的問題。而后處理是在模型輸出結果之后進行調整來緩解偏差問題,方法較為簡單,成本低且具有一定的可解釋性,后續研究可以定義更優質的評估器和重排序策略來緩解推薦系統中的偏差問題。

b)中處理主要是通過一些訓練模型或者手段來糾正偏差。相較于前處理和后處理,可解釋性會較差,且相較于前處理和后處理,中處理訓練的模型會更依賴于訓練數據,模型的可移植性不高。構建更優質的模型、提高模型的可解釋性以及提升去偏模型的通用性是接下來主要的研究問題。

c)利用因果技術解決推薦系統中的偏差,主要分為基于IPS的研究和基于因果圖的研究。利用IPS技術緩解推薦系統中的偏差主要是通過修正評價指標和樣本加權兩種方式,各個研究的主要不同之處在于傾向分數的計算以及其所基于的假設。該方法效果的好壞很大程度上依賴于傾向分數計算的準確性,傾向分數的不準確性會導致該方法的方差較大。關于傾向分數的計算,有的研究使用單純自定義的函數來計算,有的進行預先的實驗來提前確定,也有的通過無偏的模型從數據中來學習傾向分數。如何更加準確地計算傾向分數和改善IPS方差大的缺點將是未來主要的研究問題。

d)基于因果圖的因果性去偏主要思想就是理清推薦系統中的因果關系,定位到偏差的位置,然后利用反事實推斷來去掉偏差帶來的消極影響。難點是如何確定各種因果關系,只有擬定的因果關系符合整個推薦過程的因果關系,最終才會帶來推薦效果的提升。未來的研究方向應是利用更準確細致的因果圖,能夠更全面理清推薦過程的因果關系,發現更細粒度的因果關系,去掉由混淆因子帶來的虛假相關性,保留用戶作出某種反饋行為的因果關系,進而準確捕捉隱藏于混淆反饋數據中的真實用戶偏好,更好地提升推薦效果。

e)由于同一推薦場景中會同時存在多種偏差,只解決某一種偏差并不能保證推薦算法的無偏性,最大程度地提升推薦效果,如何去除多種偏差也是亟待解決的一個問題。另外,傳統的指標不足以衡量推薦問題的偏差程度,而目前尚未有統一的偏差衡量指標,更合理有效和統一的偏差衡量指標的出現能規范推薦算法偏差的相關研究。另外,像Yahoo!R3和coat包含無偏數據的數據集的搜集和發布,也會極大地促進推薦系統偏差方面研究的進展。

6結束語

由于推薦系統解決信息過載問題的有效性,推薦系統在各個領域的應用廣泛且普遍,其中不可忽略的偏差問題也引起了廣大學者和業界的關注和研究。偏差的存在影響了推薦效果,如何妥善緩解和處理偏差問題就顯得十分重要。因果技術能夠發現整個推薦過程中的因果關系,有利于準確清晰了解整個推薦過程的因果關系,同時也提供了一定的可解釋性。為了更好地理解推薦系統中的各種偏差,本文首先根據不同的產生主體對偏差進行分類,從主體角度劃分偏差的類別,有利于統一去除同一個主體產生的各種偏差,為一次性去除多種偏差提供思路;其次本文重點從相關性和因果性的角度分析和對比了推薦系統中有關解決偏差的各個研究,希望能促進使用因果手段解決推薦系統偏差的研究;接下來本文總結和分析了當前推薦系統偏差研究普遍使用的數據集和性能評價指標以及新提出的偏差衡量指標,希望為偏差衡量指標的研究提供思路;最后對推薦系統中的偏差研究今后的發展方向進行探討和展望。

參考文獻:

[1]Chen Jiawei,Dong Hande,Wang Xian,et al.Bias and debias in recommender system:a survey and future directions[EB/OL].(2010-10-07)[2022-02-10].https://arxiv.org/pdf/2010.03240.pdf.

[2]Marlin B M,Zemel R S,Roweis S,et al.Collaborative filtering and the missing at random assumption[C]//Proc of the 23rd Conference on Uncertainty in Artificial Intelligence.Arlington,Virginia:AUAI Press,2007:267-275.

[3]Yuan Bowen,Liu Yaxu,Hsia J Y,et al.Unbiased ad click prediction for position-aware advertising systems[C]//Proc of the 14th ACM Confe-rence on Recommender Systems.New York:ACM Press,2020:368-377.

[4]Joachims T,Granka L,Pan B,et al.Accurately interpreting clickthrough data as implicit feedback[J].ACM SIGIR Forum,2017,51(1):4-11.

[5]Xu Shuyuan,Ge Yingqiang,Li Yunqi,et al.Causal collaborative filtering[EB/OL].(2021-02-03)[2022-02-10].https://arxiv.org/pdf/2110.07122.pdf.

[6]李孟浩,趙學健,余云峰,等.推薦算法研究進展[J/OL].小型微型計算機系統,2022,43(3):544-554.(Li Menghao,Zhao Xuejian,Yu Yunfeng,et al.Survey on research progress of recommendation algorithms[J].Journal of Chinese Computer Systems,2022,43(3):544-554.)

[7]于蒙,何文濤,周緒川,等.推薦系統綜述[J].計算機應用,2022,42(6):1898-1913.(Yu Meng,He Wentao,Zhou Xuchuan,et al.Overview of recommendation system[J].Journal of Computer Applications,2022,42(6):1898-1913.)

[8]Wang Xiaojie,Zhang Rui,Sun Yu,et al.Doubly robust joint learning for recommendation on data missing not at random[C]//Proc of International Conference on Machine Learning.New York:ACM Press,2019:6638-6647.

[9]Zhang Wenhao,Bao Wentian,Liu Xiaoyang,et al.Large-scale causal approaches to debiasing post-click conversion rate estimation with multi-task learning[C]//Proc of Web Conference.New York:ACM Press,2020:2775-2781.

[10]Saito Y.Doubly robust estimator for ranking metrics with post-click conversions[C]//Proc of the 14th ACM Conference on Recommender Systems.New York:ACM Press,2020:92-100.

[11]Guo Siyuan,Zou Lixin,Liu Yiding,et al.Enhanced doubly robust learning for debiasing post-click conversion rate estimation[EB/OL].(2022-01-09)[2022-02-10].https://arxiv.org/pdf/2105.13623.pdf.

[12]Wang Tian,Wang Dashun.Why Amazon’s ratings might mislead you:the story of herding effects[J].Big Data,2014,2(4):196-204.

[13]Liu Yiming,Cao Xuezhi,Yu Yong.Are you influenced by others when rating?Improve rating prediction by conformity modeling[C]//Proc of the 10th ACM Conference on Recommender Systems.New York:ACM Press,2016:269-272.

[14]Ma Hao,King I,Lyu M R.Learning to recommend with social trust ensemble[C]//Proc of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2009:203-210.

[15]Tang Jiliang,Gao Huiji,Liu Huan.mTrust:discerning multi-faceted trust in a connected world[C]//Proc of the 15th ACM International Conference on Web search and Data Mining.New York:ACM Press,2012:93-102.

[16]Chaney A J B,Blei D M,Eliassi-Rad T.A probabilistic model for using social networks in personalized item recommendation[C]//Proc of the 9th ACM Conference on Recommender Systems.New York:ACM Press,2015:43-50.

[17]Wang Xin,Hoi S C H,Ester M,et al.Learning personalized preference of strong and weak ties for social recommendation[C]//Proc of the 26th International Conference on World Wide Web.New York:ACM Press,2017:1601-1610.

[18]Ding Jingtao,Quan Yuhan,He Xiangnan,et al.Reinforced negative sampling for recommendation with exposure data[C]//Proc of the 28th International Joint Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2019:2230-2236.

[19]Wang Wenjie,Feng Fuli,He Xiangnan,et al.Clicks can be cheating:counterfactual recommendation for mitigating clickbait issue[C]//Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2021:1288-1297.

[20]Lu Hongyu,Zhang Min,Ma Shaoping.Between clicks and satisfaction:study on multi-phase user preferences and satisfaction for online news reading[C]//Proc of the 41st International ACM SIGIR Conference on Research amp; Development in Information Retrieval.New York:ACM Press,2018:435-444.

[21]Lu Hongyu,Zhang Min,Ma Weizhi,et al.Effects of user negative experience in mobile news streaming[C]//Proc of the 42nd Internatio-nal ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2019:705-714.

[22]Zannettou S,Chatzis S,Papadamou K,et al.The good,the bad and the bait:detecting and characterizing clickbait on YouTube[C]//Proc of IEEE Security and Privacy Workshops.Piscataway,NJ:IEEE Press,2018:63-69.

[23]Wen Hongyi,Yang Longqi,Estrin D.Leveraging post-click feedback for content recommendations[C]//Proc of the 13th ACM Conference on Recommender Systems.New York:ACM Press,2019:278-286.

[24]Yi Xing,Hong Lianjie,Zhong Erheng,et al.Beyond clicks:dwell time for personalization[C]//Proc of the 8th ACM Conference on Recommender systems.New York:ACM Press,2014:113-120.

[25]Yin Peifeng,Luo Ping,Lee W C,et al.Silence is also evidence:interpreting dwell time for recommendation from psychological perspective[C]//Proc of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM Press,2013:989-997.

[26]Yang B,Lee S,Park S,et al.Exploiting various implicit feedback for collaborative filtering[C]//Proc of the 21st International Conference on World Wide Web.New York:ACM Press,2012:639-640.

[27]Liu Chao,White R W,Dumais S.Understanding web browsing beha-viors through Weibull analysis of dwell time[C]//Proc of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2010:379-386.

[28]Wu Xinwei,Chen Hechang,Zhao Jiazhu,et al.Unbiased learning to rank in feeds recommendation[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2021:490-498.

[29]Fang Zhichong,Agarwal A,Joachims T.Intervention harvesting for context-dependent examination-bias estimation[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2019:825-834.

[30]Wang Xiaojie,Zhang Rui,Sun Yu,et al.Combating selection biases in recommender systems with a few unbiased ratings[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2021:427-435.

[31]Zhang Qi,Cao Longbin,Shi Chongyang,et al.Tripartite collaborative filtering with observability and selection for debiasing rating estimation on missing-not-at-random data[C]//Proc of AAAI Conference on Artificial Intelligence.New York:ACM Press,2021:4671-4678.

[32]Chen Jiawei,Wang Can,Ester M,et al.Social recommendation with missing not at random data[C]//Proc of IEEE International Confe-rence on Data Mining.Piscataway,NJ:IEEE Press,2018:29-38.

[33]Saito Y.Asymmetric tri-training for debiasing missing-not-at-random explicit feedback[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2020:309-318.

[34]Schnabel T,Swaminathan A,Singh A,et al.Recommendations as treatments:debiasing learning and evaluation[C]//Proc of International Conference on Machine Learning.2016:1670-1679.

[35]Lee J,Park S,Lee J.Dual unbiased recommender learning for implicit feedback[C]//Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2021:1647-1651.

[36]Wang Nan,Qin Zhen,Wang Xuanhui,et al.Non-clicks mean irrelevant? Propensity ratio scoring as a correction[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2021:481-489.

[37]Wang Nan,Wang Xuanhui,Wang Hongning.Unbiased learning to rank via propensity ratio scoring[EB/OL].(2021-12-14)[2022-02-10].https://arxiv.org/pdf/2005.08480.pdf.

[38]Ovaisi Z,Ahsan R,Zhang Y,et al.Correcting for selection bias in learning-to-rank systems[C]//Proc of Web Conference.New York:ACM Press,2020:1863-1873.

[39]Zheng Yu,Gao Chen,Li Xiang,et al.Disentangling user interest and conformity for recommendation with causal embedding[C]//Proc of Web Conference.New York:ACM Press,2021:2980-2991.

[40]Wang Xiang,Xu Yaokun,He Xiangnan,et al.Reinforced negative sampling over knowledge graph for recommendation[C]//Proc of Web Conference.New York:ACM Press,2020:99-109.

[41]Saito Y,Yaginuma S,Nishino Y,et al.Unbiased recommender lear-ning from missing-not-at-random implicit feedback[C]//Proc of the 13th International Conference on Web Search and Data Mining.New York:ACM Press,2020:501-509.

[42]Zhu Ziwei,He Yun,Zhang Yin,et al.Unbiased implicit recommendation and propensity estimation via combinational joint learning[C]//Proc of the 14th ACM Conference on Recommender Systems.New York:ACM Press,2020:551-556.

[43]駱錦濰,劉杜鋼,潘微科,等.基于改進的傾向得分估計的無偏推薦模型[J].計算機應用,2021,41(12):3508-3514.(Luo Jinwei,Liu Dugang,Pan Weike,et al.Unbiased recommendation model based on improved propensity score estimation[J].Journal of Computer Applications,2021,41(12):3508-3514.)

[44]Agarwal A,Wang Xuanhui,Li Cheng,et al.Addressing trust bias for unbiased learning-to-rank[C]//Proc of World Wide Web Confe-rence.New York:ACM Press,2019:4-14.

[45]Agarwal A,Zaitsev I,Wang Xuanhui,et al.Estimating position bias without intrusive interventions[C]//Proc of the 12th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2019:474-482.

[46]Joachims T,Swaminathan A,Schnabel T.Unbiased learning-to-rank with biased feedback[C]//Proc of the 10th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2017:781-789.

[47]Qin Zhen,Chen S J,Metzler D,et al.Attribute-based propensity for unbiased learning in recommender systems:algorithm and case studies[C]//Proc of the 26th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining.New York:ACM Press,2020:2359-2367.

[48]Agarwal A,Takatsu K,Zaitsev I,et al.A general framework for counterfactual learning-to-rank[C]//Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2019:5-14.

[49]Vardasbi A,De Rijke M,Markov I.Cascade model-based propensity estimation for counterfactual learning to rank[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2020:2089-2092.

[50]Zhuang Honglei,Qin Zhen,Wang Xuanhui,et al.Cross-positional attention for debiasing clicks[C]//Proc of the Web Conference.New York:ACM Press,2021:788-797.

[51]Liu Dugang,Cheng Pengxiang,Dong Zhenhua,et al.A general know-ledge distillation framework for counterfactual recommendation via uniform data[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2020:831-840.

[52]Yu Jiangxiang,Zhu Hong,Chang C Y,et al.Influence function for unbiased recommendation[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2020:1929-1932.

[53]McInerney J,Brost B,Chandar P,et al.Counterfactual evaluation of slate recommendations with sequential reward interactions[C]//Proc of the 26th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining.New York:ACM Press,2020:1779-1788.

[54]Wang Wenjie,Feng Fuli,He Xiangnan,et al.Deconfounded recommendation for alleviating bias amplification[C]//Proc of the 27th ACM SIGKDD Conference on Knowledge Discovery amp; Data Mining.New York:ACM Press,2021:1717-1725.

[55]Abdollahpouri H,Mansoury M,Burke R,et al.Addressing the multistakeholder impact of popularity bias in recommendation through calibration[EB/OL].(2007-07-23)[2022-02-10].https://arxiv.org/pdf/2007.12230.pdf.

[56]Abdollahpouri H,Mansoury M,Burke R,et al.User-centered evaluation of popularity bias in recommender systems[C]//Proc of the 29th ACM Conference on User Modeling,Adaptation and Personalization.New York:ACM Press,2021:119-129.

[57]Abdollahpouri H,Burke R,Mobasher B.Managing popularity bias in recommender systems with personalized re-ranking[C]//Proc of the 32nd International Flairs Conference.Palo Alto,CA:AAAI Press,2019.

[58]Borges R,Stefanidis K.On mitigating popularity bias in recommendations via variational autoencoders[C]//Proc of the 36th Annual ACM Symposium on Applied Computing.New York:ACM Press,2021:1383-1389.

[59]Zhu Ziwei,He Yun,Zhao Xing,et al.Popularity-opportunity bias in collaborative filtering[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2021:85-93.

[60]Zhu Ziwei,He Yun,Zhao Xing,et al.Popularity bias in dynamic recommendation[C]//Proc of the 27th ACM SIGKDD Conference on Know-ledge Discovery and Data Mining.New York:ACM Press,2021:2439-2449.

[61]Parapar J,Radlinski F.Diverse user preference elicitation with multi-armed bandits[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2021:130-138.

[62]Yang Longqi,Cui Yin,Xuan Yuan,et al.Unbiased offline recommender evaluation for missing-not-at-random implicit feedback[C]//Proc of the 12th ACM Conference on Recommender Systems.New York:ACM Press,2018:279-287.

[63]Wei Tianxin,Feng Fuli,Chen Jiawei,et al.Model-agnostic counterfactual reasoning for eliminating popularity bias in recommender system[C]//Proc of the 27th ACM SIGKDD Conference on Knowledge Discovery amp; Data Mining.New York:ACM Press,2021:1791-1800.

[64]Zhang Yang,Feng Fuli,He Xiangnan,et al.Causal intervention for leveraging popularity bias in recommendation[EB/OL].(2021-05-13)[2022-02-10].https://arxiv.org/pdf/2105.06067.pdf.

[65]Patro G K,Biswas A,Ganguly N,et al.Fairrec:two-sided fairness for personalized recommendations in two-sided platforms[C]//Proc of Web Conference.New York:ACM Press,2020:1194-1204.

[66]Kaya M,Bridge D,Tintarev N.Ensuring fairness in group recom-mendations by rank-sensitive balancing of relevance[C]//Proc of the 14th ACM Conference on Recommender Systems.New York:ACM Press,2020:101-110.

[67]Zhu Ziwei,Wang Jianling,Caverlee J.Measuring and mitigating item under-recommendation bias in personalized ranking systems[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2020:449-458.

[68]Wu Chuhan,Wu Fangzhao,Qi Tao,et al.Fairness-aware news recommendation with decomposed adversarial learning[C]//Proc of the AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2021:4462-4469.

[69]Zhu Ziwei,Kim J,Nguyen T,et al.Fairness among new items in cold start recommender systems[C]//Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2021:767-776.

[70]Islam R,Keya K N,Zeng Ziqian,et al.Debiasing career recom-mendations with neural fair collaborative filtering[C]//Proc of Web Conference.New York:ACM Press,2021:3779-3790.

[71]Ge Yingqiang,Liu Shuchang,Gao Ruoyuan,et al.Towards long-term fairness in recommendation[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2021:445-453.

[72]Li R Z,Urbano J,Hanjalic A.Leave no user behind:towards improving the utility of recommender systems for non-mainstream users[C]//Proc of the 14th ACM International Conference on Web Search and Data Mining.New York:ACM Press,2021:103-111.

[73]Wu Le,Chen Lei,Shao Pengyang,et al.Learning fair representations for recommendation:a graph-based perspective[C]//Proc of Web Conference.New York:ACM Press,2021:2198-2208.

[74]Fu Zuohui,Xian Yikun,Gao Ruoyuan,et al.Fairness-aware explainable recommendation over knowledge graphs[C]//Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2020:69-78.

[75]Li Yunqi,Chen Hanxiong,Fu Zuohui,et al.User-oriented fairness in recommendation[C]//Proc of Web Conference.New York:ACM Press,2021:624-632.

[76]Li Yunqi,Chen Hanxiong,Xu Shuyuan,et al.Towards personalized fairness based on causal notion[C]//Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2021:1054-1063.

[77]Chen Jinwei,Dong Hande,Qiu Yang,et al.AutoDebias:learning to debias for recommendation[C]//Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.New York:ACM Press,2021:21-30.

[78]Huang Jin,Oosterhuis H,De Rijke M,et al.Keeping dataset biases out of the simulation:a debiased simulator for reinforcement learning based recommender systems[C]//Proc of the 14th ACM Conference on Recommender Systems.New York:ACM Press,2020:190-199.

[79]Chen Jiawei,Wang Can,Zhou Sheng,et al.Fast adaptively weighted matrix factorization for recommendation with implicit feedback[C]//Proc of AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2020:3470-3477.

[80]Sato M,Takemori S,Singh J,et al.Unbiased learning for the causal effect of recommendation[C]//Proc of the 14th ACM Conference on Recommender Systems.New York:ACM Press,2020:378-387.

[81]Schnabel T,Bennett P N.Debiasing item-to-item recommendations with small annotated datasets[C]//Proc of the 14th ACM Conference on Recommender Systems.New York:ACM Press,2020:73-81.

[82]Khademi A,Lee S,Foley D,et al.Fairness in algorithmic decision making:an excursion through the lens of causality[C]//Proc of the World Wide Web Conference.New York:ACM Press,2019:2907-2914.

[83]趙森棟,劉挺.因果關系及其在社會媒體上的應用研究綜述[J].軟件學報,2014,25(12):2733-2752.(Zhao Sendong,Liu Ting.Causality and its applications in social media:a survey[J].Journal of Software,2014,25(12):2733-2752.)

[84]Yao Liuyi,Chu Zhixuan,Li Sheng,et al.A survey on causal inference[J].ACM Trans on Knowledge Discovery from Data,2021,15(5):1-46.

[85]Abdollahpouri H,Mansoury M.Multi-sided exposure bias in recom-mendation[EB/OL].(2020-07-01).https://arxiv.org/abs/2006.15772.

收稿日期:2022-02-13;修回日期:2022-04-04基金項目:國家自然科學基金資助項目(52130403);中央高校基本科研業務費專項資金資助項目(N2017003)

作者簡介:郭楠(1977-),女,遼寧大連人,副教授,碩導,博士,主要研究方向為推薦系統、數字身份管理、虛擬/增強現實;黃慧慧(1998-),女(通信作者),山東菏澤人,碩士研究生,主要研究方向為推薦系統、機器學習、數據挖掘(2071760@stu.neu.edu.cn).

主站蜘蛛池模板: 第九色区aⅴ天堂久久香| 国模私拍一区二区| 国产精品jizz在线观看软件| 日本高清有码人妻| 欧美a级完整在线观看| 欧美在线导航| 国内精品视频在线| 久久青草免费91线频观看不卡| 超清无码熟妇人妻AV在线绿巨人| AV无码国产在线看岛国岛| 亚洲v日韩v欧美在线观看| 国产真实乱子伦精品视手机观看| 国产欧美精品午夜在线播放| 在线观看国产精品一区| 韩国自拍偷自拍亚洲精品| 亚洲色婷婷一区二区| 国产激情无码一区二区三区免费| 婷婷六月色| 青草视频在线观看国产| 色精品视频| 色婷婷视频在线| 国产流白浆视频| 成人在线视频一区| 亚洲色无码专线精品观看| 国产95在线 | 五月天久久婷婷| 国产午夜精品一区二区三| 91精品人妻互换| 国产区在线看| 五月婷婷精品| 国产欧美日韩va另类在线播放| 国产精品9| 欧美色99| 婷婷伊人五月| 午夜日韩久久影院| 国产精品久久久久久搜索| 香蕉久久永久视频| 在线国产欧美| 丁香五月婷婷激情基地| 国产精品视频观看裸模| 亚洲无码视频喷水| 欧美特黄一级大黄录像| 青青青视频91在线 | 午夜激情福利视频| 蜜桃臀无码内射一区二区三区 | 一本久道热中字伊人| 色婷婷色丁香| 亚洲欧美日韩另类在线一| 色综合久久综合网| 一级在线毛片| 国产9191精品免费观看| 免费观看国产小粉嫩喷水 | 日韩国产 在线| 亚洲视频无码| 国产欧美日韩另类| 久久久久久尹人网香蕉| 久久永久免费人妻精品| 国产黄网永久免费| 国产浮力第一页永久地址| 日本国产精品一区久久久| 久久久久青草大香线综合精品| 国产在线专区| 国产成人av大片在线播放| 久久久久久久97| 亚洲色中色| 亚洲日本韩在线观看| 美女裸体18禁网站| 香蕉久久国产超碰青草| 亚洲一区国色天香| 欧美一区二区三区欧美日韩亚洲| 尤物视频一区| 国产又粗又猛又爽视频| 欧美日韩激情| 亚洲天堂网在线播放| 一区二区三区四区在线| 欧美成人a∨视频免费观看 | 久久精品国产亚洲麻豆| 国产福利小视频在线播放观看| 毛片网站在线看| 999精品色在线观看| 老司国产精品视频| 欧美精品1区2区|