趙海燕,趙佳斌,陳慶奎,曹 健
1(上海理工大學 光電信息與計算機工程學院 上海市現代光學系統重點實驗室 光學儀器與系統教育部工程研究中心,上海 200093)2(上海交通大學 計算機科學與技術系,上海 200030) E-mail:17702181056@163.com
作為解決信息過載[1]的主要工具之一,推薦系統得到了廣泛的應用.推薦系統能在沒有明確用戶意圖的情況下,幫助用戶發現有價值的信息,對于物品而言,它也在一定程度上能夠適應長尾效應現象[2].在應用需求的推動下,個性化推薦系統成了學術界和工業界熱門的研究方向.基于會話的推薦系統(Session-based Recommender system)是個性化推薦系統的一個重要組成部分.
推薦問題通常被抽象成矩陣填充/重構問題[3],主要的思想是對用戶-評分矩陣中的缺省值填充預測,隨后進行協同過濾計算.這樣的抽象方法適合訓練有用戶長期偏好的模型,然而很多情況下用戶的信息和過去的行為是不可知的:1)在許多電商網站進行購物是不需要用戶認證的;2)用戶訪問在線流媒體網站時很少有登錄的習慣,匿名的方式占到了絕大多數;3)用戶的興趣和意圖是不斷變化的,長期用戶的興趣和意圖是不斷變化的,長期配置文件只能反映用戶的一般偏好,無法及時更新推薦策略以適應這種變化,利用短期會話信息能彌補這樣的不足.當用戶的長期配置文件不存在時,就需要根據用戶和站點交互的會話日志來做出推薦.這種僅依賴于用戶當前進行的會話中的動作序列來預測用戶下一個動作的問題被稱之為基于會話的推薦.其中會話(session)指的是在給定時間內發生的用戶與站點的交互,利用會話日志進行推薦主要的優勢是能夠推斷新用戶或者匿名用戶的喜好.對于老用戶,根據他的當前會話,推薦系統能夠調整推薦策略適應用戶的興趣變化進而提升推薦效果.研究表明短期意圖對推薦系統準確性的影響要大于用戶的長期偏好[4].
目前,基于會話的推薦主要的算法包括:使用序列模式挖掘技術來預測用戶的下一個行為,基于馬爾可夫模型的方法,以及基于深度學習中的循環神經網絡的方法.
在推薦的過程中,推薦系統不僅要考慮用戶的長期興趣,同時也應該結合用戶當時所處的環境、短期意圖、興趣變化等額外的信息.文獻[5]提出了上下文感知推薦系統的概念,將上下文信息融入到推薦系統中,從而將傳統的“用戶-物品”的二維評分效用模型擴展成了包含上下文信息的多維評分效用模型[5,6].
依據上下文的不同形式和內容,可以將上下文感知推薦系統進行不同的分類.本節中將對序列感知推薦和時間感知推薦作對比.
基于會話的推薦系統是序列感知推薦系統(sequence-aware recommender system)的一個分支,而序列感知推薦是指用戶的上下文信息呈現出一種序列形式.根據不同的應用方向,序列感知推薦可以劃分為4個類別:交互上下文情境適應、趨勢發現、重復推薦和考慮順序約束.
在諸如電子商務網站、在線流媒體網站的推薦中,用戶當前的狀態、情緒被稱作是用戶交互上下文[7].用戶意圖是由可觀察的和不可觀察的兩種上下文信息共同驅動的[8].用戶當前的情緒由于不能經直接觀察得出,所以通常的做法是根據用戶的近期行為和整個社區的行為模式分析得出.根據長期交互日志和短期交互日志所占的比重,又可以分為以下3種情況:
1)基于會話的推薦系統:這種情況下,只有用戶的短期會話活動是已知的,即用戶與系統之間的交互是被限制在有限的時間段內,只考慮用戶的短期行為.推薦系統從會話點擊中獲取信息,主要針對新用戶和匿名用戶,典型的應用有視頻推薦[9]、新聞/音樂推薦[10,11],在線的流媒體網站用戶很少會注冊登錄訪問,大多數用戶都是以“游客”的方式觀看收聽,電商網站[12]會有源源不斷的新用戶進入,需要根據用戶短期的交互會話做出推薦.
2)會話感知推薦系統:在這類問題設置中,知道用戶最近會話行為的同時,還有了解用戶的一般偏好或者過去的交互.主要是針對的是那些“回頭客”,推薦系統不僅考慮了用戶當前會話行為同時結合用戶長期配置文件.長期興趣推薦用戶最終會購買的物品不考慮何時購買,短期會話考慮用戶當前即時需求,預測近期甚至是下一個即將選購的商品,對兩種不同的用戶信息設置適當的權重[13].主要的應用有電子商務網站[14]和手機應用推薦[15]等.
3)基于最后N個交互的推薦:只考慮最后N個用戶行為的推薦系統被稱為基于最后N個交互的推薦系統.主要的應用是在基于位置的社交網絡推薦,包括連續興趣點的推薦[16-18]和音樂推薦[19].
時間感知推薦系統是將“時間”這一重要的上下文信息納入到推薦系統中.在Netflix競賽中,時間感知推薦系統開始受到人們的關注,通過時間因素發現用戶興趣的周期性變化[20],將原本的用戶和物品的二維矩陣擴展到帶有時間信息的高維矩陣,進而提高推薦結果的個性化和準確性.時間是動態變化的,伴隨季節的更替及時間的流逝,用戶和物品的關系也呈現出動態變化的特性.時間對推薦結果的影響主要體現在:1)用戶的興趣偏好會隨時間變化;2)物品通常有自己的流行周期;3)時間本身的周期性,比如冬去春來、四季更替.與時間感知推薦系統相比,基于會話的推薦系統關注的重點是近期用戶行為發生的順序.而時間感知推薦系統往往考慮用戶過去行為的時間信息,關注事件發生的時間點.
表1 與上下文感知推薦其他方向的關系
Table 1 Relationship with other context-aware recommendation approaches

推薦技術推薦方向參考文獻上下文感知推薦系統序列感知推薦基于位置的推薦時間感知推薦交互上下文趨勢發現重復推薦順序約束基于會話的推薦會話感知推薦最后N個交互推薦[9],[10],[11][14],[15][16],[17],[18][21],[22][23],[24][25],[32][26],[27][28],[29]
基于會話的推薦與其他推薦方向的關系如表1所示.
推薦算法是推薦系統的核心,通過理解用戶和物品以及物品和物品之間的關系向用戶推薦新物品.推薦算法可以是基于長期偏好和短期興趣,舉例來說前者就是向特定的用戶推薦特定的物品,而后者則是在購買了電腦主機后推薦相應的外設產品.
傳統的推薦算法主要有協同過濾算法(collaborative filtering,簡稱 CF)、基于內容的推薦算法(content-based filtering,簡稱 CB)和混合推薦算法(hybrid filtering),旨在捕獲用戶長期偏好.協同過濾算法[30]主要通過分析用戶對物品的偏好,發現物品之間的關聯性,或者用戶之間的關聯性,然后再基于這些關聯性進行推薦.協同過濾算法可以分為基于鄰域的協同過濾和基于模型的協同過濾.基于鄰域的協同過濾算法包括了基于物品的協同過濾和基于用戶的協同過濾.前者把與目標用戶喜歡的相似的物品推薦給目標用戶,后者把同目標用戶相似的用戶所喜歡的物品推薦給該用戶.基于模型的協同過濾是通過評分矩陣構建的模型來預測用戶對物品的喜好程度,包括矩陣分解(Matrix Factorization)、監督學習(Supervised Learning)、非監督學習(Unsupervised Learning)等機器學習模型都被運用于基于模型的協同過濾.基于內容的推薦算法[31]是根據用戶已經選擇的對象,從推薦對象中選擇其他特征相似的對象作為推薦結果,推薦過程中不考慮用戶的其他模型,推薦效果依賴于特征工程的好壞.混合推薦算法按照不同的策略[32]將不同推薦類型或推薦算法進行組合并生成推薦,主要的做法是結合協同過濾推薦算法和基于內容的推薦算法[33,34].以上的方法都需要分析用戶過去的興趣偏好,使用的前提是識別用戶,即需要創建用戶配置文件跟蹤用戶.用戶對物品的反饋包括顯式反饋和隱式反饋[35],顯式反饋主要反映為評分和評論,用戶以一種明確且量化的方式來表明自己對物品的態度.而隱式反饋通常是購買歷史、收藏夾、點擊序列等,這類信息是用戶在使用的過程中留下的自然行為,系統無法直接識別喜歡與否,需要推薦系統從中“揣摩”出用戶偏好.
協同過濾和矩陣分解這樣經典的推薦算法在預測用戶評分問題上表現優異,但不適用于基于會話的推薦,主要原因如下:
1)存在大量的匿名用戶和新用戶,這個群體過去的行為和用戶信息對系統而言是無法獲取的即用戶對物品的評分矩陣不存在;
2)會話信息是短期內用戶的行為序列包括:購買、查看、點擊、收聽等,它是一種隱式反饋信息,難以量化度量;
3)很多用戶都是“沉默的大多數”,在購買或者查閱后不會做出評價;
4)會話中即便存在顯式評分,這樣的評分也往往是滯后的.實現基于會話推薦主要方法有以下幾類:頻繁模式挖掘、最近鄰、馬爾可夫模型與強化學習和基于循環神經網絡的方法.
基于會話的推薦問題可以表示為序列預測問題:設{x1,x2,…xn-1,xn}為一個點擊會話,其中xi(1≤i≤n)是m個項目總數中點擊項目的索引,輸出對象y=M(x),其中y=[y1,…,ym]′∈Rm,將y視為對該會話中可能發生的所有下一個項目的排名,其中yi對應于項目i的得分.通常的做法是按照yi進行排序,根據需求取前k個項目.
頻繁模式指的是頻繁出現在數據集中的項集、序列或者子結構.例如在購物時分析哪些商品是經常被同時購買的,經典的案例就是“啤酒和尿布”,20世紀90年代的沃爾瑪超市工作人員通過數據分析發現“啤酒”和“尿布”經常會出現在同一次購物中,將二者放在一起后,兩樣商品的銷量都有顯著的提升,主要的文獻有[31,32,33,36]等.
文獻[36]提出了逐項協同過濾推薦算法,該算法能擴展到海量數據并生成高質量的推薦.算法維護了一張相似項目表,尋找與用戶購買物品及評分相似的物品做聚類,然后選出其中最受歡迎或者相關的一個.其中設置物品相似矩陣可作對用戶會話預處理,把會話中經常一起點擊的項目做相似項處理.在基于會話的推薦時,使用相似矩陣根據用戶當前的點擊項目做出推薦[37].缺點是只考慮用戶最后一次的點擊而忽略之前的行為信息,無法整合序列信息.然而會話中的上下文信息有助于發現用戶當前需求,需要根據以前的點擊項與當前會話中的相關性給出相應的推薦[38].
序列模式挖掘技術在識別頻繁模式時會考慮到會話中行為的順序性[39],將相同順序出現的物品視為一種模式.文獻[40]提出了基于個性化序列模式挖掘的推薦框架,強調了在順序挖掘中兼顧用戶的個性化.順序模式挖掘技術在下一項(next-item)推薦中的主要思路是:許多用戶在訪問了項目i后接著訪問j,則向剛訪問了項目i的用戶推薦j,這樣的做法是可行的.基于這樣的思想,可以將順序模式挖掘技術應用于基于會話的推薦系統.文獻[41]發現將用戶訪問網站的歷史信息做更細粒度的劃分并不能產生很好的個性化效果,進而提出了一種基于點擊流的順序和非順序模式挖掘的可擴展框架用來預測用戶下一個即將訪問的網站.該框架包含了頻繁項目集和序列模式兩種數據結構能滿足實時推薦的需求.在預測方面,更多的限制模式[42]如連續順序模式有更好的效果,在個性化方面,一般順序模式和頻繁項集是比較有效的方案.文獻[52]認為網站的結構特征例如拓撲結構、連通及動態生成程度對Web推薦中使用的順序和非順序模型會有顯著影響,因而提出基于關聯規則的個性化推薦框架來挖掘訪問歷史記錄中的順序和非順序模式.文獻[42]提出了一種MASP(移動應用程序序列挖掘)的方法來預測用戶下一個即將使用的app,把用戶的最近位置和最近使用的app作為預測的關鍵.MASP算法通過位置的變化和app的啟動發現應用程序的順序模式,創造性地結合了用戶位置路徑和app使用的虛擬路徑,以最大支持度的方式選出下一個app.
基于鄰域的方法[37,44]是利用物品和用戶行為之間的相似性,通過比較用戶會話的相似性應用于基于會話的推薦系統.k最近鄰是一種分類算法,核心思想是對給定的一個物品能用與它最接近的k個鄰居來表示.kNN的方法根據當前會話中的用戶行為在訓練集中尋找k個最相似的會話.基于最近鄰的方法主要有兩類,分別是基于物品的kNN和基于會話的kNN.
基于物品的kNN把與當前會話中最后一項在其他會話中共現的那些項中最相似的那一個作為輸出.兩個事件在不同的會話中頻繁共現,那么我們認為這兩個事件是相似的.一般采用余弦相似度,不容易受到流行度偏差的影響.為了能夠較快做出響應,系統會提前計算所有項目的相似性,常用于電商[45]和音樂推薦[46].
基于會話的kNN在考慮當前會話中最后一個點擊項的同時也會比較整個會話與其他會話的相似性,綜合兩者做出合理的推薦[47].受到在線推薦中時間的限制,需要預先處理訓練會話集并在啟動時創建內存索引數據結構(緩存)[48].
kNN的方法雖然簡單,但十分有效,特別是在準確率方面有著不錯的表現[49,50],常被用于目前十分流行的基于循環神經網絡模型的對照方法[48,51].
馬爾可夫模型是一種統計模型,在自然語言處理和生物基因序列分析領域有著出色的表現.其中馬爾可夫過程是指過程中每個狀態的轉移只依賴于之前的n個狀態,這個過程被稱為n階模型,其中n是影響轉移狀態的數目[52].一階馬爾科夫過程,即每個狀態的轉移只依賴于前一個狀態,是最簡單的馬爾科夫過程.推薦是一個連續的過程[53],基于會話的推薦問題可以轉化為有序序列預測問題,如此便可使用馬爾可夫決策過程(MDP)這一順序決策的隨機模型.馬爾可夫鏈(MC)是時間和狀態都是離散的馬爾科夫過程,能夠捕獲用戶點擊會話中的順序模式.MC模型通過轉化圖的方式對用戶會話中的順序行為建模來預測用戶的下一個行為.由于數據的稀疏性,馬爾可夫鏈通常無法直接使用.文獻[54]用隱馬爾可夫模型來克服MC的缺陷.文獻[55]采用了可分解個性化馬爾可夫鏈(FPMC)的方法結合一階馬爾可夫鏈和矩陣分解的優點來模擬個性化順序行為,在稀疏和密集數據上的表現均優于MF和MC.文獻[56]進一步在FPMC的基礎上,針對稀疏性問題和數據的長尾分布,采用用戶長期偏好和當前會話中的順序行為的方法來表示用戶,例如在電影推薦中,用戶的一貫偏好是科幻片,但是在他觀看了哈利波特I之后應該向該用戶推薦哈利波特II.馬爾可夫鏈在提取用戶短期偏好方面有著良好的表現,但是,受馬爾可夫鏈特性的限制即下一個動作僅依賴于有限個先前的行為.文獻[56]用基于相似性模型(FISM)來彌補這個缺點.文獻[57]提出混合變量記憶馬爾可夫模型(MVMM)來預測用戶下一項感興趣的項目,并選擇N-gram模型作為基準模型.
馬爾可夫決策過程(MDP)則是對馬爾可夫鏈的擴展,它結合了馬爾可夫過程和確定性動態規劃的最優策過程,具有馬爾可夫性(無后效性)[58].MDP有兩大優勢:
1)考慮了每項推薦的長期影響;
2)考慮每項推薦的預期價值.例如在歌曲推薦方面,系統會監測用戶對所推曲目的反映,是收聽還是跳過,從而設立獎勵機制.
文獻[59]首次使用馬爾可夫決策過程對順序數據推薦問題進行建模,用到了強化學習的方法來學習最優策略.文獻[60]利用強化學習對MDP中的顯式偏好和隱式反饋進行利用和組合.
前期的研究[61,62]成功地將循環神經網絡(RNN)應用在序列數據建模問題.RNN是一種具有非線性動態特性的分布式隱狀態模型[63],可以有效地模擬整個用戶交互會話(點擊、查看),能對會話建模以發現其中的主題思想,是基于會話推薦問題的自然選擇.
文獻[51]首次將循環神經網絡(RNN)應用于推薦系統,不僅證明了RNN能應用于基于會話的推薦問題,而且針對基于會話推薦的這項特定任務,設計了帶有GRU(Gated Recurrent Unit)的RNN模型(GRU4REC).在訓練RNN時采用了排名損失(ranking loss)旨在將模型的關注點集中到用戶可能感興趣的頂級項目上.在兩個不同數據集上的實驗結果也表明采用了RNN的策略相較于以往的方法,推薦效果有了明顯的改進.文獻[48]進一步認為文獻[42]中的GRU4REC方法的有效性問題沒有得到解決,故通過使用基于會話的kNN結合啟發式的手段對合適近鄰進行采樣,驗證了GRU4REC方法的真實有效,發現RNN方法確實能夠捕獲kNN方法無法識別的數據中的序列模式.文獻[64]又提出了在GRU4REC上引入四條優化方法,包括數據增強技術、設置時間閾值來適應變化、使用特權信息(關于點擊項目的屬性)和輸出嵌入.文獻[65]中則通過排名損失函數對RNN進行優化.
用戶的會話點擊不僅有序列特征,通常還有項目的文本和圖像特征,文獻[9]探究了融合項目屬性特征的RNN框架p-RNN(并行RNN),它根據點擊會話和點擊項目的特征進行聯合會話建模,框架的輸入是項目ID和項目特征,輸出是下一個點擊項的評分.
用戶在瀏覽的過程中,在某一物品上停留的時間長度能從側面反映出對該物品的喜好程度,是隱式反饋的一種表現形式,停留時間越長則表示越感興趣,反之亦然.文獻[66]探究了這種隱式反饋在會話推薦中的價值,在RNN框架中加入用戶在物品上的停留時間,通過設定閾值的方式來判斷用戶對特定物品的感興趣程度.
有的情況下,用戶會登錄或者網站對用戶有其他形式的標識,文獻[76]便考慮了存在用戶信息文檔的情況,提出了一種層次化的RNN模型,將存在用戶歷史信息的處理成會話感知推薦問題,將匿名/新用戶處理成基于會話的推薦問題.為了突出在基于會話的推薦中更具個性化這一特性,文獻[68]考慮到在商業系統中,用戶靜態上下文(年齡、性別、位置)是容易獲取的,故提出增強RNN模型(ARNN)無縫集成用戶靜態上下文到RNN中.
表2 不同推薦方法的特點比較
Table 2 Comparison of characteristics of different recommendation methods

類目推薦技術特點參考文獻頻繁模式挖掘(FPM)逐項(item-to-item)易于實現,對計算性能有較高的要求[36],[31],[32]順序模式挖掘考慮順序模式,可擴展性較差,需要合適的閾值[39],[40],[41],[42]K近鄰(kNN)基于物品的kNN僅考慮會話中的最后一個元素[45],[46]基于會話的kNN在基于物品的kNN的基礎上會考慮會話之間的相似性[47]馬爾可夫模型(MM)馬爾可夫鏈(MC)能夠對會話中的順序模式建模,通常使用MC的變體[54],[55],[56],[57]馬爾可夫決策與強化學習(MDP&RL)考慮獎勵機制,RL學習其中的最佳策略[59],[60]深度學習(DL)循環神經網絡(RNN)克服了MC的限制,適合對會話中的復雜動態序列建模[51],[61],[62]
新聞推薦也是基于會話推薦的重要應用方向,它更關注消息的時效性和新鮮度.文獻[69]提出一種新的基于循環神經網絡的架構,以不同的粒度級別來組合長/短期用戶偏好,其中長期用戶偏好代表了用戶穩定的興趣,而短期偏好則代表了用戶當前的需求.基于會話推薦的不同方法之間的特點如表2所示.
在研究中,經常使用的含序列特性的數據集主要來自3個領域,分別是電商、音樂和新聞.以下簡單介紹幾個常用的數據集: RecSys Challenge 2015的數據集(1)http://2015.recsyschallenge.com/,主要內容是某個用戶在訪問電子商務網站的會話期間執行的一系列點擊事件.數據包中包含訓練數據和測試數據,訓練數據有兩個文件:點擊事件yoochoose-clicks.dat和購買行為yoochoose-buys.dat.點擊事件包括:會話ID;時間戳;商品ID;商品類別.購買行為包括:會話ID;時間戳;物料ID;價格;數量.測試文件與點擊事件文件結構相同.這些數據是在2014年的幾個月內收集的,反映了某歐洲在線零售商中用戶的點擊和購買情況.
Amazon數據集:來自Amazon.com(2)https://www.amazon.com/,是最大的數據集之一,其中包括1996年5月至2014年7月的評論文本和時間戳.其中不同類別的產品構建為不同的獨立數據集[70],該數據集包含近600萬個對象,超過1.8億個關系.這些關系是用戶訪問亞馬遜網站并記錄其提供的產品推薦的結果.
30MUSIC和NOWPLAYING:30MUSIC數據集是來自last.fm(3)http://www.last.fm/api互聯網廣播電臺的收聽歷史,包括含有時間信息的收聽會話、播放列表和部分用戶的評分[71].NOWPLAYING(4)http://www.nowplayingplugin.com數據集是依賴于Twitter創建的有關用戶音樂收聽行為的數據集并不斷更新[72].
在傳統的基于矩陣填充的推薦問題中,劃分訓練集和測試集一般采用隨機抽樣的方法遵循互斥的原則.對于會話感知推薦系統應該采用會話級別的劃分方式避免分離單個用戶的會話;在社區級和用戶級的劃分中,應當優先選擇用戶級的劃分手法,如此可以保證向新用戶提供求推薦[73].
不同于傳統推薦系統要求的輸出目標為一個/組物品的按評分高低的排序,基于會話的推薦問題的目標是預測當前會話下用戶的下一個動作,具體表現為購物中下一個要購買的商品,收聽會話中下一首想播放的曲目等.數據有序列性即無法將會話事件隨機分配給訓練集和測試集,所以使用滑動窗口的方式來替代原本的交叉驗證方法[48].使用的評價指標主要包括命中率(HR)、準確率(Precision)、召回率(Recall)、和平均倒排序值(MRR)[48,76,64].
文獻[74]認為對于預測下一項的問題,命中率能夠反映該推薦系統的性能,因為我們只關注是否找到了合適的項目.
(1)
其中分母|GT|是所有的測試集合,分子NumberofHits@K是每個用戶top-K推薦列表中屬于測試集合的個數的總和.
準確率代表了用戶對于系統所推薦商品感興趣的概率,就是所推薦的物品有多少是準確的[75].召回率表示用戶感興趣的商品被系統推薦的概率即有多少準確的物品被系統成功推薦[75].待預測商品可能存在的四種情況如表3所示.
Ntp表示系統推薦且用戶喜歡,Nfn表示系統推薦但用戶不喜歡,Nfp表示用戶喜歡但系統沒推薦,Ntn用戶不喜歡且系統沒推薦,L為推薦列表長度.Bu是測試集中用戶u喜歡的商品數,則準確率和召回率定義為:

(2)

(3)
表3 待預測商品有四種可能的情況
Table 3 Four possible scenarios for the goods to be forecasted

用戶喜好系統推薦系統不推薦喜歡NtpNfn不喜歡NfpNtn
MRR是把準確推薦項在推薦系統給出結果的排序位置的倒數作為它的準確度,再對所有的問題求平均.

(4)
其中|Q|是查詢個數,ranki是對第i個查詢,第一個相關的結果所在的排列位置.
伴隨智能手機的普及,人們喜歡利用碎片化的時間通過手機進行各種操作,如瀏覽新聞、閱讀文章、選購商品等.手機上的應用更適合于基于會話的推薦,因為相對于PC端,手機用戶在某一時間內總是在一個應用中進行操作.由于手機上的傳感器較多,因此能夠獲取更多的上下文信息(地點、用戶的運動狀態甚至用戶的情緒),所以在移動端,結合上下文信息進行基于會話的推薦是未來的應用方向.
為了能夠更好地獲取用戶需求,需要引入多種類型的數據,甚至包括聲音、圖像、視頻、各種傳感器信息.如何融合這些異構的多元數據提高會話推薦的準確性將是重要的方向.
人們的選擇從根本上其意圖的體現.用戶不同的行為可能反映用戶不同的需求和意圖,例如在訪問電商網站時會有搜索、查看、加入購物車、添加愿望清單等操作,如何綜合考慮不同行為的效果從而進一步揣摩用戶意圖,并將意圖與偏好相結合,是值得研究人員討論的問題.
從算法角度看,自從Hidasi B等人[42]創造性地將RNN用于推薦系統以來,由于RNN在利用會話中的順序信息相較于馬爾可夫模型和順序模式挖掘有著更為突出的表現,RNN成了該問題的“自然選擇”,近期許多研究圍繞對RNN模型的改進展開,例如考慮特征信息、使用損失函數進行優化[9,56]等.未來的研究可以把RNN模型作為基礎,開發新的模型以更好地利用會話中的順序模式.但是在算法研究中其他深度學習模型也將引入,例如文獻[67]提出用卷積神經網絡(CNN)來解決會話推薦問題.因此,如何結合不同的場景采用不同的深度學習模型值得研究.
互聯網使得人們的各種海量信息都被記錄下來.預測用戶感興趣的下一個項目、讓用戶能夠在短時間內快速獲取到有價值的內容,能讓服務提供商提供有針對性的服務從而提高用戶體驗,這正是基于會話推薦的任務所在.基于會話的推薦的主要優勢是僅依靠用戶的短期會話來識別用戶偏好,因而對于用戶的興趣變化十分敏感且相較于用戶的長期偏好的獲取準確性更高.該方法不僅能面向新用戶和匿名用戶,對于新上線的手機app、電商或是在線流媒體網站,能夠根據少量的用戶交互信息做出合理的推薦,從而可在短時間內提升訪客滿意度、網站銷售額及點擊量.可以預計,會話推薦的研究和應用將會得到進一步的重視.