999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于點擊模型和網絡嵌入的查詢推薦模型①

2022-01-05 10:17:48王奕昕范春曉吳岳辛
計算機系統應用 2021年12期
關鍵詞:用戶信息模型

王奕昕, 范春曉, 吳岳辛

(北京郵電大學 電子工程學院, 北京 100876)

伴隨著互聯網的發展越來越迅速, 互聯網中的信息越來越繁多, 搜索引擎作為人們獲取互聯網信息的主要途徑, 其在日常生活中扮演的角色也越發重要. 但是在檢索過程中, 用戶往往難以根據其搜索意圖給出簡潔準確的查詢, 從而導致搜索引擎無法為用戶提供最符合其搜索意圖的結果. 搜索引擎如今通過查詢推薦為用戶構造相關查詢的方法來提升用戶的搜索滿意度.

查詢推薦主要包含查詢自動補全和查詢重構兩方面的內容. 查詢自動補全指用戶在輸入少量查詢前綴等信息的情境下在搜索框的下拉列表中生成包含輸入前綴的候選查詢; 查詢重構指用戶完成輸入后通過對查詢詞替換、刪除等操作來優化前面的查詢以獲得更令人滿意的搜索結果的過程. 近些年伴隨著查詢推薦技術在信息檢索系統中發揮著愈發重要的作用, 發現查詢自動補全相比查詢重構具有局限性, 故更多的查詢推薦研究著重于查詢重構推薦.

成功的查詢推薦取決于捕獲用戶的搜索意圖、準確的建模用戶的信息需求, 直觀上需要充分利用查詢上下文信息, 包括同一搜索會話中的歷史查詢信息等.上下文信息在查詢建議和查詢自動補全的研究中被廣泛利用, 傳統的方法依賴于查詢的相似性如術語復用和查詢共現[1]等, 其在提供相似度較高的候選查詢的同時存在數據稀疏的問題. 而基于深度學習的方法是如今解決此問題的主流方法, 分層遞歸的編碼-解碼結構[2]在有序編碼上下文的同時解決了數據稀疏的問題,反饋記憶網絡[3]在之前的研究僅將用戶反饋信息作為輔助信息進行聚類的基礎上解決了數據稀疏的問題且有利于找到更細粒度的搜索意圖. 查詢重構對搜索會話的上下文有極大的影響, 重構推理網絡[4]利用同態查詢嵌入系統和異構網絡嵌入模型對用戶查詢和查詢重構進行建模, 其同時保留了句法和語義屬性, 解決了由于預定義策略和本體輔助帶來的范圍外策略和歧義查詢的問題.

前述提到的最新研究中仍然存在一系列問題: 在建模用戶查詢意圖的過程中考慮因素比較單一, 無法完整表達用戶的興趣; 使用的圖模型嵌入方法對復雜的查詢-URL圖無法構造清晰準確的嵌入表達; 對同一查詢會話內的用戶行為及興趣抽取缺乏相關性, 使其缺乏表示完整性.

本文提出了基于點擊模型和網絡嵌入的查詢推薦模型UBM來解決這些問題, 幫助用戶構建查詢. 首先通過點擊鏈式模型引入查詢時序, 將其和用戶偏好注意力結合生成反饋意圖; 利用屬性異構網絡構建帶有標題屬性的查詢-URL關系圖, 并以此建模查詢重構.引入多頭自注意力機制, 捕獲多個表示子空間的關系和會話行為的內部交互相關性. 最后采用多任務學習來訓練查詢鑒別器和查詢生成器來進行查詢推薦.

1 基本概念

定義1. 點擊模型(click model)[5]是根據用戶的歷史點擊信息, 建模用戶的興趣和行為, 從而預測用戶的未來點擊行為, 提高點擊間的相關性. 而用戶的點擊行為受到結果位置、結果置信度等因素的影響, 不能直接利用結果相關性來估計. 點擊模型包含了用戶的整個搜索過程, 運用不同的假設去估計不同因素的影響從而更準確地利用用戶的隱式反饋來計算用戶的點擊概率.

定義2. 網絡嵌入(network embedding)又叫圖嵌入(graph embedding)[6]是用來學習網絡中節點的低維度表示, 并將學習到的特征用來解決基于圖的各類任務. 其主要思想是找到一種映射函數, 從圖的拓撲結構、頂點間的關系、子圖以及邊的性質等信息中挖掘出復雜網絡結構中的低緯度信息表示.

2 基于點擊模型和網絡嵌入的查詢推薦模型

在搜索引擎平臺中, 用戶不能清晰地表達其查詢意圖導致查詢結果滿意度較低, 因此需要通過查詢推薦策略來幫助用戶構建查詢詞. 然而現有的查詢推薦策略無法完整建模用戶興趣從而導致推薦結果不佳.本文為了解決查詢效率低的問題, 設計了關聯用戶行為的查詢推薦方法來幫助用戶構造查詢從而完成檢索過程. 如第1節所述, 點擊模型可以挖掘出用戶歷史點擊行為的相關性從而表達用戶興趣, 而網絡嵌入可以幫助我們從復雜的查詢-URL二部圖中挖掘出用戶查詢與結果的關系從而得到用戶的偏好, 通過結合兩者的優勢, 設計了基于點擊模型和網絡嵌入的查詢推薦模型, 捕獲用戶查詢行為和重構行為的潛在關系進而為用戶生成最符合其查詢意圖的推薦結果. 模型設計結構如圖1所示. 首先, 在嵌入層引入用戶點擊鏈式模型, 通過對用戶點擊行為的分析, 推斷用戶對返回文檔的興趣度, 綜合用戶單個會話內針對同一查詢的多次點擊, 得到對于返回文檔的點擊概率評分矩陣, 將其與偏好注意力編碼結合得到用戶當前查詢對于返回文檔的反饋意圖行為分布; 另外將URL的標題信息加入到查詢-URL二部圖中作為URL的屬性信息, 并利用屬性異構網絡對其不同類型的節點與邊進行表示, 將不同維度不同性質的向量轉換到同一緯度, 并以此建模用戶的查詢重構行為; 接著在方法層利用多頭注意力機制捕獲多個表示子空間的信息, 在會話級別抽取出更多的特征; 最后在輸出層利用多任務學習來同時訓練查詢鑒別器和查詢生成器來解決不同任務的需求以提高其性能.

圖1 基于點擊模型和網絡嵌入的查詢推薦模型圖

2.1 嵌入層

嵌入層主要對查詢進行嵌入處理, 對查詢的反饋信息及查詢的重構信息進行建模, 將其引入模型之中,按功能分為反饋構造器和重構構造器兩部分.

2.1.1 反饋構造器

該部分旨在從用戶的查詢意圖中提取反饋信息,這些信息反映在用戶的點擊順序、用戶的點擊文檔和略過文檔中.

本文利用點擊鏈式模型[7], 根據用戶在一個查詢會話時間內的多次點擊行為, 計算出每次點擊返回的文檔列表的點擊概率得分: 當文檔被瀏覽但被跳過時, 得分總是0, 因為它表示用戶在查看后沒有選擇單擊; 點擊的文檔得分總是1; 點擊文檔后的得分根據狀態轉移方程得到. 考慮越往后的點擊越能代表用戶的搜索意圖, 而設計倍增系數 β, 使后續的每一次點擊概率評分都倍增 β倍:

其中, 二進制隨機變量Ei表示對位置i處的文檔的檢視事件, 二進制隨機變量Ci表示對位置i處的文檔的點擊事件,Ri表示用戶感知的相關性, αi表示用戶行為參數.

對于查詢返回文檔列表D, 計算文檔概率評分Gn={g1, …,gi, …,gn}, 其中gi為每次點擊計算出的點擊概率評分的累加(如表1), 之后對文檔概率評分計算歸一化操作得到文檔歸一化評分G:

表1 點擊概率評分累加例子示意表

注意力機制編碼是用來衡量查詢和返回文檔的相關性, 捕獲查詢中的詞對查詢文檔的重要性, 這代表著具有更高注意力得分的文檔對應著用戶更多的查詢意圖.

其中,Emb是詞嵌入矩陣,GRU[8]是一種改良的RNN模型.

對文檔D={d1, …,di, …,dn}中每個文檔用和查詢q同樣的方式不同的參數進行編碼, 編碼后的注意力向量為

查詢對于每個查詢文檔的注意力權重是其注意力向量的標準化點積:

根據文檔概率評分和每個查詢的注意力權重相加后經過Softmax標準化后的值, 通過加權求和得到用戶的反饋行為分布F:

2.1.2 重構構造器

查詢重構[9,10]是用戶對以前的查詢不滿意, 通過對查詢進行一系列的優化得到滿意結果的過程. 重構構造器在圖嵌入的基礎上, 參考詞嵌入的句法和語義信息獲取方法, 構造重構嵌入. 從查詢日志出發, 結合每個查詢的特點, 提取查詢詞、URL和標題, 構造查詢URL二部圖.

圖2具有以下特點: 第一其查詢及URL均與其附加特征相連, 第二在圖中節點和邊的類型不完全相同.考慮這些特點, 選用類似屬性異構網絡[11]的方式來構建嵌入. 首先對圖中不同類型的頂點使用不同空間的向量表示; 之后使用非線性網絡函數對頂點進行向量變換, 轉換到同一維度; 最后利用連接邊的鄰居頂點相似來構造目標函數.

圖2 包含標題信息的查詢-URL二部圖

基于詞嵌入的定義與圖嵌入的補充, 對于查詢qi和qi+1間 的差異可以定義為查詢重構ri:

式中,ri可以從句法和語義兩個方面捕獲查詢間相關性, 建模查詢重構行為.

2.2 方法層

方法層主要對嵌入層的輸出進行兩層結構的編碼:查詢級別的編碼和會話級別的編碼; 查詢級別的編碼主要是將嵌入層的輸出映射到固定長度的向量, 會話級別的編碼主要對順序及位置敏感的信息進行編碼[12].

2.2.1 查詢級別編碼

查詢級別編碼是對用戶的查詢q使用和式(7)相同的形式與參數將其構造為標準的嵌入向量qk. 之后將用戶查詢qk、用戶反饋Fk及 用戶重構rk-1三個部分,將其經過組合拼接線性變換得到用戶輸入序列X={X1, …,Xi, …,Xn} , 其中Wr為可學習到的線性變換矩陣.

2.2.2 會話級別編碼

會話級別的編碼使用Transformer[13,14]中的編碼器對輸入序列X進行編碼處理. 最終輸出的隱層向量為X={Xhidden1, …,Xhiddeni, …,XhiddenK}, 上下文向量c可以表示為編碼器隱層向量的加權和:

其中, γi為隱層權值.

2.3 輸出層

輸出層的設計思路來源于查詢推薦問題的場景描述, 其存在兩個場景: 根據查詢相似度等的候選查詢列表的排序問題和查詢生成問題; 本文根據不同的場景設計了多任務學習框架, 同時訓練兩個不同的模塊: 查詢鑒別器和查詢生成器.

2.3.1 查詢鑒別器

查詢鑒別器的任務是評估候選查詢列表中的每個候選查詢成為符合查詢意圖的查詢的可能性.

2.3.2 查詢生成器

查詢生成器的任務是在沒有任何候選查詢的基礎上, 利用方法層編碼器的輸出生成查詢序列.

交叉熵被用作該層兩個模塊的損失函數, 在模型訓練和優化過程中, 將兩個損失函數結合起來, 共同解決任務.

3 實驗分析

3.1 實驗數據

本實驗的實驗數據來源于搜狗實驗室提供的搜狗搜索引擎在2006年8月中31天的查詢日志[15]. 查詢日志包括查詢時間、用戶ID、查詢詞、該URL在結果中的排名、用戶點擊的順序號、用戶點擊的URL等信息. 運用標準的30分鐘間隔[16]劃分數據集, 將查詢分為多個會話. 而僅包含一個查詢的會話將被放棄,因為必須有先前查詢的會話作為上下文信息. 把會話中的最后一個查詢視為正確的建議. 由于網頁鏈接的時效性等原因無法從鏈接得到文檔的更多信息, 只能從搜狗本身提供的互聯網語料庫中找到鏈接對應的標題信息, 將其作為文檔的內容信息. 將會話隨機分為3個部分: 60%為訓練集、30%為開發集、10%為測試集. 訓練集訓練神經基線模型和我們的模型; 開發集是在訓練集訓練出來的模型基礎上進行測試, 通過測試結果不斷優化模型; 測試集評估所有方法. 數據集的劃分結果信息如表2所示.

表2 數據集統計信息表

3.2 評價指標

本實驗選用MRR指標作為評價重排序結果的指標, 選用PER指標作為評估生成結果好壞的評價指標.MRR是國際上通用的對搜索算法進行評價的機制, 利用平均倒數排名來評估推薦列表返回結果的可靠性.PER代表與位置無關的錯誤率, 它基于生成的查詢和目標查詢之間的單詞覆蓋率, 代表的是忽略單詞順序將生成的查詢轉換為目標查詢所需的最小單詞插入和刪除次數的長度歸一化表示.

3.3 方法對比

本實驗目的在于測試深度學習環境下的不同查詢推薦策略對推薦結果的影響, 因此在此對比以下5個模型:

MPS是一種依靠上下文中的查詢共現來排序查詢的最大似然方法, 其常作為深度學習方法中生成候選查詢列表的方法.

HRED是利用用戶已經提交的查詢基于層次遞歸編碼-解碼器預測后續查詢, 進而得到候選查詢推薦序列.

ACG[17]是利用查詢感知的注意力機制增強序列到序列模型以編碼用戶查詢會話的上下文信息, 并提出了復制和生成兩種機制來確定后續推薦詞.

FMN將用戶與系統的交互信息加入到了模型之中, 通過用戶反饋在提供相同查詢前綴時給出符合用戶需求的查詢推薦.

RIN是利用異構嵌入網絡和同態隱空間建模查詢以及查詢重構, 捕獲重構信息對查詢推薦的影響.

3.4 實驗結果及分析

這部分將首先利用評估指標對兩類任務進行評估,之后對文章所提出的新思路及方法進行分析和討論.如表3所示為各個模型對于兩類不同任務在測試集上的結果.

表3 不同方法在鑒別式和生成式任務上的表現

3.4.1 基于鑒別式任務的評估

對于鑒別式任務使用MRR指標來進行評估, MRR指標越高表明推薦列表的結果越符合用戶查詢意圖.基于查詢共現的MPS方法僅僅根據查詢間的相似度及流行度等消息進行排序, 效果相對較差. 選取的基線模型都是深度學習模型, 主要在于深度學習模型其對于上下文的關系以及順序關系等相對而言有更好的效果. ACG由于其門控機制控制復制和生成的選擇使模型效果有所提升; FMN建模了用戶的正負反饋行為,使模型更能學習到用戶興趣相關的信息; RIN建模了用戶的查詢重構行為, 使其對在一個會話中有多次查詢的場景有較好的效果. 本文同時建模了用戶的查詢點擊行為、檢視行為及查詢重構行為等, 盡可能地利用了查詢日志信息來模擬了用戶在一次查詢過程中所面對的場景, 使模型在鑒別式任務的指標上相比之前效果最好的RIN有了7.72%的提升.

3.4.2 基于生成式任務的評估

對于生成式任務使用PER指標來進行評估, PER指標越低代表生成的查詢和目標查詢差異越小. MPS不是生成模型所以不考慮. ACG由于其門控的生成器及RIN中的查詢生成器與生成式任務相貼近, 其相比其它模型在生成式任務上有一定優勢. 本文利用了序列到序列生成模型效果比較好的Transformer中的編碼器-解碼器結構, 在生成模型上提升了6.13%的覆蓋率.

3.4.3 分析與討論

為了進一步驗證并深入了解本文所提出的模型,本文進行了消融研究去比較所提出的關鍵技術的作用.

點擊鏈式模型的影響. 點擊模型的原理是用戶點擊行為導致的不同位置的文檔的不同點擊可能性. 由于反饋構造器部分由點擊鏈式模型與注意力機制編碼構成, 圖3展現了反饋構造器不同組成對MRR性能的影響. 通過觀察可知, 同時排除點擊鏈式模型與注意力機制編碼的模型UBM(-a-c)與RIN的結果基本相同.而單獨考慮注意力機制編碼UBM(-c)僅能帶來接近2%的提升, 僅考慮點擊鏈式模型UBM(-a)的效果提升了接近5%說明在反饋構造器中起主要作用的是點擊鏈式模型.

圖3 反饋構造器不同組成的UBM的MRR性能

屬性異構網絡的影響. 屬性異構網絡的原型是查詢-URL二部圖, 其常規方法是使用隨機游走[18]或Node2Vec

等圖嵌入方法建立嵌入. 本文引入URL的標題作為輔助信息, 使圖中存在了性質不同的邊和節點. 圖4展現了不同圖嵌入模型及輔助信息影響下的MRR性能影響. RIN中使用的是Node2Vec模型但其沒有考慮標題信息, 其相比添加了標題信息的模型RIN(+title)效果相差不大, 分析原因主要在于Node2Vec對于不同類型節點的關系無法正確建模, 導致其存在一些差錯使得整體效果提升不大. 將屬性異構網絡模型嵌入作為圖嵌入模型使用時, 其不添加標題UBM(-title)的效果相比使用Node2Vec的效果提升了5%, 體現了屬性異構網絡本身的優越性; 而添加標題后UBM因為其附加的輔助信息與屬性異構網絡的設計目的相同, 使得模型效果提升了2%.

圖4 不同網絡嵌入與輔助信息的UBM的MRR性能

4 總結與展望

在本文中, 我們通過建模用戶行為包括其點擊行為及查詢重構行為, 對其查詢意圖進行了分析, 提出了一種基于用戶行為的查詢建議方法. 以用戶檢視行為和點擊行為作為基準設計了點擊模型, 從而借助注意力機制捕獲了用戶查詢與返回結果的相關性, 使得從會話內查詢結果中可以得到更多的用戶查詢意圖信息;接著受日常生活啟發, 了解到標題作為用戶第一時刻檢視的信息, 其極大的影響了用戶的查詢行為, 于是利用屬性異構網絡將標題作為輔助屬性信息引入我們的模型, 并以此來構建我們的查詢重構, 使得重構行為更具有可解釋性; 最后利用多頭注意力機制并借助多任務學習, 使得該模型在查詢鑒別和查詢生成兩類任務中都相比于基線模型有了不同程度的提升效果. 此外,對結果的分析也證明了我們所提出的方法的有效性和魯棒性. 在未來的工作中, 我們試圖通過在不同場景中捕獲的不同輔助信息, 將其集成入我們的模型中, 觀察其是否對這類任務具有普適性.

猜你喜歡
用戶信息模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 又爽又大又黄a级毛片在线视频| 极品国产在线| 另类欧美日韩| 538国产视频| 亚洲天堂高清| 特黄日韩免费一区二区三区| 国产欧美日韩另类精彩视频| 91毛片网| 亚洲精品不卡午夜精品| 国产精品亚洲欧美日韩久久| 亚洲欧美精品在线| 女人av社区男人的天堂| 亚洲av成人无码网站在线观看| 亚洲国产成人久久精品软件 | 国产亚洲高清视频| 97青青青国产在线播放| 亚洲成人一区二区| 久久精品娱乐亚洲领先| 国产理论一区| 熟妇丰满人妻| 欧美色香蕉| 在线观看欧美国产| 亚洲成人动漫在线观看| 婷婷成人综合| AV不卡无码免费一区二区三区| 亚洲国产精品日韩专区AV| 中文字幕有乳无码| 无码福利视频| 伊人丁香五月天久久综合| 亚洲国产日韩欧美在线| 亚洲国产天堂在线观看| 国产精品爆乳99久久| 亚洲精品国产首次亮相| Aⅴ无码专区在线观看| 拍国产真实乱人偷精品| 欧美区日韩区| 欧美精品一区在线看| 国产经典三级在线| 欧美精品亚洲二区| 国产日本视频91| 久久国产精品77777| 久久精品丝袜| 九九久久精品国产av片囯产区| 国产精品无码AV片在线观看播放| 秋霞午夜国产精品成人片| 欧美日韩午夜视频在线观看| 亚洲成a人片在线观看88| 天天色综网| 亚欧成人无码AV在线播放| 91 九色视频丝袜| 国产区免费| 亚洲综合中文字幕国产精品欧美| 亚洲日韩第九十九页| 免费人成视频在线观看网站| 无码AV动漫| 99热这里只有免费国产精品 | 欧美成人一级| 久久久国产精品免费视频| 精品国产成人高清在线| 毛片在线播放a| 无码一区中文字幕| 成人91在线| 中文字幕有乳无码| a欧美在线| 精品视频第一页| 亚洲 日韩 激情 无码 中出| 一级毛片在线播放免费观看| 国产在线91在线电影| 中文字幕 91| 日本精品中文字幕在线不卡| 青草视频网站在线观看| 综合社区亚洲熟妇p| 日本精品中文字幕在线不卡| 114级毛片免费观看| 久无码久无码av无码| 99在线国产| 国产美女精品人人做人人爽| 国产成年女人特黄特色大片免费| 本亚洲精品网站| 无码高潮喷水专区久久| 国产精品美女免费视频大全 | 女人18一级毛片免费观看|