白瑩琦,帕力旦·吐爾遜,李 煜,付 敏
(1.西北大學 圖書館,陜西 西安 710127;2.新疆師范大學,新疆 烏魯木齊 830017)
用戶在搜索數字文獻資源時,其結果頁面是一個返回列表。此時,用戶可能會進行多種方式的操作。例如在點擊任何一個返回結果之前,先快速瀏覽很多其他結果的名稱;或者按照返回結果列表依次點擊瀏覽;或者放棄當前搜索并發出一個新的查詢。因此,用戶與系統交互式的行為建模研究是實現良好搜索引擎的關鍵因素。
對于系統平臺,將用戶搜索某項記錄的操作動作進行排序,便可以表示為一個動作序列,具體定義為=<(,), (,), (,)...>,其中(d,s)是由兩個元素組成的動作:動作的類型d以及該動作對應的返回結果序列r≥1。其中動作類型包含三種,具體如下:
(1)快速瀏覽:d="",當一個搜索結果簡介在電腦屏幕上停留的時間至少為1 s時,數據庫系統平臺將其定義為“一次快速瀏覽”。
(2)查閱查看:d="",當用戶選擇某條特定的結果并加載更為詳細的結果介紹時,系統平臺將記錄該操作,并定義為“查閱查看”。
(3)下載確定:d="",當用戶在查閱查看后,確認填寫和提交下載該記錄。這樣的操作在系統平臺也會被記錄,并定義為“下載確定”。
以某省屬211高校圖書館數據庫系統日志為例,摘錄某注冊用戶的一組動作序列,每組動作序列也可以看作是三個動作分量序列的組合。例如,某用戶已經快速瀏覽結果頁面的第1~5條記錄,隨后更為詳細地查閱查看了第4條記錄的詳細情況,下載確認該紀錄后再瀏覽第5條記錄。
每種動作之間存在關聯,對該關聯的挖掘可以憑借研究連續動作序列進行建模與分析。由于“查閱查看”是可以監測到的,而“快速瀏覽”則不然,只是記錄了是否進行,而無法對被瀏覽的記錄進行排序。因此,本文的研究目標在于能夠通過“查閱查看”動作記錄中推斷出“快速瀏覽”時符合用戶需求的結果排序。主要貢獻總結如下:
(1)建立了使用“查閱查看”信息來估計“快速瀏覽”順序的模型。
(2)針對常規用戶行為特征,提出條件連續概率來評估行為模型。
在有關提升搜索引擎性能的工作中,White等人通過使用商用搜索線索集,研究了用戶與結果頁面交互時搜索行為的可變性,其中每個線索代表一個交互圖;從用戶提交查詢開始,到用戶完成搜索任務結束,通過交互圖的變化展現行為的動態變化。Klockner等人通過眼睛跟蹤實驗來研究掃描瀏覽的序列。Cutrell等人根據眼睛跟蹤的數據,研究了搜索結果對用戶行為的影響。Joachims等人調查了用戶“從上到下”的瀏覽行為,其結論是在用戶單擊搜索結果之前,已經查看了大多數的結果,只有少數的結果沒有被查看。Thomas等人也通過眼睛跟蹤實驗,得出用戶遵循“進兩步,退一步”的方式來瀏覽結果頁面。現有方法足以感知用戶在進行數字資源搜索時的“快速瀏覽”動作。
針對在線用戶的行為,Spina等人研究了某在線社交網站的互動日志,從點擊和查詢提交關鍵詞兩方面調查了該網站會員的個人行為特征;Mansouri等人從數以百萬計的在線求職頁面記錄中,選擇與職位相關的查詢,研究了最熱門職位數量與一周內的職位搜索次數之間的關系。
對于電子商務搜索日志,Parikh等人分析了大約1.15億個eBay查詢記錄,并指出不同查詢的頻率分布遵循冪律分布;Hasan等人則擴展了這一研究,發現查詢頻率(查詢受歡迎程度的衡量標準)與eBay上檢索結果的數量呈正相關,這顯示了供求之間的平衡。
本文的數據集是某高校圖書館數據庫的用戶交互日志樣本。測試分析時采用了兩種不同工作模式的動作序列:(1)基于手機的Android/iOS應用程序進行在線搜索,其中搜索結果頁面沒有分頁和連續滾動;(2)基于桌面的網絡瀏覽器進行搜索,結果頁面都是分頁的,每個頁面包含15個結果。采用近2萬個動作序列分別響應Android/iOS查詢和瀏覽器查詢。
“快速瀏覽”是“查閱查看”和“下載確定”的前提。對于每條記錄,用戶通常會在“查閱查看”結果之前“快速瀏覽”包括在內的幾乎所有返回結果,記錄下用戶查看其他返回結果的數量。對比Android/iOS用戶和瀏覽器用戶,使用瀏覽器的用戶每次“查閱查看”某條結果時,“快速瀏覽”的結果數量比使用Android/iOS的用戶更多。
通常情況下,用戶在完成本次搜索之前,已經對搜索結果頁面進行了更深入的檢查。總的來說,所有對結果進行“查閱查看”的返回結果中,用戶的“快速瀏覽”排列次序都遵循類似的模式,這意味著可以從“查閱查看”信息中推斷“快速瀏覽”;而“下載確認”這一動作提供的額外信息會進一步加強這種關系。
對于“下載確認”與“快速瀏覽”的推斷,與Wicaksono等人所提出的經驗值()計算近似。根據經驗值的計算,這里考慮前20個結果(基于瀏覽器用戶的第一頁),對“下載確認”和“快速瀏覽”分別估計的延續概率明顯不同,見表1所列的RBP和INSQ這兩個模型的最佳擬合參數的值。然而,本文依舊認為“快速瀏覽”可以從“下載確認”這一動作序列中推斷出來,具體將在后文中說明。

表1 RBP和INSQ的最佳擬合參數值
本章描述了印象模式的建模方法。進行回歸預測時,基于以下三個假設選擇模型:
(1)用戶從上到下查看返回結果。
(2)如果第條返回結果被“查閱查看”,則第1至條返回記錄都被“快速瀏覽”。
(3)用戶可以在“查閱查看”第條返回結果之前,先查看后續返回結果。
在上述假設中,第一個是人們正常閱讀習慣,并具有已有研究結果的支撐。
針對假設二,圖1為其提供了進一步的證據,顯示了用戶“查閱查看”和“快速瀏覽”結果的最大數量之間的差異分布。

圖1 兩種訪問方式下交互動作數量差異(diff)分布
對于第三個假設,首先定義兩個與“查閱查看”動作相關的特征,如式(1)所示,為用戶“查閱查看”數量最多的結果排序位置;為“查閱查看”不同屬性結果的數量。其中,w為使用線性回歸得到的線性組合最佳系數;為偏移參數。

表2顯示了擬合參數取值影響占比,支撐了上文給出的第三個假設。在其他因素保持不變的情況下,diff隨用戶“查閱查看”數量最多的結果排序位置(>0)的增加而增加,隨不同屬性結果的“查閱查看”數量(<0)的減少而減少。

表2 擬合參數取值影響占比
綜合上述三個假設條件,累積分布(diff≥)是用戶“快速瀏覽”從返回結果(,)到(,)+的占比,其中(,)是用戶在“快速瀏覽”結果時“查閱查看”最多結果的排序位置。建立如下三個模型:
模型1:基于啟發式方法,設計一個具有“相似行為”的函數近似表征(diff=),并通過“快速瀏覽”和“查看查閱”日志記錄來選擇參數。具體定義如下:

其中:為超參,經驗取值為0.832;為控制衰變率的參數。根據交互日志中不同用戶訪問數據庫的方式不同,分別計算如下:

模型2:前期分析中發現,diff依賴于和這兩個因素。為了更精準地估計,對衰變參數進行線性擬合,則有:

則模型1可近似等價地定義為:


模型3:為了更精確地估計推斷,需要進一步使用用戶“查閱查看”的分布密度來估計用戶在最后一次點擊“快速瀏覽”之后的返回結果數量。設(imp=|,)為用戶在對結果進行“查閱查看”時,已完成對結果“快速瀏覽”的概率。同時提出“查閱查看”間斷分布(gap=|,),即用戶在面對個返回結果時,連續“快速瀏覽”個結果而不“查閱查看”的概率。于是模型3可定義為:

其中:(gap≥(·|))是由用戶發出的所有查詢的平均值決定的;用戶的總體推斷模型(imp=|,)也是通過求平均值來計算的。

其中:C()為記錄的用戶“查閱查看”次數;為經驗常數。
本文分析了高校圖書館數據庫服務器所提供的交互日志,其中包含利用移動設備(Android/iOS)應用程序發起查詢的1.58萬條搜索查詢交互日志,以及通過臺式機/筆記本電腦瀏覽器發起查詢的40 129條交互日志。
如圖2和圖3顯示了得到的經驗條件連續概率 ,并將其與SDCG和INSQ的兩條參考曲線進行了比較。“快速瀏覽”下的延續概率與“查看查閱”的明顯不同。

圖2 “快速瀏覽”下的條件延續概率

圖3 “查看查閱”下的條件延續概率
將近似估計的 值與使用原始查詢集計算的參數進行比較,并將其 應用于“查閱查看”動作序列中。表3的數據表明三種模型下近似 與真值的加權頻率均方誤差(WMSE)越小越好。

表3 加權頻率均方誤差(WMSE)
()是根據“加權精度有效性”度量與搜索引擎結果頁面中的第個返回記錄相關聯的權重;同時也是根據用戶查看的第個記錄而產生推斷的直接估計。在加權精度度量中,權重()是非遞增的,()≥(+1),這意味著查看排在后面的返回結果的概率小于查看排在前面的結果。使用相對熵即K-L散度來衡量概率分布之間的差異。表4顯示了在每個搜索引擎結果頁面的前10個和前50個結果的計算值,數值越小越好。從實驗結果可以看出,對于前10個結果的評估,模型1優于模型2;對于前50個結果的評估,模型3優于模型2。

表4 K-L散度分布差異
通過研究數據資源后臺用戶交互日志中的交互動作模式,并確認用戶通常在每次“查閱查看”之前會“快速瀏覽”第個之前的絕大多數結果以及第個之后的少數結果,提出推斷模型。該模型基于“查閱查看”動作序列來推斷返回結果列表中的哪些結果可能已經被用戶“快速瀏覽”,從而有助于對用戶行為模型予以修訂,為下次精準搜索提供依據。